GPU
對圖像進行處理的相關計算。
1999年,美國英偉達公司推出世界上第一款圖像處理器芯片。2001年,科學計算開發(fā)人員從矩陣乘法運算著手GPU通用計算。2008年,英偉達推出支持CUDA的Tesla架構顯卡之后,GPU迅速轉(zhuǎn)向?qū)嵱?,在計算力學、地質(zhì)科學、生命科學、雷達遙感、計算金融等領域得到應用。
?21世紀以來,GPU已經(jīng)成為高性能計算的重要角色。2017年11月最新的TOP500數(shù)據(jù)顯示,世界排名前500的超級計算機中,有87臺采用了GPU協(xié)處理器。Volta架構動搖了2018年的TOP500版圖,它的性能飛越能夠重新定義超級計算機:過去,千萬億次計算意味著一個機房、一個集群,現(xiàn)在僅需要一個8卡GPU節(jié)點就能實現(xiàn)。
?GPU微架構以高度并發(fā)為基礎特征,其并行編程模型主要是CUDA和OpenCL。前者是一個配備完整工具包、針對單一供應商(英偉達)的成熟開發(fā)平臺,具有統(tǒng)一的開發(fā)套件(CUDA Toolkit、NVIDIA GPU Computing SDK、NSight等)、非常豐富的庫(cuBLAS、cuFFT、cuSPARSE、cuRAND、NPP、Thrust、NCCL等)以及PTX匯編代碼生成、離線編譯等成熟的編譯器特性;后者是一個有著開放的標準,具有跨平臺性和通用性,支持包括Nvidia、AMD、Intel、Qualcomm、ARM在內(nèi)的多類處理器,能夠更好地支持異構計算。
?GPU的出現(xiàn)和發(fā)展,與傳統(tǒng)CPU形成了強烈的對比和有效互補。CPU擅長處理具有復雜控制邏輯的任務,如操作系統(tǒng)、通用應用程序;而GPU擅長處理大量同類型數(shù)據(jù)上的密集數(shù)值計算。GPU的定位仍舊是CPU的加速器/協(xié)處理器,但是考慮到阿姆達爾定律,整體加速受限于不可并行的部分,應當盡量減少程序中的串行處理。