GPU挑戰(zhàn)CPU地位!詳解CUDA+OpenCL威力
關(guān)于GPU并行計(jì)算,其實(shí)AMD比NVIDIA更早提出了GPGPU(通用GPU)的概念,那么NVIDIA怎么看老對手AMD在并行計(jì)算方面的發(fā)展呢?現(xiàn)在我們就看看NVIDIA技術(shù)人員對于AMD的評價(jià)。
● 衡量GPU并行計(jì)算的主要指標(biāo)就是浮點(diǎn)運(yùn)算能力,根據(jù)理論值來看,AMD GPU似乎要比NVIDIA GPU高不少(HD4850達(dá)到1TFLOPS、HD4870 1.2TFLOPS),那NVIDIA GPU的優(yōu)勢是什么?
答:的確,GPU的浮點(diǎn)運(yùn)算能力非常重要,但這只是理論值而已,理論與實(shí)際存在很大的差距,尤其是在GPU架構(gòu)截然不同的情況下,幾乎沒有可比性。目前超級計(jì)算機(jī)500強(qiáng)的排名是使用統(tǒng)一的軟件進(jìn)行評估獲得的實(shí)際浮點(diǎn)運(yùn)算性能,而并非理論值,采用NVIDIA Tesla GPU的超級計(jì)算機(jī)初出茅廬就排行第29,實(shí)際運(yùn)算能力得到了充分肯定。
任何架構(gòu)都有效率高低之分,GPU也不例外,NVIDIA CUDA架構(gòu)的GPU執(zhí)行各種復(fù)雜的圖形指令及非圖形指令都有著非常高的效率,而競爭對手的產(chǎn)品聽起來擁有較多的流處理器、理論浮點(diǎn)運(yùn)算能力也很夸張,但實(shí)際性能如何呢,通過最新DX10游戲來看其效率很低,GPU的本職工作都做不好,何談指令更加復(fù)雜的并行計(jì)算呢?
● 科學(xué)研究對運(yùn)算精度要求非常高,雙精度浮點(diǎn)運(yùn)算使用率很高,NVIDIA GPU的雙精度運(yùn)算能力只有單精度的1/8,而AMD雙精度性能是單精度的1/5,這是為什么呢?
答:確實(shí),在不少應(yīng)用領(lǐng)域都須需要雙精度浮點(diǎn)運(yùn)算,這方面NVIDIA上代GPU做得還不夠好,當(dāng)初主要考慮提升單精度浮點(diǎn)運(yùn)算的能力和效率,在民用場合會得到非常出色的效能(比如視頻轉(zhuǎn)碼、物理加速等)。
不過,新一代Tesla產(chǎn)品的雙精度浮點(diǎn)運(yùn)算能力將會提高至原來的4倍之多,新一代核心不僅僅是工藝改進(jìn)頻率提升而已,事實(shí)上我們對內(nèi)核架構(gòu)作了進(jìn)一步優(yōu)化,每個SM內(nèi)部FP64運(yùn)算單元達(dá)4個,這樣NVIDIA下一代GPU的雙精度浮點(diǎn)運(yùn)算能力可以達(dá)到單精度的1/2,性能提升非??捎^!
● 對于AMD的FireStream流處理加速卡,NVIDIA怎么看?
答:AMD FireStream比NVIDIA Tesla誕生得早,但由于架構(gòu)和開發(fā)平臺問題,市場占有率及用戶認(rèn)可度根本無法同Tesla相提并論。大家看到的多是有關(guān)產(chǎn)品方面的報(bào)道,而不是有關(guān)應(yīng)用及解決方案方面,因?yàn)锳MD根本拿不出什么像樣的應(yīng)用軟件,目前最流行的Folding@Home蛋白質(zhì)分布式運(yùn)算以及AVIVO視頻轉(zhuǎn)碼,其實(shí)早在X1000時代就存在了,時至今日產(chǎn)品更新?lián)Q代了三四代,但GPU運(yùn)算效率并沒有得到提升,為什么呢?
因?yàn)锳MD沒有給用戶提供一種系統(tǒng)的開發(fā)平臺,而是僅使用匯編一類的低級語言去進(jìn)行GPGPU編程,這樣的開發(fā)效率極低,而且移植起來非常困難,針對不同架構(gòu)的GPU需要重新編寫軟件才能提供支持。舉個最簡單的例子,HD4000剛發(fā)布時候的Folding@Home運(yùn)算效能甚至還不如HD3000,要知道HD4000的理論性能是后者的2.5倍之多!
可以這么說,AMD的GPU架構(gòu)純粹是針對圖形渲染設(shè)計(jì)的,而且很落后,因?yàn)镹VIDIA很久以前的NV30就是這種SIMD架構(gòu),并行計(jì)算只是AMD圖形架構(gòu)的副產(chǎn)品,所以AMD在面對并行計(jì)算時能有多高的效率值得懷疑。或許OpenCL的出現(xiàn)能給AMD一些機(jī)會,但AMD有的NVIDIA都有,而AMD沒有的正是NVIDIA的強(qiáng)項(xiàng),優(yōu)秀的CUDA架構(gòu)再加上各類編譯器/API可以讓NVIDIA GPU大放異彩!
關(guān)注我們


