打倒X86!NVIDIA的CPU+GPU戰(zhàn)略全解析
馬路徹表示,“由于GPU本身的架構(gòu),半導(dǎo)體集成度的增加主要提高的是并行計(jì)算性能。即使是現(xiàn)在每年性能提高幅度也有74%左右?!贝送?,GPU和CPU并行處理性能差也將越拉越大,以浮點(diǎn)運(yùn)算計(jì),2001年的顯示核心浮點(diǎn)性能是當(dāng)時(shí)CPU的30倍,而這一差距在今日已經(jīng)拉大到1000倍,今后也將繼續(xù)擴(kuò)大下去。
同樣依照摩爾定律發(fā)展,GPU通用計(jì)算能力比CPU提高幅度要大得多
自從NVIDIA支持DX10的統(tǒng)一渲染架構(gòu)G80核心發(fā)布以來,半導(dǎo)體工藝的進(jìn)步使得GPU內(nèi)置的核心(流處理器)數(shù)量越來越多,GPU基礎(chǔ)架構(gòu)改良速度對比CPU也越來越快。GPU的通用計(jì)算能力在這幾年來得到很大提高。
NVIDIA旗下GPU的核心數(shù)量變化歷史
因?yàn)镚PU起初是為圖形處理設(shè)計(jì),對指令集的依存度很低,即使再多線程數(shù)量也仍然能保持并行處理性能維持在高水平不變。舉例來說,對于3D角色的反射光計(jì)算,每個(gè)多邊形反射光計(jì)算中法線處理互不相干,因此多邊形數(shù)量再多也不會(huì)造成瓶頸,GPU的運(yùn)算能力可以充分發(fā)揮。
CPU和GPU的并行處理示意圖
GPU實(shí)際并行計(jì)算示例:復(fù)雜多邊形的反射光處理運(yùn)算
GPU理論浮點(diǎn)運(yùn)算性能取得了飛躍
GPU并行計(jì)算適合多種要求高性能運(yùn)算的應(yīng)用
因此,科學(xué)運(yùn)算中最適合利用GPU強(qiáng)大的并行計(jì)算能力,馬路徹表示,NVIDIA近年來所力推的Tesla加速卡就是例子,同時(shí)取得了很多成果。
關(guān)注我們
