打倒X86!NVIDIA的CPU+GPU戰(zhàn)略全解析
不過GPU的發(fā)展也會受到阿姆達(dá)爾定律的影響,當(dāng)GPU集成的核心數(shù)量越來越多時也一定會遇到瓶頸。解決瓶頸的方法可以是在GPU中加入線程控制機(jī)能,用來安排指令優(yōu)先級和打包指令使其提高執(zhí)行效率。
NVIDIA G80核心流水線示意圖
NVIDIA GT100(GTX280)核心架構(gòu)圖
NVIDIA在G80架構(gòu)中首次在芯片和流處理器(SM)級別都加入了線程管理機(jī)能"Thread Scheduler",此后隨著圖形核心的發(fā)展,在Fermi架構(gòu)上Thread Scheduler進(jìn)化為"Gigathread Engine",使得并行運(yùn)算性能進(jìn)一步得到大幅提高。
并行計算架構(gòu)示意圖
Fermi核心架構(gòu)圖,Thread Scheduler進(jìn)化為GigaThread Engine
但是,在CUDA Core數(shù)量最大已經(jīng)達(dá)到512個的況下,如果再增加勢必會給線程管理模塊部分帶來更高負(fù)荷,甚至有發(fā)熱過高燒毀的危險。因此,為了使GPU的并行計算性能維持優(yōu)勢,需要搭載更加強(qiáng)力的線程控制及管理模塊,Project Denver正是為此誕生。
GigaThread Engine介紹,搭載2基硬件級別線程管理DMA引擎
NVIDIA負(fù)責(zé)產(chǎn)品市場部門的執(zhí)行副總裁Ujesh Desai確認(rèn)了Project Denver從三年前就已經(jīng)開始開發(fā),目標(biāo)是實(shí)現(xiàn)CPU和GPU的統(tǒng)合。
關(guān)注我們
