從CPU架構(gòu)和技術(shù)的演變看GPU未來發(fā)展
★ CPU發(fā)展趨勢(shì):不斷的整合功能模塊
通過前面詳細(xì)的介紹我們可以發(fā)現(xiàn),CPU的發(fā)展趨勢(shì)就是不斷去整合更多的功能和模塊,從協(xié)處理器、到緩存、再到內(nèi)存控制器甚至整個(gè)北橋。
目前AMD和Intel的所有主流CPU都已經(jīng)整合了內(nèi)存控制器,Intel最新的Lynnfield(Core i7 8XX和i5 7XX)已經(jīng)整合了包括PCIE控制器在內(nèi)的整個(gè)北橋,而Clarkdale(Core i5 6XX和i3 5XX)更是將GPU也整合了進(jìn)去。
★ GPU發(fā)展趨勢(shì):不斷的蠶食CPU功能
至于GPU,從某種意義上來說,它本身就是一顆協(xié)處理器,主要用于圖像、視頻、3D加速。之所以這么多年來沒有被CPU所整合,是因?yàn)镚PU實(shí)在太復(fù)雜了,以現(xiàn)有的制造工藝限制,CPU不可能去整合一顆比自身規(guī)模還要大很多的GPU,它頂多只能整合一顆主流中低端的GPU,而這樣的產(chǎn)品只能定位入門級(jí),無法滿足游戲玩家和高性能計(jì)算的需要。
GPU從誕生至今一步步走來,就是在不斷蠶食著原本屬于CPU的功能,或者說是幫助CPU減負(fù)、去處理哪些CPU并不擅長的任務(wù)。比如最開始的T&L(坐標(biāo)轉(zhuǎn)換與光源)、VCD\\DVD\\HD\\BD視頻解碼、物理加速、幾何著色。而今后和未來,GPU將奪走一項(xiàng)CPU最重要的功能——并行計(jì)算、高精度浮點(diǎn)運(yùn)算。
★ GPU前途似錦:浮點(diǎn)運(yùn)算的未來
我們知道,CPU第一個(gè)整合的就是專門用來加速浮點(diǎn)運(yùn)算的協(xié)處理器,此后歷代SSE指令集也都是為了加強(qiáng)CPU的SIMD(單指令多數(shù)據(jù)流)浮點(diǎn)運(yùn)算性能。而GPU打從一開始就被設(shè)計(jì)成為了SIMD架構(gòu)(至今Cypress也還是這種架構(gòu)),擁有恐怖浮點(diǎn)運(yùn)算能力的處理器。當(dāng)今GPU的浮點(diǎn)運(yùn)算能力更是達(dá)到多核CPU的幾十倍甚至上百倍!
CPU和GPU的浮點(diǎn)運(yùn)算能力
CPU永遠(yuǎn)都趕不上GPU的發(fā)展速度,因此最適合進(jìn)行浮點(diǎn)運(yùn)算的顯然是GPU,CPU繼續(xù)擴(kuò)充核心數(shù)目已經(jīng)變得毫無意義,因此整個(gè)業(yè)界都在想方設(shè)法的發(fā)掘GPU的潛能,將所有的并行計(jì)算任務(wù)都轉(zhuǎn)移到GPU上面來。即便是Intel也看到了GPU廣闊的前景,因此著手研發(fā)GPU。
此前由于API和軟件的限制,GPU在并行計(jì)算方面的應(yīng)用舉步維艱、發(fā)展緩慢,NVIDIA孤身推廣CUDA架構(gòu)雖然小有成就但孤掌難鳴。好在OpenCL和DirectCompute兩大API的推出讓GPU并行計(jì)算的前途豁然開朗,此時(shí)ATI和NVIDIA又重新站在了同一起跑線上,那么很顯然誰的架構(gòu)更適合并行計(jì)算,那么誰就能獲得更強(qiáng)的性能和更大范圍的應(yīng)用,通過本文的分析可以看出,ATI的架構(gòu)依然是專注于傳統(tǒng)的圖形渲染,并不適合并行計(jì)算;而NVIDIA的架構(gòu)則完全針對(duì)通用計(jì)算API和指令集優(yōu)化設(shè)計(jì),確保能發(fā)揮出接近理論值最大效能,提供最強(qiáng)的浮點(diǎn)運(yùn)算性能!
★ CPU面臨拐點(diǎn):強(qiáng)化整數(shù)性能,浮點(diǎn)運(yùn)算交給GPU
AMD同時(shí)擁有CPU和GPU,而且AMD在技術(shù)方面往往能夠引領(lǐng)業(yè)界,因此其未來發(fā)展規(guī)劃非常值得大家思考。根據(jù)AMD最新的產(chǎn)品路線圖來看,其下一代的高端CPU核心Bulldozer(推土機(jī)),它最大的亮點(diǎn)就是每一顆核心擁有雙倍的整數(shù)運(yùn)算單元,整數(shù)和浮點(diǎn)為非對(duì)稱設(shè)計(jì):
AMD下一代“推土機(jī)”架構(gòu),大幅強(qiáng)化整數(shù)運(yùn)算單元
在一個(gè)推土模塊里面有兩個(gè)獨(dú)立的整數(shù)核心,每一個(gè)都擁有自己的指令、數(shù)據(jù)緩存,也就是scheduling/reordering邏輯單元。而且這兩個(gè)整數(shù)單元的中的任何一個(gè)的吞吐能力都要強(qiáng)于Phenom II上現(xiàn)有的整數(shù)處理單元。Intel的Core構(gòu)架無論整數(shù)或者浮點(diǎn),都采用了統(tǒng)一的scheduler(調(diào)度)派發(fā)指令。而AMD的構(gòu)架使用獨(dú)立的整數(shù)和浮點(diǎn)scheduler。
據(jù)AMD透露,目前存在于服務(wù)器上的80%的操作都是純粹的整數(shù)操作,因此AMD新一代CPU大幅加強(qiáng)了整數(shù)運(yùn)算單元而無視浮點(diǎn)運(yùn)算單元。而且,隨著CPU和GPU異構(gòu)計(jì)算應(yīng)用越來越多,GPU將會(huì)越來越多的負(fù)擔(dān)起浮點(diǎn)運(yùn)算的操作,預(yù)計(jì)未來3-5年的時(shí)間內(nèi),所有浮點(diǎn)運(yùn)算都將會(huì)交給最擅長做浮點(diǎn)運(yùn)算的GPU,這也就是推土機(jī)加強(qiáng)整數(shù)運(yùn)算的真正目的。
當(dāng)然,AMD和Intel都會(huì)推出CPU整合GPU的產(chǎn)品,不管是膠水還是原生的解決方案,其目的并不是為了消滅顯卡和GPU,而是通過內(nèi)置的GPU為CPU提供強(qiáng)大的浮點(diǎn)運(yùn)算能力。但由于制造工藝所限,被CPU所整合的GPU不是集成卡就是中低端,只能滿足基本需求。所以想要更強(qiáng)大的游戲性能和并行計(jì)算性能的話,專為浮點(diǎn)運(yùn)算而設(shè)計(jì)的新一代架構(gòu)的GPU產(chǎn)品,才是最明智的選擇。
所以說,CPU和GPU,誰也不可能取代誰,雙方是互補(bǔ)的關(guān)系,只有CPU和GPU協(xié)同運(yùn)算,各自去處理最擅長的任務(wù),才能發(fā)揮出計(jì)算機(jī)最強(qiáng)的效能。CPU會(huì)整合GPU的,但僅限中低端產(chǎn)品;GPU會(huì)取代CPU進(jìn)行浮點(diǎn)運(yùn)算的,但它仍然需要CPU來運(yùn)行操作系統(tǒng)并控制整個(gè)計(jì)算機(jī)。只有當(dāng)制造工藝發(fā)達(dá)到一定程度時(shí)才有可能將CPU和GPU完美融合在一起,到時(shí)候是CPU整合GPU還是GPU整合CPU都很難說,但誰被誰整合已經(jīng)不重要了?!?
關(guān)注我們
