處理器革命:二代酷睿處理器性能對比
五、整合圖形核心
Intel的集成顯卡似乎總是個笑話,但這次確實(shí)不一樣了。SNB的CPU性能相比現(xiàn)在提升了10-30%,進(jìn)化到第六代的GPU圖形性能則會輕松翻好幾番。
Westmere雖然也自帶了圖形核心,但與CPU是雙內(nèi)核封裝,只是通過45nm工藝、更多著色硬件、更高頻率提升了性能,SNB則將CPU、GPU封裝在同一內(nèi)核中,全部采用32nm工藝,特別是顯著提高了IPC(指令/時鐘)。
SNB GPU有自己的電源島和時鐘域,也支持Turbo Boost技術(shù),可以獨(dú)立加速或降頻,并共享三級緩存。顯卡驅(qū)動會控制訪問三級緩存的權(quán)限,甚至可以限制GPU使用多少緩存。將圖形數(shù)據(jù)放在緩存里就不用繞道去遙遠(yuǎn)而“緩慢”的內(nèi)存了,這對提升性能、降低功耗都大有裨益。
不過這么做并沒有說起來這么簡單。NVIDIA GF100核心費(fèi)了九牛二虎之力,SNB其實(shí)也差不多,同樣進(jìn)行了全新設(shè)計。
順便提一下Intel的獨(dú)立顯卡工程Larrabee。它的重點(diǎn)是廣泛使用全面可編程硬件(除了紋理硬件),SNB則是全面使用固定功能硬件,功能特性和硬件單元相對應(yīng),這樣的好處是性能、功耗、核心面積都大大優(yōu)化,損失則是缺乏彈性。顯然,Intel世界的中心仍舊是CPU,不能讓GPU過分強(qiáng)大,這和NVIDIA的理念正好相反。
可編程著色硬件被稱為EU,包含著色器、核心、執(zhí)行單元等,可以從多個線程雙發(fā)射時取指令。內(nèi)部ISA映射和絕大多數(shù)DX10 API指令一一對應(yīng),架構(gòu)很像CISC,結(jié)果就是有效擴(kuò)大了EU的寬度,IPC也顯著提升。
抽象數(shù)學(xué)運(yùn)算由EU內(nèi)的硬件負(fù)責(zé),性能得以同步提高。Intel表示,正弦(sine)、余弦(cosine)操作的速度比現(xiàn)在的HD Graphics提升了幾個數(shù)量級。
Intel此前的圖形架構(gòu)中,寄存器文件都是即時重新分配的。如果一個線程需要的寄存器較少,剩余寄存器jiuihui分配給其他線程。這樣雖能節(jié)省核心面積,但也會限制性能,很多時候線程可能會面臨沒有寄存器可用的尷尬。在芯片組集成時代,每個線程平均64個寄存器,Westmere HD Graphics提高到平均80個,SNB則每個線程固定為120個。
所有這些改進(jìn)加起來,SNB里每個EU的指令吞吐量都比現(xiàn)在的HD Graphics增加了一倍。
SNB集成的GPU圖形核心分為兩大版本,分別擁有6個、12個EU。首批發(fā)布的移動版全部是12個EU,桌面版則根據(jù)型號不同而有兩種配置,可能是高端12個、低端6個。得益于每個EU吞吐量翻番、運(yùn)行頻率更高、共享三級緩存等特點(diǎn),即使只有六個的時候性能也會相當(dāng)令人滿意。
六、媒體引擎
除了GPU圖形核心,SNB中還有一個媒體處理器,專門負(fù)責(zé)視頻解碼、編碼。
媒體處理器
新的硬件加速解碼引擎中,整個視頻管線都通過固定功能單元進(jìn)行解碼,和現(xiàn)在正好相反。Intel據(jù)此宣稱,SNB在播放視頻的時候功耗可降低一半。 視頻編碼引擎則是全新的。具體細(xì)節(jié)沒有公布,但是Intel現(xiàn)場拿出了一段3分鐘長的1080p 30Mbps高清視頻,將其轉(zhuǎn)換成640×360 iPhone格式,結(jié)果整個過程耗時僅僅14秒鐘,轉(zhuǎn)換速度高達(dá)400FPS左右,而這只花費(fèi)了大約3平方毫米的核心面積。
Intel與軟件產(chǎn)業(yè)合作密切,相信這種視頻轉(zhuǎn)碼技術(shù)會很快得到廣泛支持。
七、新一代Turbo Boost
Lynnfield Core i7/i5首次引入了智能動態(tài)加速技術(shù)“Turbo Boost”(睿頻),能夠根據(jù)工作負(fù)載,自動以適當(dāng)速度開啟全部核心,或者關(guān)閉部分限制核心、提高剩余核心的速度,比如一顆熱設(shè)計功耗(TDP)為 95W的四核心處理器,可能會三個核心完全關(guān)閉,最后一個大幅提速,一直達(dá)到95W TDP的限制。 現(xiàn)有處理器都是假設(shè)一旦開啟動態(tài)加速,就會達(dá)到TDP限制,但事實(shí)上并非如此,處理器不會立即變得很熱,而是有一段時間發(fā)熱量距離TDP還差很多。
SNB利用這一點(diǎn)特性,允許單元控制單元(PCU)在短時間內(nèi)將活躍核心加速到TDP以上,然后慢慢降下來。PCU會在空閑時跟蹤散熱剩余空間,在系統(tǒng)負(fù)載加大時予以利用。處理器空閑的時間越長,能夠超越TDP的時間就越長,但最長不超過25秒鐘。
不過在穩(wěn)定性方面,PCU不會允許超過任何限制。
之前我們也已經(jīng)說過了,SNB GPU圖形核心也可以獨(dú)立動態(tài)加速,最高可達(dá)驚人的1.35GHz。如果軟件需要更多CPU資源,那么CPU就會加速、GPU同時減速,反之亦然。
關(guān)注我們



