從CPU架構(gòu)和技術(shù)的演變看GPU未來發(fā)展
高頻低能的Pentium 4和Pentium D苦苦抵抗Athlon 64和Athlon 64 X2瘋狂進攻的同時,Intel也在秘密研發(fā)新一代Core微處理器架構(gòu),全新的Core 2 Duo雖然沒有整合內(nèi)存控制器,但憑借高效率、低層級流水線和融合大量先進技術(shù)的指令架構(gòu),Core 2 Duo一舉擊敗Athlon 64 X2成為新的性能之王。
當(dāng)然,Intel還有另外一項創(chuàng)新性的技術(shù)也助Core 2 Duo一臂之力,拉大與對手的優(yōu)勢,它就是Intel Advanced Smart Cache(高級智能緩存技術(shù)),簡單來講就是多顆處理器核心共享大容量緩存,通常被稱為共享式大容量二級緩存。
傳統(tǒng)的雙核心設(shè)計每個獨立的核心都有自己的L2,但Intel Core微架構(gòu)則是通過核心內(nèi)部的Shared Bus Router共用相同的L2,當(dāng)CPU 1運算完畢后把結(jié)果存在L2時,CPU 0便可通過Shared Bus Router讀取CPU 1放在共用L2上資料,大幅減低讀取上的延遲并減少使用FSB帶寬,同時加入L2 & DCU Data Pre-fetchers及Deeper Write output緩沖存儲器,大幅增加了緩存的命中率。
與AMD K8雙核心L2架構(gòu)相比,CPU 0需要讀取CPU 2 L2中數(shù)據(jù)時,首先需要向系統(tǒng)總線發(fā)出需求,并通過Crossbar Switch就把取讀資料,但CPU 0發(fā)現(xiàn)讀取自己的L2沒有所要的數(shù)據(jù)才會要求讀取CPU 1的L2資料,情況等同于CPU 0的L3,而共享式的L2設(shè)計卻沒有以上需要。
Smart Cache架構(gòu)還有很多不同的好處,例如當(dāng)兩顆核心工作量不平均時,如果獨立L2的雙核心架構(gòu)有機會出現(xiàn)其中一顆核心工作量過少,L2沒有被有效地應(yīng)用,但另一顆核心的L2卻因工作量過重,L2容量沒法應(yīng)付而需要傳取系統(tǒng)內(nèi)存,值得注意的是它并無法借用另一顆核心的L2空間,但SmartCache因L2是共用的而沒有這個問題。
共享式L2不但能夠減少兩顆核心之間讀取緩存數(shù)據(jù)的延遲、提高數(shù)據(jù)命中率,而且還能有效提高緩存利用率,避免分離式緩存存放重復(fù)數(shù)據(jù)的可能,變相提高的緩存容量。Intel上代的Core 2 Duo和Core 2 Quad至今在性能方面并不輸給AMD的Phenom II系列處理器,其中共享式二級緩存設(shè)計功不可沒。
★ 共享式三級緩存已成為主流:
共享式二級緩存固然擁有諸多優(yōu)勢,但需要對傳統(tǒng)CPU架構(gòu)進行大幅調(diào)整,雙核心還算容易、多核心就比較麻煩了,緩存的存取機制都需要完全重新設(shè)計。因此AMD另辟蹊徑,在保持現(xiàn)有二級緩存不變的情況下,直接新增大容量的三級緩存,從而為多核提供協(xié)同運算的高速暫存數(shù)據(jù)倉庫。
AMD初代的Phenom四核處理器就采用了共享式三級緩存設(shè)計,每顆核心的一級緩存保持不變,二級緩存都是獨立的512KB,三級緩存為一體式的2MB。而到了Phenom II代,45nm工藝使得處理器能夠整合更大容量的緩存,于是L3倍增至6MB,性能提升非常明顯。
Core i7 Die示意圖
Intel在Core 2 Quad之后,也在醞釀全新的原生四核產(chǎn)品,此次Intel集所有先進技術(shù)于一體,不僅整合了內(nèi)存控制器,而且引入了比AMD HT更先進的QPI總線,還引入了共享式三級緩存,容量高達8MB,比Phenom II還多2MB。
至于低端的雙核Core i3/i5處理器,Intel為了保持架構(gòu)統(tǒng)一,也放棄了Core 2上面的共享二級緩存設(shè)計,每顆核心僅有256KB的獨立L2,而是植入了4M容量的L3,雖然總緩存容量不如E8X00系列的6MB L2,但性能上還是取得了長足的進步。
此后,32nm工藝的引入使得Intel可以在單一芯片之中集成更多的核心和更大的緩存,所以我們看到i7-980X擁有六顆物理核心以及高達12MB的L3,性能更上一層樓,令人嘆為觀止!
關(guān)注我們
