英特爾45nm新旗艦四核QX9650解析測試
首批45nm Penryn分為三個(gè)系列:至尊四核心的Core 2 Extreme QX9050、主流四核心的Core 2 Quad Q9000、雙核心的Core 2 Duo E8000。

而2008年1月,“Core 2 Quad Q9550、Q9450、Q9300”三款主流四核心跟進(jìn),主頻2.83GHz、2.66GHz和2.50GHz,二級緩存前兩款2×6MB、后一款2×3MB(注意編號第三位5和0的不同),熱設(shè)計(jì)功耗均為95W。另外,同月發(fā)布的還有“Core 2 Duo E8500、E8400、E8300、E8200”四款主流雙核心面世,主頻3.16GHz、3.00GHz、2.83GHz和2.66GHz,二級緩存均為2×3MB,熱設(shè)計(jì)功耗都是65W。
這些產(chǎn)品都采用了45nm工藝, 這使得Intel每年推出具增強(qiáng)微架構(gòu)或全新微架構(gòu)處理器產(chǎn)品的承諾順利兌現(xiàn),其不僅僅是單純制程提升,更重要的是,微架構(gòu)設(shè)計(jì)經(jīng)全力改良后,性能更較當(dāng)年Intel P4 Willamette提升至Northwood核心,有過之而無不及,同時(shí)使功耗更低。下面我們就來全面了解45nm的Penryn會(huì)帶給我們怎樣的驚喜。
● 45nm出現(xiàn)是晶體管誕生60歲最好的禮物自1947年晶體管發(fā)明迄今,科技進(jìn)步的速度驚人,催生了功能更為先進(jìn)強(qiáng)大,又能兼顧成本效益和耗電量的產(chǎn)品。雖然科技進(jìn)展迅速,但晶體管產(chǎn)生的廢熱和漏電,仍是縮小設(shè)計(jì)及延續(xù)摩爾定律 (Moore''s Law) 的最大障礙,因此業(yè)界必須以新材料取代過去40年來制作晶體管的材料。
翻查晶體管歷史,2007年正好是晶體管誕生60周年,首顆晶體管出現(xiàn)于1947年12月16日,貝爾實(shí)驗(yàn)室 (Bell Labs)的William Shockley、John Bardeen和Walter Brattain成功制作第一個(gè)晶體管,改變了人類的歷史。那么,在這60周年的今天,Intel公司首次推出45nm工藝處理器,作為晶體管60周歲最好的禮物。

摩爾定律之父——戈登摩爾
這其中我們要感謝一個(gè)人,那就是Intel的創(chuàng)始人戈登摩爾(Gordon Moore),通過長期的對比,研究后發(fā)現(xiàn):CPU中的部件(我們現(xiàn)在所說的晶體管)在不斷增加,其價(jià)格也在不斷下降。“隨著單位成本的降低以及單個(gè)集成電路集成的晶體管數(shù)量的增加;到1975年,從經(jīng)濟(jì)學(xué)來分析,單個(gè)集成電路應(yīng)該集成65000個(gè)晶體管。”Intel此后幾年的發(fā)展都被摩爾提前算在了紙上,使人們大為驚奇,“摩爾定律”也名聲大振。為了讓人們更直觀地了解摩爾定律,摩爾及其同事總結(jié)出一句極為精練的公式 “集成電路所包含的晶體管每18個(gè)月就會(huì)翻一番”。
之后的芯片內(nèi)集成的晶體管數(shù)量也證實(shí)了他的這句話,并且發(fā)展速度還在加快。從芯片制造工藝來看,在1965年推出的10微米(μm)處理器后,經(jīng)歷了6微米、3微米、1微米、0.5微米、0.35微米、0.25微米、0.18微米、0.13微米、0.09微米、0.065微米,而0.045微米的制造工藝將是目前CPU的最高工藝。以下我們就來簡單的見證一下Intel CPU工藝制程一路走來的風(fēng)雨歷程。
● 90nm的出現(xiàn)是CPU工藝一個(gè)質(zhì)的飛躍奇怪的是每當(dāng)新一代CPU問世時(shí),人們都會(huì)熱衷于討論它采用了多少微米或納米制程。的確,每一次制程(或制造工藝)的進(jìn)步都會(huì)對芯片制造業(yè)產(chǎn)生舉足輕重的影響,并演繹一個(gè)個(gè)經(jīng)典的傳奇。

Pentium讓CPU工藝從微米時(shí)代跨入了納米
按照摩爾老先生在文章中提出,芯片上集成的晶體管數(shù)量大約每18個(gè)月就將翻一番。從1971年Intel發(fā)布第一款處理器4004時(shí),所采用的工藝是10微米,芯片內(nèi)僅包含著2300多個(gè)晶體管,主頻也非常的低。直到1995年奔騰處理器發(fā)布后,CPU的制造工藝才首次采用納米工藝表示,第一代奔騰處理器采用的是800nm工藝,同時(shí)也標(biāo)志著CPU制造工藝從微米時(shí)代跨入了納米時(shí)代。奔騰處理器芯片內(nèi)的晶體管數(shù)量為310萬個(gè),主頻也有所提升,此時(shí)CPU的速度也有大幅的提升。

奔騰4E將CPU工藝帶入了90nm時(shí)代
之后CPU工藝就開始飛速的發(fā)展,芯片內(nèi)集成的集體管數(shù)量不斷的翻倍。到2004年。CPU制作工藝發(fā)生了質(zhì)的飛躍,推出了核心為Prescott的Pentium 4E處理器,在此次推出的Pentium 4E處理器中,一個(gè)顯著的特點(diǎn)就工藝再次改進(jìn)為90nm,集成了1億個(gè)晶體管。其中首批90nm處理器型號為3.40E GHz、3.20E GHz、3.00E GHz、2.80E GHz P4(“E”后綴商標(biāo))支持超線程技術(shù),800MHz前端總線和1MB二級緩存; 但此次工藝的提升,沒有使得功耗降低,因?yàn)橹黝l的提升,使得Prescott處理器功耗開始走高。
此時(shí),Intel推出90nm處理器后,并且在最短的時(shí)間內(nèi)宣布全面進(jìn)入90nm時(shí)代。而AMD在工藝制程方面比英特爾顯然慢了一大步,因此,在2004年,AMD和英特爾在制造工藝上的距離已經(jīng)拉開。
● 工藝再提升 勢不可擋的65nm制作工藝但隨著芯片中晶體管數(shù)量增加,原本僅數(shù)個(gè)原子層厚的二氧化硅絕緣層會(huì)變得更薄進(jìn)而導(dǎo)致泄漏更多電流,隨后泄漏的電流又增加了芯片額外的功耗。此時(shí),由于受“泄漏電流”的影響,導(dǎo)致后續(xù)產(chǎn)品頻率無法提升,功耗高居不下。為了從當(dāng)前的窘境中逃出來,Intel迅速部署65nm產(chǎn)品計(jì)劃。迅速在2005年推出了Pentium Extreme Edition 955,標(biāo)志著Intel進(jìn)入一個(gè)新的階段,65nm時(shí)代的來臨。
Pentium Extreme Edition 955處理器基于65nm工藝,是整個(gè)Pentium D 900系列雙核心產(chǎn)品中最高端的一款。

Pentium Extreme Edition 955
盡管新品均采用65nm工藝制造,但其TDP(Thermal Design Power)依然為130W。工作電壓需要從1.2v到1.375V,機(jī)箱內(nèi)部溫度不能夠超過68.6度。不過,Preslers無論在制造工藝還是架構(gòu)變革方面都有了非常大改進(jìn),包括獨(dú)立的雙L2 Cache設(shè)計(jì),以及制造工藝較90nm產(chǎn)品有了非常大的改觀。
雖然這一代產(chǎn)品晶體管材質(zhì)較上一代并沒有太大變化,但是在漏電方面的改進(jìn)還是非常顯著的,起初在90nm工藝下采用的應(yīng)變硅技術(shù),在新一代65nm處理器上得到進(jìn)一步發(fā)展,雖然絕緣層還是停留在1.2nm,但是晶體管扭曲提升了15%,這樣的結(jié)果就是漏電減小了4分之一,這樣也使的晶體管的響應(yīng)速度在沒有功耗提升的情況下提升了近30%,整體表現(xiàn)還是不錯(cuò)的。
● 新的工藝起點(diǎn)—45nm處理器登場目前Intel兩年一更換工藝,在65nm工藝處理器全面上市后,Intel再次提升了CPU的制作工藝,將在本月16號推出其首款45nm Penryn處理器。全新45nm Penryn家族共有7名成員,包括雙核心桌面處理器Wolfdate、四核心桌面處理器Yorkfield、雙核心行動(dòng)處理器 Penryn、雙核心Xeon DP處理器 Wolfdate DP、四核心 Xeon DP處理器Harpertown、雙核心 Xeon MP處理器Dunnington DC及四核心Xeon MP處理器Dunnington QC。

Intel首款45nm Penryn處理器QX9650
據(jù)了解,Penryn雙核心版本內(nèi)建 4.1 億個(gè)晶體管,四核心則有8.2億個(gè)晶體管,微架構(gòu)經(jīng)強(qiáng)化后,在相同頻率下較上代Core產(chǎn)品擁有更高性能,同時(shí)L 2 Cache容量提升50%,明顯提高數(shù)據(jù)讀取執(zhí)行的速率。此外,亦加入47條全新Intel SSE4指令,提高媒體性能和實(shí)現(xiàn)高性能運(yùn)算應(yīng)用。

CPU-Z下的QX9650
泡泡網(wǎng)近期有幸拿到首批Intel 45nm處理器Penryn QX9650, 其核心頻率3GHz,12MB二級緩存,F(xiàn)SB 1333MHz,是的絕對旗艦。接下來我們將會(huì)與65nmQX6850進(jìn)行對比測試。
◎ 測試平臺(tái)
硬件系統(tǒng)配置 | |
處理器 | Intel QX9650 Intel QX6850 |
ASUS P5E3 DELUXE | |
希捷 7200.10 160G 16M | |
內(nèi)存 | 芝奇 1GB DDR3 1600×2 |
Nvidia 8800 ULTRA 核心: 8800ULTRA(612MHz) 流處理器:1500MHz 顯存: 768 MB GDDR3(1080MHz) | |
電源 | 海韻 S12 600W |
散熱器 | Cooler Master |
軟件系統(tǒng)配置 | |
操作系統(tǒng) | Windows |
顯卡驅(qū)動(dòng) | 163.71_forceware_winxp_32bit_english_whql.exe |
此次測試我們將采用技術(shù)與實(shí)際結(jié)合的方式,希望讀者們能更直觀的了解QX9650的特性與性能。
● 45nm采用了High-K金屬柵極技術(shù)
此前我們對CPU工藝進(jìn)程也有簡短的回顧,細(xì)心的朋友可能會(huì)發(fā)現(xiàn),從90nm工藝開始出現(xiàn)了嚴(yán)重的漏電問題,阻礙了芯片和個(gè)人計(jì)算機(jī)的設(shè)計(jì)、大小、耗電量、噪聲與成本開發(fā)。因此,在新一代45nm Penryn處理器采用全新材料制作的45nm晶體管絕緣層和開關(guān)閘極,減低晶體管漏電情況。
其實(shí)晶體管就是一種簡單的開關(guān)裝置,可處理電子數(shù)據(jù)中的0、1組合。處理器就是含有數(shù)百萬此類通過銅線以特定方式連接在一起的晶體管。而晶體管內(nèi)部是由源極、漏極、柵電極、柵介質(zhì)、及硅底層通道。源極是指晶體管中電流產(chǎn)生的部分,它包含涂層硅(doped Si),漏極是指晶體管中電流流向的部分,這部分與源極一樣,都參雜了一些雜質(zhì)以降低電阻。不過晶體管是絕對對稱的,則電流可以從源極流向漏極,也可以從漏極流向源極。柵極電極就是晶體管頂端的區(qū)域,其電流的狀態(tài)決定晶體管是打開還是閉合,傳統(tǒng)上柵的制作材料是多晶硅或原子隨意排列且不形成網(wǎng)格狀結(jié)構(gòu)的硅。柵極介質(zhì)是位于柵極電極以及溝槽之間一層薄層,目前的數(shù)字芯片中晶體管柵介質(zhì)是由二氧化硅組成,而二氧化硅是絕緣體材料,它的作用是隔絕來自柵極電極的泄漏電流,但如果這個(gè)柵介質(zhì)層太薄其泄漏電流的電量就越大。
為了降低漏電問題,同時(shí)還要提高其性能。Intel采用了High-k的新材料制作晶體管閘極電介質(zhì),而且晶體管閘極的電極也搭配了全新的金屬材料。這樣,經(jīng)過測試顯示,不僅晶體管的性能提升了,同時(shí)漏電現(xiàn)象與之前相比也較少了5倍。據(jù)了解,制作閘極電介質(zhì)的材料主要是二氧化硅,因?yàn)樗邆淞撕芎玫囊字菩?,能夠減少厚度保持晶體管的整體性能。
由于High-k閘極電介質(zhì)和現(xiàn)有硅閘極并不兼容,Intel全新45nm晶體管設(shè)計(jì)也必須開發(fā)新金屬閘極材料,目前新金屬的細(xì)節(jié)仍未有消息透露,Intel現(xiàn)階段尚未說明其金屬材料的組合。另與上一代技術(shù)相較,Intel 45nm制程令晶體管密度提升近2倍,得以增加處理器的晶體管總數(shù)或縮小處理器體積,令產(chǎn)品較對手更具競爭力,此外,晶體管開關(guān)動(dòng)作所需電力更低,耗電量減少近30%,內(nèi)部連接線采用銅線搭配low-k電介質(zhì),順利提升效能并降低耗電量,開關(guān)動(dòng)作速度約加快20%。
值得注意的是,Intel成功令新一代45nm制程產(chǎn)品的漏電情況降低逾5倍,其中晶體管閘極氧化物漏電量更降低超過10倍,相較上代65nm制程產(chǎn)品,在同一功耗表現(xiàn)下,頻率下可提升約20%,或是在同一頻率下功耗更低,電池續(xù)航力也明顯大幅提升。
從上面的介紹我們可以看出,工藝的改進(jìn)可以讓處理器功耗更低,發(fā)熱量也會(huì)減低,那么為了驗(yàn)證這一觀點(diǎn),我們就是用45nm的QX9650與65nm QX6850進(jìn)行功耗對比。
詳細(xì)的測試平臺(tái)前面已介紹過,再此就不重復(fù)
這次測試功耗我們選用了具備30年研發(fā)經(jīng)驗(yàn)的臺(tái)灣電源品牌,Seasonic(海韻)出品的電源測試儀:Power Angel。功耗測試方法非常簡單,我們對整套平臺(tái)的功耗進(jìn)行統(tǒng)計(jì)。測試儀直接通過實(shí)時(shí)監(jiān)控輸入電源的電壓和電流計(jì)算出當(dāng)前的功率。這其中的功率包括,CPU、主板、內(nèi)存、硬盤、顯卡、電源以及線路損耗在內(nèi)的主機(jī)總功率。顯示器功率并不計(jì)算在內(nèi)。

海韻Seasonic出品的Power Angel電源測試儀
◎ 空閑時(shí)功耗對比
提示:以下成績左邊為QX9650、右邊為QX6850
電腦空閑時(shí),在整個(gè)平臺(tái)沒有換的情況下,兩顆處理器功率相差比較大,QX9650要比QX6850低了18W。
◎ 負(fù)載時(shí)功耗對比
從負(fù)載時(shí)功耗對比看出,45nm的QX9650表現(xiàn)非常不錯(cuò),比65nm的QX6850功耗低了68W,就算是對于個(gè)人來說能節(jié)省不少電費(fèi),減少不必要的能源消耗。不僅如此,功耗低證明其發(fā)熱量就小,那么風(fēng)扇轉(zhuǎn)速也可以相對的調(diào)慢,使得工作的時(shí)候更安靜。因此,45nm的處理器在降低功耗的消耗確實(shí)有明顯的改進(jìn)。
● 新技術(shù)讓Penryn優(yōu)勢更明顯
除了采用更先進(jìn)的45奈米制程外,Penryn 亦基于Intel Core微架構(gòu)設(shè)計(jì)作出多項(xiàng)改良,稱為Enhanced Intel Core Microarchitecture(加強(qiáng)型 Core微架構(gòu)),同時(shí)采用了新的SSE4指令集,并加入了:
Fast Radix-16 Divider(快速 Radix-16 除法器)
Super Shuffle Engine(超級洗牌引擎)
Split Load Cache Enhancement(增強(qiáng)型緩存拆分負(fù)載)
Improved Store Forwarding(存儲(chǔ)轉(zhuǎn)發(fā))
Faster OS Primitive Support(高速操作系統(tǒng)同步原始支持)
Virtualization Performance Improvements (增強(qiáng)的Intel 虛擬化技術(shù))
Deep Power Down Technology(深度節(jié)能技術(shù))
Enhanced Dynamic Acceleration Technology(增強(qiáng)型動(dòng)態(tài)加速技術(shù))
據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運(yùn)算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數(shù)據(jù)分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW | |
而Intel資深工程師兼Penryn微架構(gòu)主管Stephen Fischer表示,與上代處理器產(chǎn)品相比,Penryn處理器在繪圖效能約超過15%、視訊編碼平均可提高20%、3D內(nèi)容制作可提高逾30%,3D游戲效能更可高達(dá)40%,視乎軟件設(shè)計(jì)而定。
● 技術(shù)測試結(jié)合:浮點(diǎn)和整數(shù)的除法運(yùn)算速度增加◎ Enhanced Core MA :Fast Radix-16 Divider
Penryn處理器除沿襲Core微架構(gòu)的優(yōu)點(diǎn)外,并進(jìn)一步改良除法器的設(shè)計(jì),在科學(xué)計(jì)算、三維坐標(biāo)轉(zhuǎn)換和其它數(shù)學(xué)運(yùn)算密集型功能中,其帶來約2倍的除法器速度,所包含的新一代的快速除法技術(shù)稱為Radix-16,可加速浮點(diǎn)和整數(shù)的除法運(yùn)算速度。
其實(shí)Intel在Core微架構(gòu)中支持每個(gè)周期可處理多達(dá)4個(gè)指令(對比舊有處理器最多只能同時(shí)處理3個(gè)指令),且重新采用較高效率的14層Pipeline Stages,為提升分支預(yù)測的能力及準(zhǔn)確性,Branch Predictor的Bandwitdh提升至20Byte (K8、Banias 為16B,Netburst為4B),令指令執(zhí)行效率大大提高。
此外,Core微架構(gòu)更加入Macro-Fusion技術(shù),可把部份指令組合成單一Micro-Op 指令,令特定情況下每個(gè)周期可執(zhí)行5個(gè)指令,更保留Micro-op Fusion技術(shù),把相同的Macro-ops混合成單一個(gè)Micro-ops 透過Out-of-order邏輯可減少10% 的Micro-op指令執(zhí)行數(shù),除提升核心的執(zhí)行效率,同時(shí)也保持高能源效益。
據(jù)了解,基數(shù)為4的算法會(huì)在每次迭代運(yùn)算中計(jì)算其2位的商值,當(dāng)提高到基數(shù)為16的算法時(shí),則允許在每次迭代中計(jì)算4位的商值,進(jìn)而使延遲縮減一半。
◎ 實(shí)測SiSoftware Processor Arithmetic

從實(shí)際的測試中看出,Dhrystone和Whetstone是Processor(s) Arithmetic測試項(xiàng)目中的整數(shù)以及浮點(diǎn)運(yùn)算,用最終成績來評定一款處理器性能。新的Penryn QX9650與QX6850相比,在整數(shù)以及浮點(diǎn)運(yùn)算上QX9650分別提高了2.4%與12.6%。
● 技術(shù)測試結(jié)合:音效、視訊編碼效率得到提高
◎ Penryn :SSE4指令集強(qiáng)化視訊編碼效率
SSE4指令集進(jìn)一步強(qiáng)訊編碼效果,例如可同時(shí)處理8個(gè)4-byte寬度的SAD(Sums of Absolute Differences)運(yùn)算,常用于新一代高清影像編碼如VC.1及H.264等規(guī)格中,令視頻編碼速度進(jìn)一步提升。
◎ Super Shuffle Engine
Intel在Core微架構(gòu)中加入128Bit-SIMD interger arithmetic及128bit SIMD雙倍精準(zhǔn)度Floating-Point Operations單元。舊有的處理器執(zhí)行128Bit的SSE、SSE2及SSE3指令時(shí),需要把指令分拆為2個(gè)64Bit指令,在2個(gè)頻率周期完成,但Core微架構(gòu)則只需要1個(gè)頻率周期便能完成,執(zhí)行效率提升達(dá)1倍,現(xiàn)時(shí)SSE指令集已普遍使用于主流軟件中,包括繪圖、影像、音效、加密、數(shù)學(xué)運(yùn)算等用途,單周期128Bit處理器能力利用頻率以外的方法提升效能。
另一方面,Penryn處理器也有顯著改良,其加入全新Super Shuffle Engine,令SSE 指令運(yùn)算更具效率,以往處理Unpacking、Packing、Align Concatenated Sources、Wide Shifts、Insertion及Horizontal Arithmetic Functions Setup等128Bit寬度的字節(jié)、字及Dword SSE數(shù)據(jù)時(shí),均無法在單一周期內(nèi)完成,但Super Shuffle Engine設(shè)計(jì)除可讓這些不同性質(zhì)的128Bit SSE指令,在1個(gè)周期內(nèi)便可完成,減低延遲及吞吐量外,更不用在軟件端中作出改良即可實(shí)現(xiàn)。
◎ 音頻、視頻編碼測試



以上兩款測試是針對音頻、視頻的轉(zhuǎn)碼速度測試,在固定的文件下進(jìn)行轉(zhuǎn)碼,耗時(shí)多少,用的時(shí)間越短證明性能越好。因?yàn)镼X9650新增了多種技術(shù),因此成績比QX6850高出不少。
據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運(yùn)算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數(shù)據(jù)分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW | |
● SSE4 :向量、浮點(diǎn)運(yùn)算專門化 加入串流式負(fù)載指令
在應(yīng)用SSE4指令集后,Penryn增加了2個(gè)不同的32Bit向量整數(shù)乘法運(yùn)算支持,引入了8 位無符號 (Unsigned)最小值及最大值運(yùn)算,以及16Bit 及32Bit 有符號 (Signed) 及無符號運(yùn)算,并有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運(yùn)算能力。同時(shí),SSE4 改良插入、提取、尋找、離散、跨步負(fù)載及存儲(chǔ)等動(dòng)作,令向量運(yùn)算進(jìn)一步專門化。
SSE4加入了6條浮點(diǎn)型點(diǎn)積運(yùn)算指令,支持單精度、雙精度浮點(diǎn)運(yùn)算及浮點(diǎn)產(chǎn)生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉(zhuǎn)換其路徑模式,大大減少延誤,這些改變將對游戲及 3D 內(nèi)容制作應(yīng)用有重要意義。
此外,SSE4加入串流式負(fù)載指令,可提高以圖形幀緩沖區(qū)的讀取數(shù)據(jù)頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時(shí)緩沖區(qū)內(nèi),讓指令最多可帶來8倍的讀取頻寬效能提升,對于視訊處理、成像以及圖形處理器與中央處理器之間的共享數(shù)據(jù)應(yīng)用,有著明顯的效能提升。
◎ 實(shí)測SiSoftware Processor Multi-Media

從測試結(jié)果看,多媒體運(yùn)算能力上QX9650只比QX6850高出一點(diǎn),優(yōu)勢不是很明顯,普通消費(fèi)者在使用時(shí)并不能體會(huì)出區(qū)別,只能使用專門軟件才能區(qū)別開。
◎ Cinebench圖形渲染測試

CINEBENCH RELEASE 10主要考察處理器在進(jìn)行圖形渲染任務(wù)時(shí)的性能,并且支持多線程的軟件。此次測試中QX9650比QX6850提高9%,顯示出新款45nm處理器擁有超強(qiáng)的圖像處理器能力
◎ CPUMark99測試
CPUMark 99是最原始的CPU性能測試軟件,對主頻、外頻和二級緩存容量都比較敏感。而在這個(gè)傳統(tǒng)的測試項(xiàng)目中,QX9650以8分的優(yōu)勢勝出。
◎ SuperPI 測試

◎ WinRAR 3.60文件壓縮性能測試

這次使用目前最流行的WinRAR壓縮軟件來進(jìn)行數(shù)據(jù)壓縮測試,其3.60版本之后加入了對多線程的支持。新款QX9650由于在運(yùn)算能力上的出色表現(xiàn),使其在數(shù)據(jù)壓縮測試中高出QX6850 14%的壓縮能力。
◎ EVEREST Ultimate Edition

測試小結(jié):總的來說,在實(shí)際應(yīng)用測試中,各個(gè)項(xiàng)目的成績變化還是蠻大的。特別是數(shù)據(jù)壓縮與內(nèi)存讀寫速度測試上,QX9650都以較大的優(yōu)勢勝出。
◎ 3D Mark03:


3DMark03引入了畫質(zhì)過濾測試,并且提供了紋理過濾的選項(xiàng),提供了并非默認(rèn)的FSAA抗鋸齒選項(xiàng)。3DMark03受到處理器、內(nèi)存和主板的影響更小,并且專注于顯示卡著色能力的測試,顯示卡的效能高低將成為3DMark03得分的主要瓶頸。
◎ 3D Mark05:


Dmark05一共使用三個(gè)游戲進(jìn)行測試,Game1測試的舞臺(tái)是一個(gè)未來太空基地,主體動(dòng)態(tài)光影采用了高達(dá)2048x2048的紋理,因此對于顯卡的像素填充率以及顯存帶寬有著很高的要求。
◎ 3D Mark06:


測試小結(jié):游戲理論性測試部分,QX9650與QX6850在成績總分上并沒有太大的區(qū)別,因?yàn)樗麄冎苯訕?gòu)架都相同,同時(shí)頻率之類的區(qū)別也不大,但是由于QX9650加入新的指令集,因此在CPU運(yùn)算成績上要高出一些。
◎ Crytek

◎ Company of Heros

◎ COJ

◎ Half-Life2——EPISOOE TWO

◎ Farcry

游戲測試總結(jié):實(shí)際游戲測試中,我們都把畫質(zhì)開到最高下進(jìn)行測試。從一些DX10的游戲測試上看,這兩款處理器的差距并不大,只有1至2幀的差距。而在一些DX9游戲測試中,差距就很明顯,比如Half-Life2—EPISOOE TWO QX9650比QX6850提升8%。
◎ 45nm新工藝讓處理器功耗降得更低
目前從整個(gè)DIY行業(yè)來說,大家都在提倡節(jié)能環(huán)保的原則。那么,對于電腦中的核心——CPU來說當(dāng)然也不例外,低功耗的CPU將成為未來處理器市場的主流,因此采用最新工藝,最新架構(gòu)和最新的節(jié)能技術(shù)的CPU,都是廠商追求的目標(biāo),因?yàn)橹挥羞@些新技術(shù)可以確保高性能低能耗技術(shù)的實(shí)現(xiàn)。而Intel 45nm處理器的出現(xiàn)正是順應(yīng)了追求低功耗時(shí)代的產(chǎn)品。
從前面的功耗測試中我們就有深刻的體會(huì),在平臺(tái)相同、處理器滿負(fù)載的情況下,45nm處理器比65nm處理器的平臺(tái)低了68W,這個(gè)數(shù)值是相當(dāng)可觀的,如果是普通消費(fèi)者使用那么一天就能節(jié)省1.6度電(如果是多人使用,那么節(jié)省的能源就相當(dāng)可觀了)。
◎ 臺(tái)式機(jī):45nm的QX9650打敗市場最高性能產(chǎn)品
PCPOP.COM泡泡網(wǎng)CPU評測室 測試時(shí)間: | ||||
測試項(xiàng)目 | Intel Core 2 QX 9650 | Intel Core 2 QX 6850 | 提升幅度 | |
8800Ultra 1024x768 | ||||
理論性測試 | ||||
Processor Arithmetic | Dhrstone | 56013 | 54626 | 2.4% |
Whetstone | 41276 | 36042 | 12.6% | |
Processor Multi-Media | Integer | 332689 | 332229 | 將近0% |
Fioating | 173356 | 173153 | 將近0% | |
Memory Bandwidth | Int AUU | 7264 | 6896 | 5% |
Float FPU | 7118 | 6762 | 5% | |
PCMark | 9652 | 9632 | 將近0% | |
3D理論性測試 | ||||
3DMark | Overall | 43850 | 42835 | 2.3% |
CPU項(xiàng) | 2345 | 2201 | 6% | |
3DMark | Overall | 18342 | 18192 | 將近0% |
CPU項(xiàng) | 20873 | 19895 | 4.6% | |
3DMark | Overall | 13548 | 13533 | 將近0% |
4428 | 4420 | 將近0% | ||
實(shí)際應(yīng)用測試 | ||||
SuperPI | 15.37 | 17.67 | 13% | |
WinRAR 3.60文件壓縮性能 | 1937 | 1654 | 14.6% | |
Cinebench圖形渲染 | 11759 | 10676 | 9.2% | |
視頻編碼測試 | 44秒 | 47秒 | 6.3% | |
音頻編碼測試 | 單線程 | 171秒 | 183秒 | 6.5% |
多線程 | 108秒 | 117秒 | 7.6% | |
EVEREST Ultimate | 內(nèi)存寫入速度 | 8578 | 8388 | 2.2% |
內(nèi)存讀取速度 | 7103 | 6094 | 14.2% | |
實(shí)際游戲測試 | ||||
Crytek | 26.5 | 25.13 | 5.1% | |
Company of Heros DX10 | 57.6 | 56.2 | 2.4% | |
Half-Life2 EPISOOE TWO | 185.4 | 169.29 | 8.6% | |
COJ | 31 | 30.9 | 將近0% | |
Farcry | 182.8 | 179.86 | 1.6% | |
市場上,規(guī)格、性能最高的就屬Q(mào)X6850,但是45nm的QX9650的出現(xiàn)將會(huì)替代其性能第一的霸主地位。從測試結(jié)果看,不管是功耗、處理器運(yùn)算性能、游戲測試等方面QX9650都要高于65nm的QX6850??梢哉fIntel Penryn處理器的出現(xiàn)將繼續(xù)穩(wěn)坐最高性能處理器的寶座。
◎ 筆記本:性能更高,功耗更低
Penryn移動(dòng)版還會(huì)加入兩項(xiàng)新穎的省電技術(shù)——C6 State和EDAT。C6 State可讓筆記本處理器的功耗在空閑狀態(tài)下降到非常低的水平,核心電壓也會(huì)根據(jù)情況大大降低,同時(shí)緩存徹底轉(zhuǎn)移其中的數(shù)據(jù)并完全關(guān)閉。從這種狀態(tài)中恢復(fù)需要一點(diǎn)點(diǎn)時(shí)間,而且會(huì)對性能產(chǎn)生一定的影響,但對筆記本用戶來說,電池續(xù)航時(shí)間的重要性顯然更大。EDAT可以單獨(dú)提高某個(gè)處理核心的頻率,并將其他暫時(shí)不使用的核心關(guān)閉,以適應(yīng)單線程任務(wù)或者只能利用一個(gè)核心的多線程任務(wù)。
可以說Intel 45nm處理器面對著AMD全新K10微架構(gòu)來襲,單純以微架構(gòu)而論或許在效能表現(xiàn)略有不及,但由于擁有更為先進(jìn)制程、核心頻率及成本等優(yōu)勢,整體而言,AMD K10未必能占得上風(fēng),還是讓我們共同把目光聚焦在第四季度,期待這場具有劃時(shí)代意義的大戰(zhàn)。<
關(guān)注我們


