推土機強拆沙橋 AMD下代平臺模擬測試
泡泡網(wǎng)主板頻道8月6日 從雙核到四核再到六核,在這幾年處理器從核心數(shù)量以及性能方面一直在大跨度的前進,當然這樣迅速的進步首先要感謝桌面處理器的兩大廠商Intel與AMD的競爭。
不過在經(jīng)歷了無數(shù)次的較量之后,AMD優(yōu)異桌面產(chǎn)品在性能方面逐漸被Intel甩開,尤其是在Intel推出了32nm工藝的新一代SandyBridge處理器之后,AMD在高端平臺性能方面的劣勢更加明顯,因此AMD即將推出蓄力已久的新一代產(chǎn)品“推土機”——Bulldozer桌面處理器。
自從我們關(guān)于“推土機”的消息放出之后,關(guān)于它的眾多信息就被陸續(xù)透露出來。首先是其新架構(gòu)的革新,其次是性能方面的大跨度前進。當然新一代產(chǎn)品即將推出不管是AMD還是我們消費者固然愿意看到新平臺在性能方面有大跨度提升,而AMD也放言“推土機”將比Intel的Core I7 四核心產(chǎn)品性能快50%!
從Intel推出了Core 2處理器之后,筆者也一直在關(guān)注AMD的動向,希望AMD能借新一代全新架構(gòu)再現(xiàn)當年的K8雄風,不過直到 Phenom II 的發(fā)布AMD也未能挽回劣勢的局面,雖然Phenom II 相比老一代的產(chǎn)品已經(jīng)有了不小的改進,但它改進的還不夠徹底。
“推土機”的發(fā)布已經(jīng)日益臨近,相比大家對它也有了不少期待以及猜測,雖然AMD也放言“推土機”將比Intel的Core I7 四核心產(chǎn)品性能快很多,但是要做什么樣的改進才能超越Core I7 呢?下面筆者就帶著大家展望一下未來的“推土機”,以及“推土機”平臺需要做出的改進。
Bulldozer推土機可以說既是AMD官方也是很多網(wǎng)友寄予厚望的一代架構(gòu),Intel的酷睿2處理器在市場風光多年就是得益于當初相比上代性能提升40%、功耗降低40%的全新架構(gòu),AMD也確實需要類似的架構(gòu)來提振“士氣”。
推土機架構(gòu)采用模塊化設(shè)計
在AMD官方文檔上表述了推土機架構(gòu)帶來了很多全新的特性,比如采用模塊化設(shè)計,傳統(tǒng)的核心被模塊取代,并且配有16MB的L3級緩存。
每個模塊設(shè)計方面共享了一個浮點調(diào)度器可以節(jié)省大量的晶體管,有效降低處理器核心面積進而降低成本,此外功耗也更好控制。每個模塊的兩個128bit FMAC單元既可以被每個核心(每個模塊可以簡單看做現(xiàn)在的兩個核心)單獨使用,也可以合并成一個256bit FMAC。此外,推土機新架構(gòu)講支持全新的X86指令集,包括SSE4.1、SSE4.2、AVX、XOP。
相比SMP和CMP,Bulldozer的共享模塊化設(shè)計執(zhí)行效率更高
AMD推土機架構(gòu)可以說是AMD徹底重新設(shè)計,共享、專用單元結(jié)合和模塊化設(shè)計讓這一架構(gòu)相比Intel Sandy Bridge有著很多大不一樣的誘人特性,但是相信這些規(guī)格上的改進并不能說明“推土機”一定一掃之前的頹勢,因為高規(guī)格需要高效能才會匹配!就像AMD Phenom II 產(chǎn)品雖然有著6MB的L3級緩存但是他的效率仍然不盡人意,下面筆者就進行深入分析!
既然AMD表示“推土機”相比Phenom II 產(chǎn)品有著巨大的改進,那么我們以目前的Phenom II 產(chǎn)品作為基準,來談?wù)摗巴仆翙C”在Phenom II 性能的基礎(chǔ)上應(yīng)該有哪些改進,當然還要加入Intel Core 2產(chǎn)品作對比,因為“推土機”要超越的的并不僅僅是自家的Phenom II ,而是Intel目前的高端I7系列處理器。
根據(jù)筆者的經(jīng)驗來看,“推土機”想要超越Intel Core I7 必須要做到一下幾點改進:
1.單線程性能
已經(jīng)進入了多核心時代以后,核心數(shù)量成為了一個衡量處理器性能的重要指標,以至于讓大家逐漸忽視了單線程性能,其實在多核心的時代單線程性能依然對處理器性能有著不小的影響。
2.L3緩存容量
對于處理器內(nèi)部的緩存來說,AMD處理器核心相對于Intel的需求相對要小一些,由于I/A處理器架構(gòu)不同緩存的鏈路速度也不同并且非常復(fù)雜,因此至于原因下面的文章里僅會簡單說明。
3.內(nèi)存帶寬性能
雖然AMD內(nèi)存控制器很早就融入了處理器中,并且在當時也發(fā)揮出了很好的效能,但是Intel后來者居上,目前在內(nèi)存帶寬方面已經(jīng)大幅度超越了AMD,因此“推土機”必須在此方面大幅度提升性能!
4.處理器、內(nèi)存控制器、L3緩存的頻率還有功耗。
說起頻率這一直是AMD的痛處,Intel憑借迅速提升工藝來大幅度減少漏電革新架構(gòu)以至于目前在頻率方面奄然沒有任何壓力,反觀AMD雖然Phenom II 965以及六核心1100T在頻率方面已經(jīng)提高到了3.4GHz左右,但是其功耗頗高以至于很難再有發(fā)幅度提升。
上面筆者已經(jīng)提出了“推土機”想要超越Intel Core I7 需要做到的改進,那么下面我們就來用測試數(shù)據(jù)來深入分析“推土機”究竟在性能上提升多大的幅度才能超越Intel Core I7 !
硬件系統(tǒng)配置 | |
AMD Phenom II X 6 1100T (AM3 /3.3GHz)
| |
Crosshair V Formula | |
希捷 Barracuda XT 2TB | |
宇瞻獵豹 DDR3-1600 | |
ENERMAX ELT620AWT-ECO | |
AMD Radeon HD 6970(獨顯) | |
顯示器 |
優(yōu)派VX2423w(1920x1080) |
軟件系統(tǒng)配置 | |
Windows7 RTM 7600 64BIT |
測試平臺介紹
羿龍II X6 1100T基于六顆Thuban核心設(shè)計,采用了45nm制程,默認主頻設(shè)置在3.30GHz,外頻200MHz,倍頻16.5X,支持Turbo Core技術(shù),而且3MB二級緩存和6MB三級緩存的超大緩存量為大數(shù)據(jù)量的運算提供了支撐。
內(nèi)存:宇瞻獵豹超頻內(nèi)存
宇瞻第二代獵豹超頻采用獨特的窗孔式散熱鰭片,該技術(shù)主要是利用窗孔的通風從而在窗孔中加入散熱鰭片,從而能夠高效的使風帶走散熱鰭片上面的溫度,使內(nèi)存能夠保持一個良好溫度進行超頻和穩(wěn)定工作。窗孔式散熱片在上方還有一個螺旋紐扣,使兩個散熱片能夠和顆粒結(jié)合的更緊更牢固,從而使散熱片更好的帶走內(nèi)存顆粒上的溫度。此外,金色的散熱片非常搶眼,給人的第一印象非常高端尊貴。
獵豹內(nèi)存系列產(chǎn)品,不但有著高頻率、低延遲的性能優(yōu)勢外,而且在產(chǎn)品品質(zhì)上面,也采用了原廠特挑的模組顆粒,為了就是提高該產(chǎn)品的超頻性和穩(wěn)定性。
近期有消息透露AMD推土機架構(gòu)處理器將在9月份發(fā)布,并且其各種規(guī)格和性能也流露了出來,但就目前的成績并沒有滿足大家的希望。
AMD推土機處理器FX-8130P
上面就是被曝光的AMD推土機處理器規(guī)格以及性能,由于根據(jù)這些圖片還不能確定推土機的性能,因此筆者根據(jù)推土機的規(guī)格用目前的Phenom II處理器進行了性能模擬。
由于Phenom II處理器最高僅有六核心產(chǎn)品因此我們將模擬推土機相對應(yīng)的FX-6110,在規(guī)格表中我們看到FX-6110支持DDR3 1866的內(nèi)存頻率,并且推土機產(chǎn)品頻率都較高,還支持Turbo Core動態(tài)加速,據(jù)爆出的最新消息頻率應(yīng)該在3.8GHz,因此我們將Phenom II超頻到了類似規(guī)格。
經(jīng)過調(diào)試我們將AMD Phenom II 六核1100T超頻到3.8GHz,并且將內(nèi)存頻率調(diào)整到1866MHz,基本和推土機FX-6110的規(guī)格近,下面我們來看一下,測試成績的對比分析。
上面筆者提出了單線程性能在處理器中影響巨大,下面我們將AMD Phenom II 1100T默認和模擬推土機FX-6110的性能進行了對比,另外我們加入的Intel 2600K的成績對比。
圖形渲染效能:CineBenchR10
CineBench使用針對電影電視行業(yè)開發(fā)的Cinema 4D特效軟件引擎,可以測試CPU和顯卡的性能。Maxon公司表示,相對于之前的9.x版,R10版更能榨干系統(tǒng)的最后一點潛能,準確體現(xiàn)系統(tǒng)性能指標。最新R10版最高支持16核處理器。
CineBench R10可以針對不同處理器選擇不同的線數(shù)來進行渲染
從CineBench R10的單線程測試來看AMD確實不給力啊,雖然目前處理器都向多核心發(fā)展,但是單線程性能依然非常重要,另外我們不得不說Intel I7 2600K的單線程性能太強勁了,我們模擬出的FX-6110的性能還是不能追上2600K。
這是一款國際象棋測試軟件,但它并不是獨立存在的,而是《Fritz9》這款獲得國際認可的國際象棋程序中的一個測試性能部分。由于國際象棋的運算大致仍舊是依靠電腦CPU的高速處理能力,將每一個可能的走法以窮舉算法預(yù)測,從中選擇勝算最大的非常好的走法。所以用它來衡量對比不同的PC系統(tǒng)中CPU的多線程運算能力也是有參考價值的。
Fritz測試
在多線程的性能時我們看到了模擬出的FX-6110的性能列為第一,而2600K屈居第二,1100T排位第三名,從多線程的測試來看AMD推土機超越Intel的I7系列產(chǎn)品還是沒有問題的。
2600K內(nèi)存讀取成績都在一萬六以上
而1100T的帶寬還在一萬以下徘徊
模擬出的FX-6110也僅有一萬一千分左右
通過內(nèi)存的性能測試來看,AMD平臺的瓶頸確實不小,搭配1866MHz頻率的平臺內(nèi)存帶寬也僅有一萬一千分左右,為什么都是雙通道AMD平臺的內(nèi)存效率不高呢?下面我們來為大家解答
如果你是一位長期玩超頻、并且細心觀察的玩家,你會發(fā)現(xiàn)在AMD推出Phenom II以后其L3級緩存的性能基本是和內(nèi)存的讀寫性能沒有太大差別的,而Intel卻完全相反,其實這個原因就出自內(nèi)存控制器和L3級緩存的頻率上!
首先我們來看一下Intel的緩存,大家仔細看其L2以及L3級緩存的標注是On-Die ECC Full-Speed,這個意思就是On-Die(核心內(nèi)部)ECC(支持ECC校驗)Full-Speed(全速運行)!
其實前兩個規(guī)格已經(jīng)不太重要了,因為不論AMD還是Intel的緩存早就被封裝在了核心內(nèi)部,并且都支持了ECC校驗技術(shù),而Full-Speed(全速運行)才是重點,Intel Full-Speed(全速運行)就代表著L3級緩存適合主頻的速度完全同步的,換句話說就是主頻是多少L3級緩存的速度就是多少,另外Intel的內(nèi)存控制器也是Full-Speed! 好下面我們來看看AMD的緩存!
AMD處理器內(nèi)部的L2級緩存和Intel一樣On-Die ECC Full-Speed,但是L3級緩存我們看到了差異!
L3級緩存的標注是On-Die ECC NB-Speed !大家肯定要問這NB-Speed是個什么速度? 好下面我來為大家解釋!
AMD處理器內(nèi)部其實是以兩個頻率在運行的,L1以及L2級緩存和運算核心的速度是一致的,也就是主頻的速度!
而L3級緩存和內(nèi)存控制器的速度是一致,并且以另外一種頻率運行,上面說的NB-Speed其實就是內(nèi)存控制器(NB是內(nèi)存控制器)的速度,這個速度就是我們在CPU-Z內(nèi)存頁面看到的“注:后面”的這個頻率。
NB-Speed這個頻率其實是以一個較慢的速度運行的,1100T的主頻為3.3GHz,但是L3級緩存和內(nèi)存控制器的速度確僅為2000MHz,也就2Ghz。
Intel的處理器都以全速運行包括緩存和內(nèi)存控制器,而AMD確不同,到這里大家明白為什么AMD的內(nèi)存性能比較低了吧。好下面我們繼續(xù)來看游戲性能測試。
3DMark Vantage所使用的全新引擎在DX10特效方面和《孤島危機》不相上下,但3DMark不是游戲,它不用考慮場景運行流暢度的問題,因此Vantage在特效的使用方面比Crysis更加大膽,“濫用”各種消耗資源的特效導(dǎo)致Vantage對顯卡的要求空前高漲,號稱“顯卡危機”的Crysis也不得不甘拜下風。
畫面設(shè)置:3DMark Vantage中直接內(nèi)置了四種模式,分別為Extreme(旗艦級)、High(高端級)、Performance(性能級)和Entry(入門級),只有在這四種模式下才能跑出總分,如果自定義模式就只能得到子項目分數(shù)了。
3DMark Vantage
從3DMark Vantage的測試成績來看,AMD平臺的差距就顯露了出來,雖然模擬出的FX-6110相比1100T有些提升,但是由于單線程性能不濟,因此整體成績被Intel 平臺拉開了差距!
時至今日,依然沒有任何一個測試軟件或者游戲能夠取代3DMark在游戲玩家心目中的地位,因為3DMark的魅力就在于它所帶來的不僅僅是驚艷的畫面,更重要的是向廣大玩家提供了一種權(quán)威、系統(tǒng)、公正衡量顯卡性能的分值。
3DMark11的測試重點是實時利用DX11 API更新和渲染復(fù)雜的游戲世界,通過六個不同測試環(huán)節(jié)得到一個綜合評分,藉此評判一套PC系統(tǒng)的基準性能水平。
● 3DMark 11的特色與亮點:
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面細分、計算著色器、多線程。
2、原生支持64bit,保留32bit:原生64位編譯程序,獨立的32位、64位可執(zhí)行文件,并支持兼容模式。
3、全新測試場景:總計六個測試場景,包括四個圖形測試(其實是兩個場景)、一個物理測試、一個綜合測試,全面衡量GPU、CPU性能。
4、拋棄PhysX,使用Bullet物理引擎:拋棄封閉的NVIDIA PhysX而改用開源的Bullet專業(yè)物理庫,支持碰撞檢測、剛體、軟體,根據(jù)ZLib授權(quán)協(xié)議而免費使用。
● 3DMark 11 Extreme模式:
雖然在3DMark Vantage的測試中AMD平臺的性能稍弱,但是在高分辨率特效下得3DMark 11 Extreme模式中我們看到了I7 2600K和模擬出的FX-6110以及1100T的性能相差無幾!
游戲介紹:《沖突世界》將帶領(lǐng)玩家返回著名的冷戰(zhàn)時期,玩家每一個決定均影響游戲中人物和情節(jié)??捎谟螒蛑懈惺懿灰粯拥膱F隊精神,與隊友于陰森恐怖的戰(zhàn)場上一同作戰(zhàn)?!短K聯(lián)進攻》是其最新的資料片,收錄全新角色、扮演蘇聯(lián)軍隊、10套新影片和全新多人聯(lián)機地圖等等。
畫面設(shè)置:《沖突世界》是首批DX10游戲之一,采用了自行研發(fā)的MassTech引擎,支持多種當前的主流顯示特效,如容積云,景深效果,軟陰影等,光照系統(tǒng)也表現(xiàn)出色,尤其是半透明的容積云特效營造出了十分逼真的戶外場景,物理加速結(jié)合體積光照渲染出了最逼真的爆炸效果。
測試方法:內(nèi)置Benchmark是一段非常華麗的過場動畫作為測試程序,最終得出最大、最小和平均FPS,測試結(jié)果非常精確。
在《沖突世界:蘇聯(lián)進攻》這款游戲中我們看到了AMD 1100T在性能方面確實和I7平臺有些差距,但是模擬出的FX-6110以及將差距追平,看來AMD推土機還是會有不錯的表現(xiàn)!
游戲介紹:《鷹擊長空》由Ubisoft旗下的Bucharest Studio工作室所研發(fā)制作而成,以湯姆克蘭西最擅長的近現(xiàn)代國際沖突為背景,加上現(xiàn)代化的軍事武器,和五角大廈不愿證實的開發(fā)中的先進武器,交織出最激烈的高科技攻防戰(zhàn)。而《鷹擊長空》也脫離前面幾項作品的框架,將戰(zhàn)爭從地面拉拔到空中,享受廣大無界限的戰(zhàn)斗空間。
鷹擊長空的游戲測試中我們看到,我們模擬出的FX-6110和I7平臺的性能是比較接近的,而默認的1100T平臺的性能稍弱。
賽車游戲中,轟鳴的發(fā)動機聲、風馳電掣的急速快感,足以讓無數(shù)玩家腎上腺素飆升。也許正是如此,才使得賽車類游戲在眾多游戲中備受廣大玩家的青睞。繼4月初,EA早早推出了《優(yōu)品飛車15》之后,今天,另一款賽車類經(jīng)典力作《科林麥克雷:塵埃3》也正式發(fā)布。
09年末,其前作《塵埃2》帶著首款DX11游戲的光環(huán)強勢出擊,成為眾多DX11游戲中的經(jīng)典。如今,新作《塵埃3》將在諸多DX11游戲特效的力助下,使得游戲畫質(zhì)的表現(xiàn)更加出色、完美。
經(jīng)典新作《塵埃3》的游戲?qū)崪y中我們看到其測試成績?nèi)齻€平臺都是比較接近的,看來在高畫質(zhì)的游戲方面AMD即將推出的推土機性能還是可以滿足我們需求的!
上面筆者進行的模擬性能測試雖然不能完全代表AMD即將推出的推土機以及整體平臺的性能,但是相信大家還是可以看到一些有用信息。
比如在多線程應(yīng)用方面目前的1100T經(jīng)過超頻已經(jīng)可以具備挑戰(zhàn)2600K的能力,相信AMD推土機經(jīng)過了改良必然要再前者的性能之上!
說道改進,我們不得不說目前AMD的最具瓶頸的單線程以及內(nèi)存帶寬的效能,希望推土機在這兩點上能有大跨度的進步。
其實單單處理器性能有提升還不夠,平臺整體的性能還需要主板芯片組的支持,當然我們現(xiàn)在已經(jīng)看到了推土機御用的9系列芯片產(chǎn)品,剩下的就是等待AMD新一代“推土機”在短時間內(nèi)登臺。 ■<
關(guān)注我們
