[7800GTX專題]核心架構(gòu)解析&專業(yè)測試
隨著NVIDIA最新GeForce 7800GTX的發(fā)布,人們關(guān)注的焦點再次放到了高端圖形芯片的革新上。在了解了GeForce 7800GTX顯卡的性能和CineFX 4.0引擎的基礎(chǔ)上,想必您對GeForce 7800GTX的芯片架構(gòu)方面產(chǎn)生了更大的興趣,今天我們就再來看看GeForce 7800GTX圖形芯片的架構(gòu)方面有什么改進。
每一代新的圖形芯片,勢必在架構(gòu)上有重大改變,因為這是提升芯片性能的最重要途徑。僅僅是提升頻率,不能稱之為不同的芯片。在GeForce 7800GTX圖形芯片中,包含了NVIDIA最新的技術(shù),并且在架構(gòu)上比上一代產(chǎn)品有了更進一步的改進。
GeForce 7800GTX圖形芯片架構(gòu)上的改進主要體現(xiàn)在兩個方面:
◎ 并行性:GeForce 7800GTX在并行處理能力上有大幅度的提高,相比上一代產(chǎn)品,提供了更豐富的處理管線,從而讓性能得到了大幅的提升。
◎ 管線密度:GeForce 7800GTX圖形芯片并不是上一代產(chǎn)品的管線數(shù)增加的版本,而是真正對管線內(nèi)部進行了改進,每一個管線均有內(nèi)在的改進,提升了單個管線的處理能力。并且在處理數(shù)據(jù)的精度上有了進一步的提升。
在了解GeForce 7800GTX圖形芯片的架構(gòu)之前,我們先從微觀的角度來看看這款芯片。

在GeForce 7800GTX芯片上,集成了高達3億200萬的晶體管,可以說是世界上最復雜的芯片了。
這3億200萬個晶體管代表什么意思呢?我們給大家算個加法大家就明白了:
芯片 | 晶體管數(shù)目 |
PS2 CPU | |
PS2 圖形芯片 | |
XBOX CPU | |
XBOX 圖形芯片 | |
NGC CPU | |
NGC 圖形芯片 | |
Athlon 64 FX55 | |
合計 |
我們看到,即使將目前市場上非常先進的3款游戲機的處理器和圖形芯片加起來,再加上PC上最快的處理器Athlon64 FX55,總共的晶體管數(shù)目只有300.4M,也就是3億40萬個,還沒有GeForce 7800 GTX圖形處理器的一顆多。

圖形芯片 | 頂點處理管線 | 像素處理管線 |
GeForce 7800 GTX | 8 | 24 |
GeForce 6800 Ultra | 6 | 16 |
GeForce 6800 GT | 6 | 16 |
GeForce 6800 | 5 | 12 |
GeForce 6800 Le | 5 | 8 |
GeForce 6600 GT | 3 | 8 |
GeForce 6600 | 3 | 8 |
GeForce 6200 | 3 | 4 |
首先我們來看看在GeForce 7800GTX全新的架構(gòu)中VertexShader Unit(頂點渲染單元)的具體架構(gòu)。
然后我們再來看看在GeForce 7800GTX圖形芯片中像素渲染管線的具體架構(gòu)。
那么經(jīng)過這些改良的GeForce 7800GTX圖形芯片的性能將有多大的性能提升呢?我們特別安排了專門針對Shader性能的測試,首先我們使用3DMark05中自帶的測試功能對VertexShader的性能進行了測試:
在這個測試中,測試的過程主要是考察處理頂點的能力,所以受分辨率的影響不是很大,通過測試我們也驗證了這一點,所以我們僅僅用一個常用的分辨率來進行這個測試。
在對Vertex Shader進行了測試之后,我們再來看看Pixel Shader的性能測試。同樣的,我們使用3DMark 05中所提供的測試選項進行測試。
![[7800GTX專題]核心架構(gòu)解析&專業(yè)測試](http://sy0.img.it168.com/pcpop_default.png)
![[7800GTX專題]核心架構(gòu)解析&專業(yè)測試](http://sy0.img.it168.com/pcpop_default.png)
和前面我們測試的VertexShader不同,PixelShader的性能很大程度上會受顯示分辨率的影響,所以我們看到,不同的分辨率的性能也有著比較大的差異。
除了使用3DMark 05中自帶的測試功能之外,我們還使用了更為專業(yè)的Shader測試軟件進行測試,我們使用的是ShaderMark最新的2.1版。
ShaderMark是一個專門測試3D Shader性能的測試軟件,這個測試軟件其中自帶了實現(xiàn)多種效果的Shader,通過運行這些Shader來測試顯示芯片的性能。
在最新的2.1版本的ShaderMark中,支持最新的DirectX 9.0中的ShaderModel 3.0。ShaderMark 2.1能夠很好的提供對SM3.0的支持,并且可以表現(xiàn)出ShaderModel 3在畫質(zhì)和性能上的優(yōu)勢。
Shader精度 | RADEON X850XT | GeForce 6800 Ultra | GeForce 7800 GTX |
Pixel Shader 1.1 完全精度 | s16e7 | s10e8 | s10e6 |
Pixel Shader 1.4 完全精度 | s16e7 | s10e8 | s10e6 |
Pixel Shader 2.0 完全精度 | s16e7 | s23e8 | s23e8 |
Pixel Shader 2.0 局部精度 | s16e7 | s10e5 | s10e5 |
Pixel Shader 3.0 完全精度 | s0e0 | s23e8 | s23e8 |
Pixel Shader 3.0 局部精度 | s0e0 | s10e5 | s10e5 |
這里特別說明一下,上表中“s10e6”代表10位底數(shù)6位指數(shù)的有符號數(shù)。
下面我們就來看看在ShaderMark 2.1中各種Shader的執(zhí)行效率。ShaderMark中包含了各種各樣的特效Shader一共24個,下面是我們的測試結(jié)果。
Shader種類 | X850XT | 6800U | 7800GTX |
Per Pixel Diffuse Lighting | 964 | 898 | 1553 |
Per Pixel Directional Light Shader (Phong) | 721 | 718 | 1316 |
Per Pixel Point Light Shader (Phong) | 719 | 718 | 1316 |
Per Pixel Spot Light Shader (Phong) | 596 | 658 | 1077 |
Per Pixel Anisotropic Lighting | 721 | 718 | 1316 |
Per Pixel Fresnel Reflections | 629 | 658 | 1196 |
Per Pixel Car Surface Shader | 403 | 416 | 778 |
Per Pixel Environment Mapping | 1205 | 1075 | 1674 |
Per Pixel Environment Bump Mapping | 792 | 837 | 1316 |
Per Pixel Bump Mapping | 671 | 703 | 1196 |
Per Pixel Shadowed Bump Mapping | 245 | 459 | 702 |
Per Pixel Veined Marble Shader | 347 | 419 | 778 |
Per Pixel Wood Shader | 387 | 448 | 837 |
Per Pixel Tile Shader | 284 | 325 | 568 |
Per Pixel Refraction and Reflection Shader with Phong Lighting | 326 | 347 | 626 |
Per Pixel BRDF-Phong/Anisotropic Lighting | 417 | 438 | 837 |
Fur Shader With Anisotropic Lighting | 42 | 54 | 76 |
Combination Effect | 137 | 178 | 311 |
Dual Layer 8x8 PCF Shadow Mapping without Flow Control | 46 | 60 | 105 |
Dual Layer 8x8 PCF Shadow Mapping with Flow Control | 不支持 | 88 | 101 |
205 | 119 | 267 | |
不支持 | 134 | 299 | |
143 | 84 | 198 | |
Per Pixel Edge Detection And Hatching Shader using 1 RT and 2 Passes | 121 | 94 | 180 |
我們注意到在HDR特效上,X850XT有的項目不支持。在成績方面,我們看到,GeForce 7800GTX的性能比前面的兩塊顯卡高很多,基本上都是翻倍的提升,這證明GeForce 7800GTX在Shader的運行效率上的確有很大進步。
● 總結(jié)
GeForce 7800GTX圖形處理器在架構(gòu)上的改變是明顯而且有效的,同時選擇增加管線的數(shù)目和提升管線的能力是一個很好的主意,這樣從兩方面入手,使得在管線數(shù)目增加不到1倍的情況下實現(xiàn)了性能的翻倍。
關(guān)注我們
