国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

王者歸來!NVIDIA歷代旗艦級顯卡回顧

    泡泡網(wǎng)顯卡頻道3月16日 兩軍交戰(zhàn),陣前能斬落敵方武將于馬下,則士氣大振,已然勝了一半。而在PC領域,處理器和顯卡等核心產(chǎn)品線的戰(zhàn)場上也是同樣的道理,旗艦級顯卡作為各自最強3D圖形性能的代表,肩負著展示技術、樹立形象、打擊競爭的特殊使命。

    NVIDIA和AMD兩大巨頭之間每一次優(yōu)異產(chǎn)品的對決都可以用驚天地、涕鬼神來形容!對于消費者來說,新旗艦的性能總能給人驚喜,更讓人激動的是那些首次應用的新技術和特效:革命性的架構往往就是從旗艦顯卡開始!

    在兩大圖形巨頭日漸白熱化的競爭中,半年更新、一年換代早已成為顯卡領域的“摩爾定律”。而每當新王者登基、改朝換代之時,我們也會于第一時間為大家獻上詳細的評測文章。歲月如斯,顯卡已經(jīng)伴我們走過十余載,每每想起TNT時代的時光,曾經(jīng)的感動就涌上心頭,今天我們就來緬懷一下昔日的王者,重新尋找落寞的皇族!

    在Riva 128面世之前,NVIDIA還只是一家默默無聞的小公司,處女作NV1是款聲卡顯卡二合一的產(chǎn)品,未能得到眾廠商認可;NV2胎死腹中;而NV3則依靠對微軟Windows系統(tǒng)的完美支持以及Direct3D標準的壯大一舉成名,稱為當時圖形霸主3DFX的強力競爭對手!

Windows 95和Direct3D開辟電腦圖形新戰(zhàn)場

成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧

Windows 95的震撼力遠大于如今的Windows 7

    1995年8月,微軟發(fā)布了Windows95操作系統(tǒng),憑借嶄新的圖形交互式界面設計,很快席卷了全球個人電腦市場。在PC領域,微軟的成功是空前的,幾乎沒有遇到任何可以匹敵的對手。微軟的Windows95操作系統(tǒng)憑借接近90%(PC OS)的市場占有率,直接代動了相關硬件產(chǎn)品的需求,也使得全球的硬件軟件廠商都不得不向其靠攏。由于微軟的Windows95采用圖形交互式界面(GDI),對于顯示芯片有了更高的要求,這也正式揭開了電腦圖形市場的龍爭虎斗!

    在之前的1995年2月,微軟收購英國Rendermorphics公司,利用其所有的RealityLab 2.0技術制定了Direct3D標準,整合在其WINDOWS操作系統(tǒng)中,對PC圖形芯片市場產(chǎn)生了巨大影響。

NV3=Riva 128,首次大獲成功:

    此時的NVIDIA總結了前2款芯片的經(jīng)驗教訓,在經(jīng)過細致的市場分析之后,將研發(fā)的方向定位于市場前景廣闊的PC圖形芯片市場,并且決定加入對DirectX的支持。這無疑是個非常明智的選擇,在當時由于3DFX的GLIDE的成功,各家顯示芯片公司紛紛效仿,也想推出自己的3D API,例如,3dfx有GLIDE、PowerVR的PowerSGL、ATI的3DCIF,無疑使得微軟Direct 3D的推廣十分緩慢,NVIDIA此時選擇旗幟鮮明的站到了Direct 3D的一邊,這種做法也受到了微軟的賞識,從而有了一個堅強的后盾。

    另外,當時在3D FPS游戲市場,獨領風騷的是ID SOFRWARE的QUAKE系列,而其程序設計師JOHN CARMARK明確的拒絕了3DFX采用GLIDE的建議,而是基于公開的OPENGL API開發(fā),這無疑也是NVIDIA得以崛起的另一個因素。而且,經(jīng)過時間的考驗,至今這兩家公司仍然保持了非常好的關系。后來在Quake3的硬件加速問題上,John Carmack甚至拒絕提供任何形式的MiniGL加速,而要求所有圖形卡運行在OpenGL ICD環(huán)境下,使得3DFX相當難堪。

RIVA 128(NV3)

    接著,為配合研發(fā)方向的轉變,NVIDIA聘請了David Kirk(NVIDIA首席科學家,現(xiàn)已當選美國國家工程院院士),并將其任命為技術總監(jiān)。1997年,NV3終于面世,被命名為RIVA 128。它也是第一個提供硬件三角形引擎的128 bit圖形芯片,雖然RIVA 128的圖像質量比不上3dfx Voodoo,但是憑借100M/秒的像素填充率和對OPENGL的良好支持,RIVA 128在非GLIDE API的游戲中完全超過了Voodoo,迅速贏得了消費者和一些OEM廠商的青睞。

Diamond Viper 330(RIVA 128)

    Riva128支持AGP 1x規(guī)范,可以配合Intel的LX芯片組主板使用。1997年底,Dell、Gateway等廠商相繼使用了RIVA 128顯卡。零售市場上,Diamond、STB、ASUS、ELSA和Canopus等也都相繼推出了基于此芯片的產(chǎn)品。不到一年,Riva 128的出貨量就突破100萬顆,NVIDIA終于憑借NV3打了個翻身仗。

    總的來看,Riva 128取得成功的因素是多方面的,本身的處理性能固然很重要,但是1998年游戲軟件方面的發(fā)展變化也很關鍵:

    首先,年初ID開放了QUAKE2引擎的授權,包括VALVE在內的游戲軟件開發(fā)商在3月份就獲得了QUAKE2引擎的源代碼,并用于游戲的開發(fā),使得QUAKE2引擎的3D游戲名作諸如《異教徒》、《半條命》等大量上市,Riva 128良好的OpenGL性能得到了充分的發(fā)揮。

    第二,3DFX的GLIDE API失去了過去在游戲開發(fā)領域的統(tǒng)治地位,最著名的兩個例子就當時稱得上是風靡世界的古墓麗影2和優(yōu)品飛車3,這兩個過去本來是GLIDE的御用游戲,都加入了對D3D的支持,Riva 128等非VOODOO顯卡也可以通過D3D接口很完美的運行游戲。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
當時主要3D顯卡規(guī)格對比
 
    半年后,NVIDIA又發(fā)布了Riva 128ZX,并為它提供了完整的OpenGL支持,在Win95/98和WinNT4.0下都有完整的OpenGL ICD驅動程序。同時,Riva 128ZX還解決了Riva 128的一些BUG,顯存也增至8MB,效能改善比較明顯。

NV4=TNT震撼發(fā)布,雷管引爆性能

 
    1998年10月,NVIDIA發(fā)布了TNT,TNT是TwiN Texel的縮寫。核心架構為2條32bit象素流水線的渲染體系,每條象素流水線有1個TMU,在每個時鐘周期內并行處理兩個紋理。這樣工作在90MHz的RivaTNT最大填充率能達到180M Texels/sec。同時Riva TNT還首次擁有24bit Z緩沖(Z-Buffer)以及8位的stencil buffer。
 
    成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧

    TNT的設計目標是要達到Voodoo2兩倍的性能,不過由于0.25微米制程在當時沒有完善,NVIDIA只好采用了0.35微米制程,使得RivaTNT只能工作在90MHz下。不過即便如此,RivaTNT還是擊敗了Voodoo2,成為當時速度最快的3D加速卡。超過Voodoo2兩倍性能的任務也就交給了后面的TNT2來完成。
 
    而且NVIDIA也注意到優(yōu)良的驅動程序對充分發(fā)揮顯示芯片性能的重要性,并為RIVA TNT編寫了全新的驅動,并命名為“雷管”(Detonator)。
 
    憑借出色的3D性能,德國的ELSA 、美國的Canopus等四家顯卡生產(chǎn)商宣布加入NVIDIA陣營,著名的CreATIve公司也在第一時間推出了基于TNT顯示芯片的產(chǎn)品。9月,NVIDIA被《個人電腦雜志》評為最有影響力的顯示芯片生產(chǎn)商,而TNT被Mercury研究公司評為速度最快的顯示芯片。同時,NVIDIA還被OpenGL架構委員會吸納為新成員,成為第一個加入OPGL ARB的專業(yè)顯示芯片設計公司。
 
NV5=TNT2,性能翻倍,奠定NVIDIA王朝
 
    1999年4月,核心代號為NV5的RivaTNT2發(fā)布了,由于采用了0.25 微米制程,TNT2標準版的頻率提高到125MHz,頻率的提升以及核心內部的優(yōu)化,RivaTNT2的性能有了一個較大的飛躍,性能在當時無人可及。后期RivaTNT2還采用了0.22微米制程,頻率進一步提升。
 
   成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧

名稱

RIVA TNT

RIVA TNT2 

架構

NV4

NV5

制造工藝

0.35 Micron

0.25 Micron

晶體管數(shù)目

7 Million

15 Million

DirectX支持

6

6

頂點管線

1

1

VS版本

-

-

像素管線

2 x 1

2 x 1

PS版本

-

-

核心頻率

90 MHz

125 MHz

填充率

180 MTexels/s

250 MTexels/s

顯存位寬

128-bits

128/64-bits

顯存類型

SDR

SDR

顯存速度

110 MHz

150 MHz

顯存帶寬

1.76 GB/s

2.40/1.00 GB/s

    從TNT2開始NVIDIA對產(chǎn)品進行了市場化細分,在高中低端,面向多種不同的用戶,TNT2芯片衍生出TNT2 Vanta、TNT2 M64、TNT2、TNT2 Pro、TNT2 Ultra等不同的型號產(chǎn)品,搭配不同顯存的容量,產(chǎn)品線覆蓋了大部分的市場。

TNT2 Ultra

    TNT2 Ultra是系列最高端產(chǎn)品,也是NVIDIA第一次使用Ultra后綴命名高端產(chǎn)品,TNT2 Ultra只是從NV6核心中挑選出的品質優(yōu)秀的芯片,并搭配了速度最快的顯存,其核心/顯存頻率高達150/183MHz,后期更是提高到175/200MHz,性能上超過了3DFX的VOODOO3 3500以及MATROX的G400 Max,而且支持的特效也很全面(比G400少一個EBM環(huán)境凹凸貼圖),成為當時性能之王。當然TNT2 Ultra的售價也很高,當時麗臺、華碩、創(chuàng)新等一線品牌TNT2 Ultra的國內上市售價高達2300元(1999年5月)。

    TNT2標準版是高端系列的普及型產(chǎn)品,也是TNT2 Ultra的降頻版,核心/顯存頻率為125/150MHz,但是由于TNT2采用0.25微米工藝,核心普遍可以工作在150MHz左右,所以也造就了良好的超頻能力,于是眾多游戲發(fā)燒友更傾向于購買TNT2標準版版超頻至TNT2 Ultra來使用,記得當時甚至還有不少玩家超到了165/200MHz的水平,性能也是也達到了一個新的高度。價格上TNT2標準版也更有優(yōu)勢,32MB顯存的TNT2國內上市售價為1500-1750元左右,16MB的TNT2 Pro則在1350-1500左右。

NV6=NV5工藝改進版,TNT2 Pro/M64/Vanta誕生

    后期隨著制程的進步,NV6也使用了0.22微米工藝,并被命名為TNT2 PRO,也被用于部分TNT2 Ultra。由于使用0.22微米制程后,TNT2 PRO的成本、功耗有、發(fā)熱有明顯下降,超頻能力更強,性價比進一步提高。除了高中端的TNT2標準版外,NVIDIA同時也利用0.22微米工藝的NV6芯片,推出了針對中低端用戶的TNT2 Vanta和TNT2 M64。

    1999年8月,伴隨著微軟DirectX 7.0的發(fā)布,引入基于圖形核心的多邊形轉換與光源處理(Transform and Lighting),而且10月上市QUAKE3引擎也采用了這種技術。

 
● 硬件T&L,首款GPU誕生,GeForce的時代來臨
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
傳統(tǒng)3D圖形管線
 
    在Direct7時代,多邊形轉換和光照處理是由CPU負責的,大量復雜的數(shù)學運算對CPU造成了極大的負擔,而GeForce 256可以支持硬件Transform and Lighting,也成為了第一個GPU圖形核心。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
  
    GeForce 256是被作為一個圖形處理單元(GPU)來設計的,GPU是一個單芯片處理器。它有完整的轉換、光照、三角形設置和渲染引擎(分別為:Transform、Lighting、Setup、Rendering)等四種3D處理引擎,一些以前必須由CPU來完成的圖形運算工作現(xiàn)在可以由GeForce256 GPU芯片獨立完成,大多數(shù)情況下具有完整的傳輸和光照相引擎的GPU運算速度比CPU快2-4倍,同時也有效地減輕了CPU的浮點運算負擔,減少了對CPU的依賴性。
 
    NV10圖形核心,為0.22微米工藝制造,集成了2300萬個晶體管,在當時已經(jīng)超過了PentiumIII的數(shù)量,本應采用0.18微米的制造工藝,不過為了盡早搶占市場,仍然采用了0.22微米,如此大量的晶體管數(shù)量芯片的發(fā)熱和功耗也是不小的問題,NVID1A公司只好將其核心頻率定為120MHz,不過憑借創(chuàng)紀錄的有4條象素管線,峰值像素填充率達到480M/s,遠高于TNT2 Ultra。
 
    Geforce 256具有了現(xiàn)代GPU的大部分的初步特征,核心采用了256位渲染引擎,具有4條象素管線,每管線一個紋理映射單元,它也是第一個使用DDR顯存的PC顯卡。Geforce 256核心頻率為120MHz,三角形生成率為1500萬個/秒,峰值像素填充率達到480 M/s,并使用了四紋理(Quad Texel)引擎,相同頻率下,Geforce 256的紋理處理性能是TNT2的兩倍。特效方面,支持立方體環(huán)境映(Cube environment mapping)以及頂點混合、紋理壓縮和凹凸映射貼圖等。視頻方面,為了加強為MPEG-2視頻回放性能,NV10中加入了硬件動態(tài)補償功能。

GeForce 256 DDR
 
    GeForce 256 DDR的顯存頻率為300MHz,帶寬由SDRAM的2.66 GHz提升至4.8 GHz,也達到了當時PC圖形卡的巔峰,使得GeForce 256像素填充能力進一步爆發(fā),在高分辨率下、32BIT渲染環(huán)境中表現(xiàn)趨于完美。由于當時DDR顯存售價也是十分的昂貴,所以GeForce 256 DDR的售價也是高達到2500元以上。

GeForce 256 SDR

    GeForce 256 SDR版的售價上有不小的優(yōu)勢,在國內的售價至少比GeForce 256 DDR要便宜500元。其顯存頻率為200MHz,帶寬2.4GB/S,這樣對NV10核心的性能有了不小的限制,高分辨率、32為色深下的性能下降很大,幾乎和TNT2 Ultra相近,但由于成本下降不少因此銷量也不錯。

GeForce 2代,您知道GTS的含義嗎?

 
    2000年5月,研發(fā)代號為NV15的新一代圖形核心問世,由于其紋理填充率達到了創(chuàng)紀錄1.6Giga texels/sec,也是第一個紋理填充率過億的GPU,所以NVIDIA將其命名為GeForce2 GTS以紀念其特殊的歷史含義。

    GeForce2 GTS 采用了更先進的0.18微米制程,核心頻率200MHz,也具有4條象素管線,和GeForce256不同的是,每管線采用了兩個紋理映射單元,這一經(jīng)典的4x2架構一直延續(xù)GeForce4才結束。
 
    
 
    NV15采用了第二代的T&L引擎(2nd GenerATIon Transform and lighting) ,支持立方體環(huán)境映(Cube environment mapping) 、頂點混合(Vertex blending)、 材質保護(Protective textures) 、材質壓縮(Texture compression)、逐象素著色控制(Per-Pixel Shading Control), 核心還具有多結構圖形Single Pass處理、 硬體反鋸齒(Anti-Aliasing)效果處理 、各異向性過濾(Anisotropic)處理。
 
    GeForce2上也首開了PC圖形核心通用計算的先河,憑借其強大的多紋理處理性能,結合紋理環(huán)境參數(shù)和紋理函數(shù)可以實現(xiàn)一些很靈活的應用。它具有Texture Shader以及Register Combiner單元,有一定的數(shù)值計算能力。開發(fā)人員可以利用Texture Shader的依賴紋理進行數(shù)據(jù)訪問,用Register Combiner進行計算。GeForce2被用于求解數(shù)學上的擴散方程,成為GPU通用計算的最早應用。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
規(guī)格一覽
 
    值得注意的是,在GeForce2 GTS 上,NVIDIA Shading Rasterizer(NSR)技術被正式引入。NSR讓處理器每次可對單一像素進行七項運算,包括:基本貼圖、單像素曲面映射(bump mapping)、單像素diffuse lighting、單像素specular lighting、顏色煙霧效果、ambient light、以及Alpha transperency。過去,GPU對Vertex(即三角形的三點)上的像素進行運算,再以平均值來決定整個三角形的光影和bump mapping(凹凸映射)等效果。而NV15可以對三角形上的每個像素(Per-Pixel Shading )進行運算,因此光影效果更加細致和準確。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
Geforce2架構圖
 
    另外,相比GeForce 256,GeForce 2 GTS另一個進步是采用單周期雙紋理處理技術,不僅擁有4條像素渲染管線,而且每管線每周期可以處理兩個紋理貼圖,當時游戲畫面的提高基本上都是通過大量的多邊形、更復雜的貼圖來實現(xiàn)的,QUAKE3引擎以DirectX 7來說都是如此,所以強大的紋理貼圖對提高游戲速度很有幫助。三角形生成率為2500萬個/秒。
 
    GeForce 2 GTS 的另一個革新在于其首次采用了0.18微米工藝制程,由TSMC制造的GeForce2 GTS(0.18微米,564 PBGA 封裝)中,晶體管數(shù)目已經(jīng)增加到了2500萬,采用0.22微米GeForce256的晶體管數(shù)目為2200萬到2300萬。而相對于功耗18w 的GeForce256,GeForce2 GTS的耗電量僅僅10w左右,功耗大幅度下降。而且制造工藝的革新讓GeForce2 GTS成為了核心頻率首次超過200MHz的GPU。
 
    由于完整支持DirectX 7.0與OpenGL 1.2 ICD,所以不僅在3D游戲的表現(xiàn)超越了所有的同級顯卡,在工作站級3D應用設計上也有不俗的表現(xiàn)。GeForce2 GTS在多媒體性能也有一定的提高,可以連接更多的周邊設備。 DVD壓縮方面使用新一代Enhance Motion CompensATIon硬件解壓縮,使得 DVD的品質與速度都非常不錯。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
視頻功能強大
 
    2000年10月,在ATI正式發(fā)布Radeon256后,NVIDIA推出了GeForce 2 Ultra,依然牢牢控制著顯示性能的制高點。
   
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧

GeForce 2 Ultra
 
    GeForce 2 Ultra相比GeForce 2 GTS有著更高的顯存及核心頻率。其核心頻率為250 MHz,所以GeForce 2 Ultra的峰值像素填充率達到了1GB/s,而其紋理填充率高到2GB/s,后來的GeForce3 Ti 500甚至也沒能超過這個高度,也遙遙領先于其競爭對手Radeon 256。
 


 
 
 
 
 







 
 
DX8時代,考驗像素和頂點能力
 
   2001年以后,由于NVIDIA已經(jīng)完成了對3DFX的收購,顯卡市場演變?yōu)镹VIDIA與ATI兩雄爭霸的局勢。

 
    而在此時,微軟正式推出了劃時代的DIRECTX8 ,將可編程的著色管線概念正式引入到GPU,新的shaders(光影處理器)數(shù)據(jù)處理方式也是DirectX 8中最具意義的創(chuàng)新。Shader采用了新的數(shù)據(jù)處理程序模型,這與舊有的預定義模型是不同的。這種模型中,數(shù)據(jù)是透過virtual machine以一個類似于帶有特殊匯編指令集的pre-arranged(事先安排好)程序進行處理的,程序員可以直接對其進行編程。
 

 
    憑借可編程幾何管線和可編程像素管線,使用者可以自由的控制幾何和像素的代碼設計。這對于圖形開發(fā)者是空前的,他們可以通過基本的著色器,利用開發(fā)工具,產(chǎn)生全新的,極具創(chuàng)造力的效果。也正是可編程管線的引入,為GPU發(fā)展翻開了新的篇章,GPU開始向SIMD處理器方向發(fā)展,憑借強大的并行處理性能,使得GPU開始用有了部分流式處理器特征。
 
● 首款DX8顯卡,GeForce 3發(fā)布
 
    2001年初,NVIDIA正式發(fā)布Geforce 3 ,代號NV20。從Geforce 3開始,可編程的nFiniteFX SHADER引擎正式被引入,完整實現(xiàn)了對Pixel shaders和Vertex shaders 處理單元的硬件支持,Geforce 3也是2001年上半年唯一完全可以支持DirectX8.0的GPU。
 

 
    Geforce 3默認核心頻率為200MHz,擁有4條管線,每管線2個TMU(紋理貼圖單元),這和Geforce 2是一樣的,所不同的是Geforce 3還擁有一個Vertex shaders 單元,以及4個Pixel shaders單元,這也是和Geforce 2質的區(qū)別。
 

 

 

GeForce 3 Ti

 

    NVIDIA在Geforce3還在采用了第一代的“光速顯存架構”(Light Speed Memory Architecture)采用了一系列新技術來充分利用顯存提供的帶寬。光速顯存架構采用的第一個技術是“顯存交錯控制”技術,由芯片內核集成的專門的顯存控制單元來完成。光速顯存架構另一個技術是“無損Z壓縮算法”,在不降低畫質的前提下大大降低了Z-緩存數(shù)據(jù)對顯存帶寬的占用。除此之外,Geforce3中還加入了一個被稱之為Z軸吸收選擇(Z-Occlusion Culling)的技術來達到隱面消除技術(HSR)的效果以盡量減少不必要的資源消耗。
 
    不過Geforce 3上市后在當時大部分DX7以及QUAKE3游戲的主流分辨率中,GeForce 3并沒有能完全超過GeForce 2 ULTRA,確實出乎所有人意料。但由于首次使用交錯內存結構,超高的內存效率使得GeForce 3在高分辨率下還是有很強的優(yōu)勢。此后隨時間的推著移,大量DIRECTX8的游戲上市,人們才意識到在畫面Geforce 3特效方面帶來的革新與震撼。
 
對抗8500,GeForce 3細分為Ti 500/200
 
    GeForce 3上市后,伴隨著新一代DirectX8的游戲引起了不小的轟動,市場反響也很不錯,,但是300多美元的售價阻礙了GeForce 3的普及。2001年秋,NVIDIA又對市場進行了細分,由GeForce 3派生出面向中端的GeForce 3 Ti 200和具有最優(yōu)異性能、直接對抗Radeon 8500的GeForce 3 Ti 500。
 

 

 

耕升GeForce3 Ti500
 
    GeForce3 Ti200相對于標準版的GeForce 3,核心/顯存頻率從200/230 MHz降至175/200 MHz,這樣在性能上與GeForce 3標準版拉開了一定的距離,而且較低的運行頻率提高了使得對良品率的要求不再苛刻,同時供電電路的精簡也使板卡廠商降低生產(chǎn)成本。過低的默認頻率也給了GeForce3 Ti200相當大的超頻潛力,從而成為當時2000元左右最具性價比的高端產(chǎn)品。由于硬件上可以完整支持DirectX8,在這個價位上優(yōu)勢明顯,所以迫使對手ATI把僅支持DirectX7的Radeon 7500從上市初的1999元降到了1500以內。根據(jù)當年測試表明,Inno3D GeForce3 Ti200顯卡憑借出色的品質很容易通過超頻達到GeForce 3標準版的200/230 MHz頻率下,受到游戲玩家的追捧。
 
     GeForce3 TI500擁有系列中最高的頻率,達到240/250 MHz。GeForce3 Ti500使用8層PCB以及更奢華的作工用料來確保高頻率下的穩(wěn)定運行,價格因此也居高不下,當時售價為3000人民幣左右。 面對晶體管數(shù)量更多、頻率高于自己Radeon 8500,GeForce3 TI500得益于優(yōu)秀的驅動支持,在于Radeon 8500對抗中絲毫不落下風,但功耗方面卻更具優(yōu)勢,成為當時高端游戲顯卡的首選
    由于競爭對手ATI在2001年秋發(fā)布了的Radeon 8500,也是在高端市場上第一次略微領先了NVIDIA。雖然憑借出色的驅動支持,TI500在游戲中仍然有一定的優(yōu)勢,但是即使這樣,Radeon 8500和TI500的勢均力敵的態(tài)勢,還是給了NVIDIA一定的壓力。
 
● 為了王位!GeForce 4 Ti發(fā)布

GeForce4 Ti 4600 128MB DDR 128bit, 300/650 MHz
 
    于是,2002年2月,NVIDIA發(fā)布了研發(fā)代號為NV25的GeForce4 Ti系列顯卡,也是DirectX 8時代下最強勁的GPU圖形處理器。GeForce4 Ti芯片內部包含的晶體管數(shù)量高達6千3百萬,為改良的TSMC 0.15微米工藝生產(chǎn),采用了新的PBGA封裝,運行頻率達到了300MHz。核心集成的6300萬個晶體管相當于Athlon CPU的2倍,發(fā)熱也不小,所以GeForce4 Ti系列顯卡上都配備了散熱風扇。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
 NV25核心內部
 
    NV25擁有4條素管線,每管線2個TMU(紋理貼圖單元),這和前兩代產(chǎn)品是一樣的,所不同的是Geforce 4還擁有2個Vertex shaders單元,以及4個Pixel shader單元。
 
    GeForce4 Ti采用了第二代nfiniteFX 引擎,它是從GeForce3時代開創(chuàng)的nFiniteFX引擎改進而來的,頂點SHADER單元增加到2個,像素著色單元的效率顯著的提升。GeForce4 Ti也同時引入了第二代LightSpeed Memory Architecture II(LMA II)光速顯存構架技術,在全屏反鋸齒方面,GeForce4 Ti采用了新的Accuview AA技術。從總體上看,GeForce4 Ti也是從GeForce3的加強優(yōu)化版本,核心增加了一個頂點單元,同時頻率也比GeForce3有了很大的提升。

生不逢時的鈦極4800:

    2002年底,市場正式開始從AGP4X向AGP8X過渡,NV也順應時勢的推出了GF4 TI4200/4800-8X,除了接口帶寬升級之外,頻率也略有提升,性能更上一層樓。

    但在此時,微軟的DirectX 9 API標準已經(jīng)成型,ATI率先發(fā)布首款DX9顯卡Radeon 9700/9500,不但性能上完全超越了GeForce Ti 4000系列,而且支持新的圖形標準,這對NVIDIA造成了不小的壓力。而此時NVIDIA全新架構的GeForce FX系列正面臨制造工藝和技術方面的難題,屢次延期導致產(chǎn)品線青黃不接。

    所以說GeForce 4 Ti 4000系列雖然性能不錯,而且性價比很高,但生不逢時!

最具爭議的作品——GeForce FX系列


    2002年11月18日,Comdex 2002上,NVIDIA發(fā)布了研發(fā)代號NV30的GeForce FX,這也成了歷史上NVIDIA最具爭議的一款產(chǎn)品。在回顧GeForce FX系列產(chǎn)品前,我們不妨先對NV30的問世背景做個簡單介紹。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
 GeForce FX看上去很美好
 
    眾所周知,從DirectX 6時代確立優(yōu)勢地位以來,經(jīng)過DirectX 7、8兩代的發(fā)展,伴隨著與微軟的良好合作,NVIDIA成為了桌面PC獨立顯示核心的霸主,市場占有率成倍提升。在收購了3DFX以后,NVIDIA又通過GeForce 3、4兩代產(chǎn)品在市場占有率方面擊敗了另一個對手ATI,而且,通過雄厚的技術實力,其每半年更新一代的做法也令對手疲于奔命。隨著GeForce 4的成功,NVIDIA也處于歷史上的最巔峰時期,產(chǎn)品不僅局限于PC顯示核心,更延伸到主版芯片組,電視游戲機領域。
 
    不過NVIDIA的一家獨大也引起了一些業(yè)內人士的不滿,他們指責NVIDIA是圖形業(yè)內的Intel。當然這也使與NVIDIA一貫合作良好的微軟有所注意,尤其是NVIDIA在DirectX 8標準制定過程中的某些做法以及開發(fā)自主的CG語言等,使得微軟不等不重新審視這個昔日的合作伙伴,兩家公司的開始逐漸變得貌合神離。
 
    后來,在NVIDIA為微軟提供XBOX硬件解決方案的過程中,隨著制造工藝的進步,硬件產(chǎn)品的制造成本是逐漸下降的,但是NVIDIA與微軟的合同中并未考慮這一點,等到微軟意識到這一點后,希望修改合同中的部分內容,但卻遭到了NVIDIA的拒絕……
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
DX9第一代產(chǎn)品讓NVIDIA一敗涂地
 
    作為回應,DirectX 9規(guī)范的制定過程中,竟然沒有考慮任何NVIDIA的意見。在參考了ATI的部分提議后,微軟將24BIT渲染精度、著重于Shader并行處理性能等作為DirectX 9的主要特點。除此之外,在年底發(fā)布的3DMARK03中,微軟的影響也是顯而易見,NVIDIA這時再也按耐不住,對3DMARK的開發(fā)公司Futuremark進行了公開的指責。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
NVIDIA忙碌于芯片組的研發(fā)
 
    再來看NVIDIA自身方面,2001年秋到2002年底也是其歷史上最忙碌的一段時間。除了半年一次的GPU升級之外,NVIDIA還要根據(jù)合同為微軟開發(fā)XBOX用SoundStorm音頻處理芯片以及XBOX的主板。而且在主版芯片組領域,NVIDIA的壓力更大,在經(jīng)歷了NForce遭受冷遇的開局后,無疑對雄心勃勃的NVIDIA打擊不小。所以在NForce2上,NVIDIA傾盡全力,誓要在AMD平臺與VIA一較高下。攤子鋪的過開,也使NVIDIA開發(fā)資源變得分散。
 
    綜上所述,在這種大背景下,經(jīng)過數(shù)次延期修改,并打破了NVIDIA過去半年發(fā)布一款核心的規(guī)律之后,NV30問世了。由于采用了3DFX的反鋸齒技術,NVIDIA將其正式命名為GeForce FX 5800 Ultra,并于2003年初上市。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧  
 
    NV30像素管線部分采用了成熟的4X2架構,為當時領先的0.13微米制程制造,核心集成的晶體管數(shù)達到創(chuàng)紀錄的1.25億個,由于較高的默認頻率,所以其功耗、與發(fā)熱非常之大,為此NVIDIA使用了稱為名為“FX Flow”的散熱系統(tǒng),包含一個銅制散熱片、熱管和換氣裝置。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
 “FX Flow”散熱系統(tǒng)
 
     GeForce FX 5800 Ultra使用Flip-Chip封裝設計,頻率提高到了驚人的500MHz。BGA和Flip-Chip封裝方式的芯片,可以直接和插槽接觸,縮短布線距離,同時也提高了信噪比,可以適應更高頻率,并降低功耗。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
 Flip-Chip BGA
 
    核心渲染架構方面,NV30首次引入了CineFX著色引擎。其中的Cine是CinemATIc(電影般的)的縮寫,而FX則表示其部分技術源自3DFX。CineFX的意思就是指新一代核心可以渲染出電影般的視覺效。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
CineFX引擎  

   在CineFX著色引擎中,具有32個128位浮點處理器。并在PC圖形核心歷史上首次提供了128bit色彩精度的支持,并且可以在同一個著色程序中的不同色彩精度中切換。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
SHADER規(guī)格對比

    NV30的頂點著色單元較前代也有了質的飛躍,可以支持到Vertex Shader 2.0+,所能處理的最大指令數(shù)為65536,這一點遠遠高于DX9.0的規(guī)范。而且,初級的動態(tài)循環(huán)和分支指令的引入提高了著色單元的可編程性。像素著色單元支持Pixel Shader 2.0+,同樣也超出了DX9.0規(guī)范,最大指令數(shù)提高到1024,對于每一個像素最大可進行16個紋理貼圖操作,而且像素單元可以支持更多的高級指令,并且可以進行指令預判??偟膩碚f,CineFX引擎支持更多的指令,因此可以帶給開發(fā)者更大的發(fā)揮空間。

    同時CineFX引擎也可以很好的支持NVIDIA的Cg(C for Graphics)編程語言,使得開發(fā)人員可以利用Cg語言而無需針對底層硬件進行編程,從而降低了圖形編程的難度,可以更方便、快捷的開發(fā)出游戲所需要的渲染效果
。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
高度靈活的CG語言

    在反鋸齒方面,4X FSAA是NV30設計的中心,也是NV30硬件效率最高的操作。為了使4X FSAA運行更快,NV30在反鋸齒設計上進行了重新制定,每個數(shù)據(jù)通道的寬度都為4X FSAA做了優(yōu)化。同時,NV30還首次采用了Intellisample(智能采樣)、(Adaptive Texture Filtering)自適應紋理過濾等技術一提供更好畫面質量。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
讓人想入非非的渲染效果

    在內存控制方面,NV30擁有4X32bit共128bit的位寬。由于采用了全新的DDR-II顯存,所以NV30在GeForce 4的LMA II的基礎上(Lightspeed Memory Architecture,光速內存結構)針對DDR-II做了相應的優(yōu)化設計。這款內存控制器實際上是全新設計,對4X FASS進行了全速優(yōu)化。ROP(光柵化處理器)、幀緩存等都是根據(jù)它來設計的。而且它運行在2X的核心頻率上,可以充分利用DDR-II的特性。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
DDR-II SDRAM

     GeForce FX 5800 Ultra的DDR-II SDRAM顯存運行頻率為1GHz,不過由于是128BIT位寬,和對手的Radeon 9700相比,其峰值帶寬落后25%。但由于新型LMA內存控制器提高了Z-culling和壓縮方面的性能,頂點、紋理和Z軸數(shù)據(jù)都進行了壓縮以節(jié)省帶寬,在程序配合較好的情況下,NV30可以更有效的使用帶寬。再加上Z-occlusion和紋理壓縮等技術,GeForce FX 5800 Ultra的實際最大帶寬可以達到20GB/s。
 
    雖然在2002年11月18日NV30就已經(jīng)發(fā)布,但是由于0.13微米制程等因素的延誤,直到2003年2月,GeForce FX 5800 Ultra才正式上市,而且由于當時0.13微米工藝并不完善以及較高的核心頻率,導致NV30芯片發(fā)熱量極大,必須采用“FX Flow"散熱系統(tǒng)。為了保證核心以及DDRII顯存在高達500MHz的頻率下穩(wěn)定工作,NVIDIA不等不比較獨特的采用12層PCB設計,同時供電電路的做工用料也是非常豪華,再加上DDRII顯存在當時的價格也是十分昂貴,這些因素使得GeForce FX 5800 Ultra的成本異常之高且功耗也十分巨大。所以其上市售價也接近500美元,十分驚人。由于上市時間的延誤以及核心自身的不成熟,GeForce FX 5800系列的輝煌也只持續(xù)了不到3個月,就被下一代的GeForce FX 5900所替代。

重新審視NV30的失敗之處:


    現(xiàn)在回過頭來看,NV30在架構的設計上還是存在著不少問題,其中最主要的就是Piexl Shader的處理能力低下。由于NV30的Piexl Shader單元沒有co-issue(標量指令+矢量指令并行處理)能力,而在DirectX9.0中,單周期3D+1D是最常見指令處理方式,即在很多情況下RGB+A是需要非綁定執(zhí)行的,這時候NV30就無法并行執(zhí)行,指令吞吐量大大降低。其次,NV30沒有miniALU單元,也限制了NV30的浮點運算能力。   
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
RGBA處理過程

    另外,NV30在寄存器設計(數(shù)量及調用方式)、指令存儲方式(讀寫至顯存)等方面也有缺陷。NV30的寄存器數(shù)量較少,不能滿足實際程序的需要。而且,用微軟的HLSL語言所編寫的pixel shader2.0代碼可以說NV30的“天敵”,這些shader代碼會使用大量的臨時寄存器,并且將材質指令打包成塊,但是NV30所采用的顯存是DDR-SDRAM,不具備塊操作能力。同時,NV30材質數(shù)據(jù)的讀取效率低下,導致核心的cache命中率有所下降,對顯存帶寬的消耗進一步加大。

成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧

寄存器調用

    同時,由于NV30是VILW(超長指令,可同時包含標量和SIMD指令)設計類型的處理器,對顯卡驅動的shader編譯器效率有較高的要求。排列順序恰當?shù)膕hader代碼可以大幅度提升核心的處理能力。NVIDIA也和微軟合作開發(fā)了"Shader Model 2.0A",可以為NV30產(chǎn)生更優(yōu)化的代碼。在早期的一些游戲中,這種優(yōu)化還是起到了一定的作用。但對于后期Shader運算任務更為繁重的游戲則效果不大。

成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
shader代碼

   從宏觀上說,NV30的整體架構更像是一個DirectX7(固定功能TRUE T&L單元)、DirectX 8(FX12combiner DX8整數(shù)處理單元)、DirectX 9(浮點像素單元)的混合體。而在DirectX 9的應用中,不能出現(xiàn)非浮點精度的運算,所以前兩者是不起作用的,造成了NV30晶體管資源的浪費,同時也影響了性能。而NV30這種DirectX 7、8、9三帶同堂的架構也讓我們想起了一個至今仍在廣泛使用的3D測試軟件: 3DMark03——這會是一種巧合嗎?
 
    雖然NV30的架構決定了它在DirectX 9游戲中的表現(xiàn)不會很好,但是由于在整個2003年,DirectX 9并未成為游戲開發(fā)的主流,所以NV30的架構缺陷并未暴露出來。即便如此,NVIDIA還是意識到了NV30的一些不足,并迅速對NV30的像素著色單元做出了改進,并于2003年5月的GDC上,發(fā)布了新一代研發(fā)代號為NV35的5900系列。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧

 亡羊補牢之作——NV35,F(xiàn)X5900

    NV35芯片采用更加成熟了的0.13微米銅互聯(lián)工藝,芯片的良率比NV30大幅度提升。核心面積為40mm×40mm,采用1309針FCPGA封裝,內部晶體管數(shù)量達到了1.3億。雖然比NV30又增加了500萬個晶體管,不過通過改進的工藝,NV35的發(fā)熱量略有降低,因此沒有搭配Flow FX散熱系統(tǒng)。

    新的NV35采用了CineFX2.0引擎,和第1代CineFX相比,NVIDIA對Piexl Shader做出了一定的改進,在保留FX12 combiner的同時增加了兩個可進行浮點運算的miniALU,雖然miniALU的功能有限,但是還是使得NV35的浮點運算能力提高了一倍。
 
    NV30中的CineFX2.0還改進了Intellisample(智能采樣)技術,增加了更多的高級紋理、色彩以及Z軸壓縮算法以提升圖象質量,并重新命名為“Intellisample HTC(高分辨率壓縮技術)”技術。

成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
UltraShadow技術

    CineFX 2.0引擎引的另一個改進是引入了UltraShadow的技術。UltraShadow也可以說是為IDSoftware的新一代DOOM3引擎量身打造的,因為DOOM3引擎大量采用了體積陰影技術(Volumetric Shadow),Shadow Volume可以更加精確的表現(xiàn)動態(tài)光影效果的場景,但由于陰影體積引入了額外的頂點和面,也加大了光影計算的強度。而Ultra Shadow可以簡化光影計算的過程,它允許程序員定義場景中一個區(qū)域,將物體的陰影計算限定在一個特定范圍內,從而加速陰影的計算速度。此外,UltraShadow技術還允許程序員在一些關鍵的區(qū)域對陰影進行調整,從而創(chuàng)造出可與真實情況媲美的優(yōu)秀視覺效果。Ultra Shadow還能利用Intellisample HTC技術以確保陰影邊緣的
平滑,提高了最終輸出的效果。
 
成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
 GeForce FX 5900 Ultra
 
   由于NV30核心是采用128bit位寬的顯存控制器,GeForce FX5800Ultra即使搭配很高工作頻率的DDR II顯存,在付出了更大發(fā)熱量和更高成本的代價下,顯存帶寬(16Gb/s)仍然低于采用256bit DDR I規(guī)格顯存的Radeon 9700 Pro。所以在NV35也采用了256bit顯存控制器,不但可以提升是顯存帶寬,利用普通的DDR顯存代替DDR II還可以減少顯卡的成本,而且頻率降低后的發(fā)熱量也小的多。最終,GeForce FX 5900 Ultra搭配的850MHz DDR-I顯存可以提供的帶寬高達27.2GB/s。
 
    NV35剛發(fā)布時有兩個版本——GeForceFX 5900和5900 Ultra,核心頻率分別為400MHz和450MHz,而顯存頻率都是850MHz。因此顯存帶寬達到27.2GB/s,不僅遠遠超過GeForceFX 5800 Ultra的16GB/s,也比Radeon 9800Pro的21.8GB/s高出不少。
 
    雖然在5月發(fā)布的5900系列為NVIDIA在高端產(chǎn)品線挽回了不少損失,但是在市場規(guī)模、利潤最大的中端方面,卻面臨更嚴峻的形勢,由于ATI在3月發(fā)布了RV350,也就是Radeon 9600 系列,再加上因為具有修改潛力而已經(jīng)頗具人氣的Radeon 9500,使其競爭力大幅度提高,而NVIDIA則只能由經(jīng)典但已顯老邁的TI 4200、新一代的5600 Ultra來抵擋ATI的攻勢,但是早期的5600 Ultra(350/700)因為自身架構和頻率的原因,難以獨當一面,在一些應用中性能甚至不敵Ti4200。后期的高頻版5600 Ultra(400/800)則遲到了近2個月而且產(chǎn)量有限,業(yè)界還傳出了NVIDIA在GeForce FX 5600 Ultra的生產(chǎn)上遇到了困難的消息??傊琋VIDIA的一系列變故使得ATI在中端主流市場輕松的獲得了領先。

成就3D圖形霸業(yè)!NVIDIA歷代顯卡回顧
 
三款FX Ultra版顯卡,5800、5900和5950
 
    直到2003年10月24日,NVIDIA在全球正式發(fā)布其代號NV38和NV36的全新一代圖形芯片,分別將其命名為GeForce FX 5950 Ultra以及GeForce FX 5700 Ultra。NV38采用了更為成熟的0.13mm的生產(chǎn)工藝,有利于產(chǎn)能的擴大以及芯片頻率的提高、功耗的下降。FX  5950 Ultra 的工作頻率由FX  5900Ultra的450MHz/850MHz提高到475MHz/950MHz。

    顯然由于市場競爭的激烈態(tài)勢,GeForce FX 5700 Ultra才是這次發(fā)布的重頭戲。GeForce FX 5700芯片的開發(fā)代號為NV36,目的是替代GeForce FX 5600和GeForce FX 5600 Ultra。NV36內部集成了8200萬個晶體管,雖然同樣為4X1架構,具有4條像素管線及每管線一個TMU單元,由于繼承了NV35的Cine FX2.0體系架構和Ultra Shadow陰影加速技術,頂點處理能力、特別是浮點性能比NV31提高了200%--300%。顯存方面和NV31相同,使用了兩個64-BIT顯存控制器支持128-BIT的顯存位寬。
 
    有鑒于在NV31核心的生產(chǎn)遇到的種種意外,這次NVIDIA 將NV36交由IBM 生產(chǎn),GeForce FX 5700也是IBM與NVIDIA合作的第一款產(chǎn)品。不過GeForce FX 5900/5950仍由TSMC負責生產(chǎn)。和GeForce FX 5600一樣,GeForce FX 5700也基于0.13微米工藝制造,但是IBM采用了低介電系數(shù)材料工藝(low-k dielectric),用來絕緣核心中的導體環(huán)路,在不增加功耗的情況進一步提升核心頻率。
 
    所以GeForce FX 5700 Ultra核心頻率提高到475MHz,比FX 5600 Ultra高出75MHz。顯存方面則搭配了日趨成熟DDR2的顯存,工作頻率900MHz,提高了性能的同時,也減少了功耗。后來,GDDR3顯存的FX5700Ultra,GDDR2跟GDDR3的針腳是兼容的,所以不用重新設計PCB。由于GDDR-3的Latency比GDDR-2要高,所以將其顯存工作頻率升至950MHz 。

    在經(jīng)歷了GeForce FX系列慘痛的失敗后,NVIDIA痛定思痛、吸取教訓,要挽回在高端產(chǎn)品上的失利局面,僅靠架構已完全定型的NV3x系列作一定程度的增補顯然是很難實現(xiàn)的。實際上早在NV3x系列的時代,NV40的研發(fā)就一直在進行,并且進展很好。NVIDIA將更大的希望押寶在了這款具有劃時代意義的新產(chǎn)品上。

GeForce 6800 Ultra

AGP王朝終結!末代AGP升級顯卡全回顧

奇特的NV45核心其實就是NV40搭配BR02橋接芯片

    采用NV40核心的GeForce 6800系列顯卡創(chuàng)造了很多項第一:

1.性能之王,NV40核心擁有16條像素渲染管線和6條頂點著色單元,雖然對手的X800也是同樣的配置,但管線效率的不同導致ATI必須使用更新的工藝和更高的頻率才能勉強戰(zhàn)平6800Ultra。因此NVIDIA GeForce 6系列的旗艦產(chǎn)品只有6800Ultra這一款(只有NV40這一顆核心,分為AGP和橋接PCIE的兩個版本),而對手則有X800XT、X800 XT PE、X850XT等很多工藝的核心及很多版本,而且都未能完全擊敗6800Ultra。

2.首款支持DX9C標準的顯卡,而對手的Radeon X800系列僅支持DX9b,正所謂風水輪流轉,ATI經(jīng)歷了DX9初代輝煌之后,也嘗到了落后就要挨打的滋味;

3.率先推出支持PCI-E的顯卡,NVIDIA采用的是橋接技術,而ATI采用原生方案導致產(chǎn)品推出較晚,NVIDIA在PCI-E時代來臨之際搶得先機;

4.“失傳”多年的SLI雙卡互聯(lián)技術重出江湖,NVIDIA依靠SLI技術輕松將圖形性能翻倍,性能大幅領先與對競爭手,這也迫使ATI依靠第三方解決方案開發(fā)并不成熟的CrossFire技術。

SLI技術大顯神威,迫使ATI“連夜趕制”CrossFire技術

    GeForce 6的成功徹底打亂了ATI的陣腳,以致于頻出昏招,產(chǎn)品線極為混亂,當初奚落NVIDIA的“有路不走何必搭橋”豪言壯語也食言了,正所謂三十年河東三十年河西。

GeForce 7800GTX——半年內無競爭對手

    在GeForce 6800Ultra大獲成功的基礎上,NVIDIA并沒有在NV40核心的基礎上改進高端產(chǎn)品,而是選擇了進一步提升核心規(guī)模,由此誕生了擁有24條像素渲染管線的G70核心,性能遙遙領先于競爭對手。

7800GTX(256MB)

    既不支持DX9C、交火技術也不成熟、性能方面更無法相提并論,此時的ATI面對GeForce 7800GTX是毫無還手之力,在此后半年多的時間內,7800GTX穩(wěn)坐性能之王的寶座。而中低端產(chǎn)品6600系列也大獲成功,因此NVIDIA并不急于推出基于GeForce 7架構的主流產(chǎn)品。

7800GTX 512MB由于頻率大增發(fā)熱不小,因此散熱器改用雙槽熱管版本

    終于在2005年底,ATI推出了首款DX9C產(chǎn)品X1800系列,但遺憾的是其R520核心依然只有16條像素渲染管線,即便依靠90nm工藝獲得了超高的頻率,但性能上還是無法完全擊敗7800GTX。不過未雨綢繆的NVIDIA也預留了一手,在X1800發(fā)布之后NVIDIA迅速推出了512MB顯存版本的7800GTX,在顯存容量翻倍的同時頻率也大幅提升,此時的X1800XT根本沒有任何取勝的機會。

GeForce 7900GTX——避其鋒芒,乘虛而入:

    在2005年GeForce 7800GTX稱霸圖形市場半年之后,來自48個像素單元R580核心X1900XTX的挑戰(zhàn)終于讓NVIDIA下決心推出醞釀已久的7900GTX。G71核心架構與G70沒有本質區(qū)別,可以把它看作是90nm工藝版的G70。但從G71核心上我們可以看到NVIDIA的另一種設計理念——與ATI R580完全相反的成本控制和功耗控制……

為王位而生!2006年五大旗艦顯卡回顧
 
    GeForce 7900GTX所用的G71核心同樣由臺積電90nm代工,核心僅有2.78億晶體管,比G70的3.02億還要少!除了核心工藝上的改進之外,其他方面7900GTX與7800GTX 512MB基本沒有區(qū)別,兩者的PCB、顯存、散熱器都完全相同:
 
為王位而生!2006年五大旗艦顯卡回顧    為王位而生!2006年五大旗艦顯卡回顧
 
    7800GTX 512MB的頻率為550/1700MHz,7900GTX的頻率為650/1600MHz,核心提高顯存降低,結果就是7900GTX的性能與7800GTX 512MB相比并沒有質變,想要拿它來擊敗強大的X1900XTX是非常困難的。
 
DX9最后的輝煌!2006年度GPU全面回顧
 
    不過當時來說大屏幕液晶顯示器并不普及,7900GTX的架構在中等分辨率下的傳統(tǒng)游戲中發(fā)揮還是比較出色,因此7900GTX也能勉強與X1900XTX戰(zhàn)成平手。但這并不意味著7900GTX的性能強,而是X1900XTX空有一身武藝未能發(fā)揮出來!
 
    但隨著時間的推移,X1900XTX在眾多新游戲中發(fā)揮出了過人的優(yōu)勢,在高分辨率以及打開AA的情況下表現(xiàn)更加出色,X1900XTX卓越的性能給了NVIDIA不小的壓力,這就迫使NVIDIA不得不拿出并不成熟的雙核心顯卡7950GX2!
 
7900GTX究竟耗電幾何?G71/73功耗測試
 
7900GTX的功耗優(yōu)勢很明顯
 
    雖然7900GTX的性能沒有達到預期,但X1900XTX的缺點恰恰就是7900GTX的優(yōu)點,比如:成本和價格、功耗、發(fā)熱、噪音等,這些都要歸功于G71核心小巧的核心面積。X1900XTX雖然在性能上占據(jù)優(yōu)勢,但高功耗、高發(fā)熱、高噪音與7900GTX形成了鮮明的對比!此外,7900GTX的小兄弟——同為G71核心的7900GT可以說是如入無人之境,憑借高性價比、低功耗低發(fā)熱等優(yōu)勢迅速占領了中高端市場,束手無策的ATI只能寄希望于RV570來進行反擊!

● GeForce 7950GX2——雙拳出擊,誓奪王位:

    48個像素單元的X1900XTX核心實力可不一般,24管線的7900GTX明顯不是對手,雖然它擁有功耗和成本上的優(yōu)勢,但旗艦產(chǎn)品代表的是性能與實力,NVIDIA不甘心就這么敗給X1900XTX。

    于是經(jīng)過多方面的嘗試之后,在6月份NVIDIA終于亮出了殺手锏——雙核心、1GB顯存的7950GX2顯卡!得益于良好的兼容性和成熟的SLI技術,7950GX2在任何主板上都能發(fā)揮出真正實力,兩顆G71聯(lián)手就可以輕易的擊敗X1900XTX。

為王位而生!2006年五大旗艦顯卡回顧
 
為王位而生!2006年五大旗艦顯卡回顧   為王位而生!2006年五大旗艦顯卡回顧
 
雙層PCB雙核心的7950GX2

   在7950GX2顯卡身上,G71低成本、低發(fā)熱、低功耗的優(yōu)勢再次得到體現(xiàn):兩顆G71加起來的核心面積同R580相當,雙PCB設計使用了兩塊8層PCB,其成本要低于一塊12層PCB,分離式供電模塊也不復雜。最終7950GX2的售價依然維持在5000多元的價格,在這類“超級顯卡”的陣營里 ,這樣的價格是極具競爭力的!

    X1900XTX性能再強,也不可能是兩片7900的對手,在眾多測試中7950GX2毫無懸念的擊敗了X1900XTX,終于奪回了性能之王寶座!

為王位而生!2006年五大旗艦顯卡回顧

    7950GX2雖然實力強悍,但它也有很多無法回避的缺點,由于7950GX2擁有兩顆G71核心以及1GB顯存,以往N卡在功耗、發(fā)熱和噪音方面的優(yōu)勢不復存在,實際上7950GX2在這方面比起X1900XTX有過之而無不及!另一方面7950GX2是基于SLI技術的產(chǎn)物,一些新游戲、新特效無法有效的利用雙核心,7950GX2的性能自然比較差,所以7950GX2嚴重依賴于驅動的優(yōu)化!

    雖然7950GX2奪回了單卡性能之王的稱號,而且兩片7950GX2能夠組建四核心Quad SLI,但NVIDIA的Quad SLI驅動一直都不夠成熟,直到被8800GTX所取代都沒能發(fā)布一款令人滿意的驅動,所以7950GX2雙卡還是不敵ATI CrossFire,ATI之后發(fā)布的X1950XTX就是針對7950GX2而來的!

    NVIDIA雖然依靠7950GX2重奪單卡性能之王的寶座,但在雙卡方面Quad SLI很難取得突破,而且陳舊的GF7架構無法支持HDR+AA,事實上7950GX2只是權宜之計。而全新架構的G80才是NVIDIA更新產(chǎn)品線,從根本上擊潰對手的重型武器,毫不夸張得說:GeForce 8800GTX的發(fā)布帶領NV進入了一個黃金時代!

 2006年11月8日 GeForce 8800GTX(G80)——DX10 統(tǒng)一渲染架構

    G80核心的橫空出世宣告了DX10時代的來臨,8800GTX先于微軟的Vista和DirectX 10發(fā)布,雖然當時沒有任何一款DX10游戲(半年后才陸續(xù)面市),但8800GTX強大的DX9C性能已經(jīng)給大家留下了深刻印象,雙核心的7950GX2在8800GTX面前無地自容。

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

    8800GTX強大的實力源自于多方面:從規(guī)格不難看出,G80是相當恐怖的一款GPU,核心擁有6.81億個晶體管,是G71的2.5倍之多!這就奠定了G80龐大的渲染能力;其次顛覆傳統(tǒng)Shader架構的標量流處理器,最大限度的提升了核心的執(zhí)行效能;當然384Bit顯存位寬也充分保證了數(shù)據(jù)吞吐能力;革命意義的架構以及強大的性能足以人為之瘋狂!最后,由于發(fā)布時間很早,游戲開發(fā)商為NVIDIA新一代架構的鼎力優(yōu)化與支持,也成就了其強大的DX10游戲性能。

為王位而生!2006年五大旗艦顯卡回顧

    當然G80也并非完美:它依然使用臺積電90nm工藝制造,因此核心面積非常大,功耗以及發(fā)熱也是再創(chuàng)新高,

掀起你的蓋頭來!G80廬山真面目曝光

G80的廬山真面目

為王位而生!2006年五大旗艦顯卡回顧    DX9最后的輝煌!2006年度GPU全面回顧

    優(yōu)異顯卡自然是不惜成本、最高頻率的配置,8800GTX超長的體形表明了自己的與眾不同。8800GTX之所以這么長久是因為功耗太大使得供電模塊變得非常復雜。8800GTX使用了12顆16M×32Bit規(guī)格的顯存,組成了768MB 384Bit的配置,雖然沒有使用GDDR4顯存,但帶寬已是再創(chuàng)新高。

    由于之前我們對G80的架構以及核心引擎都進行了非常詳細的分析與介紹,所以此處不再贅敘,感興趣的朋友請看“為王位而生 GeForce8800全面解析測試”一文。

2007年5月8日,GeForce 8800Ultra(G80)

    在得知競爭對手將會與5月份發(fā)布R600核心的HD2900XT之后,NVIDIA適時地放出了基于G80核心的高頻版8800Ultra,當然這也是為了實現(xiàn)自家產(chǎn)品線半年更新的承諾。

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

    嚴格來說8800Ultra并非全新產(chǎn)品,它只不過是將G80的制程從A2升級到A3,這樣良品率和沖擊高頻的能力會好些;顯存由1.0ns升級到0.8ns,另外散熱器風扇作了些改進,雖然PCB沒有任何變化,但是由于核心/流處理器/顯存頻率都提升不小,8800Ultra性能和GTX8800拉開了不小差距,順理成章的成為新一代旗艦顯卡。

2008年3月18日,GeForce 9800GX2(G92×2)

    G80強大的性能讓GTX8800和8800Ultra難逢敵手,但是功耗也成倍增加,這一軟肋從根本上阻止了它的平民化,于是G92核心應用而生。作為G80的改良版,G92工藝從90nm進化到65nm使得它功耗、發(fā)熱、成本大幅下降。但是NVIDIA對于G92的定位并非旗艦,因此使用了256Bit顯存來進一步控制成本。雖然G92核心的紋理單元和高清單元比G80強很多,而且核心頻率大幅提高,但顯存位寬限制了它的性能表現(xiàn),基于G92單核的9800GTX未能超越一年前的8800GTX。難道NV在高端不思進取么?當然不是,原來NVIDIA另有打算,當年雙G71核心的7950GX2靈魂附體,雙G92核心9800GX2震撼登場!

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

    擁有7.54億晶體管的G92核心本身功耗發(fā)熱就不低(相對G80是好些),做成雙核心顯卡自然對供電和散熱提出了很高要求,所以9800GX2顯卡的結構和散熱系統(tǒng)都是比較獨特的復雜,全密封式設計完全就像是一塊板磚。

    性能方面單顆G92可以達到接近于8800GTX的水平,雙核心性能提高80%,9800GX2自然完全超越8800Ultra成為毫無爭議新王者。雙核心本身的效率不容置疑,但其弊端就在于組建Quad SLI之后四核心效率不高,當年的7950GX2完勝X1950XTX,7950GX2 Quad SLI卻不敵X1950XTX CrossFire。好在DX10時代NVIDIA重新設定了渲染模式,在驅動優(yōu)化方面下了大功夫,隨著更多新游戲對多GPU系統(tǒng)提供優(yōu)化支持,9800GX2 Quad SLI系統(tǒng)的性能還是令人相當滿意的,四顆G92核心將3D圖形性能提升到了新的境界!

    雖然NVIDIA和AMD的旗艦顯卡性能差距較大,但雙方的產(chǎn)品策略居然驚人的相似:G80和R600核心都是采用較老的成熟工藝,將晶體管堆到極限的產(chǎn)物,也就是通過暴力手段、不惜成本(512/384Bit)制造超強性能的顯卡;而G92和RV670則是采用新工藝、向成本(256Bit)妥協(xié)之后的產(chǎn)物,因為功耗發(fā)熱得到了有效控制,這就使得雙核心方案成為可能,雙方不約而同地發(fā)布了基于G92和RV670的雙核心顯卡及其3/4路并聯(lián)系統(tǒng),在單GPU性能原地踏步的情況下,通過多核心并聯(lián)的方式大幅提升了3D性能上限,為發(fā)燒玩家提供了更強悍的解決方案。

    然而四顆GPU已經(jīng)達到了電腦系統(tǒng)可以承受的極限,繼續(xù)提升3D性能又遇到了瓶頸,現(xiàn)在就必須重頭來過,想方設法繼續(xù)提升單GPU的實力。沉寂許久之后,新一代怪獸級GPU誕生了,它就是擁有14億晶體管的GT200!

開創(chuàng)視覺計算帝國GTX280/260權威評測

● 8800GTX真正的接班人:GTX280

開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測
左:GTX280                         右:9800GTX

    第一眼看到GTX280顯卡正面,感覺造型方面與9800GTX非常相似:全覆式的散熱器外殼將顯卡裹得嚴嚴實實,風扇位略顯凹陷,這種設計的好處就是組建SLI或3路SLI時,即便兩塊顯卡緊緊埃在一塊,風扇也能吸入空氣進行良好的散熱。

GTX280的背面酷似9800GX2

開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測
左:GTX280                         右:9800GX2

    顯卡背面也安裝了外殼,從這個角度看的話跟雙核心9800GX2的造型又有些相似,當然這只是表象而已,如果將散熱器和外殼拆掉的話,就可以發(fā)現(xiàn)GTX280顯卡實際上最像8800GTX/Ultra。

GTX280的PCB最像8800GTX

開創(chuàng)視覺計算帝國GTX280/260權威評測

開創(chuàng)視覺計算帝國GTX280/260權威評測   開創(chuàng)視覺計算帝國GTX280/260權威評測
左:GTX280                         右:8800GTX

    可以看到,GTX280的核心安裝了保護蓋,輸出部分被單獨設計了一顆芯片安裝在了接口附近,還有供電模快的設計,這些都與8800GTX/Ultra的PCB設計方案如出一轍!看來GTX280才是8800GTX的正統(tǒng)接班人!

    GTX280實力雖強,怎奈雙拳難敵四手,3D圖形性能寶座被HD4870X2無情的奪走。當時業(yè)界普遍認為此次NVIDIA根本沒有機會反敗為勝,因為龐大的GT200核心功耗發(fā)熱太大,加上512Bit顯存布線過于復雜,不可能使用兩顆GT200核心制造雙核心顯卡來與HD4870X2相抗衡,但NVIDIA卻做到了……

● 2009年01月 55nm王者GeForce GTX 295震撼發(fā)布

    GTX280登上加冕還沒有多久,AMD就推出了雙核心的HD4870X2,將GTX280從性能寶座上逼了下來。雖然說用雙核心與單核心對陣并不公平,但是性能寶座的名頭卻無法改變。2009年01月,NVIDIA以牙還牙,推出了雙核心的GTX280顯卡——GTX295,目標很明確:讓HD4870X2下課!

    GTX295和上一輩雙核心顯卡一樣,都采用了雙PCB雙核心的結構,下圖就是GTX295結構的立體圖。

   從圖上可以看出,這個結構有點類似于三明治的結構,兩片PCB將碩大的散熱器夾在中間,結構看起來有一些怪異,但是但從兩顆核心之間來說,避免了兩顆核心距離太近引起的高溫。

    同時從另一個方面來講,這樣的設計正好可以只是采用一個散熱器,就能滿足兩顆核心的散熱,散熱器的正反面都被兩片PCB僅僅夾住,核心與散熱器接觸的部分采用純銅材質,更加有利于導熱,而兩片PCB上的顯存也都有相應的散熱措施。這樣的設計有效利用了散熱器、顯卡的面積,同時也減小了顯卡的體重。但是,這樣的設計對于散熱器與顯卡PCB的工藝要求相當高,而且這也是純粹的專用散熱器,成本勢必高出很多。


GTX295三明治平面圖

    和9800GX2類似,GTX295仍然是通過一個類似于SLI橋的排線讓兩顆核心進行數(shù)據(jù)交換,而將兩顆核心的數(shù)據(jù)進行運算、任務分配等都是由一顆橋接芯片來完成。

    GTX295的兩張PCB一張為主PCB,另一張為副PCB,主PCB上包含一顆核心和一顆IO芯片、一顆橋接芯片,并且?guī)в蠸LI接口,用戶可以使用此SLI接口組建Quad SLI;而副PCB上則沒有橋接芯片,只有一顆核心和一個IO芯片。

● 性能強勁 功耗合理

   在絕大多數(shù)游戲中,GTX295的性能表現(xiàn)都凌駕于HD4870X2之上,兩片GTX295組建的Quad SLI平臺性能也非常強悍,但是在部分游戲中還是因為驅動程序不完善,導致成績不正常。不過總體來說,因為驅動程序所導致的問題還是要比AMD的HD4870X2 Quad CrossFire少一些。實際上,對于這種多核心顯卡平臺,驅動程序是至關重要的。

    在GTX295的身上,我們看到的不僅僅是當今最強大的單卡,也給我們帶來了更多的新技術,如文章前面介紹的通過一塊顯卡做3D渲染、一款顯卡做PhysX物理加速就是非常重要的一個方面。同時,64xQ FSAA與遮光屏蔽功能也同樣值得稱道。

    另外,GTX295所采用的55nm工藝也讓顯卡的功耗大幅度下降。大家知道,GTX280的單卡設定功耗就高達236w,而雙核心的GTX295,設定功耗僅289w!

    GTX295的發(fā)布,標志著NVIDIA再一次坐上了性能王者的寶座。此前NVIDIA被HD4800系列低價上市打個措手不及,不得已只能通過殺價來維持市占有率。中端市場,被HD4850、HD4870鉗制,而高端市場被HD4870X2奪走了“單卡之王”的稱號。雖然當時發(fā)燒友迫切希望NVIDIA推出雙芯GTX280領銜市場,但受限于工藝發(fā)熱等原因,遲遲不見蹤跡。而現(xiàn)在,隨著55nm工藝的成熟,那個熟悉的綠巨人NVIDIA又回來了,工藝進步帶來的熱量大幅下降,將發(fā)燒友的夢想——雙芯GTX280成為了現(xiàn)實。

    如今GTX295這個怪獸已經(jīng)是老樹黃花,DX11時代來臨ATI搶得頭籌,HD5000系列風光無限,AMD已經(jīng)提前布陣好了全線DX11產(chǎn)品,就等NVIDIA前來應戰(zhàn)。可惜而NVIDIA方面的GF100依然是猶抱琵琶半遮面。GF100核心之所以延期這么久,一方面是因為NVIDIA遭遇了40nm新制程良率不足的困擾,另一方面GF100在核心架構方面的改進非常巨大,NVIDIA力圖打造一顆在DX11和GPU計算方面都趨于完美的核心。

GF100架構改進要點預覽

    如果說Cypress是“雙核心”設計的話,那么GF100的流處理器部分就是“四核心”設計,因為其raster units(光柵化引擎)是以GPC(線程處理器簇)為單位的,一式四份。而raster units的功能就是以流水線的方式執(zhí)行邊緣/三角形設定(Edge/Triangle Setup)、光柵化(Rasterization)、Z軸壓縮(Z-Culling)等操作。上頁我們介紹過Cypress的Rasterizer和Hierarchial-Z雙份的,而GF100則是四份的,雖然命名有所不同但功能是相同的

    另外,GF100擁有更多的PolyMorph(多形體引擎),是以SM(流處理器)為單位分配的,擁有多達16組。多形體引擎則要負責頂點拾取(Vertex Fetch)、細分曲面(Tessellation)、視口轉換(Viewport Transform)、屬性設定(Attribute Setup)、流輸出(Stream Output)等五個方面的處理工作,DX11中最大的變化之一細分曲面單元(Tessellator)就在這里,因此GF100的理論Tessellation性能將會遠超Cypress,因為Cypress只有一個Tessellator單元。

    至于流處理器核心部分,則是經(jīng)過了重新設計,與GT200/G92/G80相比是煥然一新,因此NVIDIA將其稱為CUDA核心而不再是流處理器。

    GF100的512個CUDA核心都符合IEEE 754-2008浮點算法(Cypress也是如此)和完整的32位整數(shù)算法,而后者在過去只是模擬的,事實上僅能計算24-bit整數(shù)乘法;同時全面引入的還有積和熔加運算(Fused Multiply-Add/FMA)。此外雙精度浮點(FP64)性能大大提升,峰值執(zhí)行率可以達到單精度浮點(FP32)的1/2,而過去只有1/8,AMD從R600開始到現(xiàn)在的Cypress核心都是1/5,沒有做任何變化。

    至于顯存控制器方面的改進,還有顯存ECC等外圍功能就不多做介紹了。總而言之,GF100核心是GPU自從進入DX10時代以來,架構變化最大的一次,在GPU圖形架構和并行計算架構方面都有了革命性的進步,因此備受玩家和業(yè)界期待。

GTX 480諜照

    NVIDIA對于尚未發(fā)布的新品一直都比較低調,但整個業(yè)界還有玩家對于GF100都抱有很高的期望,因此不斷的有相關產(chǎn)品技術資料還有產(chǎn)品實物圖被曝光?,F(xiàn)在據(jù)可靠消息表明GF100架構的GTX480顯卡將在本月26日準時發(fā)布,屆時我們將會為大家獻上全方位的架構分析及性能評測,讓我們一同期待吧!■<

0人已贊

關注我們

泡泡網(wǎng)

手機掃碼關注