GTX690評(píng)測(cè):史上最酷雙芯卡皇戰(zhàn)雙卡
泡泡網(wǎng)顯卡頻道5月4日 從2001年開始到現(xiàn)在,NVIDIA和AMD(ATI)兩大圖形巨頭烽火已逾十年,每一次卡皇之爭(zhēng)都激烈異常。因?yàn)橛衅脚_(tái)功耗和散熱極限的制約,同樣工藝下GPU核心所能集成的晶體管規(guī)模是有限的,旗艦核心規(guī)格確定之后,剩下的產(chǎn)品只需要一路刪減即可形成高中低端完整的產(chǎn)品線。既要性能卓越,又要保證功耗散熱,旗艦顯卡可以說(shuō)是集高新科技于一身的產(chǎn)品,而卡皇誰(shuí)屬也預(yù)示著本代產(chǎn)品的強(qiáng)勢(shì)與否。

隨著圖形爭(zhēng)霸日趨白熱化,單核心晶體管的集成度已經(jīng)逼近現(xiàn)有制造工藝所能承載的極限,再往上堆積,GPU核心的功耗發(fā)熱將難以控制。于是采用GPU集聯(lián)技術(shù)的雙核心顯卡應(yīng)用而生,給我們帶來(lái)超越極限的巔峰對(duì)決!
如果說(shuō)GTX680的GPU規(guī)格多少帶給我們一些意外,那雙芯的GTX690則是意料之中。從性能卓越但功耗控制完美的NVIDIA GTX680發(fā)布伊始,我們就開始對(duì)GTX690充滿了期待!而今天這款迄今為止地球上最快的顯卡終于正式和大家見面了。相對(duì)于上一代卡皇GTX590,全新Kepler架構(gòu)的GTX690性能會(huì)有多大的提升?比單核心的GTX680和HD7970又能快多少?
首先我們來(lái)看看NVIDIA的公版產(chǎn)品,作為NVIDIA目前最優(yōu)異的型號(hào),GTX690在硬件配備方面可以看成是將兩片標(biāo)準(zhǔn)規(guī)格GTX680合二為一,搭載了兩顆GK104顯示核心,顯存規(guī)格也是GTX680的兩倍,達(dá)到4GB容量,流處理器則達(dá)到了比較獨(dú)特的3072個(gè)。
一般來(lái)說(shuō),NVIDIA的高端產(chǎn)品一般都會(huì)搭載一款全覆式散熱器,并使用渦輪風(fēng)扇進(jìn)行散熱,但從GTX590開始,一顆9扇葉風(fēng)扇取代了渦輪風(fēng)扇被安置在兩顆顯示核心中間,同時(shí)幫助兩顆顯示核心完成散熱工作,不同是的,GTX690不再是千篇一律的黑色導(dǎo)流罩了。
很多朋友認(rèn)為普通風(fēng)扇會(huì)由于空氣湍流問(wèn)題在散熱效能方面沒有渦輪式風(fēng)扇好,而NVIDIA再次在最優(yōu)異型號(hào)上采用了普通風(fēng)扇,其散熱效能我們將在后面的滿載溫度測(cè)試中進(jìn)行驗(yàn)證。
經(jīng)過(guò)精心設(shè)計(jì),GTX690不但在游戲性能上達(dá)到了全新高度,而且外觀也剛勁無(wú)比。除了運(yùn)用豪華材質(zhì)打造出異乎尋常的設(shè)計(jì)以外,該顯卡還囊括了一系列創(chuàng)新技術(shù)。
1.外部框架由鋁制成,采用三價(jià)鉻電鍍處理,強(qiáng)度極高、堅(jiān)固耐用
2.風(fēng)扇外殼由鎂合金以觸變成型工藝制成,不但散熱效果較好而且還能抑制振動(dòng)l 十相重載型電源采用十層兩盎司銅質(zhì)印刷電路板,不但供電效率高,而且具有電阻小、功耗低和發(fā)熱量低的特點(diǎn)
3.散熱方案采用雙均熱板、鍍鎳散熱片與中置的軸流式風(fēng)扇,葉片間距和進(jìn)氣角度均進(jìn)行了優(yōu)化,可有效散熱
4.低矮型部件設(shè)計(jì)以及運(yùn)用管道的底板通道可令氣流通暢無(wú)阻,最大限度消除了湍流現(xiàn)象、改善了噪音水平
拆掉散熱器可以看到整齊排列在黑色PCB上的各種元件,最顯眼的就是那兩顆GK104顯示核心了,每塊顯示核心周圍有8顆三星GDDR5顯存顆粒,合計(jì)共有4GB顯存容量。
默認(rèn)核心/顯存頻率為915/6008MHz,比GTX590的608/4860MHz高出很多,比GTX680稍低,而且GTX690的功耗只有300W,比GTX590的365W更低。GTX690顯卡依然采用了兩個(gè)8Pin口輔助供電。
為了同時(shí)支持兩顆GK104顯示核心運(yùn)作,GTX690在供電模塊共配備10相供電,并且使用了大量貼片元件,顯卡背面可以看到眾多鉭電容和多層陶瓷電容,高品質(zhì)用料保證了顯卡工作穩(wěn)定性。
上圖中是顯卡背面的元件分布,顯卡提供一個(gè)SLI接口,支持雙卡四核心SLI。
GTX690在接口方面增加了一個(gè)DVI口,形成三個(gè)DVI加一個(gè)Mini DP接口的規(guī)格,可以支持4屏顯示以及3D立體幻境。
開普勒目前發(fā)布了兩款顯卡:GTX680和GTX690,而這兩款顯卡都是基于GK104核心。下面我們就介紹一下這款杰出的GPU架構(gòu)。
盡管AMD的架構(gòu)在向NVIDIA靠攏,但雙方還是有明顯區(qū)別,而且NVIDIA也在不斷的改變。至于NVIDIA和AMD歷代產(chǎn)品架構(gòu)上的變化,之前多篇文章中都已經(jīng)交代過(guò)了,這里就不再重復(fù),我們通過(guò)這個(gè)簡(jiǎn)單的數(shù)字變化,來(lái)了解一下:

先看看AMD方面,從R600一直到Cypress,可以說(shuō)一直在堆SIMD,動(dòng)輒翻倍,架構(gòu)沒有任何變化;從Cypress到Cayman變化也不大,只是把矢量單元從5D改為4D;從Cayman到Tahiti可以說(shuō)是質(zhì)變,SIMD被GCN取代,4D矢量運(yùn)算單元改為1D標(biāo)量運(yùn)算單元。
而NVIDIA方面,則是不停的對(duì)GPU的GPC、SM、CUDA核心等配比進(jìn)行微調(diào),在微調(diào)的過(guò)程中經(jīng)歷了兩次突變:第一次是GT200到GF100,首次引出了GPC(圖形處理器集群)的概念,GPC數(shù)量減少但SM數(shù)以及流處理器數(shù)量增加不少;第二次就是現(xiàn)在了,從GF100到GK104,SM數(shù)量減少,但流處理器數(shù)量暴增!
改變是為了適應(yīng)形式的變化,解決此前出現(xiàn)的一些問(wèn)題,那NVIDIA的架構(gòu)有什么問(wèn)題呢?此前我們多次提到過(guò),雖然NVIDIA的GPU在效能方面占盡優(yōu)勢(shì),但也不是完美無(wú)缺的——NVIDIA最大的劣勢(shì)就是流處理器數(shù)量較少,導(dǎo)致理論浮點(diǎn)運(yùn)算能力較低。當(dāng)然這只是表面現(xiàn)象,其背后的本質(zhì)則是MIMD(多指令多數(shù)據(jù)流)的架構(gòu),相當(dāng)一部分比例的晶體管消耗在了指令發(fā)射端和控制邏輯單元上面,所以流處理器數(shù)量始終低于對(duì)手。
GF110和GK104芯片對(duì)比圖
為了保證GPU性能持續(xù)增長(zhǎng),NVIDIA必須耗費(fèi)更多的晶體管、制造出更大的GPU核心,而這些都需要先進(jìn)的、成熟的半導(dǎo)體制造工藝的支持。NVIDIA之所以在GF100(GTX480)時(shí)代落敗,并非架構(gòu)或者研發(fā)端出了什么問(wèn)題(GF110/GTX580的成功可以證明),而是核心太大導(dǎo)致40nm工藝無(wú)法支撐,良率低下漏電流難以控制,最終導(dǎo)致核心不完整且功耗巨大。如此一來(lái),NVIDIA原有的架構(gòu)嚴(yán)重受制于制造工藝,并非可持續(xù)發(fā)展之路。
為此,NVIDIA將芯片架構(gòu)逐步轉(zhuǎn)向了SIMT的模式,即Single Instruction Multiple Threads(單指令多線程),SIMT有別與AMD的SIMD,SIMT的好處就是無(wú)需開發(fā)者費(fèi)力把數(shù)據(jù)湊成合適的矢量長(zhǎng)度,并且SIMT允許每個(gè)線程有不同的分支。 純粹使用SIMD不能并行的執(zhí)行有條件跳轉(zhuǎn)的函數(shù),很顯然條件跳轉(zhuǎn)會(huì)根據(jù)輸入數(shù)據(jù)不同在不同的線程中有不同表現(xiàn),這個(gè)只有利用SIMT才能做到。
SIMT在硬件部分的結(jié)構(gòu)還是要比SIMD復(fù)雜一些,NVIDIA還是更注重效率一些,所以NVIDIA的流處理器數(shù)量還是要比AMD少,但差距已經(jīng)沒以前那么夸張了。
基于效能和計(jì)算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構(gòu),NVIDIA雖然還是采用SIMT架構(gòu),但也借鑒了AMD“較老”的SIMD架構(gòu)之作法,降低控制邏輯單元和指令發(fā)射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當(dāng)中容納了192個(gè)核心的壯舉就變成了現(xiàn)實(shí)!
通過(guò)上面這個(gè)示意圖就看的很清楚了,CUDA核心的縮小主要?dú)w功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強(qiáng)化運(yùn)算單元削減控制單元的意圖就很明顯了。
Fermi的硬件相關(guān)性檢查變?yōu)镵epler的軟件預(yù)解碼
此時(shí)相信有人會(huì)問(wèn),降低控制單元的比例那是不是意味著NVIDIA賴以成名的高效率架構(gòu)將會(huì)一去不復(fù)返了?理論上來(lái)說(shuō)效率肯定會(huì)有損失,但實(shí)際上并沒有想象中的那么嚴(yán)重。NVIDIA發(fā)現(xiàn)線程的調(diào)度有一定的規(guī)律性,編譯器所發(fā)出的條件指令可以被預(yù)測(cè)到,此前這部分工作是由專門的硬件單元來(lái)完成的,而現(xiàn)在可以用簡(jiǎn)單的程序來(lái)取代,這樣就能節(jié)約不少的晶體管。
隨意在開普勒中NVIDIA將一大部分指令派發(fā)和控制的操作交給了軟件(驅(qū)動(dòng))來(lái)處理。而且GPU的架構(gòu)并沒有本質(zhì)上的改變,只是結(jié)構(gòu)和規(guī)模以及控制方式發(fā)生了變化,只要驅(qū)動(dòng)支持到位,與游戲開發(fā)商保持緊密的合作,效率損失必然會(huì)降到最低——事實(shí)上NVIDIA著名的The Way策略就是干這一行的!
The Way(游戲之道)計(jì)劃可以保證NVIDA的GPU架構(gòu)與游戲完美兼容
這方面NVIDIA與AMD的思路和目的是相同的,但最終體現(xiàn)在架構(gòu)上還是有所區(qū)別。NVIDIA的架構(gòu)被稱為SIMT(Single Instruction Multiple Threads,單指令多線程),NVIDIA并不像AMD那樣把多少個(gè)運(yùn)算單元捆綁為一組,而是以線程為單位自由分配,控制邏輯單元會(huì)根據(jù)線程的任務(wù)量和SM內(nèi)部CUDA運(yùn)算單元的負(fù)載來(lái)決定調(diào)動(dòng)多少個(gè)CUDA核心進(jìn)行計(jì)算,這一過(guò)程完全是動(dòng)態(tài)的。
但不可忽視的是,軟件預(yù)解碼雖然大大節(jié)約了GPU的晶體管開銷,讓流處理器數(shù)量和運(yùn)算能力大增,但對(duì)驅(qū)動(dòng)和游戲優(yōu)化提出了更高的要求,這種情況伴隨著AMD度過(guò)了好多年,現(xiàn)在NVIDIA也要面對(duì)相同的問(wèn)題了,希望他能做得更好一些。
全新的Kepler相比上代的Fermi架構(gòu)改變了什么,看架構(gòu)圖就很清楚了:

Fermi GF100/GF110核心架構(gòu)圖
Kepler GK104核心架構(gòu)圖
GK104相比GF110,整體架構(gòu)沒有大的改變,GPU(圖形處理器集群)維持4個(gè),顯存控制器從6個(gè)64bit(384bit)減至4個(gè)64bit(256bit),總線接口升級(jí)至PCIE 3.0。剩下的就是SM方面的改變了:
GF100和GF104的SM架構(gòu)圖
這里之所以要把GF104這顆中端核心的SM架構(gòu)圖也列出來(lái),是因?yàn)镚F104相比高端的GF100核心做了一些細(xì)小的改動(dòng),這些改動(dòng)也被沿用到了GK104當(dāng)中。另外從核心代號(hào)上來(lái)看,GK104其實(shí)就是用來(lái)取代GF104的,而取代GF100的核心另有他人。
GK104的SMX架構(gòu)圖
NVIDIA把GK104的SM(不可分割的流處理器集群)稱為SMX,原因就是暴增的CUDA核心數(shù)量。但實(shí)際上其結(jié)構(gòu)與上代的SM沒有本質(zhì)區(qū)別,不同的只是各部分單元的數(shù)量和比例而已。具體的區(qū)別逐個(gè)列出來(lái)進(jìn)行對(duì)比:

1. NVIDIA現(xiàn)在把流處理器稱為CUDA核心;
2. SFU(Special Function Units,特殊功能單元)是比CUDA核心更強(qiáng)的額外運(yùn)算單元,可用于執(zhí)行抽象的指令,例如正弦、余弦、倒數(shù)和平方根,圖形插值指令也在SFU上執(zhí)行;
3. Warp是并行線程調(diào)度器,每一個(gè)Warp都可以調(diào)度SM內(nèi)部的所有CUDA核心或者SFU;
4. Dispatch Unit是指令分派單元,分則將Warp線程中的指令按照順序和相關(guān)性分配給不同的CUDA核心或SFU處理;
5. LD/ST就是載入/存儲(chǔ)單元,可以為每個(gè)線程存儲(chǔ)運(yùn)算源地址與路徑,方便隨時(shí)隨地的從緩存或顯存中存取數(shù)據(jù);
6. TMU是紋理單元,用來(lái)處理紋理和陰影貼圖、屏幕空間環(huán)境光遮蔽等圖形后期處理;
通過(guò)以上數(shù)據(jù)對(duì)比不難看出,GK104暴力增加CUDA核心數(shù)量的同時(shí),SFU和TMU這兩個(gè)與圖形或計(jì)算息息相關(guān)處理單元也同比增加,但是指令分配單元和線程調(diào)度器還有載入/存儲(chǔ)單元的占比都減半了。這也就是前文中提到過(guò)的削減邏輯控制單元的策略,此時(shí)如何保證把指令和線程填滿一個(gè)CUDA核心,將是一個(gè)難題。
除了CUDA核心數(shù)量大增之外,開普勒架構(gòu)還有個(gè)很明顯的改變,那就是CUDA核心的頻率不再是GPU頻率的兩倍,現(xiàn)在整顆GPU所有單元的工作頻率都是相同的,GTX680的默認(rèn)頻率達(dá)到了1GHz!
NVIDIA的上代產(chǎn)品,比如GTX560Ti,一些AIC的超頻版本默認(rèn)核心頻率可達(dá)900MHz,CUDA頻率是1800MHz。按理說(shuō)如果新一代架構(gòu)改變不是很大的話,在28nm的幫助下核心頻率到1GHz沒有問(wèn)題,那CUDA頻率應(yīng)該可以到2GHz才對(duì)。而現(xiàn)在的情況則是CUDA的頻率“被減半了”。
NVIDIA官方對(duì)CUDA與核心同頻的解釋是——功耗原因,為了盡可能的控制GTX680的功耗,不再讓CUDA工作在兩倍頻率下。
對(duì)于這種解釋,筆者并不理解,如果CUDA頻率真能工作在2GHz下,性能提升兩倍,此時(shí)功耗增長(zhǎng)兩倍又如何?如此增加功耗是值得的,并不影響GTX680顯卡的“每瓦性能”。
所以,筆者猜測(cè)此次CUDA與核心同頻,應(yīng)該有別的原因,以下猜測(cè)純屬虛構(gòu),大家隨便看看不要當(dāng)真:
原因一:此次NVIDIA對(duì)SMX的結(jié)構(gòu)進(jìn)行了大幅度的調(diào)整,除了控制邏輯單元削減外,過(guò)于密集CUDA單元結(jié)構(gòu)也發(fā)生了一些變化,導(dǎo)致CUDA單元或控制邏輯單元上不了更高的頻率,所以現(xiàn)在就和AMD一樣同頻了;
原因二:保留實(shí)力。NVIDIA官方發(fā)言人在AMD發(fā)布HD7970之后曾表示:AMD GCN架構(gòu)“南方群島”核心的表現(xiàn)并沒有超出NVIDIA的預(yù)期,一切盡在掌握之中。而Kepler架構(gòu)則將比南方群島要強(qiáng)出許多,因?yàn)楸緛?lái)NVIDIA為新架構(gòu)設(shè)計(jì)的對(duì)手是AMD更強(qiáng)的新產(chǎn)品,但實(shí)際上南島并未達(dá)到NVIDIA的設(shè)想性能。
原因三:確實(shí)是功耗問(wèn)題,強(qiáng)行讓CUDA工作在雙倍頻率下對(duì)GPU的電路設(shè)計(jì)提出了很高的要求,28nm新工藝目前可能還尚未完全吃透,上高頻有一定的難度。
雖然CUDA頻率達(dá)不到兩倍,但NVIDIA通過(guò)加入類似Intel睿頻的技術(shù),一定程度上提高了工作頻率,性能也同比增長(zhǎng),而且高于預(yù)期,或者說(shuō)是對(duì)手不如預(yù)期。
我們先來(lái)回顧一下顯存控制器的發(fā)展史:
NVIDIA:G80(384bit)-G92(256bit)-GT200(512bit)-GF100(384bit)
AMD:R600(512bit)-RV670(256bit)-RV770(256bit)-Cypress(256bit)-Cayman(256bit)-Tahiti(384bit)
384bit顯存應(yīng)該是高端顯卡的標(biāo)配
● GK104核心為什么只有256bit顯存?
大家應(yīng)該注意到了,NVIDIA近年來(lái)的高端顯卡,很少有256bit顯存的設(shè)計(jì),現(xiàn)在就連AMD都升級(jí)到384bit顯存,256bit已經(jīng)很難在躋身為高端,為什么NVIDIA新一代的GTX680居然降級(jí)到了256bit?
答案在其核心代號(hào)上面,GK104的定位就是取代GF104/GF114,它并非是NVIDIA最高端的GPU,顯存方面自然不會(huì)用最高端的配置。
● GTX680顯存頻率彌補(bǔ)位寬不足,首次達(dá)到6GHz!
另外,之前我們反復(fù)提到過(guò),AMD從HD4870開始第一次使用GDDR5顯存,GDDR5的標(biāo)準(zhǔn)幾乎可以說(shuō)是AMD的人一手制定的,AMD歷代GPU憑借GDDR5超高頻率的優(yōu)勢(shì),以較低的顯存位寬很好的控制了成本。

而NVIDIA從GTX480開始也使用了GDDR5顯存,但頻率一直都上不去,GTX400和GTX500系列顯卡的顯存頻率一直在4000MHz上下徘徊。NVIDIA的顯卡在GPU頻率方面超頻能力還不錯(cuò),但顯存的超頻空間幾乎沒有,即便有液氮的助力也無(wú)濟(jì)于事。
現(xiàn)在,隨著開普勒的發(fā)布,NVIDIA在顯存頻率上面終于反超AMD,重新設(shè)計(jì)的顯存控制器突破了頻率的桎梏,瞬間從4000MHz飆升至6000MHz,帶寬提升達(dá)50%之多,這個(gè)幅度就相當(dāng)于把256bit免費(fèi)升級(jí)至384bit,顯存帶寬不再是瓶頸了。
長(zhǎng)篇大論的分析相信大家看得都很累,最后我們將Tahiti與GK104這兩顆GPU的所有規(guī)格都列出來(lái),進(jìn)行全方位的對(duì)比:

下面就通過(guò)數(shù)據(jù)分析一下架構(gòu)的特性:
1. GK104的晶體管數(shù)比GF110減少了,但流處理器數(shù)量達(dá)到了三倍,NVIDIA改進(jìn)架構(gòu)、提高浮點(diǎn)運(yùn)算的努力效果顯著。但是,同為1536個(gè)流處理器,GK104的晶體管數(shù)要遠(yuǎn)大于Cayman核心,這就證明了SIMT還是要比SIMD更消耗晶體管;
2. GTX680的核心與顯存頻率都創(chuàng)新高,但是TDP卻不到200W,這都要?dú)w功于它小核心的設(shè)計(jì)、以及不再使用雙倍CUDA頻率的作法,NVIDIA控制功耗的作法成效顯著;
3. Tahiti的晶體管數(shù)是GK104的1.22倍,流處理器數(shù)量是1.33倍,這兩個(gè)數(shù)字差距不是很大,N/A雙方自DX10時(shí)代以來(lái)頭一次達(dá)到了相似的晶體管利用率;
4. 從Cayman到Tahiti,AMD用了1.63倍的晶體管數(shù)才讓流處理器數(shù)量達(dá)到了原來(lái)的1.33倍;從GF110到GK104,NVIDIA減少了晶體管數(shù)量卻讓流處理器達(dá)到原來(lái)的三倍;可以看出雙方都在向?qū)Ψ降募軜?gòu)靠攏,目的只有一個(gè),就是提高GPU的運(yùn)算效能;
通過(guò)之前的測(cè)試數(shù)據(jù)來(lái)看,AMD的GCN架構(gòu)相比上代確實(shí)提高了GPU的效能。而NVIDIA方面,GTX680的性能也必定遠(yuǎn)超GTX580。
在核心面積、晶體管數(shù)量、功耗、流處理器數(shù)量、顯存容量、顯存位寬得各方面都不占優(yōu)勢(shì)(唯一的優(yōu)勢(shì)就是頻率)的情況下,GTX680的綜合性能是否能夠超越HD7970?Kepler與南方群島的架構(gòu)孰優(yōu)孰劣?
全新的GPU Boost動(dòng)態(tài)加速技術(shù)
對(duì)于顯卡來(lái)說(shuō),核心頻率仍然是決定其性能的關(guān)鍵參數(shù),在相同架構(gòu)和核心數(shù)量的情況下,更高的頻率意味著更強(qiáng)的性能。而這一次“開普勒”除了架構(gòu)上的全面改變,GTX680這次引入了一項(xiàng)全新技術(shù):GPU Boost,意思是GPU加速。這種動(dòng)態(tài)超頻技術(shù)對(duì)我們來(lái)說(shuō)并不陌生,Intel在CPU中使用了Turbo Boost(睿頻)技術(shù),NVIDIA此次的GPU Boost技術(shù)與其極為相似,不過(guò)這種技術(shù)是首次在GPU中使用,GTX680也是第一款應(yīng)用了動(dòng)態(tài)加速技術(shù)的顯卡。
不同應(yīng)用環(huán)境下的GPU功耗有多有少
一塊顯卡都有熱設(shè)計(jì)功耗(Thermal Design Power,簡(jiǎn)稱TDP),根據(jù)大量不同實(shí)際應(yīng)用測(cè)試來(lái)決定最終GPU頻率、電壓等參數(shù)。不過(guò),測(cè)試的時(shí)候發(fā)現(xiàn),并非所有應(yīng)用都可以達(dá)到TDP上限,在不同的使用環(huán)境下,顯卡的功耗有所差異。而在沒有達(dá)到散熱、功耗極限的情況下,GPU核心頻率依然有提高的余地,從而可以達(dá)到提升性能的目的,因此GPU核心實(shí)現(xiàn)動(dòng)態(tài)加速的設(shè)計(jì)思路被NVIDIA的工程師所提出。
對(duì)于負(fù)載相對(duì)低的應(yīng)用,執(zhí)行效率上仍有上升余地
在保證同樣功耗的前提下,動(dòng)態(tài)調(diào)節(jié)GPU核心頻率從而挖掘出顯卡全部潛能
GPU Boost技術(shù)的實(shí)現(xiàn)是硬件和軟件的完美結(jié)合。當(dāng)應(yīng)用運(yùn)行時(shí),硬件電路系統(tǒng)會(huì)實(shí)時(shí)監(jiān)控功耗的變化,此時(shí)在軟件控制(筆者注:Bios層面的控制,結(jié)合驅(qū)動(dòng)程序,并不需要額外安裝軟件)下后臺(tái)會(huì)動(dòng)態(tài)調(diào)整GPU頻率,根據(jù)功耗、熱量、風(fēng)扇轉(zhuǎn)速的情況讓GPU頻率達(dá)到最高。
標(biāo)準(zhǔn)頻率為1006MHz(因?yàn)檎`差軟件顯示為1005MHz)
在原本低負(fù)載的應(yīng)用時(shí)提高GPU頻率,達(dá)到1.1GHz以上
以GTX680為例說(shuō)明,其基本核心頻率為1006MHz,也就是運(yùn)行3D程序時(shí)的最低時(shí)鐘頻率,熱設(shè)計(jì)功耗為195W。當(dāng)運(yùn)行的應(yīng)用負(fù)載未達(dá)到TDP上限時(shí),GPU頻率在大多情況下可以提升至1058MHz,甚至一些應(yīng)用可以達(dá)到1.1GHz以上。
在過(guò)去,我們?cè)谶\(yùn)行3D游戲時(shí)經(jīng)常使用到一種叫做垂直同步(VSync)的技術(shù),該技術(shù)在渲染新幀的速率與顯示器刷新速率保持一致,從而達(dá)到讓游戲流暢運(yùn)行的目的。不過(guò)這種技術(shù)存在一個(gè)問(wèn)題,當(dāng)渲染速度降低的時(shí)候,瞬間幀率會(huì)嚴(yán)重下滑,以我們常用的60Hz刷新率的顯示器為例,由于垂直同步技術(shù)的使用,瞬間刷新率會(huì)降低至30、20或15。
開啟垂直同步會(huì)發(fā)生頓卡(幀率過(guò)低時(shí))
關(guān)閉垂直同步會(huì)導(dǎo)致畫面撕裂(幀率過(guò)高時(shí))
這種現(xiàn)象可能發(fā)生在游戲過(guò)程中場(chǎng)景的轉(zhuǎn)換、單位數(shù)量增加等計(jì)算壓力突然發(fā)生變化的時(shí)候。此時(shí)GPU可能無(wú)法在理想時(shí)間內(nèi)完成對(duì)一幀甚至幾幀畫面的渲染,從而導(dǎo)致刷新率瞬間大幅降低,這時(shí)候玩家會(huì)明顯的體會(huì)到卡頓、延遲。如果想要避免這種卡頓的發(fā)生,可以關(guān)閉垂直同步,而此時(shí)真與幀之間會(huì)有一個(gè)標(biāo)記線來(lái)區(qū)分,這樣可以有效避免渲染速度瞬間過(guò)慢帶來(lái)的幀率降低,但是如果渲染速度過(guò)快,就會(huì)遇到畫面撕裂的效果。無(wú)論開啟或關(guān)閉垂直同步,都會(huì)有一些意外情況發(fā)生,對(duì)于游戲體驗(yàn)有著很惡劣的影響。
Adaptive VSync技術(shù)完美解決了垂直同步開/關(guān)的矛盾
為了避免這些現(xiàn)象的發(fā)生,自然不能再使用過(guò)去的垂直同步技術(shù),而NVIDIA的軟件工程師為此開發(fā)了全新的Apdative VSync平滑垂直同步技術(shù),將會(huì)在全新的ForceWare 300系列驅(qū)動(dòng)程序中提供,可以讓游戲畫面更加平滑,不再出現(xiàn)卡頓或撕裂。
這項(xiàng)技術(shù)在運(yùn)行的原理是根據(jù)幀率實(shí)時(shí)開啟或關(guān)閉原本的垂直同步技術(shù),取兩者之長(zhǎng),達(dá)到讓游戲運(yùn)行幀率更流暢的目的。具體運(yùn)行情況是這樣:當(dāng)檢測(cè)到FPS低于60時(shí),實(shí)時(shí)關(guān)閉VSync,讓當(dāng)前幀能夠以能夠達(dá)到的最高渲染速率進(jìn)行,不至出現(xiàn)強(qiáng)制降低幀率從而出現(xiàn)嚴(yán)重卡頓的情況,而一旦幀率達(dá)到60,隨機(jī)開啟VSync,避免游戲幀率過(guò)高從而產(chǎn)生畫面撕裂。有了NVIDIA Apdative VSync技術(shù),你不用再糾結(jié)與垂直同步的開啟或關(guān)閉,從而將可以得到更流暢的游戲體驗(yàn)。
在3D圖像中,我們不可避免的遇到“鋸齒”。鋸齒是由于受到顯示設(shè)備分辨率和圖像生成原理制約,不可避免的會(huì)出現(xiàn)的一種圖像失真現(xiàn)象,具體表現(xiàn)為畫面中物體的邊緣呈現(xiàn)出三角形的鋸齒狀。為了獲得更好的視覺體驗(yàn),讓物體邊緣看起來(lái)更柔和、自然,需要進(jìn)行消除鋸齒(Anti-Aliasing,簡(jiǎn)稱AA)處理。
目前比較普遍使用的抗鋸齒技術(shù)是MSAA(MultiSampling Anti-Aliasing多重采樣抗鋸齒)技術(shù),這種技術(shù)的實(shí)現(xiàn)原理較為簡(jiǎn)單,但是卻耗費(fèi)大量硬件資源。開啟4x MSAA之后很多游戲運(yùn)行效率會(huì)大幅降低,有可能讓原本可以流暢運(yùn)行的游戲變?yōu)闊o(wú)法流暢運(yùn)行。這也是的玩家不得不在“更好畫面”和“更流暢運(yùn)行”之間做出一個(gè)艱難的選擇。
FXAA與4x MSAA效果對(duì)比(點(diǎn)擊圖片可以放大)
而NVIDIA自去年發(fā)布了一項(xiàng)全新的鋸齒處理技術(shù):FXAA(Fast Approximate Anti-Aliasing,快速近似抗鋸齒)。這一項(xiàng)技術(shù)屬于一種圖像后處理技術(shù),處理操作發(fā)生在游戲渲染管線后期工作階段。FXAA并不能徹底解決圖像鋸齒的問(wèn)題,但是可以很大程度的改良圖像效果,而它最大的優(yōu)勢(shì)在于提供不低于MSAA效果的同時(shí)執(zhí)行效率大幅提升,其單幀畫面的處理時(shí)間僅需1毫秒,而MSAA的處理時(shí)間則要高出許多。最后的結(jié)果是,使用FXAA在得到與MSAA相近的畫面品質(zhì)時(shí),運(yùn)行幀率卻能高出一倍。
FXAA的執(zhí)行效率要遠(yuǎn)高于4x MSAA
目前FXAA用兩種實(shí)現(xiàn)方法:一種是游戲引擎內(nèi)自帶,比如極度恐慌3、永遠(yuǎn)的毀滅公爵、戰(zhàn)地3等游戲;另外一種則是通過(guò)NVIDIA顯卡控制面板打開,在全新的ForceWare 300中可以提供,也就是說(shuō)今后所有的游戲都可以使用這項(xiàng)全新技術(shù)了(前提是你使用NVIDIA顯卡)。
更為強(qiáng)大的TXAA技術(shù)即將來(lái)臨
TXAA與8x MSAA效果對(duì)比(點(diǎn)擊圖片可以放大)
而如今,又一項(xiàng)新技術(shù)誕生了:TXAA。TXAA是全新一代硬件渲染的抗鋸齒技術(shù),可以提供電影級(jí)別的畫面品質(zhì),專為發(fā)揮GTX680強(qiáng)大的紋理性能而設(shè)計(jì)。TXAA將會(huì)通過(guò)HDR后處理管線從硬件層面上提供顏色矯正處理。目前TXAA分為TXAA1、TXAA2兩個(gè)級(jí)別,TXAA1可以實(shí)現(xiàn)8x MSAA的效果,執(zhí)行效率與2x MSAA相當(dāng),而TXAA2則會(huì)提供更高的畫面品質(zhì)。
與NVIDIA合作的游戲/廠商
支持TXAA技術(shù)的游戲?qū)?huì)在今年晚些時(shí)候逐漸登場(chǎng),已經(jīng)確定要發(fā)行的作品包括:機(jī)甲戰(zhàn)士在線(MechWarrior Online)、神秘世界(Secret World)、星戰(zhàn)前夜在線(EVE Online)、無(wú)主之地2(Borderlands 2),而BitSquid、Slant Six Games、虛幻4引擎、Crytek(代表作:孤島危機(jī))也都將推出采用TXAA技術(shù)的作品。
GTX680和GTX690都可以實(shí)現(xiàn)最多四屏顯示
過(guò)去NVIDIA的顯卡無(wú)論高端、主流、低端還是專業(yè)卡,單塊顯卡僅能支持兩個(gè)屏幕顯示,這一傳統(tǒng)已經(jīng)延續(xù)多年。而這次NVIDA在GTX680(全部“開普勒”核心的顯卡皆能支持該功能)的視頻輸出接口配置上進(jìn)行了大刀闊斧的改變:兩個(gè)Dual-link DVI、一個(gè)HDMI和一個(gè)DisplayPort接口,其中HDMI接口支持1.4a標(biāo)準(zhǔn),DisplayPort接口支持1.2標(biāo)準(zhǔn),從而實(shí)現(xiàn)了3860x2160的超高分辨率、更高的數(shù)據(jù)帶寬、多視頻/音頻流等全新功能。
采用這樣的接口配備完全是有原因的:根據(jù)調(diào)查,DVI依然是目前最流行的顯示信號(hào)傳輸方式,兩個(gè)可以支持高達(dá)2560x1600分辨率的DVI接口完全滿足絕大多數(shù)用戶的需求,而這一次HDMI、DisplayPort接口皆為全尺寸標(biāo)準(zhǔn)接口,用戶也無(wú)需再因?yàn)橘?gòu)買轉(zhuǎn)接頭而頭疼了,支持最新一代的顯示標(biāo)準(zhǔn)(HDMI 1.4a、DisplayPort 1.2)也令一張GTX680可以支持最新規(guī)范在未來(lái)數(shù)年內(nèi)都不會(huì)落后。
一塊顯卡就可以實(shí)現(xiàn)3D Vision Surround效果
這樣的視頻輸出配置在顯示驅(qū)動(dòng)的支持下最多可以達(dá)成四屏幕同時(shí)顯示,并且使用兩個(gè)DVI和一個(gè)HDMI接口就可以組成三屏系統(tǒng)(AMD Eyefinity技術(shù)在實(shí)現(xiàn)多屏顯示必須要使用一個(gè)DisplayPort接口)。此外顯示輸出可以完美支持立體3D顯示,這樣一來(lái)NVIDIA 3D Vision Surround技術(shù)便可以用一張GTX680顯卡完美實(shí)現(xiàn),帶來(lái)最極致的視覺體驗(yàn)。
得益全新SMX架構(gòu)、GPU Boost動(dòng)態(tài)加速技術(shù)的加入以及更高速的顯存頻率,GTX680變得無(wú)比強(qiáng)大。現(xiàn)在它可以實(shí)現(xiàn)更加華麗的PhysX物理效果、擁有更高的執(zhí)行效率,相比上代旗艦GTX580,GTX680這次可以帶來(lái)更好的物理效果體驗(yàn)。
馬克思·佩恩3
包括最新、最熱門的動(dòng)作、射擊、角色扮演類游戲《無(wú)主之地2》、《馬克思·佩恩3》都將使用PhysX物理加速技術(shù)。從而實(shí)現(xiàn)更加逼真的效果。
QQ炫舞2
QQ炫舞2視頻
除此之外,即將到來(lái)《QQ炫舞2》也將加入PhysX技術(shù)的支持,這款游戲在中國(guó)相當(dāng)火爆,擁有超過(guò)千萬(wàn)的注冊(cè)用戶。
今年NVIDIA還將推出更多使用PhysX物理加速技術(shù)的游戲。
為了讓測(cè)試平臺(tái)與今天測(cè)試的主角NVIDIA GTX690顯卡相配,我們特意選擇了目前比較高端的硬件配置與之搭配,確保能夠最大化發(fā)揮出GTX690的實(shí)際性能,測(cè)試平臺(tái)使用了Intel Core i7 3770K,8GB DDR3 1600內(nèi)存和一塊來(lái)自技嘉的Z77主板,下面是具體平臺(tái)配置。

為能夠全面衡量GTX690顯卡的實(shí)際性能,我們不僅采用了多款權(quán)威測(cè)試軟件檢測(cè)顯卡綜合效能,還采用不同DirectX版本游戲來(lái)檢驗(yàn)顯卡在不同環(huán)境下的適應(yīng)能力,同時(shí),測(cè)試中還專門加入了Physx物理效能和曲面細(xì)分效率測(cè)試,接下來(lái)就一起來(lái)看看GTX690顯卡在實(shí)際測(cè)試中的表現(xiàn)吧。
軟件介紹:作為最權(quán)威的DX10條件下顯卡性能測(cè)試軟件,3DMark Vantage可以全面衡量顯卡真實(shí)圖形性能,已成為業(yè)內(nèi)最普及的測(cè)試軟件之一。如果您想知道自家電腦的顯示性能,不妨用它來(lái)進(jìn)行測(cè)試,和我們的測(cè)試成績(jī)進(jìn)行對(duì)比。
3DMark Vantage所使用的引擎在DX10特效方面和《孤島危機(jī)》不相上下,但3DMark不是游戲,它不用考慮場(chǎng)景運(yùn)行流暢度的問(wèn)題,因此Vantage在特效的使用方面比Crysis更加大膽,“濫用”各種消耗資源的特效導(dǎo)致Vantage對(duì)顯卡的性能壓力大增。
畫面設(shè)置:3DMark Vantage中直接內(nèi)置了四種模式,分別為Extreme(旗艦級(jí))、High(高端級(jí))、Performance(性能級(jí))和Entry(入門級(jí)),只有在這四種模式下才能跑出總分,如果自定義模式就只能得到子項(xiàng)目分?jǐn)?shù)了。我們此次測(cè)試選擇了Extreme(旗艦級(jí))進(jìn)行測(cè)試。

一片GTX680的性能已經(jīng)十分驚人,讓兩塊GTX680合體后又會(huì)怎樣?在專門針對(duì)顯卡DX10模式下圖形性能進(jìn)行測(cè)試的3DMakr Vantage軟件對(duì)這一問(wèn)題進(jìn)行了充分說(shuō)明,雙GK104芯片的GTX690得分比GTX680提高11000多分,Extreme等級(jí)GPU測(cè)試成績(jī)接近30000,DX10下圖形性能比GTX680雙卡SLI僅僅少了1000分。HD7970作為AMD的現(xiàn)任單芯卡皇,在本次測(cè)試中居然只能排倒數(shù)第一!
接下來(lái)就是測(cè)試的重頭戲,DX11性能比拼。時(shí)至今日,依然沒有任何一個(gè)測(cè)試軟件或者游戲能夠取代3DMark在游戲玩家心目中的地位,因?yàn)?DMark的魅力就在于它所帶來(lái)的不僅僅是驚艷的畫面,更重要的是向廣大玩家提供了一種權(quán)威、系統(tǒng)、公正的衡量顯卡性能的方式。
● 3DMark 11的特色與亮點(diǎn):
1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面細(xì)分、計(jì)算著色器、多線程。
2、原生支持64bit,保留32bit:原生64位編譯程序,獨(dú)立的32位、64位可執(zhí)行文件,并支持兼容模式。
3、全新測(cè)試場(chǎng)景:總計(jì)六個(gè)測(cè)試場(chǎng)景,包括四個(gè)圖形測(cè)試(其實(shí)是兩個(gè)場(chǎng)景)、一個(gè)物理測(cè)試、一個(gè)綜合測(cè)試,全面衡量GPU、CPU性能。
4、拋棄PhysX,使用Bullet物理引擎:拋棄封閉的NVIDIA PhysX而改用開源的Bullet專業(yè)物理庫(kù),支持碰撞檢測(cè)、剛體、軟體,根據(jù)ZLib授權(quán)協(xié)議而免費(fèi)使用。

在主要針對(duì)顯卡DX11效能的3DMark 11中,GTX690超越GTX680更多,甚至超過(guò)了HD7970 CF。沒有任何流處理刪減的GK104果然非常強(qiáng)悍。
軟件介紹:Unigine Engine最先發(fā)布了首款DX11測(cè)試/演示程序——Heaven Benchmark,其中大量運(yùn)用了DX11新增的技術(shù)和指令,并主要針對(duì)系統(tǒng)Tessellation性能作出測(cè)試。
畫面設(shè)置:新版本進(jìn)一步強(qiáng)化了Tessellation技術(shù)的應(yīng)用,細(xì)分精度更高,畫面更上一層樓,為了更好的測(cè)試不同Tessellation設(shè)置下的性能差異,我們選擇了4AA和8AA兩種設(shè)定,將Tessellation設(shè)定為最高Extreme模式,并對(duì)2560x1600和1920x1080兩種分辨率進(jìn)行測(cè)試。
● 1920x1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

通過(guò)測(cè)試成績(jī)統(tǒng)計(jì)可以看到,單芯片顯卡NVIDIA GTX680已經(jīng)可以和HD6990相抗衡了,GTX690又成功壓制了HD7970 CF,這個(gè)環(huán)節(jié)的測(cè)試N卡全面領(lǐng)先。
游戲介紹:游戲引擎開發(fā)商BitSquid與游戲開發(fā)商Fatshark近日聯(lián)合公布了一個(gè)展示DX11強(qiáng)大技術(shù)的DEMO。這個(gè)名為《StoneGiant》(石巨人)的DEMO,可以讓玩家來(lái)測(cè)試自己PC顯卡的DX11性能。BitSquid Tech即將提供PC平臺(tái)的引擎,并且大概在今年第三季度將提供PS3和Xbox 360等其他平臺(tái)的引擎。
畫面設(shè)置:StoneGiant是一款技術(shù)演示Demo,畫面做的非常精美,進(jìn)入之后可以選擇開啟關(guān)閉Tessellation以及DOF(DX11級(jí)別景深)進(jìn)行測(cè)試,這兩項(xiàng)技術(shù)都十分消耗資源,尤其是同時(shí)打開時(shí)。其中Tessellation技術(shù)對(duì)畫質(zhì)的改善最為明顯,但DOF仔細(xì)看也有不小的畫質(zhì)提升,所以我們這里將Tesselation和DOF都開啟進(jìn)行測(cè)試。
測(cè)試方法:游戲自帶Benchmark。
● 1920x1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

這項(xiàng)測(cè)試與《Heaven Benchmark》一樣,主要針對(duì)顯卡Tessellation能力進(jìn)行測(cè)試,在這個(gè)測(cè)試中玩家可以根據(jù)不同設(shè)置直觀體驗(yàn)Tessellation技術(shù)為游戲畫面帶來(lái)的變化,測(cè)試中NVIDIA GTX690依然表現(xiàn)不俗,性能僅次于GTX680 SLI。
游戲介紹:《Aliens vs. Predator》同時(shí)登陸PC、X360和PS3,其中PC版因?yàn)橹С諨X11里的細(xì)分曲面(Tessellation)、高清環(huán)境光遮蔽(HDAO)、計(jì)算著色器后期處理、真實(shí)陰影等技術(shù)而備受關(guān)注,是AMD大力推行的游戲之一,但是這樣的主題難免讓本作有很多不和諧的地方,暴力血腥場(chǎng)面必然不會(huì)少!發(fā)行商世嘉在2009年11月就曾明志,表示不會(huì)為了通過(guò)審查而放棄電子娛樂產(chǎn)品發(fā)行商的責(zé)任,因?yàn)橛螒蛞S持“異形大戰(zhàn)鐵血戰(zhàn)士”這一中心主題,無(wú)論畫面、玩法還是故事線都不能偏離。
畫面設(shè)置AVP原始版本并不支持AA,但升級(jí)至1.1版本之后,MSAA選項(xiàng)出現(xiàn)在了DX11增強(qiáng)特效當(dāng)中,當(dāng)然還支持Tessellation、HDAO、DirectCompute等招牌。該游戲要求不算太高,所以筆者直接將特效調(diào)至最高進(jìn)行測(cè)試。
測(cè)試方法:游戲帶Benchmark,其中測(cè)試畫面頗代表意義,很好的體現(xiàn)了Tessellation異形身體以及HDAO等高級(jí)特效,希望這些特效能讓系統(tǒng)發(fā)揮所有潛力。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

作為A卡的優(yōu)勢(shì)項(xiàng)目,AVP測(cè)試環(huán)節(jié)中HD7970終于揚(yáng)眉吐氣,戰(zhàn)勝了GTX680,扳回一城。而GTX690依然是單卡無(wú)敵狀態(tài),事實(shí)上從測(cè)試開始這一點(diǎn)基本是毋庸置疑的了。
游戲介紹:《地鐵2033》(Metro 2033)是俄羅斯工作室4A Games開發(fā)的一款新作,也是DX11游戲的新成員。該游戲的核心引擎是號(hào)稱自主全新研發(fā)的4A Engine,支持當(dāng)今幾乎所有畫質(zhì)技術(shù),比如高分辨率紋理、GPU PhysX物理加速、硬件曲面細(xì)分、形態(tài)學(xué)抗鋸齒(MLAA)、并行計(jì)算景深、屏幕環(huán)境光遮蔽(SSAO)、次表面散射、視差貼圖、物體動(dòng)態(tài)模糊等等。
畫面設(shè)置:《地鐵2033》雖然支持PhysX,但對(duì)CPU軟件加速支持的也很好,因此使用A卡玩游戲時(shí)并不會(huì)因PhysX效果而拖累性能。該游戲由于加入了太多的尖端技術(shù)導(dǎo)致要求非常BT。
測(cè)試方法:選用第三方Benchmark程序,這是一小段地鐵隧道中的戰(zhàn)斗場(chǎng)景,場(chǎng)面復(fù)雜戰(zhàn)斗激烈,對(duì)顯卡提出了嚴(yán)峻考驗(yàn)。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

游戲打造出了一個(gè)陰暗、充滿危險(xiǎn)的地下世界,復(fù)雜的環(huán)境讓這款游戲在高畫質(zhì)下對(duì)顯卡性能提出了極高要求,尤其是高分辨率下,即便像GTX690這樣的雙芯顯卡也只能取得每秒28.1幀左右的成績(jī),而HD6990甚至不能流暢運(yùn)行!
游戲介紹:自《孤島驚魂》系列的版權(quán)被UBI購(gòu)買之后,該公司蒙特利爾分部就已經(jīng)開始著手開發(fā)新作,本作不但開發(fā)工作從Crytek轉(zhuǎn)交給UBI,而且游戲的故事背景也與前作毫無(wú)關(guān)系,游戲的圖形和物理引擎由UBI方面完全重新制作。
畫面設(shè)置:借助于蒙特利爾工作室開發(fā)的全新引擎,游戲中將表現(xiàn)出即時(shí)的天氣與空氣效果,所有物體也都因?yàn)槿碌奈锢硪?,而顯得更加真實(shí)。你甚至可以在游戲中看到一處火焰逐漸蔓延,從而將整個(gè)草場(chǎng)燒光!而且首次對(duì)DX10.1提供支持,雖然我們很難看到。
測(cè)試方法:游戲自帶Benchmark工具,在1920X1080和2560X1600兩種分辨率下,開最高特效分別進(jìn)行4AA/8AA測(cè)試。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

《Farcry2》營(yíng)造出了廣袤的場(chǎng)景,但對(duì)硬件的要求卻并不是很高,在4XAA+最高特效條件下,參與測(cè)試的顯卡也都能非常流暢的運(yùn)行這款游戲。
Crysis(孤島危機(jī))無(wú)疑是DX11出現(xiàn)之前對(duì)電腦配置要求最高的PC游戲大作。作為DX10游戲的標(biāo)桿,Crysis的畫面達(dá)到了當(dāng)前PC系統(tǒng)所能承受的極限,超越了次世代平臺(tái)和之前所有的PC游戲。Crysis還有個(gè)資料片Warhead,使用了相同的引擎。
畫面設(shè)置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端顯卡都只能在低分辨率下才敢開啟DX10模式,如今的DX11顯卡終于有能力單卡特效全開流暢運(yùn)行。
測(cè)試方法:Crysis內(nèi)置了CPU和GPU兩個(gè)測(cè)試程序,我們使用GPU測(cè)試程序,測(cè)試了1920X1080、2560X1600兩種分辨率和4AA/8AA模式。這個(gè)程序會(huì)自動(dòng)切換地圖內(nèi)的全島風(fēng)景。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

《Crysis》作為著名的“硬件殺手”,遇到GTX690也是乖乖就范。此外這款游戲中A卡整體表現(xiàn)較好。
《孤島危機(jī)2》是《孤島危機(jī)》的續(xù)作,游戲采CryENGINE 3引擎所制作。在游戲內(nèi)容上與一代也有很大變化,已經(jīng)從秘密的叢林作戰(zhàn)轉(zhuǎn)向了公開、大規(guī)模的現(xiàn)城市戰(zhàn)爭(zhēng)。故事發(fā)生在距一代3年后的2023年。外星人在地球上的大片區(qū)域挑起了戰(zhàn)爭(zhēng),各大城市都遭到攻擊,人口銳減,玩家將要進(jìn)行捍衛(wèi)地球的末日戰(zhàn)爭(zhēng)。
CE3擁有不遜于CE2的畫面表現(xiàn),并且?guī)?lái)了諸多的新特性和強(qiáng)大的SandBox3編輯器,同時(shí)新引擎也能適應(yīng)目前的PS3/XBOX360家用機(jī)平臺(tái),帶來(lái)家用機(jī)上的高水準(zhǔn)發(fā)揮,同時(shí)代表作Crysis2將登陸PC/XBOX360/PS3平臺(tái),引擎支持DirectX9/DirectX10/DirectX11,DX11版本僅PC,且要下載補(bǔ)丁。由于是一款NVIDIA的THE WAY游戲,所以此游戲DX11版本優(yōu)化了N卡。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

打上高級(jí)紋理補(bǔ)丁,Crysis2的顯存占用非常驚人,而本作中雙卡CF效率是非常之高。
賽車游戲中,轟鳴的發(fā)動(dòng)機(jī)聲、風(fēng)馳電掣的急速快感,足以讓無(wú)數(shù)玩家腎上腺素飆升。也許正是如此,才使得《科林麥克雷:塵埃3》在眾多游戲中備受玩家青睞。
《塵埃3》采用與《F1 2010》同樣的Ego引擎,擁有更加擬真的天氣系統(tǒng)及畫面效果。游戲?qū)﹫?chǎng)景、動(dòng)態(tài)天氣、YouTube上傳、經(jīng)典的賽車、分屏對(duì)戰(zhàn)、party模式、開放世界、更多真實(shí)世界中的贊助商和車手等特點(diǎn)。
相比首款DX11游戲的《塵埃2》,《塵埃3》在諸多DX11游戲特效的力助下,游戲畫質(zhì)表現(xiàn)更加出色。無(wú)論是日出還是日落,下雨還是干燥,看上去都非常逼真。背景的煙花和觀眾讓游戲代入感非常強(qiáng)。車身會(huì)隨著比賽的進(jìn)行染上泥土或者雪,一輛嶄新的賽車或許會(huì)在比賽完成之后,變成一輛被泥土覆蓋的“垃圾車”。
圖像方面,《塵埃3》是該系列至今為止最漂亮的一款?!秹m埃3》中的駕駛感相當(dāng)不錯(cuò),6種調(diào)整選項(xiàng)也足以應(yīng)付各種地形。而且,在芬蘭、密歇根、挪威、洛杉磯、肯尼亞和摩納哥駕駛賽車狂飆真的是一種享受。賽車會(huì)對(duì)相當(dāng)細(xì)微的操作做出回應(yīng),在雪地或泥地中,這一點(diǎn)尤其重要。而當(dāng)你的對(duì)手把雪花和泥漿彈到你的擋風(fēng)玻璃上時(shí),你只能依靠自己的直覺和細(xì)微的操作不至于翻車。而游戲中,雪花、雨滴和夜晚駕駛不僅僅是外在的裝飾而已,和現(xiàn)實(shí)生活一樣,你需要各種賽車配件來(lái)應(yīng)對(duì)這些情況。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

依然是GTX690的showtime,在這些重量級(jí)選手面前,塵埃3已經(jīng)完全難不倒他們了。
由EA DICE工作室開發(fā)的《戰(zhàn)地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且擁有強(qiáng)大的物理效果,最大的亮點(diǎn)還是光照系統(tǒng),其渲染的場(chǎng)景已近乎亂真的地步,視覺效果堪稱絕贊。游戲還支持即時(shí)晝夜系統(tǒng),為玩家營(yíng)造一個(gè)親臨現(xiàn)場(chǎng)的真實(shí)環(huán)境。

寒霜2引擎最大的特點(diǎn)便是支持大規(guī)模的破壞效果。由于考慮到游戲的畫面表現(xiàn)以及開發(fā)成本,DICE放棄了以只支持DX9的WINDOWS XP操作系統(tǒng)。另外由于該引擎基于DX11研發(fā),向下兼容DX10,因而游戲只能運(yùn)行于WINDOWS VISTA以上的的操作系統(tǒng)。
在《戰(zhàn)地3》中,“寒霜引擎2”內(nèi)置的破壞系統(tǒng)已經(jīng)被提升至3.0版本,對(duì)于本作中的一些高層建筑來(lái)說(shuō),新版的破壞系統(tǒng)將發(fā)揮出電影《2012》那般的災(zāi)難效果,突如其來(lái)的建筑倒塌將震撼每一位玩家的眼球。
《戰(zhàn)地3》采用了ANT引擎制作人物的動(dòng)作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戲中得到應(yīng)用,不過(guò)在FPS游戲中使用尚屬首次。相較于Havok等物理引擎,用ANT引擎可以花費(fèi)較少的精力制作出逼真的效果。舉例來(lái)說(shuō),戰(zhàn)士在下蹲時(shí)會(huì)先低頭俯身、放低槍口,而不是像以前的游戲那樣頭、身、槍如木偶般同時(shí)發(fā)生位移。此外,ANT引擎也可以讓電腦AI的行動(dòng)更加合理。但這款大作目前并不能良好的兼容120Hz3D以及紅藍(lán)3D模式。
● 1920X1080分辨率性能測(cè)試

● 2560X1600分辨率性能測(cè)試

寒霜2引擎年度大作戰(zhàn)地三,是為數(shù)不多的畫面可以挑戰(zhàn)Crysis的游戲大作,而對(duì)核心和顯存的要求已經(jīng)超越了Crysis!
在經(jīng)歷了兩年前阿卡姆瘋?cè)嗽簬?lái)的震撼后,Rocksteady終于在今年年底帶來(lái)了蝙蝠俠的續(xù)作——阿卡姆之城。這款游戲也在上市之初讓我們見識(shí)出了正統(tǒng)版權(quán)的威力,有華納兄弟的贊助與發(fā)行,完全再現(xiàn)電影和小說(shuō)中的原著橋段不再是夢(mèng),100%的高還原度讓玩家猶如身臨其境,再現(xiàn)了一個(gè)熒幕上真實(shí)的蝙蝠俠或許也是這部游戲的成功所在。
《蝙蝠俠:阿卡姆之城》仍然建立在《阿卡姆瘋?cè)嗽骸返臍夥丈希贿^(guò)這次上升至阿甘之城——高譚市內(nèi)戒備森嚴(yán)的,關(guān)押了大量暴徒的監(jiān)獄之中。而且新作還匯集了眾多明星參與的配音陣容以及蝙蝠俠中的極度兇殘的惡棍,并改進(jìn)和加強(qiáng)了一游戲特點(diǎn),讓玩家們擁有像《蝙蝠俠前傳2:黑暗騎士》一般的終極游戲體驗(yàn)。
阿卡姆之城的畫面,絕對(duì)是當(dāng)今次時(shí)代游戲中數(shù)一數(shù)二的,但是其開發(fā)引擎卻依舊是虛幻3,這著實(shí)讓許多玩家感嘆,到底虛幻3引擎還有多大潛力可以發(fā)揮。雖然虛幻3引擎目前來(lái)看最大的問(wèn)題就是畫面普遍油膩感十足,但是在阿卡姆之城中,少許的油膩感卻成了點(diǎn)睛之筆,讓蝙蝠俠更加貼近漫畫、電影。
除了虛幻3的引擎外,蝙蝠俠從上一代作品中就加入了NVIDIA的PhysX物理加速引擎。在游戲的細(xì)節(jié)中,更加貼近真實(shí)效果,煙霧、燈光、人物的衣服、報(bào)紙等等細(xì)節(jié)全部通過(guò)PhysX物理引擎計(jì)算,游戲中的破碎、打擊效果隨之表現(xiàn)的也不在那么匪夷所思。但是,凡事都有兩面,真實(shí)的受力表現(xiàn)換來(lái)的則是大量的資源占用,這也使得蝙蝠俠這個(gè)虛幻3引擎的游戲一下成為了硬件殺手,如果達(dá)到非常好的游戲表現(xiàn),恐怕非GTX580這樣的旗艦單卡莫屬了。
● 1920X1080分辨率、PhysX high性能測(cè)試

● 1920X1080分辨率、PhysX off性能測(cè)試

● 2560X1600分辨率、PhysX high性能測(cè)試

● 2560X1600分辨率、PhysX off性能測(cè)試

PhysX的確是個(gè)好技術(shù),可惜支持PhysX的游戲大作目前真沒幾款能拿得出手,Batman系列算是鳳毛麟角。雖然這樣,我們還是詳細(xì)的測(cè)試了這款爭(zhēng)議游戲,以獲悉HD7970和GTX690的性能差距。
對(duì)于在一塊PCB上集成了兩顆GPU核心的優(yōu)異顯卡來(lái)說(shuō),散熱、功耗與性能的平衡永遠(yuǎn)都是個(gè)問(wèn)題,而高端顯卡恐怖的發(fā)熱噪音歷來(lái)為人詬病,這次雙芯旗艦GTX690表現(xiàn)如何呢?接下來(lái)我們就通過(guò)使用Furmark對(duì)顯卡進(jìn)行滿載來(lái)驗(yàn)證一下GTX690的外部特性。
從上面的拷機(jī)測(cè)試我們可以看到,GTX690待機(jī)溫度僅僅41度,而滿載溫度最高位85度,這個(gè)成績(jī)?cè)谄炫烇@卡,尤其是雙芯顯卡中算是非常出色了。
● 平臺(tái)閑置功耗測(cè)試

雖然GTX690核心默認(rèn)頻率就達(dá)到了915MHz,而且可以自動(dòng)超頻到1GHz以上,但功耗控制的非常理想,GTX690+i7 3770K+Z77這樣的優(yōu)異平臺(tái)閑置功耗僅僅70W左右!

滿載功耗也是控制的非常不錯(cuò),F(xiàn)urmark程序最高讓這個(gè)平臺(tái)達(dá)到了363W的功耗,和NVIDIA官方宣稱的顯卡300W TDP相吻合,相對(duì)于GTX680 SLI更是優(yōu)勢(shì)明顯。
從上面的架構(gòu)解析和性能測(cè)試我們不難發(fā)現(xiàn),開普勒的雙芯旗艦——GTX690是目前地球上最強(qiáng)顯卡,當(dāng)之無(wú)愧的卡皇。除此之外,新技術(shù)的引入讓這款旗艦顯卡也不再是功耗怪獸,在歷代卡皇中,GTX690還擁有更多吸引人的新特性。
● 更智能的超頻:NVIDIA動(dòng)態(tài)加速技術(shù)
這一代“開普勒”顯卡特有的GPU Boost技術(shù)動(dòng)態(tài)加速演示
● 更平滑的動(dòng)作:自適應(yīng)垂直同步

這項(xiàng)技術(shù)在運(yùn)行的原理是根據(jù)幀率實(shí)時(shí)開啟或關(guān)閉原本的垂直同步技術(shù),取兩者之長(zhǎng),達(dá)到讓游戲運(yùn)行幀率更流暢的目的。具體運(yùn)行情況是這樣:當(dāng)檢測(cè)到FPS低于60時(shí),實(shí)時(shí)關(guān)閉VSync,讓當(dāng)前幀能夠以能夠達(dá)到的最高渲染速率進(jìn)行,不至出現(xiàn)強(qiáng)制降低幀率從而出現(xiàn)嚴(yán)重卡頓的情況,而一旦幀率達(dá)到60,隨機(jī)開啟VSync,避免游戲幀率過(guò)高從而產(chǎn)生畫面撕裂。有了NVIDIA Apdative VSync技術(shù),你不用再糾結(jié)與垂直同步的開啟或關(guān)閉,從而將可以得到更流暢的游戲體驗(yàn)。
● 更具效能的抗鋸齒技術(shù):FXAA和TXAA
FXAA在得到與MSAA相近的畫面品質(zhì)時(shí),運(yùn)行幀率卻能高出一倍。TXAA是全新一代硬件渲染的抗鋸齒技術(shù),可以提供電影級(jí)別的畫面品質(zhì),專為發(fā)揮GTX680強(qiáng)大的紋理性能而設(shè)計(jì)。TXAA將會(huì)通過(guò)HDR后處理管線從硬件層面上提供顏色矯正處理。目前TXAA分為TXAA1、TXAA2兩個(gè)級(jí)別,TXAA1可以實(shí)現(xiàn)8x MSAA的效果,執(zhí)行效率與2x MSAA相當(dāng),而TXAA2則會(huì)提供更高的畫面品質(zhì)。
● 更震撼的顯示效果:?jiǎn)慰ㄋ钠?/STRONG>

這樣的視頻輸出配置在顯示驅(qū)動(dòng)的支持下最多可以達(dá)成四屏幕同時(shí)顯示,并且使用兩個(gè)DVI和一個(gè)HDMI接口就可以組成三屏系統(tǒng)(AMD Eyefinity技術(shù)在實(shí)現(xiàn)多屏顯示必須要使用一個(gè)DisplayPort接口)。此外顯示輸出可以完美支持立體3D顯示,這樣一來(lái)NVIDIA 3D Vision Surround技術(shù)便可以用一張GTX680顯卡完美實(shí)現(xiàn),帶來(lái)最極致的視覺體驗(yàn)。
全文總結(jié):
隨著HD7970和GTX680的相繼發(fā)布,GTX680以其卓越的性能和良好的功控為人稱道,GCN、Kepler架構(gòu)優(yōu)劣之爭(zhēng)也慢慢塵埃落定,而這次GTX690的搶先發(fā)布讓人們?cè)僖淮晤I(lǐng)略了開普勒的實(shí)力!
AMD的南方群島、NVIDIA的開普勒都使用了臺(tái)積電28nm新工藝,但因?yàn)楣に嚦墒於?、發(fā)布策略的方面的原因,又不是完全相同的28nm工藝。最開始的時(shí)候,兩家自然都想使用28nm HKMG HP高性能版本,但可惜這種工藝難度較大,當(dāng)時(shí)仍然很不成熟,于是AMD沉不住氣轉(zhuǎn)而采用另外一個(gè)版本:28nm HKMG HPL。這種工藝同樣使用了HKMG(高K金屬柵極)技術(shù),但技術(shù)相對(duì)來(lái)說(shuō)更容易實(shí)現(xiàn)。
NVIDIA開普勒則選擇等待28nm HKMG HP高性能工藝。
最后的結(jié)果已經(jīng)非常明顯,AMD Radeon HD 7000系列顯卡果然得以搶先發(fā)布,但卻在性能和效率方面難以和GTX600系列抗衡。是做對(duì)的事,還是容易的事?我想這次的旗艦交鋒給了我們一個(gè)鮮活的案例?!?/P>
關(guān)注我們


