如何展現(xiàn)真實性能!媒體顯卡測試曝光
注:本文編譯自國外網(wǎng)站 HardwareCanucks.com,原文鏈接。
泡泡網(wǎng)顯卡頻道7月2日 評測幾乎是每一個IT網(wǎng)站都會做的事情,但不同的網(wǎng)站卻有著不同的準(zhǔn)確度,包括很多讀者在看了媒體的評測之后,自己想要再次嘗試測試,以幫助自己能夠買到最合適的產(chǎn)品,卻發(fā)現(xiàn)自己根本找不到自己最喜歡的網(wǎng)站到底是怎么測試的,尤其是對于顯卡的測試,這種現(xiàn)象非常嚴(yán)重。還有一個問題就是,媒體的測試成績到底能否代表顯卡玩某款游戲時的實際性能?媒體到底是怎么測試顯卡的?媒體的測試就一定準(zhǔn)確嗎?今天,我們不惜曝光這一切!
通過對20多個英語IT技術(shù)網(wǎng)站的統(tǒng)計和調(diào)查,我們發(fā)現(xiàn)絕大多數(shù)媒體在測試顯卡時,都是有游戲獨(dú)立測試工具的時候就用獨(dú)立測試工具,游戲內(nèi)置Benchmark程序的時候就用游戲內(nèi)置的BenchMark,如果可以錄制TimeDemo的話就錄制TimeDemo進(jìn)行測試。我們還發(fā)現(xiàn)很多網(wǎng)站的測試出了一個游戲標(biāo)題以外,就沒有其他的介紹了,包括是使用什么方式/何種工具測試的都沒有介紹。不過,我們看到很多網(wǎng)站似乎都是用游戲內(nèi)置的BenchMark測試工具,而不是通過實際玩游戲進(jìn)行測試。這也就導(dǎo)致了一些很有意思的結(jié)果。
在本篇文章里,我們將通過9款最熱門、同時也是目前絕大多數(shù)網(wǎng)站測試顯卡所測試的游戲進(jìn)行測試,來揭開媒體對顯卡的測試是否真的準(zhǔn)確等秘密。本文大部分內(nèi)容將放在獨(dú)立測試程序和游戲內(nèi)置測試程序這兩種測試工具上進(jìn)行討論研究,因為這兩種方式是媒體編輯最喜歡使用的兩種測試方式。當(dāng)然,最后我們還會談到TimeDemos測試法到底怎么樣、游戲場景采樣長度的重要性以及補(bǔ)丁是否影響性能等諸多問題。
本次測試我們將使用一款GTX470和一款HD5850顯卡來完成,以確定不同的測試方法定位到不同的產(chǎn)品在性能方面有怎樣的影響,另外本次測試的游戲我們都已經(jīng)玩了一遍了,就是為了更加了解這些游戲。我們將會找出一個“最糟情況”(即對顯卡要求較高的場景)和一個“典型情況”(即在玩某個游戲時最能代表大多數(shù)情況的場景),與媒體編輯經(jīng)常使用的“游戲內(nèi)置測試工具”和“游戲獨(dú)立測試工具”進(jìn)行對比。
● 測試平臺和測試方法介紹
在本次測試中,所有參加測試的游戲均已經(jīng)更新到了最新版本或者安裝了最新版本補(bǔ)?。ㄑa(bǔ)丁一節(jié)例外,文章有詳細(xì)介紹),操作系統(tǒng)也打上了最新的補(bǔ)丁,所有的成績都取決于三次運(yùn)行之后的平均成績,所有的游戲畫質(zhì)設(shè)定都是在游戲中或者游戲附帶的配置文件中設(shè)定,所有游戲和測試的幀數(shù)記錄都使用Fraps,也就是說即使游戲的BenchMark程序能跑出分,也不做統(tǒng)計。
● Batman: Arkham Asylum(蝙蝠俠:阿卡姆瘋?cè)嗽海?/STRONG>
《蝙蝠俠》從發(fā)布之后就非常熱門,原因或許是它內(nèi)置了一個BenchMark測試程序,并且又支持PhysX物理加速,全球網(wǎng)站的評測編輯都喜歡使用吧。
之前我們測試《蝙蝠俠:阿卡姆瘋?cè)嗽骸愤@款游戲的時候,幾乎所有的網(wǎng)站都是用內(nèi)置的BenchMark測試程序獲得顯卡在這款游戲中運(yùn)行的流暢度,而今天我們要使用另外兩種游戲場景進(jìn)行測試,并與游戲內(nèi)置的BenchMark測試程序所測得的結(jié)果進(jìn)行對比。這另外的兩種游戲場景分別是:
典型場景(Typical):即在以第一人稱方式玩游戲時的戰(zhàn)斗場景,記錄三分鐘的平均幀數(shù);
最糟情況(Worst Case):即在森林中的游戲場景,同樣記錄三分鐘的平均幀數(shù);
使用過《蝙蝠俠:阿卡姆瘋?cè)嗽骸分袃?nèi)置BenchMark的用戶應(yīng)當(dāng)知道,這款游戲內(nèi)置的BenchMark視角是一種第三人稱視角,也就是類似于一個浮動的攝像機(jī)拍攝的視角,從測試結(jié)果可以看出,通過BenchMark所測得的幀數(shù)相對于實際游戲過程明顯偏高。也就是說,實際玩這款游戲的時候,平均幀數(shù)可能會比通過游戲內(nèi)置BenchMark測試的幀數(shù)要低。
在實際玩這款游戲的過程中,屏幕上可能同時出現(xiàn)多個高細(xì)節(jié)的角色模型,GPU的壓力其實并不小。但游戲內(nèi)置BenchMark所采用的第三人稱拍攝視角則沒有這么消耗GPU資源。不過值得注意的是,內(nèi)置BenchMark程序所測試的成績雖然不能完全體現(xiàn)實際玩游戲時的幀率,但其中A卡和N卡的具體表現(xiàn)在任何一種場景下性能的比例都比較準(zhǔn)確,GTX470比HD5850快一些但幅度不大。當(dāng)然,這次測試沒有開啟NVIDIA獨(dú)家支持的PhysX物理加速。
● DiRT 2(塵埃2)
《塵埃2》是一款非常棒的DX11游戲,也是本次測試中唯一一款內(nèi)置的BenchMark描繪的是實際玩游戲時情況的游戲,游戲的畫質(zhì)也非常不錯。之前這款游戲出過專門為評測人員準(zhǔn)備的DEMO版,在本次測試中把DEMO版的測試也加入進(jìn)來。
與游戲內(nèi)置的BenchMark以及Demo版游戲內(nèi)置的BenchMark相對比的仍然是兩種場景,分別如下:
典型情況(Typical):猶他州賽道開拓者(Utah Trail Blazer)
最糟情況(Worst Case):巴特西的天空(Battersea: Air)
通過我們的測試,不得不說《塵埃2》這款游戲內(nèi)置的BenchMark是最為準(zhǔn)確的,和實際玩游戲時場景所得到的幀數(shù)都非常接近,而且接近的是“最糟”情況的得分,也就是說在大多數(shù)情況下,你實際玩游戲的體驗可能會比游戲內(nèi)置BenchMark的幀數(shù)稍高一點(diǎn),這樣無疑是非常合理。不過,如果你是一名非常優(yōu)秀的車手,并且總是能將其他車手大幅超越的話,游戲幀數(shù)可能會更高,因為更多的車輛才更加消耗GPU資源。
相比來說,游戲推出的獨(dú)立的DEMO版測試程序就比較杯具了,不僅僅需要通過在游戲的配置文件中強(qiáng)制開啟DX11模式(對于多數(shù)用戶來說并不容易),而且在有些顯卡上所得到的幀數(shù)和實際游戲的幀數(shù)相差很大,想必《塵埃2》游戲的自動升級沒有將升級包同時安裝到獨(dú)立的DEMO版是造成此問題的一個重要原因,結(jié)果導(dǎo)致使用該BenchMark測試的性能和你實際玩游戲的體驗相差太遠(yuǎn)。
● Farcry 2(孤島驚魂2)
《孤島驚魂2》 的場景變化無窮,是一款非常好玩的游戲,游戲內(nèi)置了一套測試工具,用戶可以通過游戲中內(nèi)置的標(biāo)準(zhǔn)游戲場景進(jìn)行測試,用戶也可以在游戲中自己錄制DEMO再通過測試工具獲得運(yùn)行過程中的平均幀數(shù)。
在本次測試中,“最糟情況(worst case)”場景我們選擇的是使用一種噴火的武器以及AK-47對一個村莊的敵人進(jìn)行攻擊的場景;“典型(Typical)”場景則使用的是你玩這款游戲絕大部分時間的操作:襲擊藏在草從中的敵人。當(dāng)然,測試工具內(nèi)置的的三種場景——Ranch Small、Ranch Medium 以及 Ranch Large 也測試了平均幀數(shù)。
上表就是本次測試的結(jié)果,其實我們可以看到,“最糟情況”和“典型情況”各個顯卡的表現(xiàn)其實都差不多,但是在游戲內(nèi)置的三個Ranch(牧場)測試中,卻發(fā)現(xiàn)各個顯卡在不同場景中的表現(xiàn)差距很大。好的是從測試成績中可以看出不管是NVIDIA還是ATI在內(nèi)置的場景中都沒有額外的優(yōu)化。所以對于《孤島驚魂2》這款游戲來說,為了更加能夠代表玩家在實際玩游戲過程中的情況,我們建議自己錄制戰(zhàn)斗的畫面進(jìn)行測試。
● H.A.W.X(鷹擊長空)
《鷹擊長空》也是一個在我們測試時經(jīng)常提起的一款游戲,盡管游戲本身內(nèi)置了BenchMark測試程序,但作為一款非常復(fù)雜的游戲,只有一個測試場景顯然不能反映游戲在實際運(yùn)行中的表現(xiàn)。
游戲中內(nèi)置BenchMark所描繪的場景是玩家駕駛飛機(jī)飛越里約熱內(nèi)盧上空,這其實是游戲玩家的首個任務(wù)之一。隨后進(jìn)入東京灣以及芝加哥大戰(zhàn),展示最激烈的戰(zhàn)斗場面。下面是我們與游戲內(nèi)置的BenchMark對比測試的兩個場景:
“典型情況(Typical)”:阿巴拉契亞關(guān),3分鐘空中作戰(zhàn);
“最糟情況(Worst Case)”:里約熱內(nèi)盧,3分鐘空中作戰(zhàn);
從測試的結(jié)果中我們看到,使用游戲內(nèi)置的BenchMark測試的結(jié)果雖然還算準(zhǔn)確,但仍然和實際玩游戲過程中的幀率有一定的差距,在一般的“典型”情況下,游戲的體驗應(yīng)該會比游戲內(nèi)置BenchMark所測試的平均幀數(shù)高一些。
● Just Cause 2(正當(dāng)防衛(wèi)2)
《正當(dāng)防衛(wèi)2》 是一款采用DX10 API的新游戲,游戲畫面也非常華麗,當(dāng)然也給顯卡的性能帶來了挑戰(zhàn)。游戲也內(nèi)置了三個場景,用以展示游戲的不同部分。但遺憾的是,沒有一個場景基于實際玩游戲時的情況。
我們?nèi)匀徽页鲆粋€“典型”的場景和一個“最糟”的場景,與游戲內(nèi)置的三個BenchMark進(jìn)行對比。下面是這兩個場景的介紹:
典型情況(Typical):Panau Village(在小鎮(zhèn)上襲擊士兵)—時長 4 分鐘;
最糟情況(Worst Case): Casino Assault(從車頂逃亡的場景)——時長 4 分鐘;
當(dāng)然,為了對比我們關(guān)閉了NVIDIA的專用特效,比如 CUDA Water和遠(yuǎn)景模糊特效。
雖然“Dark Tower”BenchMark所測試的成績和我們實際所測試的成績相近,但它仍然不能代表玩游戲時的真實水平,很簡單因為它使用的是空中飛行視角,不過比其他兩個更加離譜的BenchMark好多了。所以,在《正當(dāng)防衛(wèi)2》這款游戲中,使用“Dark Tower”BenchMark所測試的成績更加能夠代表真實玩游戲時的體驗。
● Resident Evil 5(生化危機(jī)5)
去年NVIDIA發(fā)布“Big Bang”驅(qū)動的時候,《生化危機(jī)5》正好趕上了這款驅(qū)動,得到了很大幅度的性能提升。雖然游戲本身很恐怖,但作為一款采用DX10 API 的游戲來說,這款游戲?qū)τ贕PU性能的利用以及畫質(zhì)方面都還是很不錯的。
游戲內(nèi)置兩個BenchMark,分別叫做 Fixed 和 Variable,我們?nèi)匀徽覂蓚€實際玩游戲的情況與這兩個BenchMark進(jìn)行對比。
“典型情況(Typical)”:第五關(guān)第二小節(jié),穿過街道并干掉沿途的敵人;
“最糟情況(Worst Case)”:第二關(guān)第一小節(jié),玩家乘坐卡車在橋上的場景,場景中有大量的爆炸和敵人;
Variable BenchMark看起來和實際的游戲表現(xiàn)非常接近,但這仍然代表不了全部,因為這款游戲本身對N卡有大量的優(yōu)化,在很多情況下N卡的表現(xiàn)都會比A卡更好,我們非常不愿意看到一些游戲廠商專門針對某一個品牌的顯卡/GPU進(jìn)行優(yōu)化。
● Aliens versus Predator(異形大戰(zhàn)鐵血戰(zhàn)士)
幾個星期前,Rebellion 發(fā)布了一個獨(dú)立的《異形大戰(zhàn)鐵血戰(zhàn)士》測試工具,使用了高等級的 Tessellation 特效,然后讓無數(shù)用戶的顯卡都跑不動。那么,實際玩游戲的時候是否真的這么變態(tài)呢?
為了對比,我們?nèi)匀徽覂蓚€場景與這個獨(dú)立的測試工具進(jìn)行對比測試,下面是兩個場景的一些詳細(xì)細(xì)節(jié):
“典型情況(Typical)”:Predator campaign – Swamp mission,時長4分鐘;
“最糟情況(Worst Case)”:Marine campaign – Refinery mission,時長4分鐘;
所有的畫質(zhì)設(shè)定都通過修改游戲和測試工具的配置文件來進(jìn)行。
通過實際的游戲測試來看,結(jié)果完全沒有游戲的測試工具所展示的性能那么糟糕,實際玩游戲的幀數(shù)遠(yuǎn)遠(yuǎn)要比游戲的獨(dú)立測試工具高。另外,雖然我們從游戲獨(dú)立的測試工具測出的結(jié)果是GTX470和HD5850性能相當(dāng),但根據(jù)實際玩游戲的測試結(jié)果來看,N卡的表現(xiàn)顯然要比A卡的表現(xiàn)好的多。
● STALKER:Call of Pripyat(潛行者:普里皮亞季的召喚)
最新版本的《潛行者:普里皮亞季的召喚》是一款采用采用 DX11 API 較早的游戲了,雖然使用了豐富的DX11特效,但該作的畫質(zhì)表現(xiàn)并不令人滿意。該游戲也擁有獨(dú)立的測試工具,而且由于測試工具的設(shè)置界面非常簡單,測試結(jié)果也很精確,網(wǎng)站的評測人員都很喜歡使用游戲獨(dú)立的測試工具測試顯卡性能。
該游戲的獨(dú)立測試工具內(nèi)置了4種場景,每次運(yùn)行都會將這四種場景跑完,從某種程度上來說可以綜合的體現(xiàn)出顯卡在這款游戲不同場景下的表現(xiàn)。但實際上是怎么樣的呢?能否代表游戲玩家玩這款游戲時的性能表現(xiàn)呢?我們也挑選了兩種實際玩的情況與游戲本身的測試工具進(jìn)行對比,不過需要注意的是,游戲本身的測試工具所測試的成績我們只記錄了其中兩個,分別是 Day 和 Sunshafts。下面是我們實際玩這款游戲時選擇的場景:
“典型情況(Typical)”:室內(nèi)和室外的組合場景;
“最糟情況(Worst Case)”:普里皮亞季的城市中;
以上兩種情況都運(yùn)行三分鐘,并穿插著戰(zhàn)斗場面。
通過測試來看,在不同的游戲場景下顯卡的表現(xiàn)完全不一樣,但整體來說實際玩游戲的幀數(shù)要比使用獨(dú)立測試工具時測試的幀數(shù)高,反映出了這款游戲的測試工具也不是那么靠譜。另外還有一點(diǎn),我們發(fā)現(xiàn)在某些情況下,HD5850的最低幀數(shù)比GTX470最低幀數(shù)高,而在實際的游戲中無論如何也沒辦法重現(xiàn)這一點(diǎn),同樣我們也沒有辦法重現(xiàn)HD5850與GTX470的平均幀數(shù)那么大的差距。從實際玩游戲所測得的幀數(shù)來看,HD5850和GTX470之間的差距很小,而通過游戲獨(dú)立的測試工具來看卻差距很大。
所以,我們認(rèn)為雖然這款游戲的獨(dú)立測試工具是一個很不錯的東西,但如果用在N卡和A卡對比的文章中就不合適了,顯然有失公平。
讓用戶可以自己錄制TimeDemo的游戲越來越少,即使之前有一些游戲支持錄制TimeDemo,但似乎也有逐漸取締該功能的勢頭,這其中有很多很多的原因。但通過前面的測試我們看到,很多游戲提供的 BenchMark 工具并不能真正意義上代表用戶在玩游戲時的情景。
目前的主流熱門游戲中,只有《求生之路 2》以及《孤島驚魂2》還保留著這種比較傳統(tǒng)的功能,所以本小節(jié)的測試我們只能通過這兩款游戲來完成?!肚笊?》使用我們經(jīng)常使用的Atrium關(guān)作為測試場景,而《孤島驚魂2》使用村莊戰(zhàn)斗的場景作為測試場景。
為了得出更加準(zhǔn)確的結(jié)果,玩第一圈不記錄幀數(shù),而第二圈則開啟 Fraps 記錄幀數(shù),同時 Fraps 還用來記錄相同場景TimeDemo回放的幀數(shù),當(dāng)然我們保證玩游戲的場景和回放的TimeDemo場景是完全一樣的。下面首先是《孤島驚魂2》的測試成績:
從測試結(jié)果我們可以看到,在相同的場景下,使用TimeDemo回放和實際玩游戲的情況下幾乎沒有差距,也可以反映其準(zhǔn)確性。接下來,我們在看看使用TimeDemo以及實際游戲情況下對比在《求生之路2》這款游戲中的表現(xiàn):
雖然從柱狀圖反映出的長度來看,要比上面測試的《孤島驚魂2》差距大一些,但是仔細(xì)一算也僅僅只有3%的差距,這樣的差距在游戲中完全可以作為誤差忽略掉,所以整體來看,使用TimeDemo回放進(jìn)行游戲測試時非常準(zhǔn)確的。
雖然準(zhǔn)確度很高,但目前所面臨的一個最大問題是只有非常少的游戲支持錄制/回放TimeDemo,其實使用TimeDemo進(jìn)行測試不僅僅可以讓評測編輯更加輕松,最重要的是網(wǎng)站的評測編輯可以向讀者共享出自己錄制的TimeDemo,而共享TimeDemo可以最大限度的提高網(wǎng)站測試的透明度,并真正意義上幫助讀者選購正確的產(chǎn)品。我們真心的希望更多的游戲能夠在不遠(yuǎn)的將來支持該功能。
當(dāng)游戲廠商為某游戲發(fā)布新的補(bǔ)丁之后,人們通常會慶幸又修復(fù)了一些游戲中的Bug,但很多人不知道廠商也可能為了優(yōu)化/提升性能而發(fā)布游戲補(bǔ)丁包。
在過去,人們通常需要去搜索游戲補(bǔ)丁。而現(xiàn)在,很多游戲廠商(比如 Valve 的 Steam)直接提供了更新服務(wù),讓游戲可以自動更新并且對于用戶來說非常簡單。但遺憾的是,很多評測編輯卻不把更新當(dāng)回事,甚至完全禁用游戲中的任何更新(Hey兄弟,別不承認(rèn),你自己心里最清楚),以避免游戲每次有新的更新之后又要重新測試一大堆顯卡。有些評測編輯甚至一年都不帶更新游戲的...
下面,我們不得不說一下更新游戲的重要性。我們這里通過兩個案例來測試游戲更新前和更新后的性能提升,當(dāng)然我們確保兩次測試都使用相同的測試方法和測試場景,由于這兩款游戲都不是 Steam 游戲,所以我們只能手動更新。
● Aliens versus Predator(異形大戰(zhàn)鐵血戰(zhàn)士)
《異形大戰(zhàn)鐵血戰(zhàn)士》于2010年2月份正式發(fā)布,其實在該游戲發(fā)布之后已經(jīng)發(fā)布了一堆的補(bǔ)丁,每一次都有性能提升。該游戲的首個補(bǔ)丁其實在游戲發(fā)布的當(dāng)天就發(fā)布了,并且提到了大量的性能提升(如上圖),為了這篇文章,我們假設(shè)(希望如此)所有的用戶都打上了這個補(bǔ)丁,我們以打上這個補(bǔ)丁之后所測試的成績作為基準(zhǔn)線。
該游戲的第二個補(bǔ)丁發(fā)布于游戲上市大約一個月之后的3月份,又一次的提到了在開啟 Tesselation 的情況下提升性能,這個補(bǔ)丁還修正了NVIDIA DX11顯卡運(yùn)行黑屏的問題。
最近的一個補(bǔ)丁剛剛發(fā)布沒幾個星期,又一次的對 DX11的Tesselation性能進(jìn)行小幅度的調(diào)整,并修復(fù)了一些使用NVIDIA最新顯卡的渲染錯誤。接下來我們就來看這兩次補(bǔ)丁更新(第一次作為基準(zhǔn)線)之后和更新之前有什么不同:
雖然沒有非常大的差距,但還是可以很明確的看出游戲補(bǔ)丁帶來的性能提升。另一方面有意思的是這兩次更新之后,HD5850和GTX470的最低幀數(shù)雙雙下降,不過從平均幀數(shù)上看起來在DX11方面的優(yōu)化NVIDIA比ATI更加受益(至少在我們的測試中)。
● DiRT 2(塵埃 2)
《塵埃 2》是一個不經(jīng)常打補(bǔ)丁的游戲,唯一的一個補(bǔ)丁是在今年三月份發(fā)布的,主要包含一些重要的調(diào)整和優(yōu)化。
《塵埃2》首次發(fā)布遇到的一個重要問題是在中端GPU上低品質(zhì)陰影有問題,而高端DX11顯卡(比如HD5800)的高品質(zhì)陰影設(shè)置也有問題,不過這個問題都在三月份發(fā)布的補(bǔ)丁中解決了,該補(bǔ)丁的一個重要作用就是優(yōu)化陰影渲染,尤其是在較高設(shè)定的陰影下時,性能提升非常明顯(我們使用最高的Ultra進(jìn)行測試),并且支持多核心CPU。我們同樣來對比一下打補(bǔ)丁之前和打補(bǔ)丁之后的結(jié)果:
從測試的結(jié)果可以看出,打補(bǔ)丁之前和打補(bǔ)丁之后的測試成績完全不一樣,GTX470和HD5850都有高達(dá)10%的性能提升,非常顯著。
通過上面兩個游戲的測試,我們可以看出給游戲打補(bǔ)丁所帶來的性能提升其實比更新驅(qū)動程序所帶來的性能提升更快更高,《塵埃2》這款游戲就是一個很好的案例。
我們談?wù)撚螒驁鼍安蓸娱L度的重要性理由很簡單:想要得到一款顯卡玩某游戲的準(zhǔn)確性能,取決于合適數(shù)量的數(shù)據(jù)點(diǎn)。遺憾的是,對于一個動輒就需要晚上好幾十個小時都通不了關(guān)的游戲來說,采樣長度只能是越長越好。但這并不現(xiàn)實,所以找到最能夠代表整個游戲的場景是最為非常重要的。但這里有一個問題是,很多人僅僅決定用一個三十秒或者五十秒的場景來測試一款顯卡在游戲中的性能,這樣測試的成績能具有參考性嗎?我們來看一下結(jié)果:
● Aliens versus Predator(異形大戰(zhàn)鐵血戰(zhàn)士)
上面的圖表說的是我們通常玩游戲情景的一部分,結(jié)果不言而喻。如果僅僅使用30秒的游戲采樣長度來比較兩款顯卡的平均性能的話,是完全不能代表性能差距的。但最大的問題是,30秒游戲采樣長度所得到的最低幀數(shù)完全和整個游戲所得到的最低幀數(shù)完全不一樣,頭30秒我們測試到的最低幀數(shù)是HD5850的30幀,而當(dāng)游戲場景采樣延長到200多秒的時候,最低幀數(shù)只有18FPS;
仔細(xì)看曲線圖表,幾乎沒有任何一個30秒?yún)^(qū)間可以代表整個顯卡在游戲中的表現(xiàn)。
● Just Cause 2(正當(dāng)防衛(wèi) 2)
《正當(dāng)防衛(wèi) 2》這款游戲的測試也告訴了我們同樣的道理,從曲線圖上可以看出有,如果你僅僅記錄10多20秒的成績的話,兩款顯卡的性能幾乎相當(dāng),即使記錄前30秒的成績,兩款顯卡的性能也相差甚微。但實際上當(dāng)我們記錄超過100秒的長度時,發(fā)現(xiàn)GTX470的性能遠(yuǎn)遠(yuǎn)好于HD5850。
結(jié)論很明顯,僅僅30秒的游戲場景采樣長度對比顯卡的性能是絕對不夠的,甚至記錄最低幀數(shù)都不夠,而且我們也可以看出較長的采樣長度是必須的。
經(jīng)過前面多頁的測試對比之后,現(xiàn)在到了該做結(jié)論的時候了。其實,我們的結(jié)論很簡單而且沒有什么可爭議的,就是測試一款游戲沒有完美的方法,有很多因素都會影響測試結(jié)果,但我們沒有辦法完全考慮到。然而,我們還是證明出了有方法可以盡量的去避免測試成績中出現(xiàn)的不準(zhǔn)確的問題,以盡可能的保證測試成績的準(zhǔn)確。
讓我們再回頭看看目前評測編輯甚至用戶最流行的測試方法:游戲內(nèi)置或者獨(dú)立的BenchMark程序,獨(dú)立的BenchMark程序最嚴(yán)重的兩個問題就是裝不了最新補(bǔ)丁以及測試場景不能代表游戲的實際表現(xiàn)。而游戲內(nèi)置的測試程序雖然可以得到補(bǔ)丁的更新,但其測試場景仍然不能代表實際玩游戲時的測試場景。不過,當(dāng)前還是有很小數(shù)目的游戲(比如Dirt2、Hawx)內(nèi)置的測試工具和實際玩游戲是的情況差不多。所以,我們認(rèn)為游戲測試應(yīng)該完全避免獨(dú)立的測試工具,而游戲內(nèi)置的測試工具也應(yīng)當(dāng)在能夠代表實際玩游戲時情況的場合下使用。
下一個我們談到TimeDemos,從大部分測試來看使用TimeDemo的測試方法都要比游戲內(nèi)置的測試工具還準(zhǔn)確,最重要的是他可以重復(fù)非常非常相似的場景,甚至可以提供給讀者使用,但可惜的是我們只能看到越來越少的游戲支持錄制和回放Demo。這個對于游戲測試來說應(yīng)該是最好的方法了,但大多數(shù)的游戲沒有這個功能,我們只能望洋心嘆。
所以,在這種無論用何種方式測試都沒有辦法做到完美的情況下,我們就只能將最好的游戲測試的方法歸結(jié)為一個單詞:探索!不是說僅僅通過第一關(guān)或者游戲內(nèi)置的測試工具所測得的成績就能代表一款顯卡的性能,如果網(wǎng)站編輯偷懶用最簡單最不浪費(fèi)時間的方法進(jìn)行測試,那么很可能得到的是一個錯誤的結(jié)論。了解一款游戲較好的方法就是重頭到尾的將這個游戲玩一遍,沒有辦法讓任何一個人對于他完全不了解的游戲做定論,原因我們已經(jīng)看到了,否則通過一個錯誤的測試方法得到一個錯誤結(jié)果的風(fēng)險非常大。
現(xiàn)在來談?wù)勎覀冞@篇文章最初提到的問題,很顯然,這一切都?xì)w結(jié)到了一件事情:透明度。大多數(shù)時候網(wǎng)站都是扔出一篇顯卡評測而沒有說這個成績到底是怎么得來的,甚至都沒有說是不是從游戲內(nèi)置的測試工具或者獨(dú)立的測試工具得出的。要想真實的反映顯卡在游戲中的性能,是不應(yīng)該基于一個獨(dú)立的測試工具,即使是內(nèi)置的測試工具也要看其場景是否和真實玩游戲是的場景相似。這也是為什么我們相信一個真正權(quán)威的網(wǎng)站會明確的寫出他們究竟使用何種工具何種方法測試的原因?!?
關(guān)注我們
