国产v亚洲v天堂无码,av在线亚洲欧洲日产一区二区,国产成人精品午夜福利软件

泡泡網(wǎng)顯卡頻道 PCPOP首頁 / 顯卡 / 評測 / 正文

游戲外的競爭!NVATI通用計(jì)算技術(shù)分析

2008年12月26日 00:45作者：孫敏杰編輯：孫敏杰文章出處：泡泡網(wǎng)原創(chuàng)

[泡泡網(wǎng)顯卡頻道 12月26日] 最近幾個月兩大顯示芯片巨頭都沒什么真正意義上的新產(chǎn)品，高/中/低端全線顯卡一對一的PK已趨于尾聲，玩家們也逐漸對原本勢均力敵的產(chǎn)品非要通過超頻才能取勝的測試失去興趣。NVIDIA和ATI之間由明刀明槍比拼產(chǎn)品性能轉(zhuǎn)為冷戰(zhàn)暗斗技術(shù)與附加值。

2008年全年，最出風(fēng)頭的無疑是NVIDIA的CUDA技術(shù)，Tesla視覺計(jì)算、PhysX物理加速以及Badaboom視頻編碼足以讓NVIDIA無視AMD的存在，直接用GPU向Intel最強(qiáng)CPU發(fā)起挑戰(zhàn)。

GPU強(qiáng)大的浮點(diǎn)運(yùn)算能力是CPU無法企及的，GPU并行計(jì)算的確給未來PC的發(fā)展指明了一條陽光大道。但絕大多數(shù)消費(fèi)者都是比較現(xiàn)實(shí)的，他們認(rèn)為顯卡就是用來玩游戲的3D加速卡，畢竟支持GPU通用加速的軟件還不夠多、不夠完善。GPU未來發(fā)展的藍(lán)圖并不是他們最關(guān)心的內(nèi)容，CUDA和Stream是干嘛的并不重要，他們真正關(guān)注的是當(dāng)前顯卡除了玩游戲還能干什么？

首先我們來看看，在NVIDIA提供的Forceware驅(qū)動以及體積達(dá)4GB的CUDA大禮包中有什么好玩又好用的東西：

Folding @ home_GPU_v620nv：N卡專用的蛋白質(zhì)折疊分布式計(jì)算客戶端
Badaboom試用版：視頻轉(zhuǎn)換器，30天內(nèi)可免費(fèi)轉(zhuǎn)碼30次
PhysX游戲：一大堆試玩版、演示Demo還有屏保
TMPGENC XPRESS 4.6.2.266試用版：視頻編輯器
POWER DIRECTOR 7.0試用版：另一款視頻編輯器

那么，顯卡除了玩游戲之外，又能提供給用戶什么東西呢？一起來看看。

● GPU非3D游戲應(yīng)用之一：Folding@home分布式蛋白質(zhì)折疊計(jì)算

要說GPU做通用計(jì)算的概念，最早還是由ATI所提出來，早在2006年9月的Radeon X1000時代，ATI與斯坦福大學(xué)相關(guān)科研人員合作，開發(fā)了首款使用GPU浮點(diǎn)運(yùn)算能力做非圖形渲染的軟件——Folding @ Home第一代GPU運(yùn)算客戶端。

Folding@home是一個研究蛋白質(zhì)折疊、誤折、聚合及由此引起的相關(guān)疾病的分布式計(jì)算工程。最開始F@H僅支持CPU，后來加入了對PS3游戲機(jī)的支持，但同樣是使用內(nèi)置的CELL處理器做運(yùn)算。F@H因ATI的加入為GPU計(jì)算翻開了新的一頁，如今F@H第二代GPU客戶端已經(jīng)能夠支持ATI和NVIDIA的全系列DX10 GPU。

ATI顯卡運(yùn)行F@H時的屏保畫面

如果您有興趣讓您的電腦在空閑時為科學(xué)計(jì)算貢獻(xiàn)一份力量的話，那就到斯坦福大學(xué)官方網(wǎng)站下載最新的客戶端。只要您不玩游戲（意味著GPU空閑），那就可以在后臺開啟F@H客戶端進(jìn)行科學(xué)運(yùn)算，這并不會影響您的辦公與上網(wǎng)操作（CPU和內(nèi)存使用率都很?。?/P>

關(guān)于顯卡運(yùn)行F@H的效能問題，這就跟游戲一樣需要顯卡驅(qū)動的不斷優(yōu)化與改進(jìn)，根據(jù)民間對比數(shù)據(jù)來看，單核心的A卡不及同級N卡，HD4870的性能還不如9800GTX+，但GTX260也沒比9800GTX+強(qiáng)多少，GTX280還不如上代的9800GX2，雙核心的HD4870X2及GTX295自然是雙方的最強(qiáng)者。

根據(jù)官方排名來看，NVIDIA GPU所貢獻(xiàn)的運(yùn)算量早已超越所有CPU總和，甚至超過了PS3，而參與運(yùn)算的GPU數(shù)量卻要比CPU少很多。ATI GPU的表現(xiàn)也不差，僅次于NVIDIA和PS3，從表中可以看出ATI GPU數(shù)量要比NVIDIA少，這可能是A卡市場占用率不夠高、ATI推廣不力、或AFan不夠積極所致。

● 小知識：什么是Folding@home？什么是蛋白質(zhì)折疊？

蛋白質(zhì)是一個生物體系的動力和納米機(jī)器。在蛋白質(zhì)實(shí)現(xiàn)它的生物功能之前，它們會把自己裝配起來，或者說是折疊；雖然蛋白質(zhì)折疊是對所有的生物體系來說最重要的和最基本的過程，但這個過程對人類而言仍然是個未解之謎。此外，當(dāng)?shù)鞍踪|(zhì)沒有正確的折疊（折疊錯誤）會導(dǎo)致嚴(yán)重的后果，包括許多知名的疾病，比方阿茲海默癥(Alzheimer''''s)，瘋牛病(Mad Cow, BSE)，可傳播性海綿狀腦病(CJD)，肌萎縮性脊髓側(cè)索硬化癥(ALS)，帕金森氏癥(Parkinson''''s)，和其他多種癌癥及其相關(guān)得綜合病癥。

Folding@home是一個分布式計(jì)算的項(xiàng)目——從世界各地來的人下載運(yùn)行這個客戶端程序，彼此組合在一起構(gòu)成了世界上最大的超級計(jì)算機(jī)之一。每一臺參與的計(jì)算機(jī)都使蛋白質(zhì)折疊項(xiàng)目更接近成功一步。Folding@home把分布式運(yùn)算和革新的計(jì)算方法有機(jī)的結(jié)合在一起，使人類能解決比以前碰到的困難無數(shù)倍的問題。

● GPU非3D游戲應(yīng)用之二：高清視頻解碼

視頻解碼加速一直都是A卡的強(qiáng)項(xiàng)，從HD2000系列開始(HD2900XT除外)，ATI全線顯卡都內(nèi)置了UVD引擎，這個專用模塊能夠?qū)Ξ?dāng)前盛行的H.264和VC-1兩大編碼提供完全硬件解碼。

NVIDIA也有PureVideo引擎，但它只能夠做到完全硬解H.264編碼，對于VC-1編碼依然是半硬半軟，播放時CPU占用率偏高。當(dāng)然NVIDIA也有個別顯卡(G98核心8400GS)支持完全硬解碼，只可惜市面上很難買到。

N卡對于H.264視頻能完全硬解碼

主流N卡對VC-1視頻不能做到完全硬解碼

此外在高清影音一線通HDMI輸出方面ATI也有自己的獨(dú)門絕技，ATI HD2000/3000/4000全系列顯卡中都整合了音頻模塊，可以為HDMI輸出音頻信號，而N卡必須通過“飛線”從板載聲卡SPDIF導(dǎo)入音頻信號，需要占用額外的音頻聲道。

DX10顯卡中端對決！HD2600大戰(zhàn)GF8600
N卡實(shí)現(xiàn)HDMI存在功能上的不足

當(dāng)然NVIDIA的整合主板做得還是挺不錯的，MCP78、MCP79都能夠完美硬解H.264/VC-1/MPEG2三大編碼(A卡不能完全硬解MPEG2)，而且主板的聲卡本來就是整合的，所以HDMI輸出音頻也不需要飛線。只是NVIDIA的獨(dú)立顯卡在高清方面不如ATI顯卡完美。

● GPU非3D游戲應(yīng)用之三：視頻轉(zhuǎn)碼

GPU視頻編碼的鼻祖，同樣是由ATI最先實(shí)現(xiàn)的，在X1000時代，ATI在催化劑驅(qū)動中集成了一款名為Avivo Video Converter的小工具軟件，該工具能夠?qū)⒊Ｒ娨曨l轉(zhuǎn)換為手持設(shè)備(iPod、PSP等)支持的格式，速度比單純CPU編碼快好幾倍。

X1000時代的Avivo Video Converter

雖然Avivo的速度非?？?，但據(jù)測試表明該軟件似乎跟GPU的處理能力沒關(guān)系，X1300/X1600/X1800/X1900的編碼速度幾乎相同，而且ATI的新顯卡(HD2000/3000/4000)并不支持Avivo編碼器。隨后Avivo被破解，使得它能夠應(yīng)用在所有DX9/DX10顯卡(包括N卡)上面，于是很多人懷疑Avivo只是一個打著GPU的幌子、通過犧牲畫質(zhì)換取速度的CPU編碼工具！

時過境遷，當(dāng)Avivo編碼器快被眾人所遺忘，Badaboom大出風(fēng)頭之時，ATI在2008年最后一款催化劑驅(qū)動8.12當(dāng)中重新啟用塵封已久的Avivo編碼器：

雖然名稱沒變，但ATI稱這個小工具基于Stream流處理技術(shù)重新編寫，僅支持HD4000系列顯卡，速度更快，而且同樣堅(jiān)持完全免費(fèi)的策略。這對于垂涎Badaboom已久的A卡用戶來說，的確是個不小的驚喜。

DVD轉(zhuǎn)iPod格式速度對比

AIT轉(zhuǎn)換CPU占用率

NVIDIA轉(zhuǎn)換CPU占用率

根據(jù)國外媒體的測試結(jié)果，可以明顯看出ATI在速度上擁有更強(qiáng)大的實(shí)力，然而卻也使用了更多的CPU占用率作為代價(jià)，作為集CPU于GPU于一家的AMD來說，并不在意GPU應(yīng)用時CPU占用率的高低，不需要去刻意的控制CPU占用率，這或許也是它速度更快的一大原因。

NVIDIA雖然速度稍慢，卻在輸出的畫質(zhì)上明顯高于ATI，CPU占用率也要低出不少。就兩者看來，并沒有一個明顯的贏家，都體現(xiàn)出了GPU的并行計(jì)算能力，雖然Avivo速度更快，支持格式更多，但輸出質(zhì)量結(jié)果并不完美。Badaboom輸出畫質(zhì)質(zhì)量高，界面精美，但速度比Avivo慢，支持格式也相對有限，最重要的是還要收費(fèi)——試用版本只能轉(zhuǎn)30次，同時試用版轉(zhuǎn)出來的視頻帶討厭的Logo。(好在目前網(wǎng)上已有完美破解版本)

詳細(xì)評測請看：無視CPU！GPU視頻轉(zhuǎn)換ATI與NV誰更強(qiáng)?

對于ATI Avivo視頻轉(zhuǎn)換器所存在的問題，ATI官方也毫不避諱，稱這款才剛剛面世的小工具確實(shí)還不夠完善，存在一些BUG，這將會在未來的催化劑驅(qū)動中得到修正。ATI稱：Avivo視頻轉(zhuǎn)換器僅使用GPU完成視頻編碼中的一部分工作，具體的說，GPU目前僅負(fù)責(zé)視頻編碼過程中對運(yùn)算能力最敏感，最適于GPU應(yīng)用的“運(yùn)動估算”部分。由于在視頻編碼中交給GPU的負(fù)載是固定的，因此該過程中的GPU占用率可能因型號的不同而出現(xiàn)高低不等的現(xiàn)象。

詳細(xì)報(bào)道請看：AMD官方回應(yīng)Avivo視頻轉(zhuǎn)碼質(zhì)量問題！

● GPU視頻轉(zhuǎn)碼小結(jié)：

ATI Avivo Video Convert的優(yōu)點(diǎn)：免費(fèi)、片源兼容性好、轉(zhuǎn)碼速度超快
ATI Avivo Video Convert的缺點(diǎn)：軟件功能太簡單、只能轉(zhuǎn)出低碼率低分辨率影片、視頻畫質(zhì)較差、CPU占用率很高、軟件BUG不少
NVIDIA Badaboom的優(yōu)點(diǎn)：軟件界面友好、視頻畫質(zhì)高、能輸出1080p、CPU占用率低
NVIDIA Badaboom的缺點(diǎn)：付費(fèi)軟件、只支持正版光碟(網(wǎng)絡(luò)片源支持格式有限)、轉(zhuǎn)低碼率影片速度不如Avivo
兩者都不支持嵌入字幕

可以說，兩款GPU轉(zhuǎn)碼軟件都還不夠完美，但比起純CPU轉(zhuǎn)碼都要快很多，尤其是Badaboom軟件版本更新非常頻繁，新版本不但轉(zhuǎn)換效率進(jìn)一步提高，而且還能夠支持H.264的CABAC可變長編碼熵運(yùn)算，對于片源支持度也進(jìn)一步放寬。

當(dāng)初GPU高清視頻解碼技術(shù)發(fā)布時，也是問題一大堆：僅支持正版影碟和PowerDVD，不支持第三方軟件，不支持外掛字幕，不支持網(wǎng)絡(luò)常見的編碼及封裝格式如X264/MKV等，但隨著時間的推移這些問題都迎刃而解?，F(xiàn)在GPU轉(zhuǎn)碼技術(shù)正處在起步階段，存在一些問題是可以理解的，但GPU加速是大勢所趨，相信今后會有越來越多的軟件加入支持，功能和兼容性將會更完美。

● GPU非3D游戲應(yīng)用之四：視頻編碼加速

不管ATI的Avivo視頻轉(zhuǎn)換器還是NVIDIA的Badaboom，都只是非常初級的視頻轉(zhuǎn)換軟件，僅適合那些擁有手持設(shè)備的入門級用戶使用。如果專業(yè)級的視頻編輯軟件能夠應(yīng)用到GPU強(qiáng)大的并行計(jì)算能力，那才能真正吸引大批用戶的關(guān)注。所以NVIDIA和ATI都在積極的與軟件開發(fā)商合作，以便拓展GPU的應(yīng)用領(lǐng)域。

TMPGEnc 4.0 XPress支持NVIDIA CUDA

TMPGEnc 4.0能夠支持CUDA架構(gòu)的N卡，它將CUDA能力使用在了重要的濾鏡部分，使得TMPGEnc在視頻編輯方面比起其他類似軟件更加有著性能上的吸引力。通過CUDA，能夠減少一半以上的工作時間，可以說實(shí)在是一個相當(dāng)令人驚異的成績。

不過很可惜的是，TMPGEnc在轉(zhuǎn)碼部分還沒有使用好CUDA，這使得軟件在視頻輸出的時候仍然受到CPU的限制。當(dāng)然，TMPGEnc Xpress在CPU部分上已經(jīng)做出了很好的優(yōu)化，無論是Intel還是AMD都能夠利用到相應(yīng)的指令集。對于需要大量壓制視頻的用戶來說，CUDA的加入可以說是錦上添花，能夠幫助用戶節(jié)省大量時間，在減低制作平臺成本的同時，也能夠加快用戶的工作效率。

CyberLink PowerDirector Ultra 7已支持CUDA即將支持Stream

CyberLink PowerDirector（威力導(dǎo)演）的威名相信很多人都有所耳聞，這款臺灣產(chǎn)的軟件簡單易用特別適合國人使用，而且功能十分強(qiáng)大，很多方面都要強(qiáng)過日本產(chǎn)的TMPGEnc?，F(xiàn)在PowerDirector已經(jīng)能夠借助CUDA進(jìn)行加速，但也主要局限在濾鏡特效操作方面：如高斯模糊、鏡像模糊、萬花筒、光射線、顏色替換、鋼筆墨水、色彩邊緣、水彩畫、抽象派、火焰燃燒等等。而視頻轉(zhuǎn)碼輸出時還是只能依靠CPU處理。

CyberLink宣稱，用戶在使用支持CUDA技術(shù)的GeForce、GeForce Mobile、Quadro、Quadro Mobile、Tesla系列顯卡時，執(zhí)行濾鏡操作可以獲得最多五倍的速度提升，同時還能將CPU占用率從100％降至60％左右。

就在前幾天，CyberLink發(fā)布了最新的公告，宣布新的7.1版本將會加入Stream支持，但最快要在2月份才能出爐。事實(shí)上在此之前ATI已經(jīng)拿到了內(nèi)部測試版本，在很多場合公開展示ATI加速視頻轉(zhuǎn)換的效能。

據(jù)稱，PowerDirector對于Stream技術(shù)的應(yīng)用會比CUDA更多，它除了濾鏡渲染之外，在視頻編輯、回放及輸出環(huán)節(jié)都會利用到GPU的并行計(jì)算能力，視頻編輯速度將會大大提高！當(dāng)然，現(xiàn)在吹得多么天花亂墜是沒用的，還是等待專業(yè)評測對比吧。

● GPU視頻編碼小結(jié)：

很顯然，在視頻編碼方面NVIDIA要領(lǐng)先ATI至少半年，大約半年前TMPGEnc和PowerDirector 7就已經(jīng)發(fā)布了支持CUDA加速的正式版。ATI雖然也在與軟件開發(fā)商緊密合作，但支持Stream的PowerDirector 7.1最快要到09年2月份才能發(fā)布。

PowerDirector 7.1將成為同時支持CUDA和Stream技術(shù)的第三方軟件，那么N卡和A卡在通用計(jì)算領(lǐng)域的性能表現(xiàn)如何呢？我們拭目以待！

● GPU非3D游戲應(yīng)用之五：實(shí)時倍線視頻播放

除了視頻解碼和編碼，還有一種非常消耗處理器資源的應(yīng)用，那就是視頻倍線——使用特殊的插值算法以及畫面補(bǔ)償技術(shù)，讓低分辨率視頻擴(kuò)充至高分辨率，從而讓視頻與顯示器分辨率相匹配，做到點(diǎn)對點(diǎn)完美呈現(xiàn)。有些人喜歡將480p或者720p壓制成1080p，這樣做雖然會使文件體積膨脹，但畫質(zhì)確實(shí)能夠獲得一定程度的提升。

當(dāng)然最好的辦法并不是重新壓制視頻，而是實(shí)時倍線播放，基本上雙核CPU是沒有希望的，只有高端四核CPU才能做到實(shí)時倍線軟解視頻?，F(xiàn)在，GPU也能實(shí)時倍線硬解視頻了，硬解畫質(zhì)得到進(jìn)一步增強(qiáng)。

ArcSoft TotalMedia Extreme實(shí)時倍線，已支持CUDA即將支持Stream

ArcSoft TotalMedia Thertre這款高清視頻播放器的名氣雖然沒有PowerDVD和WinDVD那么大，但其功能卻絲毫不差，它能夠同時支持ATI AVIVO、NVIDIA PureVideo和Intel ClearVideo三大硬解碼技術(shù)，更重要的是它支持直接從硬盤播放下載到的HDDVD或BD，這無疑非常適合國內(nèi)用戶使用。

除此之外，TotalMedia Thertre還有自己的獨(dú)門絕技，那就是使用GPU的并行計(jì)算能力來實(shí)時倍線視頻，將標(biāo)清視頻插值擴(kuò)充至高清分辨率，大幅提升畫面細(xì)節(jié)與品質(zhì)。

現(xiàn)在TotalMedia Thertre已經(jīng)能夠?qū)卡提供支持，而到明年初將會發(fā)布新補(bǔ)丁用以支持A卡，現(xiàn)在AMD已經(jīng)拿到了測試版本，并現(xiàn)場展示了GPU實(shí)時倍線的效果：

倍線前后的視頻畫質(zhì)對比，效果確實(shí)有明顯改觀

軟件倍線設(shè)置，采用ATI Stream流處理運(yùn)算技術(shù)

在視頻應(yīng)用方面，ATI始終慢NVIDIA一拍，好在落后并不多，這幾款重量級的軟件目前已經(jīng)能夠支持N卡加速了，A卡還需要等幾個月，希望它們不要讓A卡用戶等太久。

● GPU非3D游戲應(yīng)用之六：圖形顯示/處理硬件加速

Adobe最新版的CS4系列套裝軟件最大的特性就是支持GPU加速，很多圖形特效、旋轉(zhuǎn)縮放等操作都可以通過GPU渲染完成，可以大大提高美工人員的工作效率。NVIDIA對此進(jìn)行了很多的宣傳，并專門針對PhotoShop CS4發(fā)布了Quadro CX專業(yè)繪圖卡，而ATI方面卻毫無動作，難道A卡不支持PhotoShop加速？

    事實(shí)上，Adobe全系列軟件都基于開放式的OpenGL API開發(fā)，只要是DX9級別的GPU都支持加速，這并不是N卡的專利！看看Adobe官方的最低需求：
    1.硬件支持 DirectX 9；
    2.Pixel Shader (PS) 至少為1.3版；
    3.Vertex Shader (VS)至少1.1版；

主流顯卡包括整合顯卡都支持PhotoShop CS4硬件加速

Adobe Reader 9支持PDF 2D翻頁及全屏演示加速，實(shí)時渲染文檔中的3D元素

Adobe Flash Player 10，硬件加速要求很低，幾乎不值一提

綜上，Adobe是通過完全開放的OpenGL標(biāo)準(zhǔn)支持GPU加速，對于市面上主流顯卡都能夠提供無差別完美支持，由于之前媒體的相關(guān)報(bào)道都集中在NVIDIA方面，導(dǎo)致很多人以為只有N卡才支持Adobe GPU加速，實(shí)際上A卡甚至很多整合顯卡都支持，這與CUDA或者Stream并沒有什么直接關(guān)系。（相關(guān)評測：GPU加速時代來臨! PhotoShop CS4解析）

但是，Adobe有一個視頻輸出插件RapiHD，它是基于CUDA架構(gòu)設(shè)計(jì)的，能夠利用GPU加速視頻后期輸出過程，但它僅支持Quadro系列專業(yè)顯卡(包括Adobe專用的Quadro CX)，不支持GeForce系列消費(fèi)級顯卡，當(dāng)然也不支持A卡。

● Adobe系列軟件小結(jié)：

雖然NVIDIA對于Adobe CS4系列的支持很到位，但對于普通用戶來講，A卡和N卡是沒有任何區(qū)別的，而且PhotoShop類軟件對于GPU性能的要求并不高，只要是DX9以上級別的顯卡都能大大提高圖形操作速度。

只有專業(yè)視頻編輯，在后期輸出過程中用到RapiHD插件時，Quadro專業(yè)顯卡才會顯示出驚人的效能，而ATI FireGL專業(yè)卡則不支持。

● GPU非3D游戲應(yīng)用之七：GPU物理加速

Intel閃電收購Havok，NVIDIA以迅雷不及掩耳之勢拿下Ageia，兩大物理引擎都被財(cái)大氣粗的競爭對手所搞定，于是AMD成為了局外人。實(shí)際上之前的ATI與Havok關(guān)系非常曖昧，X1000時代ATI所展示的一些GPU物理加速Demo都是基于Havok FX引擎開發(fā)，所以說在GPU物理加速方面，ATI一直都不輸于人。

ATI展示的GPU物理加速Demo，可以看到背景有Havok Logo

突如其來的收購案，猶如飛來橫禍給AMD的GPU物理加速之路蒙上了一層陰影。物理引擎只有兩家，到底該向左走還是向右走呢？競爭是殘酷的，Intel收購Havok之后，支持GPU加速的Havok FX引擎就被暫時凍結(jié)，等到明年Intel自己的獨(dú)立顯卡發(fā)布之后，才有可能開放支持；而NVIDIA的PhysX引擎也沒打算支持CPU加速。

比最強(qiáng)CPU快七倍！GPU物理加速全解析

AMD作為唯一一家同時擁有CPU與GPU業(yè)務(wù)的公司，可謂是手心手背都是肉，既要宣傳GPU的好也不能鄙視CPU。最終AMD選擇了擁有處理器業(yè)務(wù)而且即將擁有GPU業(yè)務(wù)的Intel(Havok)。因?yàn)橹挥蠬avok引擎才能同時利用CPU與GPU的富裕性能做物理加速。

AMD認(rèn)為在進(jìn)行游戲渲染時，多核心CPU的負(fù)載很低，完全可以用CPU來進(jìn)行物理加速，當(dāng)CPU性能還不夠時再交給GPU處理，必須做到CPU與GPU負(fù)載平衡才能非常好的化系統(tǒng)性能。對于用戶來說到底誰做物理加速并不重要，關(guān)鍵是要效果好，而且對系統(tǒng)要求越低越好。

不得不佩服NVIDIA的驚人實(shí)力，PhysX引擎被CUDA改造之后能夠支持全線N卡，而且越來越多的游戲開發(fā)商開始力挺PhysX引擎，其中包括大名鼎鼎的EA、THQ、2K。不過目前的情況是PhysX缺乏重量級游戲大作的支持，UT3僅僅是個別地圖支持PhysX而已，驚世駭俗之作Crysis也是采用CPU做物理加速。而像MKZ(鐵甲突襲)、Cryostasis(雪域危機(jī))這些非著名游戲的影響力著實(shí)有限。

Havok引擎將給《星際爭霸2》帶來一定的物理效果
尤其是在戰(zhàn)爭中的破壞效果會非常明顯

Havok及其靠山Intel的實(shí)力也不容小視，Intel目前只是在積聚實(shí)力、尚未發(fā)力，將來一呼百應(yīng)也并非天方夜談。即便如此，暴雪官方宣布正式支持Havok引擎已經(jīng)讓廣大玩家欣喜不已，試想重量級的《星際2》和《暗黑3》兩款大作如果采用Havok物理引擎的話，這對于PhysX將造成打擊。

● GPU物理加速小結(jié)：

不管未來物理引擎誰能稱王，GPU物理加速已經(jīng)成為大勢所趨，這主要還得歸功于NVIDIA的大力推廣。當(dāng)然AMD也沒有閑著，今年有兩件事最值得關(guān)注，一是AMD和Intel-Havok合作開發(fā)物理應(yīng)用技術(shù)、二是AMD與暴雪結(jié)成戰(zhàn)略合作伙伴關(guān)系，這對于AFan來說無疑是天大的喜訊。

當(dāng)然，現(xiàn)在NVIDIA的PhysX技術(shù)已經(jīng)有數(shù)十款游戲能夠支持，而Intel和AMD的Havok技術(shù)目前只能用CPU進(jìn)行物理運(yùn)算，物理效果一般而且消耗資源不低，Havok的新一代GPU物理加速依然遙遙無期。

首款專門作流處理/并行計(jì)算的GPU產(chǎn)品并不是NVIDIA的Tesla，而是ATI的FireStream，早在2006年，ATI就發(fā)布了基于R580核心的流處理加速卡，48個像素渲染單元成為流處理器的雛形：

FireStream第一代，其實(shí)就是1GB顯存的X1950XTX

可惜的是，在第一代DX10顯卡較量中的失敗，讓AMD浪費(fèi)了太多的時間與機(jī)會。G80核心成為高性能及并行計(jì)算的代名詞，專門針對并行計(jì)算設(shè)計(jì)的Tesla也暫露頭腳。

當(dāng)然AMD的腳步也沒有停止，F(xiàn)ireStream產(chǎn)品線伴隨著GPU的升級而更新，AMD的GPU架構(gòu)天生就擁有很強(qiáng)的浮點(diǎn)運(yùn)算能力，尤其是雙精度浮點(diǎn)運(yùn)算能力！

單精度浮點(diǎn)運(yùn)算，A卡并沒有比N卡高太多，但要知道在對精度要求很高的科學(xué)研究和勘探方面，單精度是沒有價(jià)值的，所有計(jì)算都需要雙精度64Bit。A卡的雙精度運(yùn)算是單精度的1/5，而N卡的雙精度運(yùn)算只有單精度的1/8。

顯卡構(gòu)建1U服務(wù)器看TESLA近來的發(fā)展
核心為4片GPU的1U服務(wù)器，Tesla S1070＝Tesla C1060×4

除了單GPU核心的產(chǎn)品之外，NVIDIA還有專門設(shè)計(jì)的多GPU Tesla Personal SuperComputer運(yùn)算系統(tǒng)，AMD也有類似的運(yùn)算加速系統(tǒng)：

Aprius CA8000允許在機(jī)架內(nèi)部插上最多八塊FireStream 9270流處理加速卡，從而提供將近10TFlops的單精度浮點(diǎn)運(yùn)算能力，以及1.9TFlops的雙精度浮點(diǎn)運(yùn)算能力。當(dāng)然AMD的機(jī)架體積也要比NVIDIA的1U機(jī)架大很多，雙方的外觀和結(jié)構(gòu)雖然相差很多，但基本原理是一致的，都是類似于外置顯卡的解決方案。

不過，A卡SIMD架構(gòu)的效率一直讓人擔(dān)心，目前上沒有能夠直接對比雙方實(shí)際浮點(diǎn)運(yùn)算性能的軟件，但根據(jù)Folding@home的民間數(shù)據(jù)來看，HD4870不如GTX260，而GTX260與9800GTX+是差不多的，看來雙方在并行計(jì)算方面都還有繼續(xù)優(yōu)化提升的空間。

在GPU并行計(jì)算方面，一直都沒有一個通用的標(biāo)準(zhǔn)，于是ATI和NVIDIA各自為政，NVIDIA有CUDA開發(fā)包及CUDA C編譯器，ATI也開發(fā)了Stream SDK和Brook+語言。

ArcSoft TotalMedia Thertre支持Stream

CUDA C就是對C語言的延伸，而Brook+也是一種類C的語言，兩者有一定的相似之處但并無法相容。也就是說使用CUDA編寫的軟件，想要支持ATI Stream的話，必須重新編寫一遍，這顯然是軟件開放商極不愿意看到的事情。

支持Khronos Group標(biāo)準(zhǔn)化作業(yè)的AMD首席技術(shù)官(CTO)Jason Yang稱：“軟件開發(fā)人員希望自己編寫的代碼能在各種系統(tǒng)上執(zhí)行。不過，對開發(fā)人員來說開發(fā)平臺越少越好。而能夠?qū)崿F(xiàn)這一想法的正是OpenCL”。另外，Terry Makedon回顧計(jì)算機(jī)的歷史，“供應(yīng)商的自主規(guī)格不能擴(kuò)大市場，為解決這一問題公開了開放標(biāo)準(zhǔn)，從而開拓新的市場”，OpenCL和DirectX的Compute Shader的公開顯示了對GPGPU市場擴(kuò)大的期待。AMD還將繼續(xù)采用Brook+。今后還將提供作為高抽象度軟件開發(fā)環(huán)境的Brook+，通過Brook+記述的程序，可以制成在支持OpenCL的處理器上執(zhí)行的程序。

OpenCL的誕生給整合產(chǎn)業(yè)都帶來了希望，對消費(fèi)者來說，一個開放的行業(yè)標(biāo)準(zhǔn)無疑要比各自為戰(zhàn)的企業(yè)標(biāo)準(zhǔn)親切的多。由于AMD、NVIDIA、Intel同為工作組成員，這一標(biāo)準(zhǔn)的提出為我們描繪了一個美好的未來：無需區(qū)分哪家廠商的產(chǎn)品，不分GPU、CPU，系統(tǒng)可以根據(jù)當(dāng)時的應(yīng)用需要，調(diào)動各個處理器的運(yùn)算能力，以協(xié)同合作的方式最快速度完成工作。OpenCL將統(tǒng)一管理一臺電腦上的所有計(jì)算資源，比如你的多核CPU，以及多個GPU。OpenCL將這些資源統(tǒng)一看待，算作計(jì)算單元，并配置各種級別的內(nèi)存：private、local和global。

據(jù)ATI Stream研發(fā)團(tuán)隊(duì)稱，目前ATI已將工作重心轉(zhuǎn)移到了OpenCL上來。ATI在最新公布的Stream SDK 1.3中重寫了Brook+以提升性能，將在Stream SDK 2.0中完全支持OpenCL，并積極幫助客戶從Brook+過渡到OpenCL。而NVIDIA仍堅(jiān)持兩手抓兩手都要硬的策略，為客戶同時提供CUDA C及OpenCL的支持，并稱CUDA C與OpenCL是互補(bǔ)而非競爭關(guān)系。

不難看出，雖然NVIDIA CUDA所能提供的軟件，大部分ATI也能提供支持，但是無論進(jìn)度還是效果方面，都是相差甚遠(yuǎn)！比如PowerDirector和TotalMedia Thertre，N卡用戶幾個月前已經(jīng)能夠使用GPU加速了，而ATI只能在明年一季度才提供支持；PhysX游戲已經(jīng)為數(shù)不少了，而Havok游戲(GPU加速)一款還沒有；Badaboom雖然是收費(fèi)軟件，但國內(nèi)并不缺乏盜版，而完全免費(fèi)的Avivo尚無法令人滿意。

NVIDIA和ATI從3D游戲戰(zhàn)場打到了并行計(jì)算領(lǐng)域

AMD也坦誠，雖然GPU通用計(jì)算的概念最早由ATI提出并率先應(yīng)用，但NVIDIA已經(jīng)后來者居上，在很多方面都比ATI做得好。不過AMD近年來所做出的努力也是顯而易見的，對于GPU功能的開發(fā)也是緊追不舍，并沒有落后NVIDIA太多。

ATI(AMD)與NVIDIA之間GPU之戰(zhàn)，遠(yuǎn)比AMD和Intel之間的CPU之戰(zhàn)有意思，畢竟雙方的實(shí)力差距并沒有那么懸殊。競爭是激烈的，也是好看的，近年來A/N之間的龍爭虎斗給廣大用戶帶來了性能更強(qiáng)、價(jià)格更實(shí)惠的產(chǎn)品：如果沒有HD4850/HD4870，9800GTX/GTX260就會永遠(yuǎn)高高在上，沒有HD4870X2，NVIDIA也就不會急于發(fā)布55nm的GTX285/GTX295。同理，如果沒有NVIDIA的辛勤努力及孜孜不倦的推廣，GPU并行計(jì)算也就不會這么快的深入人心，AMD也可能會將ATI之前在GPGPU方面的努力束之高閣。

顯卡，早已超出了游戲卡的范疇

2006年，當(dāng)ATI率先提出GPU通用計(jì)算時，很多人都以為這是天方夜譚，也不知道何年何月才能得償所愿。如今，只花了兩年時間，GPU就已經(jīng)在科學(xué)研究和超級計(jì)算領(lǐng)域取得突破性進(jìn)展，在民用市場也開始遍地開花?，F(xiàn)在，玩家們因一兩款特別喜愛的游戲而升級顯卡；將來，或許很多不玩游戲的人，也會沖著一兩款支持GPU加速的軟件去購買中高端顯卡。

總結(jié)：

您或許感慨NVIDIA在并行計(jì)算方面十年磨一劍的艱辛；或許為ATI因AMD收購而錯過近兩年的發(fā)展而惋惜。然后對于這樣一個全新的領(lǐng)域，無論對于領(lǐng)先者還是追趕者玩家們都應(yīng)該給予同樣的掌聲。<

0人已贊

国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

游戲外的競爭!NVATI通用計(jì)算技術(shù)分析

關(guān)注我們