国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

游戲外的競爭!NVATI通用計(jì)算技術(shù)分析

    [泡泡網(wǎng)顯卡頻道 12月26日] 最近幾個(gè)月兩大顯示芯片巨頭都沒什么真正意義上的新產(chǎn)品,高/中/低端全線顯卡一對一的PK已趨于尾聲,玩家們也逐漸對原本勢均力敵的產(chǎn)品非要通過超頻才能取勝的測試失去興趣。NVIDIA和ATI之間由明刀明槍比拼產(chǎn)品性能轉(zhuǎn)為冷戰(zhàn)暗斗技術(shù)與附加值。

    2008年全年,最出風(fēng)頭的無疑是NVIDIA的CUDA技術(shù),Tesla視覺計(jì)算、PhysX物理加速以及Badaboom視頻編碼足以讓NVIDIA無視AMD的存在,直接用GPU向Intel最強(qiáng)CPU發(fā)起挑戰(zhàn)。

    GPU強(qiáng)大的浮點(diǎn)運(yùn)算能力是CPU無法企及的,GPU并行計(jì)算的確給未來PC的發(fā)展指明了一條陽光大道。但絕大多數(shù)消費(fèi)者都是比較現(xiàn)實(shí)的,他們認(rèn)為顯卡就是用來玩游戲的3D加速卡,畢竟支持GPU通用加速的軟件還不夠多、不夠完善。GPU未來發(fā)展的藍(lán)圖并不是他們最關(guān)心的內(nèi)容,CUDA和Stream是干嘛的并不重要,他們真正關(guān)注的是當(dāng)前顯卡除了玩游戲還能干什么?

    首先我們來看看,在NVIDIA提供的Forceware驅(qū)動(dòng)以及體積達(dá)4GB的CUDA大禮包中有什么好玩又好用的東西:

  • Folding @ home_GPU_v620nv:N卡專用的蛋白質(zhì)折疊分布式計(jì)算客戶端
  • Badaboom試用版:視頻轉(zhuǎn)換器,30天內(nèi)可免費(fèi)轉(zhuǎn)碼30次
  • PhysX游戲:一大堆試玩版、演示Demo還有屏保
  • TMPGENC XPRESS 4.6.2.266試用版:視頻編輯器
  • POWER DIRECTOR 7.0試用版:另一款視頻編輯器

    那么,顯卡除了玩游戲之外,又能提供給用戶什么東西呢?一起來看看。

● GPU非3D游戲應(yīng)用之一:Folding@home分布式蛋白質(zhì)折疊計(jì)算

    要說GPU做通用計(jì)算的概念,最早還是由ATI所提出來,早在2006年9月的Radeon X1000時(shí)代,ATI與斯坦福大學(xué)相關(guān)科研人員合作,開發(fā)了首款使用GPU浮點(diǎn)運(yùn)算能力做非圖形渲染的軟件——Folding @ Home第一代GPU運(yùn)算客戶端。

    Folding@home是一個(gè)研究蛋白質(zhì)折疊、誤折、聚合及由此引起的相關(guān)疾病的分布式計(jì)算工程。最開始F@H僅支持CPU,后來加入了對PS3游戲機(jī)的支持,但同樣是使用內(nèi)置的CELL處理器做運(yùn)算。F@H因ATI的加入為GPU計(jì)算翻開了新的一頁,如今F@H第二代GPU客戶端已經(jīng)能夠支持ATI和NVIDIA的全系列DX10 GPU。


ATI顯卡運(yùn)行F@H時(shí)的屏保畫面

    如果您有興趣讓您的電腦在空閑時(shí)為科學(xué)計(jì)算貢獻(xiàn)一份力量的話,那就到斯坦福大學(xué)官方網(wǎng)站下載最新的客戶端。只要您不玩游戲(意味著GPU空閑),那就可以在后臺(tái)開啟F@H客戶端進(jìn)行科學(xué)運(yùn)算,這并不會(huì)影響您的辦公與上網(wǎng)操作(CPU和內(nèi)存使用率都很小)。

    關(guān)于顯卡運(yùn)行F@H的效能問題,這就跟游戲一樣需要顯卡驅(qū)動(dòng)的不斷優(yōu)化與改進(jìn),根據(jù)民間對比數(shù)據(jù)來看,單核心的A卡不及同級(jí)N卡,HD4870的性能還不如9800GTX+,但GTX260也沒比9800GTX+強(qiáng)多少,GTX280還不如上代的9800GX2,雙核心的HD4870X2及GTX295自然是雙方的最強(qiáng)者。

    根據(jù)官方排名來看,NVIDIA GPU所貢獻(xiàn)的運(yùn)算量早已超越所有CPU總和,甚至超過了PS3,而參與運(yùn)算的GPU數(shù)量卻要比CPU少很多。ATI GPU的表現(xiàn)也不差,僅次于NVIDIA和PS3,從表中可以看出ATI GPU數(shù)量要比NVIDIA少,這可能是A卡市場占用率不夠高、ATI推廣不力、或AFan不夠積極所致。

● 小知識(shí):什么是Folding@home?什么是蛋白質(zhì)折疊?

    蛋白質(zhì)是一個(gè)生物體系的動(dòng)力和納米機(jī)器。在蛋白質(zhì)實(shí)現(xiàn)它的生物功能之前,它們會(huì)把自己裝配起來,或者說是折疊;雖然蛋白質(zhì)折疊是對所有的生物體系來說最重要的和最基本的過程,但這個(gè)過程對人類而言仍然是個(gè)未解之謎。此外,當(dāng)?shù)鞍踪|(zhì)沒有正確的折疊(折疊錯(cuò)誤)會(huì)導(dǎo)致嚴(yán)重的后果,包括許 多知名的疾病,比方阿茲海默癥(Alzheimer''''s),瘋牛病(Mad Cow, BSE),可傳播性海綿狀腦病(CJD),肌萎縮性脊髓側(cè)索硬化癥(ALS),帕金森氏癥(Parkinson''''s), 和其他多種癌癥及其相關(guān)得綜合病癥。

    Folding@home是一個(gè)分布式計(jì)算的項(xiàng)目——從世界各地來的人下載運(yùn)行這個(gè)客戶端程序,彼此組合在一起構(gòu)成了世界上最大的超級(jí)計(jì)算機(jī)之一。每一臺(tái)參與的計(jì)算機(jī)都使蛋白質(zhì)折疊項(xiàng)目更接近成功一步。Folding@home把分布式運(yùn)算和革新的計(jì)算方法有機(jī)的結(jié)合在一起,使人類能解決比以前碰到的困難無數(shù)倍的問題。

● GPU非3D游戲應(yīng)用之二:高清視頻解碼

    視頻解碼加速一直都是A卡的強(qiáng)項(xiàng),從HD2000系列開始(HD2900XT除外),ATI全線顯卡都內(nèi)置了UVD引擎,這個(gè)專用模塊能夠?qū)Ξ?dāng)前盛行的H.264和VC-1兩大編碼提供完全硬件解碼。

    NVIDIA也有PureVideo引擎,但它只能夠做到完全硬解H.264編碼,對于VC-1編碼依然是半硬半軟,播放時(shí)CPU占用率偏高。當(dāng)然NVIDIA也有個(gè)別顯卡(G98核心8400GS)支持完全硬解碼,只可惜市面上很難買到。

高清超越UVD?G98核心8400GS全面測試
N卡對于H.264視頻能完全硬解碼

高清超越UVD?G98核心8400GS全面測試
主流N卡對VC-1視頻不能做到完全硬解碼

    此外在高清影音一線通HDMI輸出方面ATI也有自己的獨(dú)門絕技,ATI HD2000/3000/4000全系列顯卡中都整合了音頻模塊,可以為HDMI輸出音頻信號(hào),而N卡必須通過“飛線”從板載聲卡SPDIF導(dǎo)入音頻信號(hào),需要占用額外的音頻聲道。

DX10顯卡中端對決!HD2600大戰(zhàn)GF8600
N卡實(shí)現(xiàn)HDMI存在功能上的不足

    當(dāng)然NVIDIA的整合主板做得還是挺不錯(cuò)的,MCP78、MCP79都能夠完美硬解H.264/VC-1/MPEG2三大編碼(A卡不能完全硬解MPEG2),而且主板的聲卡本來就是整合的,所以HDMI輸出音頻也不需要飛線。只是NVIDIA的獨(dú)立顯卡在高清方面不如ATI顯卡完美。

● GPU非3D游戲應(yīng)用之三:視頻轉(zhuǎn)碼

    GPU視頻編碼的鼻祖,同樣是由ATI最先實(shí)現(xiàn)的,在X1000時(shí)代,ATI在催化劑驅(qū)動(dòng)中集成了一款名為Avivo Video Converter的小工具軟件,該工具能夠?qū)⒊R娨曨l轉(zhuǎn)換為手持設(shè)備(iPod、PSP等)支持的格式,速度比單純CPU編碼快好幾倍。

四核CPU大戰(zhàn)GPU!誰才是視頻轉(zhuǎn)換之王
X1000時(shí)代的Avivo Video Converter

    雖然Avivo的速度非常快,但據(jù)測試表明該軟件似乎跟GPU的處理能力沒關(guān)系,X1300/X1600/X1800/X1900的編碼速度幾乎相同,而且ATI的新顯卡(HD2000/3000/4000)并不支持Avivo編碼器。隨后Avivo被破解,使得它能夠應(yīng)用在所有DX9/DX10顯卡(包括N卡)上面,于是很多人懷疑Avivo只是一個(gè)打著GPU的幌子、通過犧牲畫質(zhì)換取速度的CPU編碼工具!

    時(shí)過境遷,當(dāng)Avivo編碼器快被眾人所遺忘,Badaboom大出風(fēng)頭之時(shí),ATI在2008年最后一款催化劑驅(qū)動(dòng)8.12當(dāng)中重新啟用塵封已久的Avivo編碼器:

    雖然名稱沒變,但ATI稱這個(gè)小工具基于Stream流處理技術(shù)重新編寫,僅支持HD4000系列顯卡,速度更快,而且同樣堅(jiān)持完全免費(fèi)的策略。這對于垂涎Badaboom已久的A卡用戶來說,的確是個(gè)不小的驚喜。


DVD轉(zhuǎn)iPod格式速度對比


AIT轉(zhuǎn)換CPU占用率


NVIDIA轉(zhuǎn)換CPU占用率

    根據(jù)國外媒體的測試結(jié)果,可以明顯看出ATI在速度上擁有更強(qiáng)大的實(shí)力,然而卻也使用了更多的CPU占用率作為代價(jià),作為集CPU于GPU于一家的AMD來說,并不在意GPU應(yīng)用時(shí)CPU占用率的高低,不需要去刻意的控制CPU占用率,這或許也是它速度更快的一大原因。

    NVIDIA雖然速度稍慢,卻在輸出的畫質(zhì)上明顯高于ATI,CPU占用率也要低出不少。就兩者看來,并沒有一個(gè)明顯的贏家,都體現(xiàn)出了GPU的并行計(jì)算能力,雖然Avivo速度更快,支持格式更多,但輸出質(zhì)量結(jié)果并不完美。Badaboom輸出畫質(zhì)質(zhì)量高,界面精美,但速度比Avivo慢,支持格式也相對有限,最重要的是還要收費(fèi)——試用版本只能轉(zhuǎn)30次,同時(shí)試用版轉(zhuǎn)出來的視頻帶討厭的Logo。(好在目前網(wǎng)上已有完美破解版本)

    詳細(xì)評測請看:無視CPU!GPU視頻轉(zhuǎn)換ATI與NV誰更強(qiáng)?

    對于ATI Avivo視頻轉(zhuǎn)換器所存在的問題,ATI官方也毫不避諱,稱這款才剛剛面世的小工具確實(shí)還不夠完善,存在一些BUG,這將會(huì)在未來的催化劑驅(qū)動(dòng)中得到修正。ATI稱:Avivo視頻轉(zhuǎn)換器僅使用GPU完成視頻編碼中的一部分工作,具體的說,GPU目前僅負(fù)責(zé)視頻編碼過程中對運(yùn)算能力最敏感,最適于GPU應(yīng)用的“運(yùn)動(dòng)估算”部分。由于在視頻編碼中交給GPU的負(fù)載是固定的,因此該過程中的GPU占用率可能因型號(hào)的不同而出現(xiàn)高低不等的現(xiàn)象。

    詳細(xì)報(bào)道請看:AMD官方回應(yīng)Avivo視頻轉(zhuǎn)碼質(zhì)量問題!

● GPU視頻轉(zhuǎn)碼小結(jié):

  • ATI Avivo Video Convert的優(yōu)點(diǎn):免費(fèi)、片源兼容性好、轉(zhuǎn)碼速度超快
  • ATI Avivo Video Convert的缺點(diǎn):軟件功能太簡單、只能轉(zhuǎn)出低碼率低分辨率影片、視頻畫質(zhì)較差、CPU占用率很高、軟件BUG不少
  • NVIDIA Badaboom的優(yōu)點(diǎn):軟件界面友好、視頻畫質(zhì)高、能輸出1080p、CPU占用率低
  • NVIDIA Badaboom的缺點(diǎn):付費(fèi)軟件、只支持正版光碟(網(wǎng)絡(luò)片源支持格式有限)、轉(zhuǎn)低碼率影片速度不如Avivo
  • 兩者都不支持嵌入字幕

    可以說,兩款GPU轉(zhuǎn)碼軟件都還不夠完美,但比起純CPU轉(zhuǎn)碼都要快很多,尤其是Badaboom軟件版本更新非常頻繁,新版本不但轉(zhuǎn)換效率進(jìn)一步提高,而且還能夠支持H.264的CABAC可變長編碼熵運(yùn)算,對于片源支持度也進(jìn)一步放寬。

    當(dāng)初GPU高清視頻解碼技術(shù)發(fā)布時(shí),也是問題一大堆:僅支持正版影碟和PowerDVD,不支持第三方軟件,不支持外掛字幕,不支持網(wǎng)絡(luò)常見的編碼及封裝格式如X264/MKV等,但隨著時(shí)間的推移這些問題都迎刃而解?,F(xiàn)在GPU轉(zhuǎn)碼技術(shù)正處在起步階段,存在一些問題是可以理解的,但GPU加速是大勢所趨,相信今后會(huì)有越來越多的軟件加入支持,功能和兼容性將會(huì)更完美。

● GPU非3D游戲應(yīng)用之四:視頻編碼加速

    不管ATI的Avivo視頻轉(zhuǎn)換器還是NVIDIA的Badaboom,都只是非常初級(jí)的視頻轉(zhuǎn)換軟件,僅適合那些擁有手持設(shè)備的入門級(jí)用戶使用。如果專業(yè)級(jí)的視頻編輯軟件能夠應(yīng)用到GPU強(qiáng)大的并行計(jì)算能力,那才能真正吸引大批用戶的關(guān)注。所以NVIDIA和ATI都在積極的與軟件開發(fā)商合作,以便拓展GPU的應(yīng)用領(lǐng)域。

  • TMPGEnc 4.0 XPress支持NVIDIA CUDA

    TMPGEnc 4.0能夠支持CUDA架構(gòu)的N卡,它將CUDA能力使用在了重要的濾鏡部分,使得TMPGEnc在視頻編輯方面比起其他類似軟件更加有著性能上的吸引力。通過CUDA,能夠減少一半以上的工作時(shí)間,可以說實(shí)在是一個(gè)相當(dāng)令人驚異的成績。

    不過很可惜的是,TMPGEnc在轉(zhuǎn)碼部分還沒有使用好CUDA,這使得軟件在視頻輸出的時(shí)候仍然受到CPU的限制。當(dāng)然,TMPGEnc Xpress在CPU部分上已經(jīng)做出了很好的優(yōu)化,無論是Intel還是AMD都能夠利用到相應(yīng)的指令集。對于需要大量壓制視頻的用戶來說,CUDA的加入可以說是錦上添花,能夠幫助用戶節(jié)省大量時(shí)間,在減低制作平臺(tái)成本的同時(shí),也能夠加快用戶的工作效率。

  • CyberLink PowerDirector Ultra 7已支持CUDA即將支持Stream

    CyberLink PowerDirector(威力導(dǎo)演)的威名相信很多人都有所耳聞,這款臺(tái)灣產(chǎn)的軟件簡單易用特別適合國人使用,而且功能十分強(qiáng)大,很多方面都要強(qiáng)過日本產(chǎn)的TMPGEnc?,F(xiàn)在PowerDirector已經(jīng)能夠借助CUDA進(jìn)行加速,但也主要局限在濾鏡特效操作方面:如高斯模糊、鏡像模糊、萬花筒、光射線、顏色替換、鋼筆墨水、色彩邊緣、水彩畫、抽象派、火焰燃燒等等。而視頻轉(zhuǎn)碼輸出時(shí)還是只能依靠CPU處理。

    CyberLink宣稱,用戶在使用支持CUDA技術(shù)的GeForce、GeForce Mobile、Quadro、Quadro Mobile、Tesla系列顯卡時(shí),執(zhí)行濾鏡操作可以獲得最多五倍的速度提升,同時(shí)還能將CPU占用率從100%降至60%左右。

    就在前幾天,CyberLink發(fā)布了最新的公告,宣布新的7.1版本將會(huì)加入Stream支持,但最快要在2月份才能出爐。事實(shí)上在此之前ATI已經(jīng)拿到了內(nèi)部測試版本,在很多場合公開展示ATI加速視頻轉(zhuǎn)換的效能。

    據(jù)稱,PowerDirector對于Stream技術(shù)的應(yīng)用會(huì)比CUDA更多,它除了濾鏡渲染之外,在視頻編輯、回放及輸出環(huán)節(jié)都會(huì)利用到GPU的并行計(jì)算能力,視頻編輯速度將會(huì)大大提高!當(dāng)然,現(xiàn)在吹得多么天花亂墜是沒用的,還是等待專業(yè)評測對比吧。

● GPU視頻編碼小結(jié):

    很顯然,在視頻編碼方面NVIDIA要領(lǐng)先ATI至少半年,大約半年前TMPGEnc和PowerDirector 7就已經(jīng)發(fā)布了支持CUDA加速的正式版。ATI雖然也在與軟件開發(fā)商緊密合作,但支持Stream的PowerDirector 7.1最快要到09年2月份才能發(fā)布。

    PowerDirector 7.1將成為同時(shí)支持CUDA和Stream技術(shù)的第三方軟件,那么N卡和A卡在通用計(jì)算領(lǐng)域的性能表現(xiàn)如何呢?我們拭目以待!

● GPU非3D游戲應(yīng)用之五:實(shí)時(shí)倍線視頻播放

    除了視頻解碼和編碼,還有一種非常消耗處理器資源的應(yīng)用,那就是視頻倍線——使用特殊的插值算法以及畫面補(bǔ)償技術(shù),讓低分辨率視頻擴(kuò)充至高分辨率,從而讓視頻與顯示器分辨率相匹配,做到點(diǎn)對點(diǎn)完美呈現(xiàn)。有些人喜歡將480p或者720p壓制成1080p,這樣做雖然會(huì)使文件體積膨脹,但畫質(zhì)確實(shí)能夠獲得一定程度的提升。

    當(dāng)然最好的辦法并不是重新壓制視頻,而是實(shí)時(shí)倍線播放,基本上雙核CPU是沒有希望的,只有高端四核CPU才能做到實(shí)時(shí)倍線軟解視頻?,F(xiàn)在,GPU也能實(shí)時(shí)倍線硬解視頻了,硬解畫質(zhì)得到進(jìn)一步增強(qiáng)。

  • ArcSoft TotalMedia Extreme實(shí)時(shí)倍線,已支持CUDA即將支持Stream

    ArcSoft TotalMedia Thertre這款高清視頻播放器的名氣雖然沒有PowerDVD和WinDVD那么大,但其功能卻絲毫不差,它能夠同時(shí)支持ATI AVIVO、NVIDIA PureVideo和Intel ClearVideo三大硬解碼技術(shù),更重要的是它支持直接從硬盤播放下載到的HDDVD或BD,這無疑非常適合國內(nèi)用戶使用。

    除此之外,TotalMedia Thertre還有自己的獨(dú)門絕技,那就是使用GPU的并行計(jì)算能力來實(shí)時(shí)倍線視頻,將標(biāo)清視頻插值擴(kuò)充至高清分辨率,大幅提升畫面細(xì)節(jié)與品質(zhì)。

    現(xiàn)在TotalMedia Thertre已經(jīng)能夠?qū)卡提供支持,而到明年初將會(huì)發(fā)布新補(bǔ)丁用以支持A卡,現(xiàn)在AMD已經(jīng)拿到了測試版本,并現(xiàn)場展示了GPU實(shí)時(shí)倍線的效果:


倍線前后的視頻畫質(zhì)對比,效果確實(shí)有明顯改觀


軟件倍線設(shè)置,采用ATI Stream流處理運(yùn)算技術(shù)

    在視頻應(yīng)用方面,ATI始終慢NVIDIA一拍,好在落后并不多,這幾款重量級(jí)的軟件目前已經(jīng)能夠支持N卡加速了,A卡還需要等幾個(gè)月,希望它們不要讓A卡用戶等太久。

● GPU非3D游戲應(yīng)用之六:圖形顯示/處理硬件加速

    Adobe最新版的CS4系列套裝軟件最大的特性就是支持GPU加速,很多圖形特效、旋轉(zhuǎn)縮放等操作都可以通過GPU渲染完成,可以大大提高美工人員的工作效率。NVIDIA對此進(jìn)行了很多的宣傳,并專門針對PhotoShop CS4發(fā)布了Quadro CX專業(yè)繪圖卡,而ATI方面卻毫無動(dòng)作,難道A卡不支持PhotoShop加速?

    事實(shí)上,Adobe全系列軟件都基于開放式的OpenGL API開發(fā),只要是DX9級(jí)別的GPU都支持加速,這并不是N卡的專利!看看Adobe官方的最低需求:
    1.硬件支持 DirectX 9;
    2.Pixel Shader (PS) 至少為1.3版;
    3.Vertex Shader (VS)至少1.1版;


主流顯卡包括整合顯卡都支持PhotoShop CS4硬件加速


Adobe Reader 9支持PDF 2D翻頁及全屏演示加速,實(shí)時(shí)渲染文檔中的3D元素


Adobe Flash Player 10,硬件加速要求很低,幾乎不值一提

    綜上,Adobe是通過完全開放的OpenGL標(biāo)準(zhǔn)支持GPU加速,對于市面上主流顯卡都能夠提供無差別完美支持,由于之前媒體的相關(guān)報(bào)道都集中在NVIDIA方面,導(dǎo)致很多人以為只有N卡才支持Adobe GPU加速,實(shí)際上A卡甚至很多整合顯卡都支持,這與CUDA或者Stream并沒有什么直接關(guān)系。(相關(guān)評測:GPU加速時(shí)代來臨! PhotoShop CS4解析

    但是,Adobe有一個(gè)視頻輸出插件RapiHD,它是基于CUDA架構(gòu)設(shè)計(jì)的,能夠利用GPU加速視頻后期輸出過程,但它僅支持Quadro系列專業(yè)顯卡(包括Adobe專用的Quadro CX),不支持GeForce系列消費(fèi)級(jí)顯卡,當(dāng)然也不支持A卡。

● Adobe系列軟件小結(jié):

    雖然NVIDIA對于Adobe CS4系列的支持很到位,但對于普通用戶來講,A卡和N卡是沒有任何區(qū)別的,而且PhotoShop類軟件對于GPU性能的要求并不高,只要是DX9以上級(jí)別的顯卡都能大大提高圖形操作速度。

    只有專業(yè)視頻編輯,在后期輸出過程中用到RapiHD插件時(shí),Quadro專業(yè)顯卡才會(huì)顯示出驚人的效能,而ATI FireGL專業(yè)卡則不支持。

● GPU非3D游戲應(yīng)用之七:GPU物理加速

    Intel閃電收購Havok,NVIDIA以迅雷不及掩耳之勢拿下Ageia,兩大物理引擎都被財(cái)大氣粗的競爭對手所搞定,于是AMD成為了局外人。實(shí)際上之前的ATI與Havok關(guān)系非常曖昧,X1000時(shí)代ATI所展示的一些GPU物理加速Demo都是基于Havok FX引擎開發(fā),所以說在GPU物理加速方面,ATI一直都不輸于人。

物理加速卡修成正果!NVIDIA收購AGEIA
ATI展示的GPU物理加速Demo,可以看到背景有Havok Logo

    突如其來的收購案,猶如飛來橫禍給AMD的GPU物理加速之路蒙上了一層陰影。物理引擎只有兩家,到底該向左走還是向右走呢?競爭是殘酷的,Intel收購Havok之后,支持GPU加速的Havok FX引擎就被暫時(shí)凍結(jié),等到明年Intel自己的獨(dú)立顯卡發(fā)布之后,才有可能開放支持;而NVIDIA的PhysX引擎也沒打算支持CPU加速。

比最強(qiáng)CPU快七倍!GPU物理加速全解析

    AMD作為唯一一家同時(shí)擁有CPU與GPU業(yè)務(wù)的公司,可謂是手心手背都是肉,既要宣傳GPU的好也不能鄙視CPU。最終AMD選擇了擁有處理器業(yè)務(wù)而且即將擁有GPU業(yè)務(wù)的Intel(Havok)。因?yàn)橹挥蠬avok引擎才能同時(shí)利用CPU與GPU的富裕性能做物理加速。

    AMD認(rèn)為在進(jìn)行游戲渲染時(shí),多核心CPU的負(fù)載很低,完全可以用CPU來進(jìn)行物理加速,當(dāng)CPU性能還不夠時(shí)再交給GPU處理,必須做到CPU與GPU負(fù)載平衡才能非常好的化系統(tǒng)性能。對于用戶來說到底誰做物理加速并不重要,關(guān)鍵是要效果好,而且對系統(tǒng)要求越低越好。

支持GPU物理加速!最強(qiáng)國產(chǎn)游戲MKZ賞

    不得不佩服NVIDIA的驚人實(shí)力,PhysX引擎被CUDA改造之后能夠支持全線N卡,而且越來越多的游戲開發(fā)商開始力挺PhysX引擎,其中包括大名鼎鼎的EA、THQ、2K。不過目前的情況是PhysX缺乏重量級(jí)游戲大作的支持,UT3僅僅是個(gè)別地圖支持PhysX而已,驚世駭俗之作Crysis也是采用CPU做物理加速。而像MKZ(鐵甲突襲)、Cryostasis(雪域危機(jī))這些非著名游戲的影響力著實(shí)有限。


Havok引擎將給《星際爭霸2》帶來一定的物理效果
尤其是在戰(zhàn)爭中的破壞效果會(huì)非常明顯

    Havok及其靠山Intel的實(shí)力也不容小視,Intel目前只是在積聚實(shí)力、尚未發(fā)力,將來一呼百應(yīng)也并非天方夜談。即便如此,暴雪官方宣布正式支持Havok引擎已經(jīng)讓廣大玩家欣喜不已,試想重量級(jí)的《星際2》和《暗黑3》兩款大作如果采用Havok物理引擎的話,這對于PhysX將造成打擊。

GPU物理加速小結(jié):

    不管未來物理引擎誰能稱王,GPU物理加速已經(jīng)成為大勢所趨,這主要還得歸功于NVIDIA的大力推廣。當(dāng)然AMD也沒有閑著,今年有兩件事最值得關(guān)注,一是AMD和Intel-Havok合作開發(fā)物理應(yīng)用技術(shù)、二是AMD與暴雪結(jié)成戰(zhàn)略合作伙伴關(guān)系,這對于AFan來說無疑是天大的喜訊。

    當(dāng)然,現(xiàn)在NVIDIA的PhysX技術(shù)已經(jīng)有數(shù)十款游戲能夠支持,而Intel和AMD的Havok技術(shù)目前只能用CPU進(jìn)行物理運(yùn)算,物理效果一般而且消耗資源不低,Havok的新一代GPU物理加速依然遙遙無期。

    首款專門作流處理/并行計(jì)算的GPU產(chǎn)品并不是NVIDIA的Tesla,而是ATI的FireStream,早在2006年,ATI就發(fā)布了基于R580核心的流處理加速卡,48個(gè)像素渲染單元成為流處理器的雛形:

AMD首款“顯卡”公布:流處理加速卡!
FireStream第一代,其實(shí)就是1GB顯存的X1950XTX

    可惜的是,在第一代DX10顯卡較量中的失敗,讓AMD浪費(fèi)了太多的時(shí)間與機(jī)會(huì)。G80核心成為高性能及并行計(jì)算的代名詞,專門針對并行計(jì)算設(shè)計(jì)的Tesla也暫露頭腳。

    當(dāng)然AMD的腳步也沒有停止,F(xiàn)ireStream產(chǎn)品線伴隨著GPU的升級(jí)而更新,AMD的GPU架構(gòu)天生就擁有很強(qiáng)的浮點(diǎn)運(yùn)算能力,尤其是雙精度浮點(diǎn)運(yùn)算能力!

    單精度浮點(diǎn)運(yùn)算,A卡并沒有比N卡高太多,但要知道在對精度要求很高的科學(xué)研究和勘探方面,單精度是沒有價(jià)值的,所有計(jì)算都需要雙精度64Bit。A卡的雙精度運(yùn)算是單精度的1/5,而N卡的雙精度運(yùn)算只有單精度的1/8。

顯卡構(gòu)建1U服務(wù)器 看TESLA近來的發(fā)展
核心為4片GPU的1U服務(wù)器,Tesla S1070=Tesla C1060×4

    除了單GPU核心的產(chǎn)品之外,NVIDIA還有專門設(shè)計(jì)的多GPU Tesla Personal SuperComputer運(yùn)算系統(tǒng),AMD也有類似的運(yùn)算加速系統(tǒng):

    Aprius CA8000允許在機(jī)架內(nèi)部插上最多八塊FireStream 9270流處理加速卡,從而提供將近10TFlops的單精度浮點(diǎn)運(yùn)算能力,以及1.9TFlops的雙精度浮點(diǎn)運(yùn)算能力。當(dāng)然AMD的機(jī)架體積也要比NVIDIA的1U機(jī)架大很多,雙方的外觀和結(jié)構(gòu)雖然相差很多,但基本原理是一致的,都是類似于外置顯卡的解決方案。

    不過,A卡SIMD架構(gòu)的效率一直讓人擔(dān)心,目前上沒有能夠直接對比雙方實(shí)際浮點(diǎn)運(yùn)算性能的軟件,但根據(jù)Folding@home的民間數(shù)據(jù)來看,HD4870不如GTX260,而GTX260與9800GTX+是差不多的,看來雙方在并行計(jì)算方面都還有繼續(xù)優(yōu)化提升的空間。

    在GPU并行計(jì)算方面,一直都沒有一個(gè)通用的標(biāo)準(zhǔn),于是ATI和NVIDIA各自為政,NVIDIA有CUDA開發(fā)包及CUDA C編譯器,ATI也開發(fā)了Stream SDK和Brook+語言。


ArcSoft TotalMedia Thertre支持Stream

    CUDA C就是對C語言的延伸,而Brook+也是一種類C的語言,兩者有一定的相似之處但并無法相容。也就是說使用CUDA編寫的軟件,想要支持ATI Stream的話,必須重新編寫一遍,這顯然是軟件開放商極不愿意看到的事情。

    支持Khronos Group標(biāo)準(zhǔn)化作業(yè)的AMD首席技術(shù)官(CTO)Jason Yang稱:“軟件開發(fā)人員希望自己編寫的代碼能在各種系統(tǒng)上執(zhí)行。不過,對開發(fā)人員來說開發(fā)平臺(tái)越少越好。而能夠?qū)崿F(xiàn)這一想法的正是OpenCL”。另外,Terry Makedon回顧計(jì)算機(jī)的歷史,“供應(yīng)商的自主規(guī)格不能擴(kuò)大市場,為解決這一問題公開了開放標(biāo)準(zhǔn),從而開拓新的市場”,OpenCL和DirectX的Compute Shader的公開顯示了對GPGPU市場擴(kuò)大的期待。AMD還將繼續(xù)采用Brook+。今后還將提供作為高抽象度軟件開發(fā)環(huán)境的Brook+,通過Brook+記述的程序,可以制成在支持OpenCL的處理器上執(zhí)行的程序。

    OpenCL的誕生給整合產(chǎn)業(yè)都帶來了希望,對消費(fèi)者來說,一個(gè)開放的行業(yè)標(biāo)準(zhǔn)無疑要比各自為戰(zhàn)的企業(yè)標(biāo)準(zhǔn)親切的多。由于AMD、NVIDIA、Intel同為工作組成員,這一標(biāo)準(zhǔn)的提出為我們描繪了一個(gè)美好的未來:無需區(qū)分哪家廠商的產(chǎn)品,不分GPU、CPU,系統(tǒng)可以根據(jù)當(dāng)時(shí)的應(yīng)用需要,調(diào)動(dòng)各個(gè)處理器的運(yùn)算能力,以協(xié)同合作的方式最快速度完成工作。OpenCL將統(tǒng)一管理一臺(tái)電腦上的所有計(jì)算資源,比如你的多核CPU,以及多個(gè)GPU。OpenCL將這些資源統(tǒng)一看待,算作計(jì)算單元,并配置各種級(jí)別的內(nèi)存:private、local和global。

    據(jù)ATI Stream研發(fā)團(tuán)隊(duì)稱,目前ATI已將工作重心轉(zhuǎn)移到了OpenCL上來。ATI在最新公布的Stream SDK 1.3中重寫了Brook+以提升性能,將在Stream SDK 2.0中完全支持OpenCL,并積極幫助客戶從Brook+過渡到OpenCL。而NVIDIA仍堅(jiān)持兩手抓兩手都要硬的策略,為客戶同時(shí)提供CUDA C及OpenCL的支持,并稱CUDA C與OpenCL是互補(bǔ)而非競爭關(guān)系。

    不難看出,雖然NVIDIA CUDA所能提供的軟件,大部分ATI也能提供支持,但是無論進(jìn)度還是效果方面,都是相差甚遠(yuǎn)!比如PowerDirector和TotalMedia Thertre,N卡用戶幾個(gè)月前已經(jīng)能夠使用GPU加速了,而ATI只能在明年一季度才提供支持;PhysX游戲已經(jīng)為數(shù)不少了,而Havok游戲(GPU加速)一款還沒有;Badaboom雖然是收費(fèi)軟件,但國內(nèi)并不缺乏盜版,而完全免費(fèi)的Avivo尚無法令人滿意。


NVIDIA和ATI從3D游戲戰(zhàn)場打到了并行計(jì)算領(lǐng)域

    AMD也坦誠,雖然GPU通用計(jì)算的概念最早由ATI提出并率先應(yīng)用,但NVIDIA已經(jīng)后來者居上,在很多方面都比ATI做得好。不過AMD近年來所做出的努力也是顯而易見的,對于GPU功能的開發(fā)也是緊追不舍,并沒有落后NVIDIA太多。

    ATI(AMD)與NVIDIA之間GPU之戰(zhàn),遠(yuǎn)比AMD和Intel之間的CPU之戰(zhàn)有意思,畢竟雙方的實(shí)力差距并沒有那么懸殊。競爭是激烈的,也是好看的,近年來A/N之間的龍爭虎斗給廣大用戶帶來了性能更強(qiáng)、價(jià)格更實(shí)惠的產(chǎn)品:如果沒有HD4850/HD4870,9800GTX/GTX260就會(huì)永遠(yuǎn)高高在上,沒有HD4870X2,NVIDIA也就不會(huì)急于發(fā)布55nm的GTX285/GTX295。同理,如果沒有NVIDIA的辛勤努力及孜孜不倦的推廣,GPU并行計(jì)算也就不會(huì)這么快的深入人心,AMD也可能會(huì)將ATI之前在GPGPU方面的努力束之高閣。


顯卡,早已超出了游戲卡的范疇

    2006年,當(dāng)ATI率先提出GPU通用計(jì)算時(shí),很多人都以為這是天方夜譚,也不知道何年何月才能得償所愿。如今,只花了兩年時(shí)間,GPU就已經(jīng)在科學(xué)研究和超級(jí)計(jì)算領(lǐng)域取得突破性進(jìn)展,在民用市場也開始遍地開花。現(xiàn)在,玩家們因一兩款特別喜愛的游戲而升級(jí)顯卡;將來,或許很多不玩游戲的人,也會(huì)沖著一兩款支持GPU加速的軟件去購買中高端顯卡。

總結(jié):

    您或許感慨NVIDIA在并行計(jì)算方面十年磨一劍的艱辛;或許為ATI因AMD收購而錯(cuò)過近兩年的發(fā)展而惋惜。然后對于這樣一個(gè)全新的領(lǐng)域,無論對于領(lǐng)先者還是追趕者玩家們都應(yīng)該給予同樣的掌聲。<

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注