關(guān)公戰(zhàn)秦瓊!4套CPU/GPU決戰(zhàn)視頻轉(zhuǎn)碼
幾年前,提起GPGPU(General-Purpose computing on GPU,GPU通用計(jì)算),大家可能還覺(jué)得是天方夜譚,也不知道何年何月才能得償所愿。而且對(duì)于新生事物總會(huì)有很多疑問(wèn):GPU真比CPU強(qiáng)很多?GPU作用超過(guò)CPU或僅是協(xié)處理器?GPU能挑戰(zhàn)CPU的地位嗎?
如今,只花了兩年時(shí)間,GPU就已經(jīng)在科學(xué)研究和超級(jí)計(jì)算領(lǐng)域取得突破性進(jìn)展,在民用市場(chǎng)也開(kāi)始遍地開(kāi)花,基于CUDA和Stream技術(shù)的軟件如雨后春筍版相繼發(fā)布,讓大家對(duì)于GPU有了一個(gè)全新的認(rèn)識(shí)——原來(lái)GPU除了3D渲染和游戲,還能干這么多事情。
不過(guò),第一批CUDA/Stream軟件主要還是集中在視頻編輯/轉(zhuǎn)碼應(yīng)用,比如Badaboom、AVIVO、MediaShow、MediaCoder等。在這些軟件發(fā)布時(shí)我們都于第一時(shí)間進(jìn)行了性能測(cè)試,前不久通過(guò)對(duì)國(guó)內(nèi)首款CUDA視頻轉(zhuǎn)碼軟件MediaCoder的測(cè)試發(fā)現(xiàn),該軟件完美支持多核CPU及指令集、再加上CUDA加速的助陣,其性能輕松超越CUDA代表作Badaboom,讓電腦視頻轉(zhuǎn)換性能更上一層樓。
但很多朋友對(duì)我們的評(píng)測(cè)也產(chǎn)生了質(zhì)疑,認(rèn)為選用Core i7平臺(tái)太過(guò)高端、測(cè)試的視頻不具代表性、而且MeidaCoder與Badaboom的用戶(hù)定位也不同。通過(guò)吸取網(wǎng)友的意見(jiàn)和建議,我們決定對(duì)目前已正式發(fā)布的支持GPU轉(zhuǎn)碼的軟件進(jìn)行一次橫評(píng),詳細(xì)對(duì)比各款軟件之間的性能差異、輸出畫(huà)質(zhì)及兼容性,通過(guò)多套平臺(tái)對(duì)比高中低端CPU與GPU的實(shí)力。
● CUDA加速的鼻祖:Badaboom
GPU視頻編碼的鼻祖應(yīng)該是ATI的AVIVO Video Convert,在X1000時(shí)代ATI就隨驅(qū)動(dòng)附贈(zèng)這款小工具,但由于輸出畫(huà)質(zhì)差、功能有限、高中低端顯卡毫無(wú)差別的原因,該軟件爭(zhēng)議比較大,此后AVIVO沉寂了很長(zhǎng)一段時(shí)間,并不再對(duì)HD2000/HD3000顯卡提供支持。
真正使用GPU進(jìn)行轉(zhuǎn)碼的軟件,Badaboom是第一款,Badaboom再次喚醒了人們對(duì)GPGPU的認(rèn)識(shí),AMD也因Badaboom的崛起而重新啟動(dòng)了AVIVO Video Convert這個(gè)小工具,來(lái)使用HD4000顯卡進(jìn)行視頻轉(zhuǎn)碼,遺憾的是,跟4年前相比該工具沒(méi)有多大改進(jìn)。
現(xiàn)在筆者就主要介紹下Badaboom這款軟件,該軟件版本更新很頻繁,經(jīng)過(guò)一年多時(shí)間的發(fā)展,兼容性不斷加強(qiáng)、轉(zhuǎn)換效率越來(lái)越高,雖然還存在一些問(wèn)題,但作為CUDA應(yīng)用的鼻祖,也是一款好用且速度快的視頻轉(zhuǎn)碼軟件。
● Badaboom支持的視頻種類(lèi):
- 輸入視頻編碼:MPEG、MPEG2、VC-1、H.264/AVC、AVCHD、HDV、RAW、WMV、VC-1、DivX、Xvid、FRAPS
- 輸入音頻編碼:AC-3、MP2、PCM、AAC
- 輸入視頻格式:M2V、MPG、VOB、AVI、TRP、TS、M2T、M2TS、MPEG、MTS、MOV、MP4、MKV、WMV
- 輸出視頻編碼:H.264(MP4),支持Baseline Profile、Main Profile,最高支持4.1版本,支持CABAC、動(dòng)態(tài)比特率、反交錯(cuò)
- 輸出視頻分辨率:最高1080p,最低320p,常見(jiàn)分辨率均支持
- 輸出視頻碼率:500Mbps~2500Mbps
- 輸出音頻編碼:AAC-LC(2 Channel)
● Badaboom的特點(diǎn)和優(yōu)點(diǎn):
- 界面簡(jiǎn)潔,極易上手
- 專(zhuān)門(mén)針對(duì)手持設(shè)備和娛樂(lè)設(shè)備設(shè)計(jì),輸出兼容性很好
- 對(duì)GPU利用率很高,轉(zhuǎn)碼速度快
● Badaboom的缺點(diǎn):
- 界面支持中文,卻不支持中文文件名和目錄
- 網(wǎng)絡(luò)流行的RMVB不支持,很多AVI和WMV也不支持
- 不支持壓字幕到視頻里面
- 不支持批量轉(zhuǎn)換
● Badaboom最新版本:1.2.1.7
- Badaboom 1.2.1.7測(cè)試版下載鏈接
- 測(cè)試版30次轉(zhuǎn)換機(jī)會(huì),轉(zhuǎn)出視頻帶Elemental Logo
- 完整版售價(jià)29.99美元(204.88人民幣)
● 同時(shí)支持CUDA與Stream:MediaShow Espresso
Cyberlink(訊連科技)旗下大名鼎鼎PowerDVD相信大家都非常熟悉,作為一家專(zhuān)注視頻與多媒體的軟件開(kāi)發(fā)商,Cyberlink不久前推出了一款專(zhuān)業(yè)的快速視頻轉(zhuǎn)換軟件——MediaShow Espresso,需要注意的是MediaShow(魅力四射)是一款視頻編輯軟件,而MediaShow Espresso才是視頻轉(zhuǎn)換軟件。
MediaShow Espresso是第一款同時(shí)支持CUDA與Stream加速的視頻轉(zhuǎn)換軟件,除此之外它還對(duì)Intel Core i7處理器的超線程及SSE4指令集做了優(yōu)化,因此無(wú)論純CPU轉(zhuǎn)碼還是GPU加速,其速度比傳統(tǒng)軟件都要快。
界面簡(jiǎn)潔明了,功能和操作方法一目了然,這就是MediaShow Espresso的最大特色,它與Badaboom的類(lèi)似,主要針對(duì)手持設(shè)備或娛樂(lè)設(shè)備轉(zhuǎn)換視頻。其兼容性與Badaboom不相上下,但視頻輸出格式更多,沒(méi)有局限于MP4這一種,但在自定義分辨率和碼率方面,沒(méi)有Badaboom那么靈活。

每一種設(shè)備提供的分辨率有限、碼率不可調(diào)
這種內(nèi)置輸出模式的設(shè)定,對(duì)于高級(jí)用戶(hù)來(lái)說(shuō)可能不夠靈活,但對(duì)于初級(jí)用戶(hù)來(lái)說(shuō)還是很方便的,用戶(hù)無(wú)需關(guān)心視頻的畫(huà)質(zhì)及分辨率,軟件內(nèi)置的模式肯定是最優(yōu)的方案。

軟件能自動(dòng)識(shí)別顯卡是否支持CUDA或Stream,默認(rèn)為開(kāi)啟
● MediaShow Espresso支持的視頻種類(lèi):
- 輸入視頻格式:AVI、MPEG、MPEG-2、MOV、WMV、MP4、DVR-MS、TS、MPG、ASF、M2T、M2TS、MTS、DV-AVI、VOB、VRO、MOD、DAT、TOD、TiVo、WTV
- 輸出視頻格式:MPEG2、MPEG4、MPEG4 AVC、WMV
- 兼容輸出設(shè)備:iPhone、iPod Touch、iPod Nano、iPod Classic、PSP、PlayStation 3、XBox、Zune
- 輸出視頻分辨率:針對(duì)特殊設(shè)備設(shè)定,分辨率有限,無(wú)法自定義
- 輸出視頻碼率:針對(duì)手持設(shè)備優(yōu)化,無(wú)法自定義碼率
● MediaShow Espresso的特點(diǎn)和優(yōu)點(diǎn):
- 界面友好,操作方便
- 專(zhuān)門(mén)針對(duì)手持設(shè)備和娛樂(lè)設(shè)備設(shè)計(jì),輸出兼容性很好
- 同時(shí)支持CUDA和Stream,并對(duì)i7優(yōu)化
- 支持批量轉(zhuǎn)換
● MediaShow Espresso的缺點(diǎn):
- 網(wǎng)絡(luò)流行的RMVB不支持,和不少M(fèi)2TS、AVI等也存在兼容性問(wèn)題
- 不支持壓字幕到視頻里面
- 分辨率和碼率都無(wú)法自定義
● MediaShow Espresso最新版本:5.0.0430.12419
- MediaShow Espresso最新試用版下載鏈接
- 30天使用期限,免費(fèi)轉(zhuǎn)換H.264視頻50次
- 完整版售價(jià)260元人民幣
● 唯一免費(fèi)的轉(zhuǎn)碼軟件:MediaCoder
前面兩款軟件雖然界面美觀、操作簡(jiǎn)便,但都是價(jià)值不菲的商業(yè)軟件,售價(jià)達(dá)200元以上,下面介紹的這款視頻轉(zhuǎn)換軟件則是完全免費(fèi)的國(guó)產(chǎn)開(kāi)源軟件。
MediaCoder是一個(gè)免費(fèi)的通用音頻/視頻批量轉(zhuǎn)碼工具,它將眾多來(lái)自開(kāi)源社區(qū)的優(yōu)秀音頻視頻編解碼器和工具整合為一個(gè)通用的解決方案,可以將音頻、視頻文件在各種格式之間進(jìn)行轉(zhuǎn)換。MediaCoder具備一個(gè)可擴(kuò)展的架構(gòu)和豐富的功能,可滿足各種場(chǎng)合下的轉(zhuǎn)碼需求。目前,MediaCoder的用戶(hù)已經(jīng)遍布全世界170多個(gè)國(guó)家。
通俗一點(diǎn)的說(shuō):玩高清的朋友一定用過(guò)終極解碼或者完美解碼吧,終極解碼就是整合了一大堆播放器和解碼器的視頻播放軟件,而MediaCoder就是整合了一大堆編碼器和插件的視頻轉(zhuǎn)碼軟件。功能大而全、靈活性高、開(kāi)源、免費(fèi)是這類(lèi)軟件的共性,如果要為MediaCoder起個(gè)中文名稱(chēng)的話,筆者認(rèn)為“終極轉(zhuǎn)碼”或者“完美轉(zhuǎn)碼”都不錯(cuò)^_^。
MediaCoder的版本更新非常頻繁,其開(kāi)發(fā)團(tuán)隊(duì)在馬不停蹄的加入各種新的功能并優(yōu)化轉(zhuǎn)碼效率,自引入CUDA編碼器以來(lái)就針對(duì)用戶(hù)的需求以及發(fā)現(xiàn)的BUG不斷修正,目前已經(jīng)趨于完善。
● MediaCoder功能簡(jiǎn)介:
- 實(shí)現(xiàn)各種音頻視頻格式間的相互轉(zhuǎn)換
- 豐富的可調(diào)整的編碼參數(shù)
- 豐富的視頻處理濾鏡,包括反交錯(cuò)、裁剪、分辨率調(diào)整、亮度色彩調(diào)整等
- 豐富的音頻處理濾鏡,包括聲道映射、重采樣、音量調(diào)整等
● MediaCoder主要特點(diǎn):
- 完全免費(fèi),版本更新極為頻繁
- 幾乎支持所有類(lèi)型的視頻,包括網(wǎng)絡(luò)流行的RMVB、DIVX等,可以轉(zhuǎn)換為任何類(lèi)型的視頻
- 為多核、多線程優(yōu)化,支持SSE4.1、X64等最新處理器指令集
- 視頻/音頻參數(shù)完全自定義,可調(diào)整范圍寬大
- CUDA加速可以支持將所有類(lèi)型的視頻轉(zhuǎn)換為H.264/X264編碼,包括M2TS、TS、MP4、MKV、MOV等眾多封裝格式
- 支持將字幕壓入視頻
- 有影音設(shè)備專(zhuān)用版本,完整版也內(nèi)置了轉(zhuǎn)碼參數(shù)及優(yōu)化方案
● MediaCoder的缺點(diǎn):
- 界面比較復(fù)雜專(zhuān)業(yè),上手比較難
- 功能太多,存在一些BUG
● MediaCoder最新版本:0.7.1.4476
- MediaCoder 0.7.1.4475 32bit完整版下載鏈接
- MediaCoder 0.7.1.4476 32bit升級(jí)補(bǔ)丁下載
- MediaCoder 0.7.1.4476 64bit升級(jí)補(bǔ)丁下載
- 32bit系統(tǒng)用戶(hù)下載前兩個(gè),64bit系統(tǒng)用戶(hù)安裝第三個(gè)補(bǔ)丁會(huì)有性能提升
- 4476版進(jìn)一步優(yōu)化了CUDA轉(zhuǎn)碼的效率和兼容性
● 測(cè)試視頻的選擇:兩部具有代表性的視頻
為了更加貼近廣大用戶(hù)日常操作時(shí)的應(yīng)用,筆者選擇了兩部視頻進(jìn)行轉(zhuǎn)碼測(cè)試,考慮到一整部電影的轉(zhuǎn)碼時(shí)間動(dòng)輒好幾個(gè)小時(shí),因此測(cè)試用影片為片段。

第一部為DVD轉(zhuǎn)iPhone,模擬經(jīng)常為手持設(shè)備轉(zhuǎn)視頻的那部分用戶(hù)。影片為《刺殺希特勒》拍攝花絮,DVD MPEG2編碼,720×576分辨率,將其轉(zhuǎn)換為iPhone支持的480×270分辨率,H.264編碼MP4封裝。
第二部為1080p轉(zhuǎn)720p,模擬經(jīng)常為網(wǎng)絡(luò)提供720p視頻下載的那部分熱心用戶(hù)、或者想把高清視頻壓縮保存至DVD刻盤(pán)的那部分“光盤(pán)黨”。影片為《007之大破量子危機(jī)》預(yù)告片,1080p H.264編碼M2TS封裝,將其轉(zhuǎn)換為720p H.264編碼MP4封裝。
● 測(cè)試軟件設(shè)置:保證三款軟件擁有相同的碼率和格式
三款軟件中,只有MediaShow Espresso是無(wú)法自定義碼率和格式的,因此所有的測(cè)試均以MediaShow Espresso為準(zhǔn),通過(guò)分析MediaShow Espresso轉(zhuǎn)換輸出文件的碼率和格式,讓Badaboom和MediaCoder向它看齊,最大限度的保證三款軟件輸出視頻擁有相同的畫(huà)質(zhì)。
- MediaShow Espresso設(shè)置說(shuō)明:
第一部視頻,MediaShow Espresso直接輸出iPhone 480×270分辨率即可,最終視頻碼率為1500Kbps。
第二部視頻,MediaShow Espresso輸出為PS3 1280×720分辨率,最終視頻碼率為10000Kbps。
MediaShow Espresso的CUDA加速默認(rèn)為開(kāi)啟,除了測(cè)試四款顯卡的加速能力之外還測(cè)試了純CPU編碼時(shí)的轉(zhuǎn)碼速度,作為對(duì)比。
- Badaboom設(shè)置說(shuō)明:
第一部視頻,Badaboom內(nèi)置的iPhone轉(zhuǎn)碼方案與MediaShow Espresso完全相同,視頻碼率也是1500Kbps,因此不用做任何設(shè)置直接轉(zhuǎn)碼即可,最終獲得的視頻文件體積也與MediaShow完全相同。
第二部視頻,Badaboom選擇右側(cè)最下方的自定義方案,碼率設(shè)定為10050Kbps(沒(méi)有10000這個(gè)整數(shù)),選擇Main Profile、開(kāi)啟CABAC、H.264 4.0版(為了與MediaShow保持一致),音頻碼率提高到256Kbps,這樣就能獲得與MediaShow差不多畫(huà)質(zhì)/大小的視頻。
Badaboom不支持純CPU轉(zhuǎn)碼,因此不進(jìn)行軟解測(cè)試,但會(huì)額外加入單卡最強(qiáng)的GTX285代替,看看比起GTX260+還會(huì)不會(huì)有提升。
- MediaCoder設(shè)置說(shuō)明:
MeidaCoder其實(shí)也提供了參考轉(zhuǎn)碼方案,但必須安裝FireFox瀏覽器并聯(lián)網(wǎng)才能訪問(wèn)“功能”“設(shè)備轉(zhuǎn)碼平臺(tái)”,然后選擇iPhone設(shè)備。這樣做太麻煩,還不如自行手動(dòng)設(shè)定,參考設(shè)置如下:

紅圈所示選項(xiàng)就是開(kāi)啟GPU加速:GPU編碼和GPU壓縮分辨率
第一步視頻,使用上圖所示的設(shè)定,轉(zhuǎn)換出來(lái)的視頻就與Badaboom沒(méi)有太大差別,都是Baseline 2.1版本,接近1500Kbps的碼率,輸出文件體積相差不過(guò)1MB。
第二部視頻稍作更改,分辨率改為720p,碼率增至10000Kbps,H.264版本調(diào)為與MediaShow和Badaboom相同的High 4.0配置,并開(kāi)啟CABAC,最終獲得的視頻文件碼率和體積都差不多。
將編碼器換為X264就能禁用GPU編碼,完全使用普通的CPU編碼,這樣就能直接對(duì)比CUDA編碼器與X264編碼器的轉(zhuǎn)換效率,看看性能提升幅度到底有多大。
一切準(zhǔn)備就緒,PK正式開(kāi)始。
其實(shí)支持GPU加速的視頻轉(zhuǎn)碼軟件還有不少,比如PowerDirect、TMPGEnc等,不過(guò)這些軟件主要應(yīng)用領(lǐng)域是視頻編輯,即為視頻增加一些特效、渲染、進(jìn)行后處理等,GPU只是起到畫(huà)龍點(diǎn)睛的作用,并不能利用到GPU的龐大的運(yùn)算資源。
只有視頻轉(zhuǎn)碼才是最消耗CPU及GPU資源的應(yīng)用,四核八線程的Core i7在壓片時(shí)也會(huì)力不存心,240個(gè)流處理器的GTX285在轉(zhuǎn)碼時(shí)也能滿負(fù)荷運(yùn)轉(zhuǎn)。因此筆者選擇了目前三款最流行的視頻轉(zhuǎn)碼軟件進(jìn)行測(cè)試。
● 測(cè)試系統(tǒng)配置:
|
硬件系統(tǒng)配置 | |
|
Core i7 920 2.66GHz Core 2 Quad Q9550 2.83GHz Core 2 Duo E8400 3.0GHz Pentium Dual Core E5300 2.6GHz | |
|
華碩 P6T Deluxe(X58) 華碩Rampage Extreme(X48) | |
|
日立1TB HDE721010SLA330 | |
金泰克DDR3-1333 2GBx3(X58) 金泰克DDR3-1333 2GBx2(X48) | |
|
影馳GTX285 微星GTX260+ OC版 微星9800GT綠色版 影馳9600GT刀鋒版 昂達(dá)9500GT | |
|
海盜船HX1000W | |
|
顯示器 |
Sony 40V380A |
|
軟件系統(tǒng)配置 | |
|
Windows 7 RTM 7600 64bit | |
|
驅(qū)動(dòng) |
Forceware 186.18WHQL |
4核8線程的Core i7可以說(shuō)是當(dāng)前壓片的神器了,現(xiàn)在已經(jīng)有很多視頻相關(guān)軟件加入了對(duì)SSE4.1指令集以及HT超線程技術(shù)的優(yōu)化。因此,雖然Core i7價(jià)格依然高高在上,很多人認(rèn)為太高端不具代表性,但評(píng)測(cè)還是要加入的。
為了滿足讀者的要求,筆者特意選擇了目前主流四核Q9550,它的主頻比i7 920還要高一些,但價(jià)格和平臺(tái)更為便宜。此外還有最強(qiáng)雙核E8400,還有最受歡迎的E5300。
顯卡方面,也盡量選擇了市場(chǎng)上的主流產(chǎn)品,從高到底依次為GTX260+、9800GT、9600GT、9500GT,其中98GT和96GT都是剛上市的綠色版,主頻較低但功耗和發(fā)熱控制相當(dāng)不錯(cuò)。
首先還是在優(yōu)異的Core i7平臺(tái)上進(jìn)行測(cè)試,作為Intel新一代處理器,i7支持SSE4.1、SSE4.2指令集,對(duì)多媒體性能優(yōu)化最好,而且超線程技術(shù)也能讓視頻轉(zhuǎn)碼性能提升不少。目前包括MediaShow、MediaCoder、TMPEGnc、PowerDirect在內(nèi)的很多視頻編輯/轉(zhuǎn)換軟件都對(duì)i7指令集提供了優(yōu)化支持。
● DVD(720×576 MPEG2)轉(zhuǎn)iPhone(480×270 H.264)MP4

9500GT確實(shí)太弱了,Badaboom使用95GT時(shí)的性能慘不忍睹,而且MediaCoder和MediaShow在開(kāi)啟CUDA加速后性能不升反降,看來(lái)32SP構(gòu)成了轉(zhuǎn)碼瓶頸,跟不上i7的腳步了。而96GT的64SP則完全夠用,MediaCoder和MediaShow對(duì)GPU的要求不算高,96GT以上級(jí)別的顯卡不會(huì)帶來(lái)更好的性能表現(xiàn)。
Badaboom主要依靠GPU加速,因此從95GT到96GT到98GT再到GTX260+都有性能提升,但提升幅度并非線性,這可能與低分辨率MPEG2編碼不夠復(fù)雜有關(guān)系。

通過(guò)CPU占用率就可以發(fā)現(xiàn),Badaboom基本把CPU架空了,完全依靠GPU的SP做運(yùn)算,而MediaCoder和MediaShow則是利用GPU做編碼、CPU做解碼和音頻等混合處理,因此CPU占用率很高。
MediaShow在開(kāi)啟CUDA后CPU占用率下降,而MeidaCoder開(kāi)CUDA后CPU占用率反而上升,而且MediaCoder在MPEG2轉(zhuǎn)碼時(shí)的性能并不比MediaShow強(qiáng)太多,可能是轉(zhuǎn)碼原理不同,或者是對(duì)i7超線程的支持與優(yōu)化不同所致。
● H.264編碼1080p轉(zhuǎn)720p

數(shù)據(jù)量更為龐大的1080p壓720p的測(cè)試中,三款軟件的整體表現(xiàn)與MPEG2類(lèi)似,但也有些不同,這里9500GT并沒(méi)有起到負(fù)作用,MediaCoder和MediaShow開(kāi)啟CUDA后都有了些許提升,另外Badaboom換用各種顯卡后的性能提升基本與顯卡的3D性能相當(dāng),看來(lái)三款軟件只有遇到高負(fù)荷的工作時(shí)才能完全發(fā)揮出應(yīng)有的實(shí)力。
MediaCoder的轉(zhuǎn)碼性能顯然是最強(qiáng)的,因?yàn)樗坏浞掷昧薈PU資源,而且GPU的貢獻(xiàn)也不少,96GT/98GT/GTX260都有提升,性能完全超越Badaboom。而MediaShow依然是96GT以上無(wú)用,此時(shí)其性能表現(xiàn)還不如Badaboom使用GTX260+時(shí)。

面對(duì)更加復(fù)雜的1080p轉(zhuǎn)720p,Badaboom轉(zhuǎn)換時(shí)的占用率比MPEG2更低,而MediaCoder占用率比MediaShow高不少,可以說(shuō)完全利用了i7 4核8線程的所有資源,因此轉(zhuǎn)碼速度最快。MediaShow既沒(méi)有效利用CPU資源,也沒(méi)充分發(fā)揮GPU的優(yōu)勢(shì),速度雖然也不錯(cuò)但沒(méi)能取得突破。
可能有些人覺(jué)得i7性能太強(qiáng),是非主流,所以我們換稍弱一點(diǎn)的主流775平臺(tái),還是用四核Q9550,這顆CPU主頻比i7 920更高,但不支持SSE4.2、不支持超線程、不支持三通道,因此轉(zhuǎn)碼性能會(huì)有所損失,下面看看三款軟件在Q9550平臺(tái)上的表現(xiàn)。
● DVD(720×576 MPEG2)轉(zhuǎn)iPhone(480×270 H.264)MP4

雖然Q9550的主頻更高,但主要依靠CPU的MediaCoder和MediaShow轉(zhuǎn)碼速度都要比i7平臺(tái)慢一些,但還是要比主要依靠GPU的Badaboom強(qiáng)。

不支持超線程的話,Q9550的CPU占用率就比較穩(wěn)定了,MediaCoder和MediaShow差不多。Badaboom轉(zhuǎn)碼時(shí)Q9550的占用率比i7提高不少,21%意味著B(niǎo)adaboom需要獨(dú)占一顆核心的資源來(lái)完成整個(gè)轉(zhuǎn)碼任務(wù)。
● H.264編碼1080p轉(zhuǎn)720p

由于Q9550性能遠(yuǎn)不如i7 920,導(dǎo)致主要依靠CPU的MediaCoder和MediaShow轉(zhuǎn)碼能力下降不少,MediaShow依然是96GT以上無(wú)用,而MediaCoder則是98GT以上無(wú)用(i7平臺(tái)GTX260+依然有提升),這說(shuō)明CPU速度下降時(shí)對(duì)GPU的要求也不如從前。
此時(shí)這兩款軟件被主要依靠GPU的Badaboom迎頭趕超,Badaboom對(duì)GPU的資源利用始終是最高的,筆者把GTX260+換為單核最強(qiáng)的GTX285后性能依然有提升(圖中Badaboom藍(lán)色成績(jī)就是GTX285,而不是CPU)。

從CPU占用率來(lái)看,軟解時(shí)MediaCoder和MediaShow不相上下,基本都充分利用了四核的資源,而開(kāi)啟CUDA后,MediaCoder的CPU占用率更高一些,看來(lái)這就是其高性能的源泉,用GPU部分消除了瓶頸,然后最大限度的發(fā)揮CPU價(jià)值。
繼續(xù)降低平臺(tái)配置,從四核換成雙核,先用優(yōu)異雙核E8400,它主頻不如E8500/E8600,但規(guī)格上也是最高的。雙核理論性能比四核減半,但E8400主頻要比Q9550高一些。
● DVD(720×576 MPEG2)轉(zhuǎn)iPhone(480×270 H.264)MP4

一到雙核平臺(tái),MediaCoder和MeidaShow就性能大降,Badaboom使用98GT以上級(jí)別的顯卡就能輕松超越它們。

通過(guò)CPU占用率來(lái)看,MediaCoder和MediaShow無(wú)論軟解還是硬解,E8400都已經(jīng)竭盡全力了。Badaboom性能雖強(qiáng),但其在雙核平臺(tái)的占用率也不低,所以衡量其性能是一定不要忘了CPU其實(shí)也貢獻(xiàn)了不少。
● H.264編碼1080p轉(zhuǎn)720p

轉(zhuǎn)H.264時(shí),Badaboom的表現(xiàn)更加神勇,搭配96GT以上顯卡就能輕松干掉MediaCoder和MediaShow了。

兩款主要依靠CPU轉(zhuǎn)碼的軟件出現(xiàn)了極大的瓶頸,雙核CPU性能有限,而GPU則很富裕,Badaboom超越它們不足為奇。
在高端雙核E8400上面,Badaboom就已經(jīng)表現(xiàn)出了很強(qiáng)的實(shí)力,現(xiàn)在筆者就換用最受歡迎的主流E5300,E5300不僅主頻更低、二級(jí)緩存更小、前端總線有限、而且連SSE4.1指令集都不支持,此時(shí)三款軟件的表現(xiàn)又將如何呢?
● DVD(720×576 MPEG2)轉(zhuǎn)iPhone(480×270 H.264)MP4

包括Badaboom在內(nèi)的三款軟件性能都下降不少,看來(lái)E5300和E8400比確實(shí)差很多。不過(guò)性能座次排行沒(méi)有發(fā)生太大變化,Badaboom搭配96GT以上級(jí)別顯卡就能全勝M(fèi)eidaCoder和MediaShow。

由于E5300太弱,導(dǎo)致Badaboom的CPU占用率也居高不小,基本上一顆核心被徹底占用了,MediaCoder和MediaShow基本上就是滿載。
● H.264編碼1080p轉(zhuǎn)720p

復(fù)雜的H.264編碼,Badaboom的優(yōu)勢(shì)更為顯著,性能幾乎達(dá)到了MediaCoder的兩倍。在低端平臺(tái),誰(shuí)對(duì)GPU的利用率高誰(shuí)的速度就最快,因此MediaCoder還是要比MediaShow快不少。

轉(zhuǎn)H.264時(shí),Badaboom的CPU占用率比MPEG2還要低一些,看來(lái)CUDA對(duì)H.264的優(yōu)化最到位,MPEG2反而更消耗CPU資源。
前面幾頁(yè)是在相同平臺(tái)上對(duì)比不同顯卡之間的差異,現(xiàn)在換一種對(duì)比方式,同為高端熱門(mén)的GTX260+顯卡,搭配不同的CPU時(shí),各款軟件之間的轉(zhuǎn)碼性能有何差異呢?


這樣的結(jié)果就更加直觀明了了,Badaboom基本上對(duì)于CPU沒(méi)有特殊要求,四核對(duì)它毫無(wú)用處,主流雙核就能滿足它。雖然E5300要比E8400差一些,但要知道E5300主頻低、緩存小、前端總線窄、不支持SSE4.1等諸多因素,相信超頻后的E5300或者E7200以上級(jí)CPU都能充分發(fā)揮Badaboom的轉(zhuǎn)碼性能。
而MediaCoder和MediaShow雖然也支持CUDA轉(zhuǎn)碼,但對(duì)GPU的利用率顯然沒(méi)有Badaboom那么高,它們只是借助GPU的力量來(lái)輔助CPU進(jìn)行轉(zhuǎn)碼,很多時(shí)候96GT或98GT就能滿足它們的需要了,更強(qiáng)的顯卡得不到充分利用。反倒是CPU多強(qiáng)都不夠用,i7即便超頻后依然能做到100%滿載。
因此,在四核平臺(tái),MediaCoder和MediaShow能夠超越Badaboom,而在雙核平臺(tái)全面敗退。
● 三款視頻轉(zhuǎn)碼軟件的速度差異分析
據(jù)了解,目前的CUDA Encoder主要模塊實(shí)際上是由NVIDIA自己編寫(xiě)的,然后透過(guò)CUDA API的方式把這些模塊提供給諸如Cyberlink、Nero、BIT等公司完成軟件整合。因此在輸出碼率相近、設(shè)置相同的情況下,幾款CUDA轉(zhuǎn)碼軟件輸出視頻的畫(huà)質(zhì)不會(huì)有太大區(qū)別,而且“編碼”效率也應(yīng)該是差不多的。
因此,我們完全不用擔(dān)心視頻輸出畫(huà)質(zhì)的問(wèn)題,只關(guān)心速度就夠了。由于編碼器相同,那么轉(zhuǎn)碼軟件的速度差異就主要體現(xiàn)在視頻“解碼”這一環(huán)節(jié)了。

MediaCoder的視頻編碼和分辨率縮放由GPU完成,視頻解碼依然靠CPU
Badaboom使用CUDA進(jìn)行解碼,因此對(duì)CPU的要求很低,如果使用高端顯卡則速度會(huì)有很大的提升;MediaCoder和MediaShow使用CPU進(jìn)行軟解碼,對(duì)于CPU的依賴(lài)性非常大,由于MediaCoder還使用GPU進(jìn)行分辨率縮放處理,因此對(duì)于GPU的利用率比MediaShow更高,進(jìn)一步減輕了CPU的負(fù)擔(dān)消除瓶頸,速度自然更快。
也許有人會(huì)問(wèn),視頻解碼很消耗資源嗎?現(xiàn)在隨便一顆主流雙核都可以軟解高清視頻,解碼也會(huì)成為速度瓶頸?話是沒(méi)錯(cuò),但要知道我們平??雌怯?4fps 1X普通倍速解碼視頻,此時(shí)的CPU占用率不會(huì)很高,但在視頻轉(zhuǎn)換過(guò)程中,解碼速度動(dòng)輒上百幀,此時(shí)CPU資源消耗就不容小視了。轉(zhuǎn)碼速度越快、解碼所消耗的CPU資源就越高,因此解碼器效率的高低會(huì)對(duì)轉(zhuǎn)碼速度造成很大幅度的影響。
● 視頻轉(zhuǎn)碼的瓶頸在哪?CUDA加速的奧秘解析:
通過(guò)任務(wù)管理器監(jiān)控MediaCoder的幾大模塊,我們就可以進(jìn)一步了解CUDA是如何加速視頻轉(zhuǎn)換的。下圖就是MediaCoder在視頻轉(zhuǎn)換過(guò)程中的四大進(jìn)程:

純CPU轉(zhuǎn)碼時(shí)各進(jìn)程所占CPU百分比
可以看到,CPU占用率最高的就是X264編碼器,達(dá)80-90%,解碼器次之10%左右,而主程序和音頻編碼器在前兩者面前幾乎就是微不足道的。

開(kāi)啟CUDA轉(zhuǎn)碼時(shí)各進(jìn)程所占CPU百分比
顯而易見(jiàn),編碼器是視頻轉(zhuǎn)換過(guò)程最大的瓶頸,將X264編碼器換為CUDA Encoder之后,編碼器本身的CPU占用率下降不少,而解碼器的CPU占用率上升不少,也就是說(shuō)編碼器節(jié)省出來(lái)不少CPU資源給解碼器用,此消彼長(zhǎng)之后達(dá)到了一個(gè)更為合理的平衡狀態(tài)。由于GPU參與運(yùn)算,消除了解碼器等待編碼器這一嚴(yán)重的瓶頸,從而使得轉(zhuǎn)碼效率大大提高。
● Badaboom是CUDA的旗桿,深入貫徹優(yōu)化PC精神
比GPU利用率的話,Badaboom是無(wú)人能敵的,GPU一手包辦了視頻解碼和編碼兩大主要流程,無(wú)論多強(qiáng)的顯卡都有用武之地,筆者從GTX260+更換為GTX285性能還會(huì)有提升。
比相對(duì)速度的話,Badaboom在中低端雙核平臺(tái)上優(yōu)秀的表現(xiàn)讓人拍手叫好,MediaCoder和MediaShow都不是對(duì)手。但由于Badaboom架空了CPU,導(dǎo)致在四核CPU平臺(tái)上(尤其是i7)的性能不如MediaCoder和MediaShow。
Badaboom的這種轉(zhuǎn)碼模式一是為了突出CUDA足以挑戰(zhàn)CPU的強(qiáng)大實(shí)力,二是帶來(lái)了一種更為經(jīng)濟(jì)實(shí)惠的轉(zhuǎn)碼方案。通過(guò)Badaboom的測(cè)試我們就可以發(fā)現(xiàn),高端顯卡搭配低端CPU,不但游戲性能不會(huì)受到影響,就連視頻轉(zhuǎn)碼性能也不會(huì)差很多。在預(yù)算有限的情況下,高端顯卡搭配低端CPU的組合在游戲和視頻方面的性能都是最強(qiáng)的——這不正是NVIDIA大力宣傳的“優(yōu)化PC”的概念么!

不得不承認(rèn),Intel的Core i7在視頻編碼方面擁有非常強(qiáng)悍的實(shí)力,但如果沒(méi)有CUDA輔助的話,純CPU編碼的速度只能相當(dāng)于Badaboom使用98GTX+級(jí)別顯卡(參考下圖)。當(dāng)然Badaboom也要消耗CPU資源,將此資源折算進(jìn)去的話i7也無(wú)法超越GTX260+,就算是將i7超頻也很難超越GTX285。
● MediaCoder追求最強(qiáng)性能:CPU+GPU異構(gòu)計(jì)算
NVIDIA通過(guò)Badaboom證明了GPU及CUDA的強(qiáng)大,但是視頻轉(zhuǎn)碼速度卻沒(méi)有得到質(zhì)的提升,也許把所有任務(wù)都交給GPU處理并不是最好的選擇,尤其是在高端平臺(tái)。
如果比絕對(duì)速度的話,使用CPU解碼、GPU編碼的MediaCoder是目前速度最快的視頻轉(zhuǎn)換軟件,它充分利用了CPU的資源,也較好的利用了GPU資源,兩者相輔相成,讓視頻轉(zhuǎn)換速度得到了飛躍式提升。這就是NVIDIA近年來(lái)最常提及的GPU+CPU異構(gòu)計(jì)算的概念。

只有CPU與GPU強(qiáng)強(qiáng)聯(lián)手,才能讓電腦性能騰飛起來(lái)
異構(gòu)計(jì)算是指系統(tǒng)內(nèi)不同的運(yùn)算部件負(fù)責(zé)各自擅長(zhǎng)的計(jì)算,從而達(dá)到非常好的的運(yùn)算效率。在視頻轉(zhuǎn)碼領(lǐng)域,如果能讓CPU和GPU的所有資源都達(dá)到100%滿負(fù)荷運(yùn)行,那么性能肯定是最高的,目前來(lái)看,無(wú)論Badaboom、MediaCoder還是MediaShow都沒(méi)能實(shí)現(xiàn),相對(duì)來(lái)說(shuō)MediaCoder是做的最好的,相信隨著CUDA編碼器和軟件優(yōu)化不斷完善、進(jìn)一步平衡算法,視頻轉(zhuǎn)碼速度還能更上一層樓!
相關(guān)評(píng)測(cè)文章推薦:
20分轉(zhuǎn)1部藍(lán)光!國(guó)產(chǎn)CUDA轉(zhuǎn)碼軟件首測(cè)
MediaCoder與Badaboom詳細(xì)介紹與畫(huà)質(zhì)對(duì)比請(qǐng)看本文
CUDA正面對(duì)決Stream!MediaShow詳測(cè)
MediaShow詳細(xì)介紹,CUDA與Stream速度對(duì)比請(qǐng)看本文
高清播放再次革命!CUDA解碼方案評(píng)測(cè)
CUDA解碼與PureVideo解碼的優(yōu)勢(shì)全面解析<
關(guān)注我們


