八核+七卡!泡泡網(wǎng)DIY個(gè)人超級(jí)計(jì)算機(jī)
泡泡網(wǎng)顯卡頻道11月21日 自從一代經(jīng)典GeForce 8800GT之后,在中高端顯卡上我們很難再見(jiàn)到單槽設(shè)計(jì)的版本了,雙槽早已成為標(biāo)配,三槽甚至巨型散熱器都見(jiàn)怪不怪了,高端顯卡似乎只有搭配巨型散熱器才拿得出手,顯卡的散熱解決方案進(jìn)入了一個(gè)怪圈。
GPU集成的晶體管數(shù)越來(lái)越多,導(dǎo)致功耗和發(fā)熱量大增,傳統(tǒng)單槽散熱器因?yàn)樯崦娣e有限,難以勝任動(dòng)輒幾百瓦功率的要求,因此多槽散熱成為必然。不過(guò)GPU的工藝制程一直在不斷升級(jí)改進(jìn),新工藝能夠縮小GPU核心面積,并降低工作電壓,從而很好的控制功耗和發(fā)熱。
就拿NVIDIA的中高端主力GTX260+來(lái)說(shuō),在55nm工藝的幫助下,新版不但性能提升顯著,而且功耗和發(fā)熱下降不少。但由于各大廠(chǎng)商依然使用老的GTX260設(shè)計(jì)方案,新核心的優(yōu)勢(shì)不但沒(méi)有發(fā)揮出來(lái),反而變本加厲的通過(guò)增加供電相數(shù)、安裝巨型散熱器的方式讓顯卡看上去更“威猛”,這種本末倒置的做法其實(shí)并沒(méi)有給消費(fèi)者帶來(lái)多少好處。
國(guó)內(nèi)AIC影馳則打破常規(guī),從設(shè)計(jì)之初就通過(guò)優(yōu)化供電模塊、適當(dāng)降低電壓的方式,控制了顯卡的功耗,而散熱器則使用了全新的定制版本,全球首款單槽設(shè)計(jì)的GTX260+就此誕生!
單槽的設(shè)計(jì)使得我們可以在一臺(tái)電腦中插入七片影馳GTX260+無(wú)雙版,再搭配四核八線(xiàn)程的Core i7處理器,“八核+七卡”的配置在性能上足以媲美超級(jí)計(jì)算機(jī),那么如此強(qiáng)悍復(fù)雜的配置該如何使用呢?他們到底能否長(zhǎng)期穩(wěn)定工作?性能如何呢?
● 難以想象的輕??!影馳GTX260+無(wú)雙版外觀(guān)賞析
當(dāng)大家習(xí)慣了高端顯卡默認(rèn)雙槽的設(shè)計(jì)方案之后,第一眼看到影馳GTX260+無(wú)雙版時(shí),只能用驚艷二字來(lái)形容。
纖細(xì)身材、簡(jiǎn)約高雅、精致外觀(guān)——影馳GTX260+無(wú)雙版絕對(duì)是非公版顯卡中的典范,渾然一體的設(shè)計(jì)使得該卡特色鮮明,整體造型不輸給NVIDIA和ATI的公版卡。
美中不足的是,這個(gè)鋁合金外殼只覆蓋了散熱器表面,未能將輸出接口也囊括進(jìn)去,否則GTX260+無(wú)雙版一體式的造型將會(huì)更加精美。
輸出接口也非常簡(jiǎn)約,使用率越來(lái)越高的HDMI無(wú)需轉(zhuǎn)接直接提供,Dual-Link DVI加裝了金屬屏蔽罩,保證30寸顯示器超高分辨率輸出,DVI也可以轉(zhuǎn)接支持D-SUB,擋板還有剩余空間所以保留了并不常用的S-Video。
● 完全超越NV公版!影馳GTX260+無(wú)雙版PCB做工用料解析
GTX260(+)總共有三種公版PCB,NVIDIA經(jīng)歷了三次縮水才將顯卡降至千元價(jià)位,當(dāng)然這其中55nm工藝功不可沒(méi)。事實(shí)上顯卡做工再好都沒(méi)用,更低的功耗與發(fā)熱對(duì)于消費(fèi)者來(lái)說(shuō)才是最實(shí)在的。
從上至下分別是P651、P654、P897版GTX260+
影馳GTX260+無(wú)雙版的做工和用料雖然不及前兩種公版,但比最后一種P897公版還是要強(qiáng)很多,全固態(tài)電容、磁蔽電感、清晰合理的布局看起來(lái)有賞心悅目的感覺(jué)。
GT200核心和NVIO芯片就無(wú)需多言了。顯存方面,GTX260+無(wú)雙版使用的是現(xiàn)代H5RS5223CFR-N2C顆粒,14顆全部分布在PCB正面,散熱無(wú)需擔(dān)憂(yōu)。尾號(hào)N2C的顯存是0.8ns的顆粒,理論頻率可達(dá)2400MHz,不過(guò)GTX260+的默認(rèn)頻率完全按照公版標(biāo)準(zhǔn),核心/流處理器/顯存分別為576/1242/2000MHz,這意味著該卡擁有不小的超頻潛力。
供電模塊設(shè)計(jì)非常整齊緊密,這是考慮到安裝MOS散熱片的需要,同時(shí)也保證了顯卡體積不會(huì)太大,并與單槽散熱器很好的兼容。
● 純銅散熱片+真空腔均熱板!影馳GTX260+無(wú)雙版散熱器拆解
影馳GTX260+無(wú)雙版最大的亮點(diǎn)就是全球優(yōu)異單槽設(shè)計(jì),因此這個(gè)單槽散熱器值得仔細(xì)研究一番,看看它有何德何能膽敢壓制近200W TDP的GPU。
取下散熱器,從底部來(lái)看似乎并無(wú)過(guò)人之處,結(jié)構(gòu)類(lèi)似于GeForce 6/7時(shí)代的公版散熱器,能夠?qū)⒑诵?、顯存、NVIO三大芯片全方位照顧到。
取下散熱器面罩之后,就可以發(fā)現(xiàn)原來(lái)整塊散熱片都是純銅的,采用精良的回流焊工藝制造出了密密麻麻的散熱片,通過(guò)側(cè)吹式方案帶走GPU熱量。銅的熱傳導(dǎo)率遠(yuǎn)高于鋁,但成本很高而且密度很大。所以影馳GTX260+無(wú)雙版雖然體積很苗條,但重量甚至比很多雙槽GTX260+還要大!
可以看到,在純銅散熱片底部,并不是普通的銅底或者熱管,而是一塊超大面積的真空腔均熱板,它負(fù)責(zé)把GPU的熱量迅速傳遞給每一張散熱鰭片,使得熱量平均分布,提高散熱效率。
大家都知道GTX 260這樣的顯卡,NVIO芯片散熱也是需要考慮的。但受限于體積,不可能為它單獨(dú)設(shè)計(jì)散熱片。而且,顯存同樣需要散熱,所以散熱器外殼采用了一體式設(shè)計(jì),兼顧顯存、NVIO芯片散熱。而且鋁基板采用了精度高的壓鑄工藝,保證散熱的同時(shí),機(jī)構(gòu)強(qiáng)度高,剛性好,無(wú)需為顯卡設(shè)計(jì)防變形金屬條。
供電部分因?yàn)殡娙莺碗姼畜w積較大的關(guān)系,一體式散熱片不能延伸至發(fā)熱很大的MOS部分,因此這塊單獨(dú)安裝了鋁制散熱片,散熱器出風(fēng)經(jīng)過(guò)此處可以輔助散熱。
通過(guò)圖片可以看到,這款單槽散熱器的成本并不低,為了嚴(yán)格控制體積付出了很多努力。正是由于優(yōu)秀的風(fēng)道設(shè)計(jì)、密集的純銅散熱片、大面積真空腔均熱板,因此影馳GTX260+無(wú)雙版才能以單槽設(shè)計(jì)壓制高端GPU。
● 單槽散熱靠譜嗎?影馳GTX260+無(wú)雙版溫度測(cè)試
硬件配置上確實(shí)很強(qiáng)大,但實(shí)際散熱能力究竟如何呢,風(fēng)扇轉(zhuǎn)速高不高、噪音大不大?我們還是通過(guò)實(shí)際測(cè)試來(lái)檢驗(yàn)吧。
首先,在啟動(dòng)的那一瞬間,GTX260+無(wú)雙有點(diǎn)象NVIDIA高端公版卡,部分筆記本電腦也是這樣設(shè)計(jì)——風(fēng)扇全速運(yùn)轉(zhuǎn)。不過(guò),顯卡自檢的一瞬間過(guò)去后,顯卡就恢復(fù)了低速轉(zhuǎn)速,即便是滿(mǎn)載也沒(méi)有出現(xiàn)過(guò)全速轉(zhuǎn)動(dòng)情況。整體來(lái)看,顯卡可以說(shuō)是比較安靜的,噪音控制的不錯(cuò)。
運(yùn)行FURMARK穩(wěn)定性測(cè)試,分辨率設(shè)置為1280×1024,長(zhǎng)時(shí)間運(yùn)行,顯卡始終工作在40%轉(zhuǎn)速下,噪音非常小。而在溫度方面,最高溫度在82度。盡管這樣的溫度在筆者了解到的GTX260中算是比較高。但單槽散熱能以很低的噪音保證顯卡的長(zhǎng)期穩(wěn)定運(yùn)行,的確難能可貴。
在實(shí)際游戲《街霸4》BENCHMARK循環(huán)測(cè)試中,顯卡的負(fù)載明顯沒(méi)有Furmark那么苛刻,此時(shí)GPU溫度一直保持在68度刻度線(xiàn)以下,看來(lái)正常用的時(shí)候,顯卡溫度還是比較低的。
在把風(fēng)扇手動(dòng)調(diào)味全速情況下,顯卡空載溫度迅速降到了42度。然后運(yùn)行FURAMRK穩(wěn)定性測(cè)試,來(lái)模擬顯卡極限滿(mǎn)載運(yùn)行。這時(shí)候,顯卡溫度最高不超過(guò)70度,看來(lái)高轉(zhuǎn)速模式下的散熱能力還是很強(qiáng)的,但此時(shí)噪音很大,除非有特殊需要否則不推薦強(qiáng)制全速,因?yàn)轱@卡風(fēng)扇支持PWM溫控技術(shù),在高溫下會(huì)自動(dòng)加速。
綜合來(lái)看,GTX 260+無(wú)雙幾乎在整個(gè)運(yùn)行過(guò)程中都比較安靜,噪音也比較小,符合影馳官方宣稱(chēng)的低噪音;在散熱效率方面,風(fēng)扇低轉(zhuǎn)速時(shí)顯卡滿(mǎn)負(fù)荷最高溫只有80度左右,并不高,而長(zhǎng)時(shí)間運(yùn)行大型3D游戲,顯卡溫度低于70度,可以說(shuō)是比較涼快。在全球最薄的體積下,實(shí)現(xiàn)又涼又靜,可以說(shuō)是很難得,散熱出色設(shè)計(jì)可見(jiàn)一斑。
● 單槽的極致用法!超級(jí)計(jì)算機(jī)平臺(tái)登場(chǎng)
單槽的設(shè)計(jì)使得我們可以在一臺(tái)電腦中插入七片影馳GTX260+無(wú)雙版,當(dāng)然需要特殊的主板才可以,一般的高端主板最多能插入3-4塊顯卡。筆者所使用的主板就是華碩的P6T7 WS SuperComputer(X58)主板,從型號(hào)上就可以看出定位于工作站,專(zhuān)門(mén)用于組建個(gè)人超級(jí)計(jì)算機(jī)。
ASUS P6T7 WS SuperComputer是一塊標(biāo)準(zhǔn)的X58+ICH10R主板,支持LGA1366接口的Core i7處理器以及三通道DDR3內(nèi)存。與普通X58主板不同的是,這款主板沒(méi)有提供任何普通PCI或PCI-E X1插槽,全部七條都是PCIE-E X16接口,最多可以插上七片顯卡。
X58北橋內(nèi)建32條PCI-E通道,最多能提供4條PCI-E X8接口供顯卡使用,那么這7條插槽從何而來(lái)呢?秘密就藏在這個(gè)一體式散熱片下面:
原來(lái)華碩在主板上一次性整合了兩顆nForce 200芯片,每顆都可以將16條PCI-E通道橋接成32條通道,這樣X(jué)58北橋的32條PCI-E通道就變成了64條,最終提供16+8+8+8+8+8+8這樣的七條PCI-E插槽,如果不是主板PCB空間不夠用的話(huà),相信設(shè)計(jì)8條PCI-E X8插槽也沒(méi)問(wèn)題。
PCI-E 2.0的帶寬是1.0的兩倍,因此PCI-E X8絕對(duì)不會(huì)限制當(dāng)今主流中高端顯卡的性能發(fā)揮,同時(shí)插7片顯卡不成問(wèn)題。
● 絕對(duì)不是作秀!七卡互聯(lián)效果顯著穩(wěn)定如初
NVIDIA的驅(qū)動(dòng)對(duì)多卡互聯(lián)有限制,最多只能支持三卡互聯(lián),也就是3-Way SLI,如果是Quad SLI的話(huà),必須是兩片9800GX2或者GTX295這樣的雙核心顯卡才能開(kāi)啟。
而且三路SLI必須使用專(zhuān)用的三路橋接器才能在驅(qū)動(dòng)當(dāng)中開(kāi)啟,多余的顯卡被孤立,最多只能允許一片當(dāng)作物理加速卡使用。因此對(duì)于游戲玩家來(lái)說(shuō),只需要四片顯卡就夠了,更多的話(huà)毫無(wú)用處。
那么我們插滿(mǎn)七塊顯卡有什么用呢?連SLI橋都沒(méi)辦法插(像交火那樣級(jí)聯(lián)是無(wú)效的),僅僅是作秀、看上去壯觀(guān)而已?當(dāng)然不是!除了游戲外,我們應(yīng)該把目光轉(zhuǎn)移到CUDA通用計(jì)算上面來(lái),大規(guī)模并行計(jì)算并不需要顯卡協(xié)同工作,不需要SLI橋相連,更不需要驅(qū)動(dòng)對(duì)多卡支持……
因?yàn)椴⑿杏?jì)算本身就是多線(xiàn)程多任務(wù)模式,如果軟件自身能支持多GPU的話(huà),就能自動(dòng)將任務(wù)均分給每顆GPU運(yùn)算,最后合并起來(lái)達(dá)到加速的目的。如果軟件不支持多GPU的話(huà),可以同時(shí)開(kāi)啟多個(gè)軟件分別指定不同的GPU來(lái)運(yùn)算,同樣可以讓性能倍增,道理與四核CPU同時(shí)跑四個(gè)SuperPi一樣!
七卡并行計(jì)算的注意事項(xiàng):
-
必須關(guān)閉SLI;
-
必須在六塊從卡上擴(kuò)展桌面,確保每塊顯卡都處于激活狀態(tài);
-
Vista不支持?jǐn)U展桌面,必須連接顯示器或者欺騙的方式才能激活從卡,XP對(duì)于多卡支持最好、Win7次之,建議使用64bit系統(tǒng);
-
主卡負(fù)載不宜過(guò)高(不要開(kāi)啟3D或者硬件加速程序),否則容易失去響應(yīng);
-
電源和散熱是個(gè)大問(wèn)題;
經(jīng)過(guò)筆者反復(fù)測(cè)試,7片影馳GTX260+完全可以同時(shí)穩(wěn)定運(yùn)行,七卡同時(shí)跑了整整一個(gè)晚上第二天上班依然穩(wěn)定如初!但由于7片顯卡挨太緊,散熱方面必須特別注意,筆者使用了兩個(gè)12CM風(fēng)扇,一個(gè)吸一個(gè)吹平放在7片顯卡上方,就能完美解決散熱問(wèn)題。
● GPGPU Benchmark基準(zhǔn)測(cè)試
目前支持通用計(jì)算的測(cè)試程序并不多,前不久發(fā)布的DirectCompute和OpenCL測(cè)試軟件都是Beta版,都不能支持多GPU,唯一能支持多GPU和多卡的測(cè)試程序就是SiSoftware Sandra 2009 SP4中的GPGPU Benchmark,筆者首先用它來(lái)測(cè)試多卡的穩(wěn)定性,并評(píng)估效能。
SiSoftware雖然能夠支持多卡和多GPU,但兼容性還是不好,效率不夠高,三卡性能甚至不如雙卡,五卡比四卡提升有限,顯卡越多效率越低,七卡的性能只相當(dāng)于單卡的四倍,那么在實(shí)際應(yīng)用中的表現(xiàn)如何呢?
● 蛋白質(zhì)折疊計(jì)算:七卡就是七倍性能!
一般的商業(yè)CUDA軟件都只能支持單GPU,而且無(wú)法利用高端顯卡全部的性能,像Badaboom這樣經(jīng)過(guò)特別優(yōu)化的軟件也只能支持雙GPU。雖然很多專(zhuān)業(yè)CUDA計(jì)算軟件能支持N多GPU,但民用通用計(jì)算軟件只有Folding@Home(蛋白質(zhì)折疊計(jì)算)和SETI@home(天文數(shù)據(jù)外星文明分析)這兩個(gè)分布式計(jì)算支持多GPU。
Folding@home是一個(gè)由斯坦福大學(xué)主持,全球主要硬件廠(chǎng)商共同參與的大規(guī)模公益性分布式運(yùn)算項(xiàng)目。其主要是研究了解蛋白質(zhì)折疊、誤折以及相關(guān)的疾病,主要研究的疾病包括:癌癥、阿茲海默癥、亨廷頓病、帕金森氏癥等。我想,這是一個(gè)比單純跑各種Benchmark來(lái)得更有價(jià)值的事情。將Folding@home程序目錄復(fù)制7份,各自分配不同的機(jī)器號(hào)并指定不同的GPU,這樣7個(gè)蛋白質(zhì)程序就能互不干涉的各自獨(dú)立運(yùn)行,由于7個(gè)程序全靠GPU運(yùn)算,因此CPU占用率非常低,完全不會(huì)影響普通2D軟件的運(yùn)行。
運(yùn)行幾個(gè)小時(shí)之后,性能估值已經(jīng)出來(lái)了,7塊顯卡的PPD分值(Points Per Day每日運(yùn)算得分)都是7000多,總分值高達(dá)53K,已經(jīng)和國(guó)內(nèi)第一強(qiáng)人65K的成績(jī)相差不遠(yuǎn)了。
通過(guò)內(nèi)置的Benchmark測(cè)試來(lái)看,每片GTX260+都能夠達(dá)到7K左右的PPD,七卡插一起的性能和單卡相比基本沒(méi)有損失,但由于網(wǎng)絡(luò)不穩(wěn)的關(guān)系,長(zhǎng)時(shí)間運(yùn)行的話(huà),個(gè)別數(shù)據(jù)包算出來(lái)的平均PPD會(huì)有所下降。
● 功耗測(cè)試:雙電源消耗多少電力
GTX260+的TDP(最大功耗)是170W左右,7塊GTX260+就需要1200W,再加上CPU主板內(nèi)存的話(huà),總功耗達(dá)1500W可能還不止。為此筆者特意使用了Silverstone通過(guò)三路SLI認(rèn)證的1500W電源,結(jié)果發(fā)現(xiàn)電源功率不是問(wèn)題,接口數(shù)量才是最大的問(wèn)題……
7塊顯卡,總共需要14個(gè)6Pin PCI-E接口,Silverstone 1500W電源提供了6個(gè)6pin(和8Pin) PCI-E供電接口,即便使用雙4Pin轉(zhuǎn)6Pin的轉(zhuǎn)接線(xiàn),將所有4Pin口用光也無(wú)法連接所有的顯卡。迫不得已使用了雙電源,每個(gè)電源各自承擔(dān)三塊半顯卡的電力。
兩個(gè)電源的24Pin輸出線(xiàn)纜可以通過(guò)一個(gè)轉(zhuǎn)接線(xiàn)并連在一起,這樣雙電源就可以隨電腦同步開(kāi)機(jī)或關(guān)機(jī)。兩個(gè)電源插在同一個(gè)插線(xiàn)板上,這樣通過(guò)電表就能測(cè)出雙電源的總功率了:
通過(guò)實(shí)測(cè)發(fā)現(xiàn),待機(jī)狀態(tài)下系統(tǒng)的總功率就高達(dá)572W,包括一顆i7 965(3.2GHz關(guān)閉節(jié)能),6GB DDR3-1333內(nèi)存,2TB硬盤(pán),主板,還有四個(gè)風(fēng)扇。
3D類(lèi)的軟件無(wú)法讓這么多顯卡同時(shí)運(yùn)行,筆者只好通過(guò)運(yùn)行7個(gè)Folding@home程序測(cè)出最高功率,此時(shí)7塊顯卡在拼命工作(但不一定是滿(mǎn)載),而i7 965基本處于空閑狀態(tài),最終功率穩(wěn)定在了1000W左右。
事實(shí)證明一個(gè)1500W電源可以帶動(dòng)如此強(qiáng)大的配置,只是電源接口確實(shí)不夠用,所以還是兩個(gè)800W電源更合適一些,而且劃算。
● “八芯八卡”達(dá)成,性能再提升
P6T7 WS Supercomputer最多提供了7條顯卡插槽,只能插7片顯卡,而且前6片必須是單槽的,但第7片可以插雙槽顯卡,如果我們把第7片顯卡換成GTX295的話(huà),那么就總共擁有8顆GPU了:
通過(guò)理論測(cè)試來(lái)看,8顆GPU的性能又獲得了不少的提升。也許有人會(huì)說(shuō)直接插四片GTX295的話(huà),不也是8顆GPU么,理論性能更高。不過(guò)四片GTX295的成本太高,而且GTX295作為雙核顯卡如果運(yùn)行在PCI-E X8模式下性能損失會(huì)比較大。
● 影馳GTX260+無(wú)雙版的適用人群:
- 電腦PCI插槽比較緊張的用戶(hù),無(wú)雙版不會(huì)影響其它擴(kuò)展卡;
- 想要組建雙路或三路SLI的用戶(hù),單槽設(shè)計(jì)節(jié)約空間而且互不影響散熱;
- 多屏輸出且有3D需求的用戶(hù),GTX260+ 3D性能出色,而且能插很多片;
- CUDA通用計(jì)算用戶(hù),多塊能達(dá)到優(yōu)異性能。
● 全文總結(jié):
通過(guò)SiSoftware的GPGPU理論測(cè)試來(lái)看,多卡的效率并不出色,顯卡越多效率越低。而且N卡本身就存在理論性能較弱、雙精度性能遠(yuǎn)遠(yuǎn)落后與A卡的情況,相信大家通過(guò)測(cè)試截圖也看出來(lái)了。
但在實(shí)際應(yīng)用測(cè)試中可以發(fā)現(xiàn),根本不是那么回事,有幾塊顯卡,并行計(jì)算性能就能提升幾倍,完全沒(méi)有任何的性能損失,這就是并行計(jì)算的優(yōu)勢(shì)。而且N卡在F@H中的運(yùn)算能力要遠(yuǎn)高于同級(jí)A卡,理論與實(shí)際的效能差距之大讓人難以想像。
多GPU運(yùn)行分布式計(jì)算的效率如此之高,可以預(yù)見(jiàn)在不久的將來(lái),無(wú)論國(guó)家和企業(yè)的超級(jí)計(jì)算機(jī)還是個(gè)人高性能計(jì)算機(jī),都將會(huì)是GPU的天下。一塊主板只能安裝一顆CPU,但顯卡卻能插很多塊,而且GPU的運(yùn)算能力遠(yuǎn)遠(yuǎn)超越了CPU,擴(kuò)充升級(jí)顯卡顯然要比CPU更加簡(jiǎn)單方便!■<
關(guān)注我們
