八核+七卡!泡泡網(wǎng)DIY個人超級計算機
泡泡網(wǎng)顯卡頻道11月21日 自從一代經(jīng)典GeForce 8800GT之后,在中高端顯卡上我們很難再見到單槽設計的版本了,雙槽早已成為標配,三槽甚至巨型散熱器都見怪不怪了,高端顯卡似乎只有搭配巨型散熱器才拿得出手,顯卡的散熱解決方案進入了一個怪圈。
GPU集成的晶體管數(shù)越來越多,導致功耗和發(fā)熱量大增,傳統(tǒng)單槽散熱器因為散熱面積有限,難以勝任動輒幾百瓦功率的要求,因此多槽散熱成為必然。不過GPU的工藝制程一直在不斷升級改進,新工藝能夠縮小GPU核心面積,并降低工作電壓,從而很好的控制功耗和發(fā)熱。
就拿NVIDIA的中高端主力GTX260+來說,在55nm工藝的幫助下,新版不但性能提升顯著,而且功耗和發(fā)熱下降不少。但由于各大廠商依然使用老的GTX260設計方案,新核心的優(yōu)勢不但沒有發(fā)揮出來,反而變本加厲的通過增加供電相數(shù)、安裝巨型散熱器的方式讓顯卡看上去更“威猛”,這種本末倒置的做法其實并沒有給消費者帶來多少好處。
國內(nèi)AIC影馳則打破常規(guī),從設計之初就通過優(yōu)化供電模塊、適當降低電壓的方式,控制了顯卡的功耗,而散熱器則使用了全新的定制版本,全球首款單槽設計的GTX260+就此誕生!
單槽的設計使得我們可以在一臺電腦中插入七片影馳GTX260+無雙版,再搭配四核八線程的Core i7處理器,“八核+七卡”的配置在性能上足以媲美超級計算機,那么如此強悍復雜的配置該如何使用呢?他們到底能否長期穩(wěn)定工作?性能如何呢?
● 難以想象的輕??!影馳GTX260+無雙版外觀賞析
當大家習慣了高端顯卡默認雙槽的設計方案之后,第一眼看到影馳GTX260+無雙版時,只能用驚艷二字來形容。
纖細身材、簡約高雅、精致外觀——影馳GTX260+無雙版絕對是非公版顯卡中的典范,渾然一體的設計使得該卡特色鮮明,整體造型不輸給NVIDIA和ATI的公版卡。
美中不足的是,這個鋁合金外殼只覆蓋了散熱器表面,未能將輸出接口也囊括進去,否則GTX260+無雙版一體式的造型將會更加精美。
輸出接口也非常簡約,使用率越來越高的HDMI無需轉接直接提供,Dual-Link DVI加裝了金屬屏蔽罩,保證30寸顯示器超高分辨率輸出,DVI也可以轉接支持D-SUB,擋板還有剩余空間所以保留了并不常用的S-Video。
● 完全超越NV公版!影馳GTX260+無雙版PCB做工用料解析
GTX260(+)總共有三種公版PCB,NVIDIA經(jīng)歷了三次縮水才將顯卡降至千元價位,當然這其中55nm工藝功不可沒。事實上顯卡做工再好都沒用,更低的功耗與發(fā)熱對于消費者來說才是最實在的。
從上至下分別是P651、P654、P897版GTX260+
影馳GTX260+無雙版的做工和用料雖然不及前兩種公版,但比最后一種P897公版還是要強很多,全固態(tài)電容、磁蔽電感、清晰合理的布局看起來有賞心悅目的感覺。
GT200核心和NVIO芯片就無需多言了。顯存方面,GTX260+無雙版使用的是現(xiàn)代H5RS5223CFR-N2C顆粒,14顆全部分布在PCB正面,散熱無需擔憂。尾號N2C的顯存是0.8ns的顆粒,理論頻率可達2400MHz,不過GTX260+的默認頻率完全按照公版標準,核心/流處理器/顯存分別為576/1242/2000MHz,這意味著該卡擁有不小的超頻潛力。
供電模塊設計非常整齊緊密,這是考慮到安裝MOS散熱片的需要,同時也保證了顯卡體積不會太大,并與單槽散熱器很好的兼容。
● 純銅散熱片+真空腔均熱板!影馳GTX260+無雙版散熱器拆解
影馳GTX260+無雙版最大的亮點就是全球優(yōu)異單槽設計,因此這個單槽散熱器值得仔細研究一番,看看它有何德何能膽敢壓制近200W TDP的GPU。
取下散熱器,從底部來看似乎并無過人之處,結構類似于GeForce 6/7時代的公版散熱器,能夠將核心、顯存、NVIO三大芯片全方位照顧到。
取下散熱器面罩之后,就可以發(fā)現(xiàn)原來整塊散熱片都是純銅的,采用精良的回流焊工藝制造出了密密麻麻的散熱片,通過側吹式方案帶走GPU熱量。銅的熱傳導率遠高于鋁,但成本很高而且密度很大。所以影馳GTX260+無雙版雖然體積很苗條,但重量甚至比很多雙槽GTX260+還要大!
可以看到,在純銅散熱片底部,并不是普通的銅底或者熱管,而是一塊超大面積的真空腔均熱板,它負責把GPU的熱量迅速傳遞給每一張散熱鰭片,使得熱量平均分布,提高散熱效率。
大家都知道GTX 260這樣的顯卡,NVIO芯片散熱也是需要考慮的。但受限于體積,不可能為它單獨設計散熱片。而且,顯存同樣需要散熱,所以散熱器外殼采用了一體式設計,兼顧顯存、NVIO芯片散熱。而且鋁基板采用了精度高的壓鑄工藝,保證散熱的同時,機構強度高,剛性好,無需為顯卡設計防變形金屬條。
供電部分因為電容和電感體積較大的關系,一體式散熱片不能延伸至發(fā)熱很大的MOS部分,因此這塊單獨安裝了鋁制散熱片,散熱器出風經(jīng)過此處可以輔助散熱。
通過圖片可以看到,這款單槽散熱器的成本并不低,為了嚴格控制體積付出了很多努力。正是由于優(yōu)秀的風道設計、密集的純銅散熱片、大面積真空腔均熱板,因此影馳GTX260+無雙版才能以單槽設計壓制高端GPU。
● 單槽散熱靠譜嗎?影馳GTX260+無雙版溫度測試
硬件配置上確實很強大,但實際散熱能力究竟如何呢,風扇轉速高不高、噪音大不大?我們還是通過實際測試來檢驗吧。
首先,在啟動的那一瞬間,GTX260+無雙有點象NVIDIA高端公版卡,部分筆記本電腦也是這樣設計——風扇全速運轉。不過,顯卡自檢的一瞬間過去后,顯卡就恢復了低速轉速,即便是滿載也沒有出現(xiàn)過全速轉動情況。整體來看,顯卡可以說是比較安靜的,噪音控制的不錯。
運行FURMARK穩(wěn)定性測試,分辨率設置為1280×1024,長時間運行,顯卡始終工作在40%轉速下,噪音非常小。而在溫度方面,最高溫度在82度。盡管這樣的溫度在筆者了解到的GTX260中算是比較高。但單槽散熱能以很低的噪音保證顯卡的長期穩(wěn)定運行,的確難能可貴。
在實際游戲《街霸4》BENCHMARK循環(huán)測試中,顯卡的負載明顯沒有Furmark那么苛刻,此時GPU溫度一直保持在68度刻度線以下,看來正常用的時候,顯卡溫度還是比較低的。
在把風扇手動調味全速情況下,顯卡空載溫度迅速降到了42度。然后運行FURAMRK穩(wěn)定性測試,來模擬顯卡極限滿載運行。這時候,顯卡溫度最高不超過70度,看來高轉速模式下的散熱能力還是很強的,但此時噪音很大,除非有特殊需要否則不推薦強制全速,因為顯卡風扇支持PWM溫控技術,在高溫下會自動加速。
綜合來看,GTX 260+無雙幾乎在整個運行過程中都比較安靜,噪音也比較小,符合影馳官方宣稱的低噪音;在散熱效率方面,風扇低轉速時顯卡滿負荷最高溫只有80度左右,并不高,而長時間運行大型3D游戲,顯卡溫度低于70度,可以說是比較涼快。在全球最薄的體積下,實現(xiàn)又涼又靜,可以說是很難得,散熱出色設計可見一斑。
● 單槽的極致用法!超級計算機平臺登場
單槽的設計使得我們可以在一臺電腦中插入七片影馳GTX260+無雙版,當然需要特殊的主板才可以,一般的高端主板最多能插入3-4塊顯卡。筆者所使用的主板就是華碩的P6T7 WS SuperComputer(X58)主板,從型號上就可以看出定位于工作站,專門用于組建個人超級計算機。
ASUS P6T7 WS SuperComputer是一塊標準的X58+ICH10R主板,支持LGA1366接口的Core i7處理器以及三通道DDR3內(nèi)存。與普通X58主板不同的是,這款主板沒有提供任何普通PCI或PCI-E X1插槽,全部七條都是PCIE-E X16接口,最多可以插上七片顯卡。
X58北橋內(nèi)建32條PCI-E通道,最多能提供4條PCI-E X8接口供顯卡使用,那么這7條插槽從何而來呢?秘密就藏在這個一體式散熱片下面:
原來華碩在主板上一次性整合了兩顆nForce 200芯片,每顆都可以將16條PCI-E通道橋接成32條通道,這樣X58北橋的32條PCI-E通道就變成了64條,最終提供16+8+8+8+8+8+8這樣的七條PCI-E插槽,如果不是主板PCB空間不夠用的話,相信設計8條PCI-E X8插槽也沒問題。
PCI-E 2.0的帶寬是1.0的兩倍,因此PCI-E X8絕對不會限制當今主流中高端顯卡的性能發(fā)揮,同時插7片顯卡不成問題。
● 絕對不是作秀!七卡互聯(lián)效果顯著穩(wěn)定如初
NVIDIA的驅動對多卡互聯(lián)有限制,最多只能支持三卡互聯(lián),也就是3-Way SLI,如果是Quad SLI的話,必須是兩片9800GX2或者GTX295這樣的雙核心顯卡才能開啟。
而且三路SLI必須使用專用的三路橋接器才能在驅動當中開啟,多余的顯卡被孤立,最多只能允許一片當作物理加速卡使用。因此對于游戲玩家來說,只需要四片顯卡就夠了,更多的話毫無用處。
那么我們插滿七塊顯卡有什么用呢?連SLI橋都沒辦法插(像交火那樣級聯(lián)是無效的),僅僅是作秀、看上去壯觀而已?當然不是!除了游戲外,我們應該把目光轉移到CUDA通用計算上面來,大規(guī)模并行計算并不需要顯卡協(xié)同工作,不需要SLI橋相連,更不需要驅動對多卡支持……
因為并行計算本身就是多線程多任務模式,如果軟件自身能支持多GPU的話,就能自動將任務均分給每顆GPU運算,最后合并起來達到加速的目的。如果軟件不支持多GPU的話,可以同時開啟多個軟件分別指定不同的GPU來運算,同樣可以讓性能倍增,道理與四核CPU同時跑四個SuperPi一樣!
七卡并行計算的注意事項:
-
必須關閉SLI;
-
必須在六塊從卡上擴展桌面,確保每塊顯卡都處于激活狀態(tài);
-
Vista不支持擴展桌面,必須連接顯示器或者欺騙的方式才能激活從卡,XP對于多卡支持最好、Win7次之,建議使用64bit系統(tǒng);
-
主卡負載不宜過高(不要開啟3D或者硬件加速程序),否則容易失去響應;
-
電源和散熱是個大問題;
經(jīng)過筆者反復測試,7片影馳GTX260+完全可以同時穩(wěn)定運行,七卡同時跑了整整一個晚上第二天上班依然穩(wěn)定如初!但由于7片顯卡挨太緊,散熱方面必須特別注意,筆者使用了兩個12CM風扇,一個吸一個吹平放在7片顯卡上方,就能完美解決散熱問題。
● GPGPU Benchmark基準測試
目前支持通用計算的測試程序并不多,前不久發(fā)布的DirectCompute和OpenCL測試軟件都是Beta版,都不能支持多GPU,唯一能支持多GPU和多卡的測試程序就是SiSoftware Sandra 2009 SP4中的GPGPU Benchmark,筆者首先用它來測試多卡的穩(wěn)定性,并評估效能。
SiSoftware雖然能夠支持多卡和多GPU,但兼容性還是不好,效率不夠高,三卡性能甚至不如雙卡,五卡比四卡提升有限,顯卡越多效率越低,七卡的性能只相當于單卡的四倍,那么在實際應用中的表現(xiàn)如何呢?
● 蛋白質折疊計算:七卡就是七倍性能!
一般的商業(yè)CUDA軟件都只能支持單GPU,而且無法利用高端顯卡全部的性能,像Badaboom這樣經(jīng)過特別優(yōu)化的軟件也只能支持雙GPU。雖然很多專業(yè)CUDA計算軟件能支持N多GPU,但民用通用計算軟件只有Folding@Home(蛋白質折疊計算)和SETI@home(天文數(shù)據(jù)外星文明分析)這兩個分布式計算支持多GPU。
Folding@home是一個由斯坦福大學主持,全球主要硬件廠商共同參與的大規(guī)模公益性分布式運算項目。其主要是研究了解蛋白質折疊、誤折以及相關的疾病,主要研究的疾病包括:癌癥、阿茲海默癥、亨廷頓病、帕金森氏癥等。我想,這是一個比單純跑各種Benchmark來得更有價值的事情。將Folding@home程序目錄復制7份,各自分配不同的機器號并指定不同的GPU,這樣7個蛋白質程序就能互不干涉的各自獨立運行,由于7個程序全靠GPU運算,因此CPU占用率非常低,完全不會影響普通2D軟件的運行。
運行幾個小時之后,性能估值已經(jīng)出來了,7塊顯卡的PPD分值(Points Per Day每日運算得分)都是7000多,總分值高達53K,已經(jīng)和國內(nèi)第一強人65K的成績相差不遠了。
通過內(nèi)置的Benchmark測試來看,每片GTX260+都能夠達到7K左右的PPD,七卡插一起的性能和單卡相比基本沒有損失,但由于網(wǎng)絡不穩(wěn)的關系,長時間運行的話,個別數(shù)據(jù)包算出來的平均PPD會有所下降。
● 功耗測試:雙電源消耗多少電力
GTX260+的TDP(最大功耗)是170W左右,7塊GTX260+就需要1200W,再加上CPU主板內(nèi)存的話,總功耗達1500W可能還不止。為此筆者特意使用了Silverstone通過三路SLI認證的1500W電源,結果發(fā)現(xiàn)電源功率不是問題,接口數(shù)量才是最大的問題……
7塊顯卡,總共需要14個6Pin PCI-E接口,Silverstone 1500W電源提供了6個6pin(和8Pin) PCI-E供電接口,即便使用雙4Pin轉6Pin的轉接線,將所有4Pin口用光也無法連接所有的顯卡。迫不得已使用了雙電源,每個電源各自承擔三塊半顯卡的電力。
兩個電源的24Pin輸出線纜可以通過一個轉接線并連在一起,這樣雙電源就可以隨電腦同步開機或關機。兩個電源插在同一個插線板上,這樣通過電表就能測出雙電源的總功率了:
通過實測發(fā)現(xiàn),待機狀態(tài)下系統(tǒng)的總功率就高達572W,包括一顆i7 965(3.2GHz關閉節(jié)能),6GB DDR3-1333內(nèi)存,2TB硬盤,主板,還有四個風扇。
3D類的軟件無法讓這么多顯卡同時運行,筆者只好通過運行7個Folding@home程序測出最高功率,此時7塊顯卡在拼命工作(但不一定是滿載),而i7 965基本處于空閑狀態(tài),最終功率穩(wěn)定在了1000W左右。
事實證明一個1500W電源可以帶動如此強大的配置,只是電源接口確實不夠用,所以還是兩個800W電源更合適一些,而且劃算。
● “八芯八卡”達成,性能再提升
P6T7 WS Supercomputer最多提供了7條顯卡插槽,只能插7片顯卡,而且前6片必須是單槽的,但第7片可以插雙槽顯卡,如果我們把第7片顯卡換成GTX295的話,那么就總共擁有8顆GPU了:
通過理論測試來看,8顆GPU的性能又獲得了不少的提升。也許有人會說直接插四片GTX295的話,不也是8顆GPU么,理論性能更高。不過四片GTX295的成本太高,而且GTX295作為雙核顯卡如果運行在PCI-E X8模式下性能損失會比較大。
● 影馳GTX260+無雙版的適用人群:
- 電腦PCI插槽比較緊張的用戶,無雙版不會影響其它擴展卡;
- 想要組建雙路或三路SLI的用戶,單槽設計節(jié)約空間而且互不影響散熱;
- 多屏輸出且有3D需求的用戶,GTX260+ 3D性能出色,而且能插很多片;
- CUDA通用計算用戶,多塊能達到優(yōu)異性能。
● 全文總結:
通過SiSoftware的GPGPU理論測試來看,多卡的效率并不出色,顯卡越多效率越低。而且N卡本身就存在理論性能較弱、雙精度性能遠遠落后與A卡的情況,相信大家通過測試截圖也看出來了。
但在實際應用測試中可以發(fā)現(xiàn),根本不是那么回事,有幾塊顯卡,并行計算性能就能提升幾倍,完全沒有任何的性能損失,這就是并行計算的優(yōu)勢。而且N卡在F@H中的運算能力要遠高于同級A卡,理論與實際的效能差距之大讓人難以想像。
多GPU運行分布式計算的效率如此之高,可以預見在不久的將來,無論國家和企業(yè)的超級計算機還是個人高性能計算機,都將會是GPU的天下。一塊主板只能安裝一顆CPU,但顯卡卻能插很多塊,而且GPU的運算能力遠遠超越了CPU,擴充升級顯卡顯然要比CPU更加簡單方便!■<
關注我們
