GPU爭奪霸權(quán)!NVIDIA談超級計算機發(fā)展
● 目前世界計算能力最強的前十超級計算機仍基于CPU集群的方式搭建,您預測何時基于NVIDIA-GPU的Tesla產(chǎn)品能躋身前十?

2008年超級計算機排行榜TOP10
Andy Keane:在前不久的世界超級計算機500強排名中,日本一所大學的超級計算機排名全球第29,這個超級計算機叫TSUBAME,它就是采用了NVIDIA的Tesla做運算,現(xiàn)在它還在不斷的升級與改進中。我不能代表東京工業(yè)大學超級計算領(lǐng)軍人物的意見,但Matsuoka博士曾公開表示,他打算使用GPU在2010年打造出一臺榮登世界最快榜單的計算機。
我在跟很多使用超級計算機的人溝通,他們已經(jīng)表現(xiàn)出極大的興趣使用Tesla進行超級計算,現(xiàn)在日本這家叫TSUBAME的超級計算機能夠躋身前30名已經(jīng)是很好的證明,除此之外美國國家超級運算應用中心(NCSA)以及法國原子能委員會(CEA)是兩家著名的超級計算中心,他們將使用GPU躋身下一屆世界五百強榜單。我們會跟更多的超級計算機中心合作,在2010-2011年會有更多使用GPU的超級計算機殺進500強,并實現(xiàn)躋身前十的目標。而且使用Tesla會更加節(jié)省功耗、電還有很多的空間和成本,這是令人非常振奮的。
● 按照目前的數(shù)據(jù)統(tǒng)計,如果要實現(xiàn)目前第一的超級計算機能力需要多少擁有240流處理器的Tesla產(chǎn)品?
Andy Keane:就拿全球第二名“美洲豹”超級計算機為例,它是美國一個叫Oakrige實驗室的超級計算機,由18萬顆CPU核心組成,也就是用了4.5萬顆4核CPU。如果改用Tesla的話,只要1.5萬個GPU就可以實現(xiàn)這個東西,到明年我們有更好的下一代的產(chǎn)品出來,那么核心數(shù)量就可以馬上減掉一個零,僅僅1500個GPU就可以實現(xiàn)!
超級計算機的運算量主要用雙精度浮點運算能力來考量,現(xiàn)在用18萬顆3GHz的CPU核心來實現(xiàn)100萬GFLOPS的運算量,如果我們想實現(xiàn)2TFLOPS的浮點運算,那就需要30多萬個核心,實現(xiàn)10TFLOPS就需要180萬個CPU,這對于超級計算機制造者來說,幾乎是不可能完成的任務!
所以說將來想依靠CPU來實現(xiàn)超級計算機性能的飛躍是很艱難的,這就是CPU序列計算的問題,一個核只能做一件事,要做很多的事就得不斷地堆積核心數(shù)量,這樣超級計算機的規(guī)模、成本、功耗、維護都是各很大的問題。而如果改用GPU來做超級計算的話,所有的問題都會迎刃而解,而且也給未來超級計算機留下了巨大的性能提升空間。
● NVIDIA與惠普以及CRAY公司聯(lián)合發(fā)布小型高性能計算系統(tǒng)。這是否意味著NVIDIA認為高性能計算將從大型計算機發(fā)展到臺式機以及桌邊型計算機上來?
Andy Keane:想要對科學技術(shù)產(chǎn)生最大的影響,高性能計算就必須發(fā)展到科學家們的桌面上。每一名研究人員、科學家以及工程師都應該擁有自己的超級計算機,這些計算機應該具備足夠的實用性能來滿足他們的工作需要。想象一下如果這些才華橫溢的人們能夠更快地解決問題,那么科學發(fā)展的節(jié)奏將會變得怎樣。憑借這些基于GPU的工作站以及擁有兼容處理器的超級計算機,現(xiàn)在的技術(shù)計算達到了前所未有的全新水平。
關(guān)注我們


