不怕美國禁售!新天河推自主超算芯片
天河2號(hào)再一次稱霸全球超算性能榜單(性能最大33.83PFlops,千萬億次浮點(diǎn)計(jì)算),雖然仍處在建設(shè)中,但它已經(jīng)比較獨(dú)特的連續(xù)5次成為Top500的冠軍。
不過,高興之余我們也有意思隱憂,因?yàn)槊绹虅?wù)部在今年4月份發(fā)布公告,決定拒絕英特爾公司向中國的國家超級(jí)計(jì)算中心出售至強(qiáng)芯片用于天河二號(hào)的升級(jí)。
因?yàn)閄eon E5處理器比較容易獲取,所以限售的重點(diǎn)直指Xeon Phi計(jì)算加速卡。至于超算為什么必須用加速卡,重點(diǎn)考慮的就是能耗和建設(shè)成本。
限售令公布后,天河2號(hào)系統(tǒng)主任設(shè)計(jì)師、國防科大教授盧宇彤曾回應(yīng),“按照原定計(jì)劃,天河二號(hào)擬在今年將計(jì)算能力從55PFLOPS升級(jí)到100PFLOPS。盡管此次美方對天河二號(hào)升級(jí)所需Intel Xeon處理器的限售,對原定升級(jí)計(jì)劃有一定影響,但我們早有準(zhǔn)備,絕不會(huì)影響天河二號(hào)從55PFLOPS升級(jí)到100PFLOPS的既定目標(biāo) 。
至于中國的信心來自那里,本次超算峰會(huì)上,盧宇彤的主題演講也親自做了回應(yīng),我們整理了ZDnet親臨現(xiàn)場后發(fā)回的報(bào)道,一起來看看。
這一次,全新的天河2A首次公開對外公布了信息,和與歷代天河系統(tǒng)的對比,其運(yùn)算峰值將達(dá)到100P,更為精彩的是,“中國計(jì)算加速卡China Accelerator”首次亮相,型號(hào)“Matrix2000”。
雖然處理器方面仍是至強(qiáng)E5-2692 V2,但這款自主的加速卡可謂是對“禁運(yùn)令”的最大回?fù)簟6遥谛阅芴嵘?00P的同時(shí),天河2A的功耗幾乎沒有增加!
事實(shí)上,通用處理器在未來的HPC系統(tǒng)里的權(quán)重會(huì)越來越低,主要工作將逐漸向控制層面轉(zhuǎn)移,計(jì)算任務(wù)則主要由加速器完成。因?yàn)镹VIDIA GPGPU Tesla同樣在美國限售范圍內(nèi),國防科大給出的中國自主研發(fā)方案就是通用計(jì)算數(shù)字信號(hào)處理器(GPDSP)。必須承認(rèn)的是,并不算有多“高大上”。
Matrix2000的主要設(shè)計(jì)規(guī)格預(yù)計(jì)為16核設(shè)計(jì),可達(dá)到2.4T的浮點(diǎn)性能,雖然還比不上Knight Landing的3T,但對于白手起家的中國來說,已經(jīng)相當(dāng)不易,而且功耗比現(xiàn)有的Xeon Phi少了100W。
Matrix2000的內(nèi)部設(shè)計(jì),采用了標(biāo)量與向量單元+超長指令字(VLIW)的架構(gòu)
針對全新的Matrix2000所準(zhǔn)備的軟件堆棧,包括GPDPS驅(qū)動(dòng)程序、操作系統(tǒng)、編譯器、數(shù)學(xué)庫等
據(jù)國防科大的相關(guān)研發(fā)人員介紹,有關(guān)DSP的浮點(diǎn)計(jì)算應(yīng)用,一直也是國防科大的研發(fā)重點(diǎn),它與超算研究可謂是并行發(fā)展。也正是因?yàn)橛辛诉@樣的積累,國防科大才能比較從容的面對美國的限售。但該研發(fā)人員也表示,GPDSP的一個(gè)推廣難點(diǎn)也就在于,在HPC應(yīng)用領(lǐng)域幾乎是從零起步,就像當(dāng)初NVIDIA剛推出GPGPU時(shí)一樣,直到CUDA的發(fā)布才迅速改善了GPGPU的應(yīng)用生態(tài)環(huán)境。
在互聯(lián)層,采用了自主研發(fā)的TH-Express 2+架構(gòu),實(shí)現(xiàn)了自適應(yīng)(Adaptive)互聯(lián)架構(gòu)
所謂的自適應(yīng)互聯(lián)架構(gòu),就從多個(gè)層面入手,通過自應(yīng)用平臺(tái)層至底層形成的智能互動(dòng),保證網(wǎng)絡(luò)效率持續(xù)而穩(wěn)定,比如自動(dòng)規(guī)避質(zhì)量不佳或擁擠的鏈路,進(jìn)一步杜絕重復(fù)的通信,并在節(jié)點(diǎn)與網(wǎng)絡(luò)故障時(shí)對路由重新配置等等。
天河二號(hào)A仍然是以自主研發(fā)的H2FS文件系統(tǒng)為核心,實(shí)現(xiàn)了1TB/s的突發(fā)傳輸,100GB/s的持續(xù)傳輸
不過盧宇彤表示,目前Matrix2000已經(jīng)通過了驗(yàn)收。這意味著至少在國防科大的層面,正式投入使用已經(jīng)沒有問題,但具體時(shí)間還不能確定,所以只給出了2016年這一較為籠統(tǒng)的時(shí)間點(diǎn)。
相關(guān)研發(fā)人員也透露,除了應(yīng)用平臺(tái)進(jìn)一步配套完善之外,GPDSP芯片本身的生產(chǎn)與物理設(shè)備的調(diào)優(yōu)還有很多工作要做。而且受限于當(dāng)前中國半導(dǎo)體生產(chǎn)工藝水平,現(xiàn)在還是采用40nm工藝的GPDSP,也在很大程度上制約了Matrix2000的能力。
總的來說,中國研制超大規(guī)模HPC系統(tǒng)的目的肯定不僅僅是為了跑個(gè)LINPACK爭個(gè)名次,否則也不會(huì)引起美國的重視并引發(fā)限售。
天河二號(hào)A的設(shè)計(jì)在某種角度上說,真正打開了中國自主HPC發(fā)展的向上之路,因?yàn)榧铀倨骱苤匾?,也因?yàn)榧铀倨鞅粐庀奘郏蕴旌佣?hào)A在這種環(huán)境下還能很快達(dá)到100P的性能,也許連美國相關(guān)人士也沒有想到,但這絕對是件好事!■
關(guān)注我們
