游戲外的競爭!NVATI通用計算技術分析
首款專門作流處理/并行計算的GPU產品并不是NVIDIA的Tesla,而是ATI的FireStream,早在2006年,ATI就發(fā)布了基于R580核心的流處理加速卡,48個像素渲染單元成為流處理器的雛形:
可惜的是,在第一代DX10顯卡較量中的失敗,讓AMD浪費了太多的時間與機會。G80核心成為高性能及并行計算的代名詞,專門針對并行計算設計的Tesla也暫露頭腳。
當然AMD的腳步也沒有停止,FireStream產品線伴隨著GPU的升級而更新,AMD的GPU架構天生就擁有很強的浮點運算能力,尤其是雙精度浮點運算能力!
單精度浮點運算,A卡并沒有比N卡高太多,但要知道在對精度要求很高的科學研究和勘探方面,單精度是沒有價值的,所有計算都需要雙精度64Bit。A卡的雙精度運算是單精度的1/5,而N卡的雙精度運算只有單精度的1/8。
核心為4片GPU的1U服務器,Tesla S1070=Tesla C1060×4
除了單GPU核心的產品之外,NVIDIA還有專門設計的多GPU Tesla Personal SuperComputer運算系統(tǒng),AMD也有類似的運算加速系統(tǒng):
Aprius CA8000允許在機架內部插上最多八塊FireStream 9270流處理加速卡,從而提供將近10TFlops的單精度浮點運算能力,以及1.9TFlops的雙精度浮點運算能力。當然AMD的機架體積也要比NVIDIA的1U機架大很多,雙方的外觀和結構雖然相差很多,但基本原理是一致的,都是類似于外置顯卡的解決方案。
不過,A卡SIMD架構的效率一直讓人擔心,目前上沒有能夠直接對比雙方實際浮點運算性能的軟件,但根據Folding@home的民間數據來看,HD4870不如GTX260,而GTX260與9800GTX+是差不多的,看來雙方在并行計算方面都還有繼續(xù)優(yōu)化提升的空間。
關注我們
