挑戰(zhàn)卡皇TITAN!GTX 780 SLI巔峰測試
隨著科學、醫(yī)學、工程和金融各領域對高性能并行計算需求的增加,NVIDIA以無比強大的GPU計算架構來不斷創(chuàng)新和滿足這種需求。NVIDIA現(xiàn)有的 Fermi GPU已經(jīng)重新定義和加速了以下領域的高性能計算(HPC)的功能,如地震處理、生化模擬、天氣和氣候建模、信號處理、計算金融、計算機輔助工程、計算流體力學和數(shù)據(jù)分析。NVIDIA的新Kepler GK110 GPU大大提高了并行計算標準,并將會幫助解決世界上面臨的最困難的計算問題。
▲ NVIDIA GeForce GTX 780
▲ GTX 780采用的GK110核心
通過提供比上一代GPU更強大的處理功能以及優(yōu)化和提高GPU上并行執(zhí)行工作負載的新方法,Kepler GK110簡化了并行程序的創(chuàng)建,將對會對高性能計算引起進一步改革。
Kepler GK110由71億個晶體管組成,是有史以來架構最復雜的微處理器。GK110新加了許多注重計算性能創(chuàng)新功能,目的是要成為NVIDIA Tesla和HPC市場上的并行處理動力站。
Kepler GK110和GK104
Kepler GK110會提供超過每秒1萬億次雙精度浮點計算的吞吐量,DGEMM效率大于80%,而之前的Fermi架構的效率是60‐65%。
除了性能之外,Kepler架構在電源效率方面也有巨大的飛躍,相對于Fermi 的性能/功率比提高了3倍之多!
之前有人說Kepler GK110更適合超級計算和通用計算,其實這是一種誤解。Kepler GK110的以下新功能不僅提高GPU的利用率,簡化了并行程序設計,而且有助于GPU在各種計算環(huán)境中部署,無論是從個人電腦還是超級計算機,GK110都適用:
Dynamic Parallelism – 能夠讓 GPU 在無需 CPU 介入的情況下,通過專用加速硬件路徑為自己創(chuàng)造新的工作,對結果同步,并控制這項工作的調(diào)度。這種靈活性是為了適應程序執(zhí)行過程中并行的數(shù)量和形式,編程人員可以處理更多的各種并行工作,更有效的將 GPU 用為計算用途。
Hyper-Q – 允許多個CPU核同時在單一GPU上啟動工作,從而大大提高了GPU 的利用率并削減了CPU空閑時間。Hyper‐Q 增加了主機和 Kepler GK110 GPU 之間的連接總數(shù)(工作隊列),允許 32 個并發(fā)、硬件管理的連接(與 Fermi相比,F(xiàn)ermi 只允許單個連接)。
Grid Management Unit –使 Dynamic Parallelism 能夠使用先進、靈活的 GRID 管理和調(diào)度控制系統(tǒng)。新 GK110 Grid Management Unit (GMU) 管理并按優(yōu)先順序在 GPU上執(zhí)行的 Grid。GMU 可以暫停新 GRID 和等待隊列的調(diào)度,并能中止 GRID,直到其能夠執(zhí)行時為止,這為 Dynamic Parallelism 這樣的強大運行提供了靈活性。
NVIDIA GPUDirect–NVIDIA GPUDirect 能夠使單個計算機內(nèi)的 GPU 或位于網(wǎng)絡內(nèi)不同服務器內(nèi)的 GPU 直接交換數(shù)據(jù),無需進入CPU系統(tǒng)內(nèi)存。GPUDirect 中的 RDMA 功能允許第三方設備,例如 SSD、NIC、和 IB 適配器,直接訪問相同系統(tǒng)內(nèi)多個 GPU 上的內(nèi)存,大大降低 MPI從GPU內(nèi)存發(fā)送/接收信息的延遲。還降低了系統(tǒng)內(nèi)存帶寬的要求并釋放其他 CUDA 任務使用的 GPU DMA 引擎。
這里先做簡單介紹,后面本文有詳細的內(nèi)容擴展。除此之外Kepler GK110 還支持其他的GPUDirect功能,包括Peer‐to‐Peer 和 GPUDirect for Video這里就不再贅述了。
關注我們
