開普勒新生力量!影馳GTX660黑將評測
● 從SM到SMX:流處理器和每瓦性能雙飛
基于效能和計算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構(gòu),NVIDIA雖然還是采用SIMT架構(gòu),但也借鑒了AMD“較老”的SIMD架構(gòu)之作法,降低控制邏輯單元和指令發(fā)射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當中容納了192個核心的壯舉就變成了現(xiàn)實!
通過上面這個示意圖就看的很清楚了,CUDA核心的縮小主要歸功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強化運算單元削減控制單元的意圖就很明顯了。
此時相信有人會問,降低控制單元的比例那是不是意味著NVIDIA賴以成名的高效率架構(gòu)將會一去不復(fù)返了?理論上來說效率肯定會有損失,但實際上并沒有想象中的那么嚴重。NVIDIA發(fā)現(xiàn)線程的調(diào)度有一定的規(guī)律性,編譯器所發(fā)出的條件指令可以被預(yù)測到,此前這部分工作是由專門的硬件單元來完成的,而現(xiàn)在可以用簡單的程序來取代,這樣就能節(jié)約不少的晶體管。
● 擺脫CUDA核心的束縛:GPU核心頻率暴漲
除了CUDA核心數(shù)量大增之外,開普勒架構(gòu)還有個很明顯的改變,那就是CUDA核心的頻率不再是GPU頻率的兩倍,現(xiàn)在整顆GPU所有單元的工作頻率都是相同的!
NVIDIA官方對CUDA與核心同頻的解釋是——功耗原因,為了盡可能的控制GeForce GTX 680的功耗,不再讓CUDA工作在兩倍頻率下。
總而言之,表面上看來來這個改變似乎不是什么好事,但實際上卻意義重大。之前GTX580之所以核心頻率低而顯卡功耗高很大程度上就是受到過高CUDA核心頻率的影響。如今擺脫CUDA核心的束縛,GPU核心頻率輕而易舉就能突破1GHz,這樣一來顯卡運行效率更高,同時功耗也控制在了很低的水平。
● 顯存頻率后來居上 全面超越對手
顯存作為顯卡數(shù)據(jù)交換的“倉庫”,其效率高低直接影響到整體的性能。在開普勒核心誕生之前,AMD一直在顯存方面占據(jù)絕對優(yōu)勢。
現(xiàn)在,NVIDIA在顯存頻率上面終于反超AMD,重新設(shè)計的顯存控制器突破了頻率的桎梏,瞬間從4000MHz飆升至6000MHz,帶寬提升達50%之多!
關(guān)注我們



