爆玩《塵埃3》!HD6000三聯(lián)屏系統(tǒng)測試
NVIDIA的MIMD(多指令多數(shù)據(jù)流)架構將并行指令的調(diào)度單元、分配單元都和特殊功能模塊設計在了GPC(圖形處理器集群)或者SM(流處理器簇)內(nèi)部。而AMD的SIMD(單指令多數(shù)據(jù)流)架構則是整顆GPU共享單一的控制單元,自R600以來都是如此。
Juniper的單一圖形裝配引擎
但隨著晶體管規(guī)模和流處理器數(shù)量的迅速膨脹,單一的控制單元已經(jīng)無法滿足大規(guī)模并行指令分配的需要,因此從Cypress開始,AMD采用了“雙核心”的設計,將SIMD陣列一分為二,也就是類似于NVIDIA GPC的設計。與此相對應的,圖形裝配引擎雖然只有一個,內(nèi)部卻設計了兩個Hierarchical Z(分層消影器)和Rasterizer(光柵器),但是其它的特殊功能模塊均只有一個。
Barts的圖形裝配引擎
Barts和Cypress一樣,依然保持了雙核心設計,圖形裝配引擎也只有一個,內(nèi)部的功能模塊并沒有太多變化。但是Ultra-Treaded Dispatch Processor(超線程分配處理器)卻變成了兩個,相對應的,超線程分配處理器的指令緩存也變成了兩份。
我們知道,BartsLE的流處理器數(shù)量和Juniper相同,按理說線程分配壓力相同,那么設計兩個線程分配處理器的目的只有一個,那就是提升效率。在DX11時代,幾何著色再加上曲面細分單元引入之后,圖形裝配引擎會產(chǎn)生更多的并行線程及指令轉(zhuǎn)交SIMD進行處理,因此分配效率成為了新的瓶頸。
SIMD架構的優(yōu)勢就是可以用較少的晶體管制造成龐大的流處理器規(guī)模,擁有恐怖的理論運算能力;但缺點就是流處理器執(zhí)行效率比MIMD架構低,其效率高低完全依賴于分配單元的派發(fā)效率。因此BartsLE這種雙線程分配處理器的設計意義重大!
關注我們
