革命性DX11架構(gòu)!GTX480/470權(quán)威評測
不管GPU架構(gòu)改不改,流處理器數(shù)量總是要擴充的,準確的說是以級數(shù)規(guī)模增長,這樣才能大幅提升理論性能。在流處理器數(shù)量急劇膨脹之后,如何管理好如此龐大的規(guī)模、并與其它模塊協(xié)調(diào)工作成為新的難題。
RV870的雙核心模塊設計
ATI RV870包括流處理器在內(nèi)的所有核心規(guī)格都比RV770翻了一倍,ATI選擇了“雙核心”設計,幾乎是并排放置兩顆RV770核心,另外在裝配引擎內(nèi)部設計有兩個Rasterizer(光柵器)和Hierarchial-Z(多級Z緩沖模塊),以滿足雙倍核心規(guī)格的胃口。

GF100可以看作是四核心設計
如果說Cypress是“雙核心”設計的話,那么GF100的流處理器部分就是“四核心”設計,因為GF100擁有四個GPC(圖形處理器集群)模塊,每個GPC內(nèi)部包含一個獨立的Raster Engine(光柵化引擎),而在以往都是整顆GPU共享一個Raster Engine。
Raster Engine由三個流水線階段組成。在邊緣設置階段中,可提取頂點位置、計算三角形邊緣方程。沒有朝向屏幕方向的三角形都通過背面剔除而刪掉了。每一個邊緣設置單元在一個時鐘周期中最多都能夠處理一個點、線或三角形。光柵器(Rasterizer)為每一個基元而運行邊緣方程并計算像素的覆蓋。如果開啟了抗鋸齒功能,那么就會為每一個多采樣以及覆蓋采樣執(zhí)行覆蓋操作。每一個光柵器在每個時鐘周期內(nèi)均可輸出8個像素,整個芯片每個時鐘周期內(nèi)總共可輸出32個光柵化的像素。光柵器所生成的像素將被發(fā)送至Z坐標壓縮(Z-cull)單元。Z坐標壓縮單元獲取像素圖塊(Pixel Tile)并將圖塊中像素的深度與顯存中的現(xiàn)有像素進行比較。完全處于顯存像素后面的像素圖塊將從流水線中剔除,從而就不再需要進一步的像素著色工作了。
我們知道RV870的Rasterizer和Hierarchial-Z雙份的,而GF100則是四份的,雖然命名有所不同但功能是相同的。
GF100的四個GPC是完全相同的,每個GPC內(nèi)部囊括了所有主要的圖形處理單元。它代表了頂點、幾何、光柵、紋理以及像素處理資源的均衡集合。除了ROP功能以外,GPC可以被看作是一個自給自足的GPU,所以說GF100就是一顆四核心的GPU。
在每個GPC內(nèi)部,是由四組SM共享一個Raster Engine,現(xiàn)在我們進一步細分GF100,來詳細看看SM的結(jié)構(gòu)。
關(guān)注我們


