三年架構大革命!R520脫胎換骨全測試
◎ 全新像素渲染管線設計,不靠數量定勝負!
前面介紹了R520核心中的關鍵,Ultra—Thearding Dispatch Processor,這個單元讓R520在像素管線數目不變的情況下提高了效率。那么現在我們就來看看R520新一代的像素渲染管線。

在R520中,16個像素渲染管線是被分成4組的,每組有四個像素渲染管線,這樣的設計和我們所熟悉的其他顯示芯片也是類似的。
對于每個像素渲染的內部結構,我們看到也是比頂點渲染管線要復雜的多,其中分為三個主要的部分:
- 紫色的是分支處理單元,主要用來處理分支流程。
- 紅色的是標量運算單元,這個部分是兩級設計結構,所以有兩個標量運算單元,用來處理標量數據。這兩個標量運算單元能夠同時運行,一個處理一個ADD指令再加上一個Input Modifier操作,另外一個執(zhí)行一個ADD命令或者是MUL命令,或者是MADD命令。
- 棕色的時向量運算單元,我們知道,像素的顏色信息通常是以向量數據存儲的,這個單元也分為兩個部分,同時能夠執(zhí)行兩個三維向量指令。這兩個指令包括:一個ADD命令加上一個Input Modifier命令;或者是ADD、MUL、MADD命令中的一個。
◎ R520通用寄存器陣列!顯示核心的L2緩存!
在頂點渲染管線下面,我們發(fā)現了一個名叫“General Purpers Register Arrays”的區(qū)域,直譯過來就是通用目的寄存器陣列的意思。
我們看到,整個R520芯片中,很多部分都和它相連著,看來這個區(qū)域的作用是相當的大,不但作為像素渲染管線數據的輸出對象,還連接著Z緩存,材質緩存等模塊。
如此看來,這塊區(qū)域的左右就有點像是CPU的L2緩存,各種數據都能調用它。
在像素渲染引擎后面就是“Render Back End”了,翻譯過來應該稱之為渲染后端單元。這個部分是負責圖像的后期處理的。
這個部分的功能模塊比較多,主要是一些像是Z軸或模板比較的操作,抗鋸齒的操作等等。
經過這個模塊以后,輸出至幀緩沖,就是最后的圖像了。
◎ 創(chuàng)新雙環(huán)形內存總線架構:完全自由緩存映射提高性能
上面介紹的都是R520處理核心方面的一些特型,除了這些,R520在內存管理上也有很大的改進。

在R520身上,ATI引入了雙向高速環(huán)形內存總線的結構,這樣就讓R520內部的總線位寬達到了512bit的程度。雙向環(huán)形總線大大提高了對內存的訪問控制。
R520的內存總線是由兩個256bit的環(huán)狀總線組成的,這樣數據可以雙方向傳輸,提高了傳輸的效率。
在總線上,一共有四個RingStop,每個上面有兩顆顯存,并且連接兩個Client Interface,中間由一個“Write Crossbar Switch”控制,這樣的設計就能讓顯存和需要數據的部分最快的進行數據傳輸。
緩存映射
像CPU一樣,圖形芯片也不是直接訪問顯存的,也是通過一塊高速緩存充當內存的鏡像后訪問的。
但是我們知道,緩存由于在芯片內部,所以容量不會太大,R520在緩存和顯存的映射上進行了改進。

在原來的時候,采用的是直接映射方式,顯存是分塊被直接映射到緩存上的,這樣如果有數據更新,整個緩存的數據就要清空,重新映射其他的區(qū)域,這樣就會有大量的失效的情況發(fā)生。

在R520中,緩存和顯存的映射已經變?yōu)橥耆杂傻挠成潢P系,自由度增大,數據刷新只需要更新局部的數據就可以了。
我們來看看ATI提供的內存映射成功率測試:
我們看到,在兩個測試中,無論是Z軸數據還是材質數據,X1800XT的緩存失效率都要低于X850的水平。
關注我們


