国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

ATI重登性能王座 48管線R580完全測試

  • 管線處理能力提高三倍:R580集成48個(gè)像素渲染單元

    眾所周知,ATI現(xiàn)有的R520顯示芯片僅僅擁有16個(gè)像素渲染單元,而對手NVIDIA的G70為24個(gè),這使得R520在于G70的競爭當(dāng)中處于不利局面,不得不依靠高頻率來彌補(bǔ)不足。而現(xiàn)在ATI將R580的像素渲染單元一舉提升至48個(gè)的境界,足足是R520的三倍,讓人刮目相看!

    48個(gè)像素渲染單元,R580顯示芯片帶給我們的震撼力是前所未有的,核心集成度如此之高那么功耗與發(fā)熱量將會(huì)到什么樣的地步?這恐怕是絕大多數(shù)人所擔(dān)心的問題!

  • R520到R580核心架構(gòu)演變:
{imageTitle}
R520核心架構(gòu)圖
 
    ATI全新架構(gòu)的R520晶體管數(shù)已經(jīng)達(dá)到了3億,如果按此標(biāo)準(zhǔn)將像素渲染管線提高到了48條,那么后果不堪設(shè)想,能否造出來還是個(gè)問題。然而ATI通過了巧妙的方法依然維持16條像素渲染管線不變,但將像素處理單元翻了三倍:
 
{imageTitle}
這是之前網(wǎng)上泄露出來的R580核心架構(gòu)圖
 
    可以明顯地看出,R580與R520的整體架構(gòu)是完全一致的,最大的區(qū)別就在像素渲染管線上面,像素渲染單元依然按照之前的四陣列流水線架構(gòu)排列,因此通常所說的像素渲染管線維持16條不變,而像素渲染單元卻是實(shí)實(shí)在在的48個(gè),它并沒有占據(jù)太多的晶體管,但渲染能力卻理論上達(dá)到了3倍與原來的水平!

    ATI并沒有單純的增加像素渲染管線,因?yàn)橐晃兜奶岣吖芫€數(shù)目對芯片工藝要求非常高。因此ATI巧妙通過增加像素渲染單元,讓傳統(tǒng)的每條像素渲染管線能夠在單時(shí)鐘周期內(nèi)進(jìn)行三次像素操作,從而大幅提升顯卡的像素渲染能力!

    那么像素渲染單元與通常所說的像素渲染管線到底有何區(qū)別呢?

    眾所周知,我們通常說X1800XT和7800GTX有多少條管線時(shí),嚴(yán)謹(jǐn)?shù)恼f法應(yīng)該是16×1和24×1,因?yàn)樗麄兊拿織l管線都擁有1個(gè)處理單元,所以像素渲染管線和像素處理單元是完全等同的。然而到了R580一代就不同了,雖然R580的規(guī)格依然是傳統(tǒng)的16條像素渲染管線,但每條管線卻擁有3個(gè)像素渲染單元,也就是相當(dāng)于48條管線的規(guī)格!

  • 48個(gè)像素渲染單元的指揮中心:R580 Ultra-Threaded技術(shù)
    原來R580并非真正擁有48條管線,很多人對這種16×3的規(guī)格表示懷疑,其執(zhí)行效率肯定不如真正意義上的48管線,理論上說是沒有錯(cuò)的。但ATI通過集成專用的Ultra-Threaded模塊能夠?qū)?8個(gè)像素渲染單元充分調(diào)度起來:
 
{imageTitle}
ATI官方R580像素渲染引擎架構(gòu)圖
 
    R580的像素渲染引擎當(dāng)中除了48個(gè)像素渲染單元之外,最核心的部分是一個(gè)叫做“Ultra-Thearding Dispatch Processor”的模塊,這個(gè)單元負(fù)責(zé)將線程分派給下面的像素渲染處理器。而且可以看出Ultra-Thearding能夠統(tǒng)一調(diào)度48個(gè)單元之間的協(xié)同工作,讓16×3管線的效能遠(yuǎn)遠(yuǎn)超越16×1,媲美48管線的水平!
 
    DirectX 9 API的Shader Model 3.0規(guī)范中最重要的特性就是像素渲染的動(dòng)態(tài)流控制,它可以根據(jù)每單個(gè)像素的狀態(tài),允許單像素渲染程序執(zhí)行不同的代碼循環(huán)和多次代碼循環(huán)。對于一個(gè)畫面,是有很多數(shù)據(jù)需要處理的,而這些數(shù)據(jù)幾乎都是平等的,像素之間、紋理之間、或者頂點(diǎn)之間。于是每個(gè)圖形芯片都需要能夠同時(shí)執(zhí)行這些操作,也就是并行運(yùn)算。

    但是現(xiàn)在出現(xiàn)了一個(gè)矛盾:一方面為了要求并行計(jì)算,很多像素要求同時(shí)進(jìn)行操作,將畫面分成一個(gè)個(gè)小塊來處理將能夠很明顯的提高效率,但是如果一個(gè)塊中的像素需要進(jìn)行不同的操作,那么將適得其反。另一方面,如果將每個(gè)像素作為最小的單位進(jìn)行處理,那么出現(xiàn)問題的可能就沒有了,但是這樣效率將會(huì)很低,因?yàn)椴煌南袼氐奶幚硪笫遣煌?,簡單的處理的快,?fù)雜的處理的慢。

    ATI的Ultra-Thearding Dispatch Processor便是用來解決這個(gè)問題的,首先,可以將每一個(gè)像素的處理過程理解成為一個(gè)“線程”,那么這個(gè)Ultra-Thearding Dispatch Processor的功能就是分配這些線程的執(zhí)行。它可以動(dòng)態(tài)檢測到每個(gè)像素渲染單元的工作情況,避免了空閑的情況存在。

    Ultra-Thearding通過一個(gè)龐大的聯(lián)合線程計(jì)數(shù)器、小線程單元、專門的分歧單元,和一個(gè)巨大的、高性能任務(wù)堆棧列表,可以在高速的動(dòng)態(tài)流控制和擴(kuò)展并行處理見取得最好的平衡,這些技術(shù)可以讓R580的像素渲染效率進(jìn)一步提高,充分釋放48個(gè)像素渲染單元的潛能,將新技術(shù)特效發(fā)揮得淋漓盡致!

  • 為什么需要如此眾多的像素渲染單元:
{imageTitle}

    上圖為近年來主流3D游戲當(dāng)中使用像素渲染指令的變化曲線,可以看出未來游戲?qū)⒏宇l繁的使用像素渲染操作。這是因?yàn)楫?dāng)今主流3D API——微軟DirectX自8.0開始導(dǎo)入可編程的渲染引擎之后,大量D3D游戲基于這一標(biāo)準(zhǔn)使用像素渲染變得非常普通,而且指令的復(fù)雜程度也是與日俱增!

    這就是為什么ATI和NV的顯卡像素渲染單元逐年遞增的原因!

5800/5900(8)→6800(16)→7800(24)→7900(32)
9700/9800(8)→X800(16)→X1800(16)→X190(48)

  • 渲染方式也發(fā)生了微妙變化:

    渲染操作越來越頻繁,渲染復(fù)雜程度越來越夸張,除此之外在游戲中的渲染方式也發(fā)生了微妙的變化。目前3D游戲中常用的渲染指令大致可以分為兩類:

1.紋理操作:從顯存中拾取數(shù)據(jù)
2.算術(shù)處理操作:完成數(shù)學(xué)變換

{imageTitle}
算術(shù)處理操作與紋理操作在游戲中所占的比重

    早期的渲染處理是粗略的把渲染資源平等的分配給上述兩種類型的渲染指令,但近來分配給算術(shù)處理操作的渲染處理資源比重越來越大。在最近的游戲當(dāng)中,兩類渲染指令的比例大約為:算術(shù)處理操作:紋理操作=5:1。從很多游戲的設(shè)計(jì)藍(lán)圖來看,這一比例還有繼續(xù)增大的趨勢。

    算術(shù)處理與紋理操作之間很重要的一個(gè)差異就是:紋理操作過多依賴于顯存容量、速度和帶寬這些外界因素,當(dāng)在硬件條件限制下顯存規(guī)格無法繼續(xù)提升時(shí),增加更多的紋理單元對紋理操作性能的提升非常有限;而算術(shù)處理則完全不同,它的處理能力完全取決于顯示核心集成的算術(shù)處理單元數(shù)量。

  • 為什么R580頂點(diǎn)處理單元維持8個(gè)不變?

    人們在談?wù)撘豢铒@卡的規(guī)格時(shí),最常提到的就是兩個(gè)重要部分——像素渲染單元和頂點(diǎn)處理單元,這也成為了ATI和NVIDIA劃分高中低端顯卡的重要手段!舉個(gè)簡單的例子:7800GTX為24像素8頂點(diǎn),而7800GT為20像素7頂點(diǎn)。前面剛剛介紹了像素渲染部分,下面就來看看R580的頂點(diǎn)引擎有何變化?

    不管NVIDIA還是ATI,逐年提高像素渲染單元的數(shù)量絕大多數(shù)人都能夠理解,這幾乎成為了近年來顯卡性能提高墨守成規(guī)的定律,然而回頭看看幾年來頂點(diǎn)處理單元似乎一直處于原地踏步狀態(tài),為什么兩大巨頭對頂點(diǎn)處理單元如此漠不關(guān)心?

    如果按照3D圖形處理順序而言,頂點(diǎn)部分是需要首先執(zhí)行的。很早之前,頂點(diǎn)坐標(biāo)的運(yùn)算是由CPU完成的,到了GeForce和Radeon以后,圖形芯片便具備了T&L(Transform&Lighting 變換和光照)的功能。

    不管是哪款顯卡,3D圖形的處理順序都是最先從頂點(diǎn)部分開始,因?yàn)轫旤c(diǎn)是用來構(gòu)造幾何物體的,進(jìn)行3D運(yùn)算建模頂點(diǎn)是最基本最核心的內(nèi)容。而像素對應(yīng)工作就是將顯卡合成的三維圖形以二維的方式輸出,簡單說像素是二維而頂點(diǎn)則是三維的。這就是他們雖然都被稱作Shader,而頂點(diǎn)常被譯為處理、著色,而像素譯為渲染的原因。

R520 R520

    然而與3D息息相關(guān)的頂點(diǎn)運(yùn)算的需求是取決于游戲本身,每一個(gè)游戲的3D模型一旦確定,在一個(gè)靜態(tài)的3D場景中,頂點(diǎn)數(shù)目也就固定下來了,這并不會(huì)因?yàn)橛螒虻募?xì)節(jié)程度、特效和分辨率而發(fā)生改變。所以頂點(diǎn)引擎往往沒有像素引擎那么繁忙,游戲開發(fā)者通常會(huì)利用貼圖等手段控制模型的3D頂點(diǎn)數(shù)目。

    因此R580與R520相比像素渲染單元翻了三倍,而頂點(diǎn)處理單元沒有任何變化。關(guān)于R580頂點(diǎn)處理單元的細(xì)節(jié)部分資料,可參閱“三年架構(gòu)大革命!R520脫胎換骨全測試”一文,此處不再多做介紹。

  • 小結(jié):

    R520顯示核心擁有16個(gè)像素單元和16個(gè)紋理單元,兩者的比例為1:1,而R580擁有48個(gè)像素單元和16個(gè)紋理單元,兩者的比例為3:1。

    可以看出,R580與R520相比最重大的變化就是像素渲染單元翻了三倍達(dá)到了48個(gè),紋理單元和頂點(diǎn)處理單元都沒有變化。這是主要是因?yàn)榘凑沼螒虬l(fā)展的趨勢、以及當(dāng)前硬件條件的限制,頂點(diǎn)處理單元夠用即可,增加紋理單元對性能的提升非常有限;而提高像素單元、增加像素與紋理的比例,能夠更加貼近未來游戲發(fā)展的需要,可以最大化顯卡的渲染效率!

    當(dāng)然,ATI并沒有單純的增加像素渲染管線,因?yàn)橐晃兜奶岣吖芫€數(shù)目對芯片工藝要求非常高。因此ATI巧妙通過增加像素渲染單元,讓傳統(tǒng)的每條像素渲染管線能夠在單時(shí)鐘周期內(nèi)進(jìn)行三次像素操作,從而大幅提升顯卡的像素渲染能力!

1人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注