国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評(píng)測(cè)    /    正文

圖形與計(jì)算那些事 AMD次世代架構(gòu)解析

    相信有些讀者很早就想問這樣一個(gè)問題了:既然圖形渲染的主要指令是4D矢量格式,那為什么R600要設(shè)計(jì)成5D的流處理器結(jié)構(gòu)呢?還沿用了5代之久?有結(jié)果就有原因,通過對(duì)Cayman核心的分析,我們可以找到答案。

    R600為什么是5D VLIW結(jié)構(gòu)?

    在5D VLIW流處理器中,其中的1個(gè)比較“胖”的ALU有別于其它4個(gè)對(duì)等的ALU,它負(fù)責(zé)執(zhí)行特殊功能(例如三角函數(shù))。而另外4個(gè)ALU可以執(zhí)行普通的加、乘、乘加或融合指令。

Barts核心的流處理器結(jié)構(gòu)

    從R600開始的Shader是4D+1D的非對(duì)等設(shè)計(jì),ATI這樣做的目的是為了讓頂點(diǎn)著色器更有效率,以便能同時(shí)處理一個(gè)4D矢量點(diǎn)積(比如w、x、y、z)和一個(gè)標(biāo)量分量(比如光照)。

    Cayman核心返璞歸真,改用4D結(jié)構(gòu)

    隨著DX10及DX11大行其道,AMD通過自己長(zhǎng)期內(nèi)部測(cè)試發(fā)現(xiàn),VLIW5架構(gòu)的五個(gè)處理槽中平均只能用到3.4個(gè),也就是在游戲里會(huì)有1.6個(gè)白白浪費(fèi)了。顯然,DX9下非常理想的VLIW5設(shè)計(jì)已經(jīng)過時(shí),它太寬了,必須縮短流處理器單元(SPU),重新設(shè)計(jì)里邊的流處理器(SP)布局。

圖形與計(jì)算那些事 AMD次世代架構(gòu)解析

Cayman核心的流處理器結(jié)構(gòu)

    于是Cayman核心誕生了,胖ALU下崗,只保留了剩下4個(gè)對(duì)等的全功能ALU。裁員歸裁員,原來胖ALU的工作還得有人干,Cayman的4D架構(gòu)在執(zhí)行特殊功能指令時(shí),需要占用3個(gè)ALU同時(shí)運(yùn)算。

    5D改4D之后最大的改進(jìn)就是,去掉了體積最大的ALU,原本屬于它的晶體管可以用來安放更多的SIMD引擎,據(jù)AMD官方稱流處理器單元的性能/面積比可以提升10%。而且現(xiàn)在是4個(gè)ALU共享1個(gè)指令發(fā)射端口,指令派發(fā)壓力驟減,執(zhí)行效率提升。雙精度浮點(diǎn)運(yùn)算能力也從原來單精度的1/5提高到了1/4。

    效率更進(jìn)一步:雙圖形引擎

    前面介紹過,從RV770到Cypress核心,圖形引擎和超線程分配處理器都只有一個(gè),但圖形引擎內(nèi)部的Hierarchical Z(分層消影器)和Rasterizer(光柵器)分為兩份。

    到了Barts核心,超線程分配處理器從一個(gè)變成兩個(gè)?,F(xiàn)在的Cayman核心則更進(jìn)一步,圖形引擎也變成了兩個(gè),也就是除了分層消影器和光柵器外,幾何著色指令分配器、頂點(diǎn)著色指令分配器、還有曲面細(xì)分單元都變成了兩份:

HD6900完全評(píng)測(cè)

    兩個(gè)曲面細(xì)分單元再加上兩個(gè)超線程分配處理器,AMD官方稱HD6970的曲面細(xì)分性能可以達(dá)到HD6870的兩倍、HD5870的三倍。其它方面比如頂點(diǎn)著色、幾何著色性能都會(huì)有顯著的提升。

    通用計(jì)算效能也有改進(jìn)

    和Cypress、Barts相比,Cayman在通用計(jì)算方面也有一定程度的改進(jìn),主要體現(xiàn)在具備了一定程度的多路并行執(zhí)行能力;雙路DMA引擎可以同時(shí)透過外部總線和本地顯存讀寫數(shù)據(jù);改進(jìn)的流控制提高了指令執(zhí)行效率和運(yùn)算單元浪費(fèi);當(dāng)然雙精度運(yùn)算能力的提高對(duì)于科學(xué)計(jì)算也大有裨益。

    不過,這些改進(jìn)都是治標(biāo)不治本,VLIW架構(gòu)從5D到4D只是一小步,只能一定程度上的提高指令執(zhí)行效率,而無法根治GPU編程困難、復(fù)雜指令和條件指令的兼容性問題??偟膩碚f,Cayman核心依然只是單純?yōu)橛螒蚨O(shè)計(jì)的GPU,AMD把5D改為4D也是基于提升3D渲染性能的考慮。

2人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注