风间由美性色一区二区三区,av无码一区二区三区

泡泡網(wǎng)顯卡頻道 PCPOP首頁 / 顯卡 / 評測 / 正文

流處理器緣何差6倍！A/N GPU架構(gòu)解析

2010年03月01日 00:01作者：孫敏杰編輯：孫敏杰文章出處：泡泡網(wǎng)原創(chuàng)

● “管線”的由來——1個時鐘周期4次運算

在圖形處理中，最常見的像素都是由RGB（紅綠藍(lán)）三種顏色構(gòu)成的，加上它們共有的信息說明（Alpha），總共是4個通道。而頂點數(shù)據(jù)一般是由XYZW四個坐標(biāo)構(gòu)成，這樣也是4個通道。在3D圖形進(jìn)行渲染時，其實就是改變RGBA四個通道或者XYZW四個坐標(biāo)的數(shù)值。為了一次性處理1個完整的像素渲染或幾何轉(zhuǎn)換，GPU的像素著色單元和頂點著色單元從一開始就被設(shè)計成為同時具備4次運算能力的算數(shù)邏輯運算器（ALU）。

完美DX10!ATI新王者HD2900XT權(quán)威評測

傳統(tǒng)像素管線/Shader示意圖

數(shù)據(jù)的基本單元是Scalar（標(biāo)量），就是指一個單獨的值，GPU的ALU進(jìn)行一次這種變量操作，被稱做1D標(biāo)量。由于傳統(tǒng)GPU的ALU在一個時鐘周期可以同時執(zhí)行4次這樣的并行運算，所以ALU的操作被稱做4D Vector（矢量）操作。

SIMD架構(gòu)示意圖

一個矢量就是N個標(biāo)量，一般來說絕大多數(shù)圖形指令中N=4。所以，GPU的ALU指令發(fā)射端只有一個，但卻可以同時運算4個通道的數(shù)據(jù)，這就是SIMD（Single Instruction Multiple Data，單指令多數(shù)據(jù)流）架構(gòu)。

● “管線”弊端越發(fā)明顯，引入混合型設(shè)計

顯然，SIMD架構(gòu)能夠有效提升GPU的矢量處理性能，由于頂點和像素的絕大部分運算都是4D Vector，它只需要一個指令端口就能在單周期內(nèi)完成4倍運算量，效率達(dá)到100%。但是4D SIMD架構(gòu)一旦遇到1D標(biāo)量指令時，效率就會下降到原來的1/4，3/4的模塊被完全浪費。為了緩解這個問題，ATI和NVIDIA在進(jìn)入DX9時代后相繼采用混合型設(shè)計，比如R300就采用了3D+1D的架構(gòu)，允許Co-issue操作（矢量指令和標(biāo)量指令可以并行執(zhí)行），NV40以后的GPU支持2D+2D和3D+1D兩種模式，雖然很大程度上緩解了標(biāo)量指令執(zhí)行效率低下的問題，但依然無法最大限度的發(fā)揮ALU運算能力，尤其是一旦遇上分支預(yù)測的情況，SIMD在矢量處理方面高效能的優(yōu)勢將會被損失殆盡。

改進(jìn)的管線/Shader結(jié)構(gòu)

可以這么理解，傳統(tǒng)的1條管線里面包含了4個基本運算單元，在早期這種架構(gòu)的執(zhí)行效率還是很高的，因為大多數(shù)程序指令都是4D的。但由于API和游戲復(fù)雜Shader指令的發(fā)展，4D指令所占比重開始下降，3D/2D/1D等混合指令頻繁出現(xiàn)，所以傳統(tǒng)的管線式架構(gòu)效率越來越低！

1人已贊

第1頁：為什么A卡的流處理器要比N卡多很多第2頁：管線的由來和傳統(tǒng)矢量運算單元的弊端第3頁：G80的標(biāo)量流處理器架構(gòu)第4頁：R600的超標(biāo)量流處理器架構(gòu)第5頁：G92和RV670：核心架構(gòu)沒有任何變化第6頁：GT200架構(gòu)的變化：重組SM結(jié)構(gòu)第7頁：RV770架構(gòu)的變化：脫胎換骨第8頁：RV870架構(gòu)的變化：雙核心設(shè)計第9頁：GF100架構(gòu)改進(jìn)最大，即將發(fā)布敬請期待

国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

流處理器緣何差6倍！A/N GPU架構(gòu)解析

關(guān)注我們

流處理器緣何差6倍！A/N GPU架構(gòu)解析