国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

革命性DX11架構(gòu)!GTX480/470權(quán)威評測

    講完了GPC(內(nèi)含光柵引擎)和SM(內(nèi)含多形體引擎)之后,就輪到了GF100的最小單元——流處理器,現(xiàn)在NVIDIA將它稱為CUDA核心。

第四章/第五節(jié) CUDA核心:第三代流處理器

    論單個CUDA核心,GF100與GT200/G80的基本功能是相同的,沿用了之前的1D標量流處理器設(shè)計,無論程序要求什么類型的指令,都可以通過線程分配器打散之后交給CUDA核心處理,從而保證任何指令都能獲得100%的執(zhí)行效率。

GF100的SM與CUDA結(jié)構(gòu)

    雖說像素和頂點等4D指令依然是主力,但在進入DX10時代后Z緩沖區(qū)(1D)或紋理存?。?D)等非4D指令所占比重越來越多,此時NVIDIA的標量流處理器架構(gòu)處理起來依然如魚得水,但對ATI的5D超標量流處理器架構(gòu)提出了嚴峻的考驗。

CUDA核心的改進:

    每一個CUDA核心都擁有一個完全流水線化的整數(shù)算術(shù)邏輯單元(ALU)以及浮點運算單元(FPU)。GF100采用了最新的IEEE754-2008浮點標準,2008標準的主要改進就是支持多種類型的舍入算法。新標準可以只在最終獲取數(shù)據(jù)時進行四舍五入,而以往的標準是每進行一步運算都要四舍五入一次,最后會產(chǎn)生較大的誤差。

    GF100能夠為32bit單精度和64bit雙精度運算提供FMA(Fused Multiply-Add,積和熔加)指令,而GT200只在64bit時才能提供。FMA不僅適用于高性能計算領(lǐng)域,事實上在渲染緊密重疊的三角形時,新的FMA算法能夠最大限度的減少渲染誤差。

16個載入/存儲單元:

    每一個SM都擁有16個載入/存儲單元,從而在每個時鐘周期內(nèi)均可為16個線程運算源地址與目標地址。支持的單元能夠?qū)⒚總€地址的數(shù)據(jù)載入和存儲到高速緩存或顯存中。

四個特殊功能單元:

    GF100每個SM內(nèi)部還擁有額外的四個SFU(Special Function Units,特殊功能單元),可用于執(zhí)行抽象的指令,例如正弦、余弦、倒數(shù)和平方根,圖形插值指令也在SFU上執(zhí)行。每個SFU在一個時鐘周期內(nèi)針對每個線程均可執(zhí)行一條指令,一個Warp(32個線程)的執(zhí)行時間可超過八個時鐘周期。SFU流水線從分派單元中分離出來,讓分派單元能夠在SFU處于占用狀態(tài)時分發(fā)給其他執(zhí)行單元。復(fù)雜的程序著色器在特殊功能專用硬件上的運行優(yōu)勢尤為明顯。

RV870的Thread Processor結(jié)構(gòu)圖

    而ATI的SFU則需要共享SP資源,在每一個Shader單元內(nèi)部擁有5個流處理器,其中比較“胖”的一個具有SFU的功能,也就是說ATI的架構(gòu)有1/5的流處理器可以零時充當SFU使用。在大量使用特殊函數(shù)運算時,A卡的處理能力會損失不少,而N卡則因為額外的SFU單元輔助效率會更高。

    另外ATI所有的流處理器在執(zhí)行整數(shù)型加、乘指令時僅支持24bit精度,而NVIDIA CUDA核心支持所有整數(shù)指令全32位精度,符合標準編程語言的基本要求。整數(shù)ALU還經(jīng)過了優(yōu)化,可有效支持64位以及更高精度的運算,這一點是對手無法比擬的。

雙Warp調(diào)度器:

    SM可對32個為一組的并行線程(又叫做Warp)進行調(diào)度。每個SM擁有兩個Warp調(diào)度器以及兩個指令分派單元。這樣就能夠同時發(fā)出和執(zhí)行兩個Warp。

    GF100的雙Warp調(diào)度器可選出兩個Warp,從每個Warp發(fā)出一條指令到16個核心、16個載入/存儲單元或4個特殊功能單元。因為Warp是獨立執(zhí)行的,所以GF100的調(diào)度器無需檢查指令流內(nèi)部的依存關(guān)系。通過利用這種優(yōu)秀的雙指令執(zhí)行(Dual-issue)模式,GF100能夠?qū)崿F(xiàn)接近峰值的硬件性能。

    大多數(shù)指令都能夠?qū)崿F(xiàn)雙路執(zhí)行,兩條整數(shù)指令、兩條浮點指令或者整數(shù)、浮點、載入、存儲的混合指令以及SFU指令均可同時執(zhí)行。但雙精度指令不支持與其它指令同時分派。

0人已贊
第1頁:千呼萬喚始出來 GTX480/470終于降臨第2頁:DX10.0大革命:畫面很完美、但速度很慢第3頁:DX10.1小修補:片面追求畫面行不通第4頁:DX11時代來臨:為高效率游戲而生第5頁:DX11特性解讀:Shader Model 5.0第6頁:DX11特性解讀:多線程處理第7頁:DX11特性解讀:兩種新的紋理壓縮格式第8頁:Tessellation:ATI原創(chuàng)技術(shù)但孤掌難鳴第9頁:Tessellation:細分曲面的原理第10頁:Tessellation:DX11中的改進第11頁:Tessellation的妙用:虛假貼圖終結(jié)者第12頁:Tessellation的妙用:隨風飄揚的旗幟第13頁:Tessellation的妙用:波瀾壯闊的水面第14頁:Tessellation的妙用:不可思議的長發(fā)第15頁:DirectCompute與Stream/CUDA/OpenCL第16頁:DirectCompute 10/11版本間的區(qū)別第17頁:DirectCompute11的妙用:順序無關(guān)透明第18頁:DirectCompute11的妙用:電影級景深第19頁:DirectCompute11的妙用:高清晰環(huán)境光第20頁:GF100圖形架構(gòu):絕非新品裝舊酒第21頁:GF100圖形架構(gòu):芯片圖與架構(gòu)圖第22頁:GF100圖形架構(gòu):居然是四核心GPU第23頁:GF100圖形架構(gòu):強大的多形體引擎第24頁:GF100圖形架構(gòu):第三代流處理器第25頁:GF100圖形架構(gòu):紋理單元不升反降?第26頁:GF100圖形架構(gòu):一級緩存與二級緩存第27頁:GF100圖形架構(gòu):光柵單元與高倍抗鋸齒第28頁:Fermi計算架構(gòu):GPU并行計算歷史第29頁:Fermi計算架構(gòu):完全按照客戶需求設(shè)計第30頁:Fermi計算架構(gòu):恐怖的雙精度性能第31頁:Fermi計算架構(gòu):首次支持C++編程第32頁:Fermi計算架構(gòu):首次支持顯存ECC第33頁:Fermi計算架構(gòu):NVIDIA Nexus開發(fā)平臺第34頁:附加功能增強:PhysX物理加速第35頁:增強附加功能:3D立體3屏技術(shù)第36頁:增強附加功能:光線追蹤第37頁:GTX400實物對比:造型一點都不夸張第38頁:GTX480實物:官方藝術(shù)照賞析第39頁:GTX470實物:官方藝術(shù)照賞析第40頁:GTX480實物:外觀和散熱器實拍圖第41頁:GTX480實物:全裸拆解與顯存解析第42頁:GTX480實物:供電模塊全解析第43頁:GTX470實物:外觀與散熱器賞析第44頁:GTX470實物:全裸拆解與供電解析第45頁:首批上市顯卡:七彩虹GTX470第46頁:Demo解析:8800/GTX200 Demo回顧第47頁:Demo解析:Supersonic Sled寓教于樂第48頁:Demo解析:Supersonic Sled物理效果第49頁:Demo解析:RagingRapidsRide第50頁:Demo解析:Island11震撼的水面第51頁:Demo解析:Hair不可思議的長發(fā)第52頁:Demo解析:Design Garage實時光線追蹤第53頁:測試平臺:Core i7 975 + X58豪華配置第54頁:DX10理論測試:《3DMark Vantage》第55頁:DX11理論測試:《Heaven Benchmark》第56頁:DX11游戲:《BattleForge》第57頁:DX11游戲:《STALKER:COP》第58頁:DX11游戲:《塵埃2》第59頁:DX11游戲:《異形大戰(zhàn)鐵血戰(zhàn)士》第60頁:DX11游戲:《戰(zhàn)地:叛逆聯(lián)隊2》第61頁:DX11游戲:《地鐵2033》第62頁:DX10.1游戲:《孤島驚魂2》第63頁:DX10.1游戲:《鷹擊長空》第64頁:DX10游戲:《孤島危機:彈頭》第65頁:DX9C游戲:《使命召喚:現(xiàn)代戰(zhàn)爭2》第66頁:PhysX游戲:《蝙蝠俠》第67頁:微軟DX11 SDK:SUBD11第68頁:微軟DX11 SDK:PN Triangles第69頁:NVIDIA Demo:Island11第70頁:NVIDIA Demo:Hair第71頁:視頻轉(zhuǎn)碼測試:Badaboom第72頁:科學計算測試:Folding Home第73頁:溫度測試:風扇溫控90度開始加速第74頁:功耗測試:先準備600W電源吧第75頁:測試成績匯總:GTX480比GTX470強多少第76頁:測試成績匯總:GTX480 PK HD5870第77頁:測試成績匯總:GTX470 PK HD5850第78頁:GTX480雙卡SLI效率測試第79頁:全文總結(jié)與展望:DX11爭霸賽才剛開始第80頁:首批上市GTX480/470顯卡及有獎互動

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注