国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

革命性DX11架構(gòu)!GTX480/470權(quán)威評測

第五章/第四節(jié) Fermi計(jì)算架構(gòu):首次支持C++

    Fermi是第一個(gè)支持新并行線程執(zhí)行(PTX)2.0指令集的體系結(jié)構(gòu)。PTX是級別較低的虛擬機(jī)和ISA,目的是為了支持并行線程處理器的運(yùn)作。在程序安裝的時(shí)候,PTX指令會被GPU驅(qū)動轉(zhuǎn)譯成機(jī)器代碼。

    PTX的主要目標(biāo)包括:

1. 提供一個(gè)能跨越數(shù)代GPU的穩(wěn)定ISA
2. 讓經(jīng)過編譯的應(yīng)用程序充分利用GPU的性能
3. 提供一個(gè)支持 C、C++、Fortran以及其他編譯器對象并且與機(jī)器無關(guān)的ISA
4. 為應(yīng)用程序和中間件開發(fā)者提供一個(gè)代碼分發(fā)ISA
5. 為優(yōu)化映射PTX 代碼至對象機(jī)器的代碼產(chǎn)生器和轉(zhuǎn)移器提供一個(gè)一般化的ISA
6. 讓庫以及性能核心程序(performance kernel)代碼編寫更容易
7. 提供一個(gè)可以跨越GPU內(nèi)核規(guī)模(從幾個(gè)到多個(gè))的可伸縮編程模型

    PTX2.0具備許多新的特性,大大提升了GPU(圖形處理器)的可編程性、精度及性能。這些特性包括:完全的IEEE 32位浮點(diǎn)精度;所有變量和指針都有統(tǒng)一的尋址空間;64位尋址;以及針對OpenCL和DirectCompute的新指令。尤為重要的是,PTX2.0完全支持C++編程語言。

統(tǒng)一尋址空間實(shí)現(xiàn)完全的C++支持

    Fermi和PTX 2.0 ISA采用統(tǒng)一的尋址空間,將存取操作的三個(gè)不同的尋址空間(線程的私有局部空間、線程塊的共用空間、全局空間)進(jìn)行了統(tǒng)一。在PTX 1.0中,存取指令都具體對應(yīng)這三個(gè)尋址空間中的一個(gè),程序就可以在一個(gè)編譯時(shí)確知的指定尋址空間中存取數(shù)值。這樣很難為C和C++指針提供完全的支持,因?yàn)橐粋€(gè)指針的目標(biāo)尋址空間在編譯時(shí)可能根本無從知曉而只有在運(yùn)行時(shí)才能動態(tài)確定。

    PTX 2.0把三個(gè)尋址空間都統(tǒng)一為一個(gè)單獨(dú)、連續(xù)的尋址空間,因此只需一套存取指令,而不再需要三套針對不同尋址空間(局部的、共用的及全局存儲器)的存取指令。統(tǒng)一尋址空間為40位,可以支持1 Terabyte的可設(shè)定地址的內(nèi)存,而存取ISA支持64位以適應(yīng)未來的增長。

    采用統(tǒng)一的尋址空間讓Fermi可以真正支持C++程序。在C++中,所有的變量和函數(shù)都存在于對象中,而對象又通過指針進(jìn)行傳遞。有了PTX 2.0,就可以利用統(tǒng)一的指針傳遞任意存儲空間里的對象。Fermi的硬件地址轉(zhuǎn)譯單元自動將指針參考映射到正確的存儲空間。

    Fermi和PTX 2.0 ISA還支持C++虛擬函數(shù)、函數(shù)指針、針對動態(tài)對象分配、解除分配的“new”和“delete”操作以及針對異常處理的“try”和“catch” 操作。

針對OpenCL和DirectCompute的優(yōu)化

    OpenCL及DirectCompute同CUDA的編程模型有非常密切的對應(yīng)關(guān)系,CUDA里的線程、線程塊、線程塊格、障柵同步、共用存儲器、全局存儲器以及原子操作都能在OpenCL和DirectCompute中看到,可以說OpenCL和DirectCompute的整個(gè)框架就是照搬CUDA的,因此基于CUDA的Fermi天生就已經(jīng)為OpenCL和DirectCompute提供了優(yōu)化。

    此外,F(xiàn)ermi還為OpenCL和DirectCompute的表面(surface)格式轉(zhuǎn)換指令提供了硬件支持,允許圖形與計(jì)算程序能簡單地對相同的數(shù)據(jù)進(jìn)行操作。PTX 2.0 ISA還為DirectCompute提供了population count、append以及bit-reverse 指令的支持。

0人已贊
第1頁:千呼萬喚始出來 GTX480/470終于降臨第2頁:DX10.0大革命:畫面很完美、但速度很慢第3頁:DX10.1小修補(bǔ):片面追求畫面行不通第4頁:DX11時(shí)代來臨:為高效率游戲而生第5頁:DX11特性解讀:Shader Model 5.0第6頁:DX11特性解讀:多線程處理第7頁:DX11特性解讀:兩種新的紋理壓縮格式第8頁:Tessellation:ATI原創(chuàng)技術(shù)但孤掌難鳴第9頁:Tessellation:細(xì)分曲面的原理第10頁:Tessellation:DX11中的改進(jìn)第11頁:Tessellation的妙用:虛假貼圖終結(jié)者第12頁:Tessellation的妙用:隨風(fēng)飄揚(yáng)的旗幟第13頁:Tessellation的妙用:波瀾壯闊的水面第14頁:Tessellation的妙用:不可思議的長發(fā)第15頁:DirectCompute與Stream/CUDA/OpenCL第16頁:DirectCompute 10/11版本間的區(qū)別第17頁:DirectCompute11的妙用:順序無關(guān)透明第18頁:DirectCompute11的妙用:電影級景深第19頁:DirectCompute11的妙用:高清晰環(huán)境光第20頁:GF100圖形架構(gòu):絕非新品裝舊酒第21頁:GF100圖形架構(gòu):芯片圖與架構(gòu)圖第22頁:GF100圖形架構(gòu):居然是四核心GPU第23頁:GF100圖形架構(gòu):強(qiáng)大的多形體引擎第24頁:GF100圖形架構(gòu):第三代流處理器第25頁:GF100圖形架構(gòu):紋理單元不升反降?第26頁:GF100圖形架構(gòu):一級緩存與二級緩存第27頁:GF100圖形架構(gòu):光柵單元與高倍抗鋸齒第28頁:Fermi計(jì)算架構(gòu):GPU并行計(jì)算歷史第29頁:Fermi計(jì)算架構(gòu):完全按照客戶需求設(shè)計(jì)第30頁:Fermi計(jì)算架構(gòu):恐怖的雙精度性能第31頁:Fermi計(jì)算架構(gòu):首次支持C++編程第32頁:Fermi計(jì)算架構(gòu):首次支持顯存ECC第33頁:Fermi計(jì)算架構(gòu):NVIDIA Nexus開發(fā)平臺第34頁:附加功能增強(qiáng):PhysX物理加速第35頁:增強(qiáng)附加功能:3D立體3屏技術(shù)第36頁:增強(qiáng)附加功能:光線追蹤第37頁:GTX400實(shí)物對比:造型一點(diǎn)都不夸張第38頁:GTX480實(shí)物:官方藝術(shù)照賞析第39頁:GTX470實(shí)物:官方藝術(shù)照賞析第40頁:GTX480實(shí)物:外觀和散熱器實(shí)拍圖第41頁:GTX480實(shí)物:全裸拆解與顯存解析第42頁:GTX480實(shí)物:供電模塊全解析第43頁:GTX470實(shí)物:外觀與散熱器賞析第44頁:GTX470實(shí)物:全裸拆解與供電解析第45頁:首批上市顯卡:七彩虹GTX470第46頁:Demo解析:8800/GTX200 Demo回顧第47頁:Demo解析:Supersonic Sled寓教于樂第48頁:Demo解析:Supersonic Sled物理效果第49頁:Demo解析:RagingRapidsRide第50頁:Demo解析:Island11震撼的水面第51頁:Demo解析:Hair不可思議的長發(fā)第52頁:Demo解析:Design Garage實(shí)時(shí)光線追蹤第53頁:測試平臺:Core i7 975 + X58豪華配置第54頁:DX10理論測試:《3DMark Vantage》第55頁:DX11理論測試:《Heaven Benchmark》第56頁:DX11游戲:《BattleForge》第57頁:DX11游戲:《STALKER:COP》第58頁:DX11游戲:《塵埃2》第59頁:DX11游戲:《異形大戰(zhàn)鐵血戰(zhàn)士》第60頁:DX11游戲:《戰(zhàn)地:叛逆聯(lián)隊(duì)2》第61頁:DX11游戲:《地鐵2033》第62頁:DX10.1游戲:《孤島驚魂2》第63頁:DX10.1游戲:《鷹擊長空》第64頁:DX10游戲:《孤島危機(jī):彈頭》第65頁:DX9C游戲:《使命召喚:現(xiàn)代戰(zhàn)爭2》第66頁:PhysX游戲:《蝙蝠俠》第67頁:微軟DX11 SDK:SUBD11第68頁:微軟DX11 SDK:PN Triangles第69頁:NVIDIA Demo:Island11第70頁:NVIDIA Demo:Hair第71頁:視頻轉(zhuǎn)碼測試:Badaboom第72頁:科學(xué)計(jì)算測試:Folding Home第73頁:溫度測試:風(fēng)扇溫控90度開始加速第74頁:功耗測試:先準(zhǔn)備600W電源吧第75頁:測試成績匯總:GTX480比GTX470強(qiáng)多少第76頁:測試成績匯總:GTX480 PK HD5870第77頁:測試成績匯總:GTX470 PK HD5850第78頁:GTX480雙卡SLI效率測試第79頁:全文總結(jié)與展望:DX11爭霸賽才剛開始第80頁:首批上市GTX480/470顯卡及有獎互動

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注