国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

革命性DX11架構(gòu)!GTX480/470權(quán)威評測

第四章/第七節(jié) GF100圖形架構(gòu):一級緩存與二級緩存

    GF100核心擁有很多種類的緩存,他們的用途不盡相同,其中一級緩存、共享緩存和紋理緩存位于SM內(nèi)部,二級緩存則是獨立的一塊,與光柵單元及顯存控制器相連。

64KB可配置共享緩存與一級高速緩存

    以往的GPU都是沒有一級緩存的,只有一級紋理緩存,因為這些緩存無法在通用計算中用于存儲計算數(shù)據(jù),只能用于在紋理采樣時暫存紋理。而在GF100當中,NVIDIA首次引入真正的一級高速緩存,而且還可被動態(tài)的劃分為共享緩存。

    在GF100 GPU中,每個SM除了擁有專用的紋理緩存外,還擁有64KB容量的片上緩存,這部分緩存可配置為16KB的一級緩存+48KB共享緩存,或者是48KB一級緩存+16KB共享緩存。這種劃分方式完全是動態(tài)執(zhí)行的,一個時鐘周期之后可自動根據(jù)任務(wù)需要即時切換而不需要程序主動干預(yù)。

    一級緩存與共享緩存是互補的,共享緩存能夠為明確界定存取數(shù)據(jù)的算法提升存取速度,而一級緩存則能夠為一些不規(guī)則的算法提升存儲器存取速度。在這些不規(guī)則算法中,事先并不知道數(shù)據(jù)地址。

    對于圖形渲染來說,重復(fù)或者固定的數(shù)據(jù)比較多,因此一般是劃分48KB為共享緩存,當然剩下的16KB一級緩存也不是完全沒用,它可以充當寄存器溢出的緩沖區(qū),讓寄存器能夠?qū)崿F(xiàn)不俗的性能提升。

    而在并行計算之中,一級緩存與共享緩存同樣重要,它們可以讓同一個線程塊中的線程能夠互相協(xié)作,從而促進了片上數(shù)據(jù)廣泛的重復(fù)利用并減少了片外的通信量。共享存儲器是使許多高性能CUDA應(yīng)用程序成為可能的重要促成因素。

共享式級高速緩存

    GF100擁有一個768KB容量統(tǒng)一的二級高速緩存,該緩存可以為所有載入、存儲以及紋理請求提供服務(wù)。二級緩存可在整個GPU中提供高效、高速的數(shù)據(jù)共享。物理效果、光線追蹤以及稀疏數(shù)據(jù)結(jié)構(gòu)等事先不知道數(shù)據(jù)地址的算法在硬件高速緩存上的運行優(yōu)勢尤為明顯。后期處理過濾器需要多個SM才能讀取相同的數(shù)據(jù),該過濾器與存儲器之間的距離更短,從而提升了帶寬效率。

    統(tǒng)一的共享式緩存比單獨的緩存效率更高。在獨享式緩存設(shè)計中,即使同一個緩存被多個指令預(yù)訂,它也無法使用其它緩存中未貼圖的部分。高速緩存的利用率將遠低于它的理論帶寬。GF100的統(tǒng)一共享式二級高速緩存可在不同請求之間動態(tài)地平衡負載,從而充分地利用緩存。二級高速緩存取代了之前GPU中的二級紋理緩存、ROP緩存以及片上FIFO。

GF100的緩存架構(gòu)讓各流水線之間可以高效地通信,減少了顯存讀寫操作

    統(tǒng)一的高速緩存還能夠確保存儲器按照程序的順序執(zhí)行存取指令。當讀、寫路徑分離(例如一個只讀紋理路徑以及一個只寫ROP路徑)時,可能會出現(xiàn)先寫后讀的危險。一個統(tǒng)一的讀/寫路徑能夠確保程序的正確運行,同時也是讓NVIDIA GPU能夠支持通用C/C++程序的重要因素。

    與只讀的GT200二級緩存相比,GF100的二級高速緩存既能讀又能寫,
而且是完全一致的。NVIDIA采用了一種優(yōu)先算法來清除二級緩存中的數(shù)據(jù),這種算法包含了各種檢查,可幫助確保所需的數(shù)據(jù)能夠駐留在高速緩存當中。

ATI的一二級緩存設(shè)計:

    我們再來看看ATI的緩存設(shè)計,其中一級緩存部分與NVIDIA類似,每組SIMD陣列擁有32KB的本地共享緩存和8KB的一級紋理緩存,在通用計算中紋理單元可用于負責數(shù)據(jù)拾取,這樣與SIMD捆綁在一起的4個紋理單元可共享8KB的一級緩存。

    RV870總共擁有20組SIMD陣列,這樣總共就是160KB的一級(紋理)緩存和640KB的共享緩存。而GF100則擁有1024KB的可動態(tài)配置的一級緩存+共享緩存,不但容量更大而且效率更高。

    二級緩存部分與GT200/G80的設(shè)計相同,L2與顯存控制器綁定在了一起,每個64bit顯存控制器獨享128KB L2,四個就是512KB。而GF100擁有單塊768KB完全共享的二級緩存,同樣是容量更大效率更高。

    可以看出,ATI的一二級緩存都是完全分散的,為了協(xié)調(diào)一二級緩存之間的數(shù)據(jù)交換,ATI特意設(shè)計了一個可全局共享的64KB數(shù)據(jù)緩存。至于獨享式緩存與共享式緩存的效率與性能,無需多言,大家可參照CPU的發(fā)展即可略知一二。

0人已贊
第1頁:千呼萬喚始出來 GTX480/470終于降臨第2頁:DX10.0大革命:畫面很完美、但速度很慢第3頁:DX10.1小修補:片面追求畫面行不通第4頁:DX11時代來臨:為高效率游戲而生第5頁:DX11特性解讀:Shader Model 5.0第6頁:DX11特性解讀:多線程處理第7頁:DX11特性解讀:兩種新的紋理壓縮格式第8頁:Tessellation:ATI原創(chuàng)技術(shù)但孤掌難鳴第9頁:Tessellation:細分曲面的原理第10頁:Tessellation:DX11中的改進第11頁:Tessellation的妙用:虛假貼圖終結(jié)者第12頁:Tessellation的妙用:隨風飄揚的旗幟第13頁:Tessellation的妙用:波瀾壯闊的水面第14頁:Tessellation的妙用:不可思議的長發(fā)第15頁:DirectCompute與Stream/CUDA/OpenCL第16頁:DirectCompute 10/11版本間的區(qū)別第17頁:DirectCompute11的妙用:順序無關(guān)透明第18頁:DirectCompute11的妙用:電影級景深第19頁:DirectCompute11的妙用:高清晰環(huán)境光第20頁:GF100圖形架構(gòu):絕非新品裝舊酒第21頁:GF100圖形架構(gòu):芯片圖與架構(gòu)圖第22頁:GF100圖形架構(gòu):居然是四核心GPU第23頁:GF100圖形架構(gòu):強大的多形體引擎第24頁:GF100圖形架構(gòu):第三代流處理器第25頁:GF100圖形架構(gòu):紋理單元不升反降?第26頁:GF100圖形架構(gòu):一級緩存與二級緩存第27頁:GF100圖形架構(gòu):光柵單元與高倍抗鋸齒第28頁:Fermi計算架構(gòu):GPU并行計算歷史第29頁:Fermi計算架構(gòu):完全按照客戶需求設(shè)計第30頁:Fermi計算架構(gòu):恐怖的雙精度性能第31頁:Fermi計算架構(gòu):首次支持C++編程第32頁:Fermi計算架構(gòu):首次支持顯存ECC第33頁:Fermi計算架構(gòu):NVIDIA Nexus開發(fā)平臺第34頁:附加功能增強:PhysX物理加速第35頁:增強附加功能:3D立體3屏技術(shù)第36頁:增強附加功能:光線追蹤第37頁:GTX400實物對比:造型一點都不夸張第38頁:GTX480實物:官方藝術(shù)照賞析第39頁:GTX470實物:官方藝術(shù)照賞析第40頁:GTX480實物:外觀和散熱器實拍圖第41頁:GTX480實物:全裸拆解與顯存解析第42頁:GTX480實物:供電模塊全解析第43頁:GTX470實物:外觀與散熱器賞析第44頁:GTX470實物:全裸拆解與供電解析第45頁:首批上市顯卡:七彩虹GTX470第46頁:Demo解析:8800/GTX200 Demo回顧第47頁:Demo解析:Supersonic Sled寓教于樂第48頁:Demo解析:Supersonic Sled物理效果第49頁:Demo解析:RagingRapidsRide第50頁:Demo解析:Island11震撼的水面第51頁:Demo解析:Hair不可思議的長發(fā)第52頁:Demo解析:Design Garage實時光線追蹤第53頁:測試平臺:Core i7 975 + X58豪華配置第54頁:DX10理論測試:《3DMark Vantage》第55頁:DX11理論測試:《Heaven Benchmark》第56頁:DX11游戲:《BattleForge》第57頁:DX11游戲:《STALKER:COP》第58頁:DX11游戲:《塵埃2》第59頁:DX11游戲:《異形大戰(zhàn)鐵血戰(zhàn)士》第60頁:DX11游戲:《戰(zhàn)地:叛逆聯(lián)隊2》第61頁:DX11游戲:《地鐵2033》第62頁:DX10.1游戲:《孤島驚魂2》第63頁:DX10.1游戲:《鷹擊長空》第64頁:DX10游戲:《孤島危機:彈頭》第65頁:DX9C游戲:《使命召喚:現(xiàn)代戰(zhàn)爭2》第66頁:PhysX游戲:《蝙蝠俠》第67頁:微軟DX11 SDK:SUBD11第68頁:微軟DX11 SDK:PN Triangles第69頁:NVIDIA Demo:Island11第70頁:NVIDIA Demo:Hair第71頁:視頻轉(zhuǎn)碼測試:Badaboom第72頁:科學(xué)計算測試:Folding Home第73頁:溫度測試:風扇溫控90度開始加速第74頁:功耗測試:先準備600W電源吧第75頁:測試成績匯總:GTX480比GTX470強多少第76頁:測試成績匯總:GTX480 PK HD5870第77頁:測試成績匯總:GTX470 PK HD5850第78頁:GTX480雙卡SLI效率測試第79頁:全文總結(jié)與展望:DX11爭霸賽才剛開始第80頁:首批上市GTX480/470顯卡及有獎互動

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注