HD7970脫胎換骨全測(cè)試!5年架構(gòu)大革命
第二章/第十四節(jié) GCN架構(gòu)的緩存:和GF100異曲同工
在流處理器部分,我們看到Tahiti與GF100如此相似,那么接下來(lái)看到緩存設(shè)計(jì)時(shí),您可能會(huì)要驚呼了……看圖說(shuō)話:
Tahiti的緩存結(jié)構(gòu)
Tahiti與GF100緩存的相同之處
先說(shuō)最直觀的,Tahiti有一個(gè)容量為768KB二級(jí)緩存,這個(gè)容量與GF100的L2完全相同,都可以進(jìn)行讀寫操作。
上頁(yè)說(shuō)過(guò),Tahiti的每組GCN陣列擁有16KB的一級(jí)緩存,GF100的SM里面也有16KB的一級(jí)緩存;每組GCN擁有64KB的本地?cái)?shù)據(jù)共享緩存,GF100的每組SM擁有48KB。
Tahiti總共擁有32個(gè)GCN陣列,所以一級(jí)緩存共有512KB,而GF100擁有16個(gè)SM陣列,一級(jí)緩存共有256KB。但別忘了GF100的L1可以是48KB,這樣總共就是768KB了。
Tahiti與GF100緩存的不同之處
雖然Tahiti的緩存層級(jí)設(shè)定與GF100非常相似,但區(qū)別也是有的:
Tahiti的每組GCN需要將16KB一級(jí)緩存當(dāng)作紋理緩存使用,而GF100的每組SM當(dāng)中設(shè)有專用的12KB紋理緩存;
一般來(lái)說(shuō)非圖形渲染不需要用到紋理緩存,而圖形渲染時(shí)又不會(huì)用到一級(jí)緩存,所以Tahiti將一級(jí)緩存與紋理緩存合并的設(shè)計(jì)更優(yōu);但NVIDIA專門設(shè)計(jì)紋理緩存也不是沒(méi)有道理,當(dāng)GPU既渲染圖形又要做計(jì)算時(shí),分離式設(shè)計(jì)的效率會(huì)更高,比如PhysX游戲……A卡不支持所以AMD不會(huì)考慮這種情況。
Tahiti整個(gè)GPU擁有一個(gè)32KB的全局?jǐn)?shù)據(jù)共享緩存,這個(gè)是沿用了Cayman的設(shè)計(jì),但容量減半了,而GF100沒(méi)有這種緩存。全局?jǐn)?shù)據(jù)共享緩存主要用于不同GCN陣列間線程的數(shù)據(jù)交換,這塊緩存只對(duì)編譯器可見,所以使用率較低,容量減半相信也是處于這個(gè)原因。
關(guān)注我們



