冷靜的怪獸!索泰3GB顯存 GTX580評測
如果你是個老鳥,那對GTX480高發(fā)熱高功耗的事兒應(yīng)該還記憶猶新。其實(shí)GTX480屏蔽流處理器的還有一個原因,就是40nm工藝良品率的問題。關(guān)于40nm的良率問題自從AMD邁入40nm工藝制程之后業(yè)界就經(jīng)常有報道,AMD和NVIDIA也都表過態(tài)說受到了這方面的影響,甚至之前有消息說GTX400的合格產(chǎn)品只有20%,最后NVIDIA出于無奈只好屏蔽一組流處理器。
而且,發(fā)布之前NVIDIA雖然口口聲聲說GTX480是史上最完美的芯片,但實(shí)際上他們心里很清楚如果再對工藝進(jìn)行改進(jìn)的話,GPU的運(yùn)算效率還是有提升空間的。一來可以解決良品率的問題,二來還可以提升效率,所以在GTX480發(fā)布之后,NVIDIA和臺積電就開始研究如何改進(jìn)40nm的生產(chǎn)工藝。
● GTX580發(fā)布,不只提升流處理器數(shù)量
在GTX480在質(zhì)疑聲中度過了卡皇歲月之后,NVIDIA發(fā)布了GF100核心的改進(jìn)版本——GF110,直接對應(yīng)的零售產(chǎn)品就是GTX580:
● 流處理器數(shù)量提升
大家已經(jīng)知道,GTX580從某種角度上來說是GTX480的改進(jìn)版本,首先是彌補(bǔ)了GTX480在流處理器數(shù)量上的遺憾,從GTX480的480個流處理器提升到了512個流處理器,這樣在顯卡的3D性能上就有進(jìn)一步的提升。
● 16/48KB動態(tài)分配緩存
GF100/GF110核心的緩存設(shè)計(jì)非常有意思,采用的是L1和共享緩存動態(tài)分配總?cè)萘繛?4KB緩存的設(shè)計(jì),這部分緩存可配置為16KB的一級緩存+48KB共享緩存,或者是48KB一級緩存+16KB共享緩存。這種劃分方式完全是動態(tài)執(zhí)行的,一個時鐘周期之后可自動根據(jù)任務(wù)需要即時切換而不需要程序主動干預(yù)。
一級緩存與共享緩存是互補(bǔ)的,共享緩存能夠?yàn)槊鞔_界定存取數(shù)據(jù)的算法提升存取速度,而一級緩存則能夠?yàn)橐恍┎灰?guī)則的算法提升存儲器存取速度。在這些不規(guī)則算法中,事先并不知道數(shù)據(jù)地址。
● 4個紋理單元
顧名思義,紋理單元就是專門用于渲染3D物體表面紋理的模塊,在圖形紋理越來越復(fù)雜的今天,紋理單元的重要性不言而喻。GTX580因?yàn)橄鄬τ贕TX480增加了一組SM,所以紋理單元數(shù)量也得到了相應(yīng)的增加。
在GF100/110架構(gòu)中,每一組SM中包含4個紋理單元,完整版的核心中一共有16個SM,所以GTX580一共擁有64個紋理單元,而GTX480由于屏蔽了一組SM,所以只有60個紋理單元。
值得一提的是,GF100/110架構(gòu)中的紋理單元直接集成到了SM內(nèi)部,且每組SM中擁有獨(dú)立的紋理緩存(4個紋理單元共享這部分獨(dú)立的紋理緩存),這樣的設(shè)計(jì)打破了之前紋理單元一直被設(shè)計(jì)在SM外圍的傳統(tǒng),有效的提升了紋理效率。雖然從紋理單元的數(shù)量方面來說看起來比GT200架構(gòu)還少,但實(shí)際效率卻高很多。
關(guān)注我們



