国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

GTX680架構(gòu)解析 GPU版開普勒三大定律

    最后再來看看開普勒架構(gòu)在其它方面的改進(jìn):

多形體引擎2.0:

    從GTX480開始,NVIDIA就宣稱只有自己“做對了DX11”,因為GF100核心擁有多達(dá)16個多形體引擎,每個多形體引擎內(nèi)部都有獨(dú)立的曲面細(xì)分單元,而HD5870整顆Cypress核心只有1個曲面細(xì)分單元。通過專項測試來看,GTX480的曲面細(xì)分和幾何性能都遙遙領(lǐng)先于HD5870。

GTX680架構(gòu)解析:GPU版開普勒三大定律

    AMD方面當(dāng)然也意識到了孽弱的曲面細(xì)分性能是個瓶頸,一方面強(qiáng)調(diào)“曲面沒必要分太細(xì)”,另一方面也在新一代產(chǎn)品中不斷的加強(qiáng)曲面細(xì)分性能。根據(jù)AMD官方的說法,HD6870通過雙超線程分配處理器將中等程度的曲面細(xì)分性能提高了2倍;HD6970通過雙圖形引擎又提升了2倍;而HD7970則重新設(shè)計了曲面細(xì)分單元,在所有等級下都可以達(dá)到HD6970的4倍!最終HD7970的曲面細(xì)分能力相比HD5870提升了10倍左右!

    在AMD不斷更新架構(gòu)的同時,NVIDIA的DX11 GPU沒有變化(GF110和GF100是一樣的),顯然HD7970的曲面細(xì)分性能已經(jīng)超越了GTX580。這次該NVIDIA著急了。

GTX680架構(gòu)解析:GPU版開普勒三大定律

    在開普勒架構(gòu)中,我們看到了多形體引擎2.0版,結(jié)構(gòu)上沒有什么變化,但處理能力翻倍了。NVIDIA稱,Kepler的多形體引擎在同頻率下的性能是Fermi的兩倍,而且新引擎在重度曲面細(xì)分情況下的效率更高,性能損失更小。

GTX680架構(gòu)解析:GPU版開普勒三大定律

DX11理論曲面性能性能測試,橫軸為細(xì)分級別

    值得注意的是,GK104只有8個多形體引擎,而GF110有16個多形體引擎,但最終GTX680的曲面細(xì)分性能比GTX580還要強(qiáng),看來單個引擎的效能確實翻倍了,超出那部分的性能應(yīng)該是高達(dá)1GHz頻率的貢獻(xiàn)。

    可以看出,NVIDIA的曲面細(xì)分單元在重度細(xì)分模式下的效率更好一些,低級別模式下HD7970并不差還略占優(yōu)勢,但級別越高差距就越大。根據(jù)目前DX11游戲的發(fā)展趨勢來看,“曲面沒必要分太細(xì)”的說法已經(jīng)過時,不然AMD也就成倍的增加曲面細(xì)分性能了,未來的DX11游戲會加入高精度曲面細(xì)分引擎,屆時N卡的優(yōu)勢會得到體現(xiàn)。

更快的高速緩存:

    GK104的緩存設(shè)計與GF100沒有區(qū)別,都是一級緩存、一級紋理緩存、二級緩存這樣的層級設(shè)計,而且緩存容量的配比也沒有變化,但因為模塊化設(shè)計的關(guān)系,總?cè)萘坑兴鶞p少。

緩存架構(gòu)讓各流水線之間可以高效地通信,減少了顯存讀寫操作

    GK104的每個SMX當(dāng)中配有64KB的Shared Memory/L1,GK104總共擁有8個SMX,所以一級緩存的總?cè)萘渴?12KB。

    GK104的每個光柵單元/64bit顯存控制器配有128KB的L2,GK104總共有4個64bit顯存控制器,所以二級緩存的總?cè)萘恳彩?12KB。

    與GF100的1MB一級緩存、768KB的二級緩存相比,GK104的緩存容量確實小了很多,這個可以通過芯片透視圖明顯的看出。

    雖然緩存容量變小了,但速度快了很多,NVIDIA強(qiáng)調(diào)GK104的L2帶寬比GF110增加了73%,其中改進(jìn)的算法提高了30%的緩存命中率,另外的43%則是得益于高達(dá)1GHz的核心頻率。此外,原子操作的吞吐量也大增3.5倍,尤其是單一共享地址的原子操作可提升11.7倍之多!

更多的紋理單元:

    GK104的每個SMX內(nèi)部擁有16個紋理單元,8個SMX總計128個紋理單元;GF110的每個SM內(nèi)部擁有4個紋理單元,16個SM總計64個紋理單元;可以看出GK104這次大幅增加CUDA核心數(shù)量的同時,也沒有忘記紋理單元。

GTX680架構(gòu)解析:GPU版開普勒三大定律

    除了數(shù)量翻倍之外,紋理存取的限制也放開了,以前因為DX11 API的限制,GPU最多只能對128個紋理進(jìn)行操作,而現(xiàn)在GK104可以使用超過100萬像素的紋理貼圖,而且可以并行的對多個紋理同時操作,在使用超大紋理時的CPU占用率大幅下降。但由于微軟DirectX API的限制,目前GK104的這些特性還只能在OpenGL API中體現(xiàn),未來版本的DirectX可能會加入支持。

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注