国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)筆記本頻道 PCPOP首頁(yè)      /      筆記本     /      評(píng)測(cè)    /    正文

處理器革命:二代酷睿處理器性能對(duì)比

二、物理寄存器文件(PRF)和執(zhí)行改進(jìn)

  類似于AMD的推土機(jī)、山貓,Intel SNB也使用了物理寄存器文件。Core 2、Nehalem架構(gòu)中,每個(gè)微指令需要的每個(gè)操作數(shù)都有一份拷貝,這就意味著亂序執(zhí)行硬件(調(diào)度器/重排序緩存/關(guān)聯(lián)隊(duì)列)必須要非常大,以便容納微指令和相關(guān)數(shù)據(jù)。Core Duo時(shí)代是80-bit,加入SSE指令集后增至128-bit,現(xiàn)在又有了AVX指令集,按照趨勢(shì)會(huì)翻番至256-bit。

   RPF在寄存器文件中存儲(chǔ)微指令操作數(shù),而微指令在亂序執(zhí)行引擎中只會(huì)攜帶指向操作數(shù)的指針,而非數(shù)據(jù)本身。這就大大降低了亂序執(zhí)行硬件的功耗(轉(zhuǎn)移大量數(shù)據(jù)很費(fèi)電的),同時(shí)也減小了流水線的核心面積,數(shù)據(jù)流窗口也增大了三分之一。

處理器革命:二代酷睿處理器性能對(duì)比

   核心面積的精簡(jiǎn)正是AVX指令(SNB最主要革新之一)集得以實(shí)現(xiàn)并保證良好性能的關(guān)鍵所在。以最小的核心面積代價(jià),Intel將所有SIMD單元都轉(zhuǎn)向了256-bit。

   AVX支持256-bit操作數(shù),相當(dāng)消耗晶體管與核心面積,而RPF的使用加大了亂序執(zhí)行緩沖,能夠很好地滿足更高吞吐量的浮點(diǎn)引擎。

    Nehalem架構(gòu)中有三個(gè)執(zhí)行端口和三個(gè)執(zhí)行單元堆棧:

    SNB允許256-bit AVX指令借用128-bit的整數(shù)SIMD數(shù)據(jù)路徑,這就使用最小的核心面積實(shí)現(xiàn)了雙倍的浮點(diǎn)吞吐量,每個(gè)時(shí)鐘可以進(jìn)行兩個(gè)256-bit AVX操作。另外執(zhí)行硬件和路徑的上位128-bit是受電源柵極(Power Gate)控制的,標(biāo)準(zhǔn)128-bit SSE操作不會(huì)因?yàn)?56-bit擴(kuò)展而增加功耗。

處理器革命:二代酷睿處理器性能對(duì)比

    AMD推土機(jī)架構(gòu)對(duì)AVX的支持則有所不同,使用了兩個(gè)128-bit SSE路徑來(lái)合并成256-bit AVX操作,即使八核心(四模塊)推土機(jī)的256-bit AVX吞吐量也要比四核心SNB少一半,不過(guò)實(shí)際影響完全取決于應(yīng)用程序如何利用AVX。 SNB的峰值浮點(diǎn)性能翻了一番,這就對(duì)載入和存儲(chǔ)單元提出了更高要求。Nehalem/Westmere架構(gòu)中有三個(gè)載入和存儲(chǔ)端口:載入、存儲(chǔ)地址、存儲(chǔ)數(shù)據(jù)。

   SNB架構(gòu)中載入和存儲(chǔ)地址端口是對(duì)稱的,都可以執(zhí)行載入或者存儲(chǔ)地址,載入帶寬因此翻倍。 SNB的整數(shù)執(zhí)行也有了改進(jìn),只是比較有限。ADC指令吞吐量翻番,乘法運(yùn)算可加速25%。

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注