性能之王還是不進(jìn)反退,Prescott全
在我們的上一篇文章中,我們已經(jīng)看到AMD K8核心處理器為了進(jìn)一步提升頻率,將流水線級數(shù)由K7的10級增加到了12級。而在Prescott核心的P4處理器中,為了進(jìn)一步提升處理器的頻率,Intel把Trace Cache之后的流水線級數(shù)變本加厲,由以前的20級增加到了30級。這恐怕是此款處理器最引人注目的改變之一了,也因此引來了諸多媒體的議論。
我們都知道,處理器流水線基本可以劃分為:指令取→指令解碼→指令執(zhí)行→載入/儲存→寫回寄存器這五個部分。通過這樣的流水線設(shè)計,就可以在每條流水線上同時處理一條以上的指令。為了敘述方便,我們可以把流水線假想為一組傳送帶,如下圖:
處理器長短流水線示意圖(點擊放大)
短流水線好比節(jié)數(shù)較少,單節(jié)皮帶行程長的模式。它的單節(jié)皮帶負(fù)載能力更大。而長流水線則好比節(jié)數(shù)較多,單節(jié)皮帶行程短的模式。它的單節(jié)皮帶負(fù)載能力較弱。
雖然從長度上看,由于長流水線級數(shù)較多,因此行程也較遠(yuǎn),在皮帶傳送速度相同(均為1M/s)的情況下,當(dāng)然是短流水線占優(yōu)勢。但隨著工廠技術(shù)的發(fā)展,必須提高產(chǎn)量。此時我們就需要提高傳送帶的送貨量。顯然我們可以想到最簡單的方法就是增加皮帶的傳送速度。
然而在短流水線的傳送帶中,由于單節(jié)皮帶較為粗長,本身質(zhì)量較大,因此要進(jìn)一步提速就顯得十分困難(極限速度可提升到1.2M/s)。相比之下長流水線設(shè)計的傳送帶則由于單節(jié)皮帶質(zhì)量小,提速就顯得容易得多(極限速度可提升到2M/s)。這樣我們通過給長流水線傳送帶大幅度提速,在流水線各環(huán)節(jié)同時正常運轉(zhuǎn)的情況下,實現(xiàn)了超越短流水線傳送帶的目的。
顯然,如果在此基礎(chǔ)上進(jìn)一步增加并行傳送帶的組數(shù),構(gòu)成“超標(biāo)量“傳送帶,那么長流水線的速度優(yōu)勢還將得到更好的體現(xiàn)。
由于上述的優(yōu)點,多數(shù)處理器在升級換代時,基本都采取了增加流水線級數(shù)的策略,以下,我們給出Intel公司幾款具有代表性處理器的流水線布置圖,以供大家參考。
Intel系列處理器流水線級數(shù)簡圖(點擊放大)
需要注意的是,P4系列處理器的流水線級數(shù)尚不包括前面的取指令、解碼部分。通過增加流水線的級數(shù),Intel宣稱Prescott核心P4處理器的工作頻率將可達(dá)到5GHz左右。
但是凡事有利必有弊。首先,長流水線的優(yōu)勢必須在提速到達(dá)一定程度之后才能夠體現(xiàn)出來??墒翘幚砥鲝S家在長流水線處理器推出的初期,由于市場等多方面因素,又不可能馬上以較高的頻率推出新處理器。因此,這些處理器在某些條件下自然就會出現(xiàn)不盡人意的情況。其次,Prescott的超長流水線設(shè)計和較高的頻率,也將帶來其它方面的一系列問題。為了減小這些問題可能帶來的損失,在Prescott中,Intel采取了許多措施進(jìn)行補救。下面,我們就進(jìn)一步為大家說明。<
關(guān)注我們


