性能之王還是不進反退,Prescott全
在我們的上一篇文章中,我們已經看到AMD K8核心處理器為了進一步提升頻率,將流水線級數由K7的10級增加到了12級。而在Prescott核心的P4處理器中,為了進一步提升處理器的頻率,Intel把Trace Cache之后的流水線級數變本加厲,由以前的20級增加到了30級。這恐怕是此款處理器最引人注目的改變之一了,也因此引來了諸多媒體的議論。
我們都知道,處理器流水線基本可以劃分為:指令取→指令解碼→指令執行→載入/儲存→寫回寄存器這五個部分。通過這樣的流水線設計,就可以在每條流水線上同時處理一條以上的指令。為了敘述方便,我們可以把流水線假想為一組傳送帶,如下圖:
處理器長短流水線示意圖(點擊放大)
短流水線好比節數較少,單節皮帶行程長的模式。它的單節皮帶負載能力更大。而長流水線則好比節數較多,單節皮帶行程短的模式。它的單節皮帶負載能力較弱。
雖然從長度上看,由于長流水線級數較多,因此行程也較遠,在皮帶傳送速度相同(均為1M/s)的情況下,當然是短流水線占優勢。但隨著工廠技術的發展,必須提高產量。此時我們就需要提高傳送帶的送貨量。顯然我們可以想到最簡單的方法就是增加皮帶的傳送速度。
然而在短流水線的傳送帶中,由于單節皮帶較為粗長,本身質量較大,因此要進一步提速就顯得十分困難(極限速度可提升到1.2M/s)。相比之下長流水線設計的傳送帶則由于單節皮帶質量小,提速就顯得容易得多(極限速度可提升到2M/s)。這樣我們通過給長流水線傳送帶大幅度提速,在流水線各環節同時正常運轉的情況下,實現了超越短流水線傳送帶的目的。
顯然,如果在此基礎上進一步增加并行傳送帶的組數,構成“超標量“傳送帶,那么長流水線的速度優勢還將得到更好的體現。
由于上述的優點,多數處理器在升級換代時,基本都采取了增加流水線級數的策略,以下,我們給出Intel公司幾款具有代表性處理器的流水線布置圖,以供大家參考。
Intel系列處理器流水線級數簡圖(點擊放大)
需要注意的是,P4系列處理器的流水線級數尚不包括前面的取指令、解碼部分。通過增加流水線的級數,Intel宣稱Prescott核心P4處理器的工作頻率將可達到5GHz左右。
但是凡事有利必有弊。首先,長流水線的優勢必須在提速到達一定程度之后才能夠體現出來??墒翘幚砥鲝S家在長流水線處理器推出的初期,由于市場等多方面因素,又不可能馬上以較高的頻率推出新處理器。因此,這些處理器在某些條件下自然就會出現不盡人意的情況。其次,Prescott的超長流水線設計和較高的頻率,也將帶來其它方面的一系列問題。為了減小這些問題可能帶來的損失,在Prescott中,Intel采取了許多措施進行補救。下面,我們就進一步為大家說明。<
關注我們


