風(fēng)雨歷程 AMD一路走來(lái)帶給我們什么?
● 核心緩存增加到1MB,處理器性能將提升15%
首先,我們應(yīng)該明白高速緩存的作用。就好比隨著處理器速度的提升,必須配套速度更快的內(nèi)存一樣,內(nèi)存尋址的延時(shí)會(huì)阻礙高速處理器性能的發(fā)揮,由此處理器很多時(shí)候都是空閑的。而增加處理器中的高速緩存的容量可以使處理器持續(xù)獲得信息數(shù)據(jù),保證處理器能夠連續(xù)工作。在hammer的體系結(jié)構(gòu)中,僅僅存在非常小的存儲(chǔ)器延時(shí)的情況,因此hammer的高速緩存要少于其他x86架構(gòu)。

從圖中能夠看到,當(dāng)二級(jí)緩存從256KB增加到1MB的時(shí)候,處理器僅僅有15%的性能提升。如果將二級(jí)緩存的容量增加到512KB,會(huì)提升處理器7~8%的性能。如果使用現(xiàn)在的工藝技術(shù),集成512KB的二級(jí)緩存,處理器的核心大約是140~150平方毫米。集成256KB二級(jí)緩存的處理器核心大約是104平方毫米。如果集成1MB二級(jí)緩存處理器的核心會(huì)驟然上升到180平方毫米。由此在低端市場(chǎng)集成256KB的二級(jí)緩存能夠大大降低生產(chǎn)成本,而相對(duì)又損失了較小的性能。
● 將緩存區(qū)提升4倍的分支預(yù)測(cè)系統(tǒng)結(jié)構(gòu)
為了避免過(guò)多的性能損失AMD從很多方面入手提高K8 hammer的執(zhí)行效率。AMD重新改進(jìn)了分支預(yù)測(cè)單元(BPU)。這種新的分支預(yù)測(cè)單元,將采用更為復(fù)雜的預(yù)測(cè)算法。在K8 hammer的分支預(yù)測(cè)單元中主要加入了名為“全歷史緩沖器”的緩沖機(jī)制。(global history counter buffer)相對(duì)于Athlon處理器中的緩沖器足足大了4倍。使用如此大的緩沖器,可以使處理器保存更多的預(yù)測(cè)結(jié)果,從而提高了分支預(yù)測(cè)的命中率。然而這些修正顯然是不夠的。在分支預(yù)測(cè)單元中AMD還加入了BAC分支地址計(jì)算器(branch address calculator)。BAC可以在5個(gè)時(shí)鐘周期內(nèi)準(zhǔn)確的計(jì)算出下一條分支的地址信息。直到計(jì)算出精確的分支地址BAC才會(huì)處于閑置狀態(tài),然而此時(shí)處理器正在并行運(yùn)算兩個(gè)程序分支,因此處理器始終處于全負(fù)荷工作狀態(tài)。應(yīng)當(dāng)指出AMD認(rèn)為改善分支預(yù)測(cè)的能力,要優(yōu)于處理器可以并行處理幾個(gè)代碼的能力。
關(guān)注我們


