三級緩存威力多大?AMD羿龍家族大對比
[泡泡網(wǎng)評測室2月24日] 處理器的緩存大小,一直都是CPU廠商定位產(chǎn)品的標準。老大Intel依靠工藝優(yōu)勢,竟然在同一時間段中將CPU依靠緩存大小劃分出了7種等級,涵蓋了中高低端整個市場(詳見“多大緩存夠用?酷睿2家族6大系列橫評”一文)。而AMD因為核心架構(gòu)和工藝原因,并不能隨心所欲劃分緩存大小,導(dǎo)致產(chǎn)品線相對單一,在市場細分中不能占得先機。

市場中沒有永遠的落后者,當AMD進入45nm時代,Phenom II的到來,AMD也能通過核心數(shù)量和緩存的搭配,設(shè)計出定位不同市場的CPU。
縱觀AMD Phenom處理器的發(fā)展,核心架構(gòu)的改進相對有限,而三級緩存的變化是最直觀的。從早期Phenom的2MB三級緩存,猛增至Phenom II的6MB三級緩存,而為了市場的需要,又推出了采用Phenom II架構(gòu)但沒有三級緩存的Athlon X4。而AMD處理器獨有的雙核、三核、四核架構(gòu),加上緩存的不同搭配,一時間,AMD處理器呈現(xiàn)出門丁興旺的景象。

對于AMD的用戶來說,多是追求性價比的用戶,而現(xiàn)在AMD處理器這樣的現(xiàn)象,對用戶即是好事也是壞事,好是用戶的選擇更多了,壞的是用戶對CPU的選擇無所適從。而細細觀察,AMD處理器百龍爭寵的現(xiàn)象,無外乎是核心與緩存搭配的結(jié)果。那么,究竟核心數(shù)量還是緩存大小對性能影響大,用戶花高價格買四核值不值?緩存和核心的平衡點在哪里?本文將對此進行深入研究。
為讓評測文章更具參考價值,同時也讓廣大網(wǎng)友能夠看到自己最感興趣的內(nèi)容,泡泡網(wǎng)DIY評測室特意開設(shè)了“You Think.I do”板塊,您可以將最感興趣的內(nèi)容、甚至任何想法發(fā)送到郵箱“Think@PCPOP.COM”,一旦您的建議被采納,在評測文章發(fā)布之日我們會為您送出精美禮物一份!
與65nm Phenom相比,新一代45nm Phenom II最大的變化就是升級到了45nm SOI沉浸式光刻生產(chǎn)工藝,好處就是主頻更高、功耗更低、集成度更高,特別是三級緩存從2MB猛增到了6MB!

三級緩存翻了三番,自然需要付出一定的代價,通過Phenom和Phenom II芯片示意圖的對比,我們就能略知一二了:

Phenom一代:淺藍色為單個核心與其二級緩存,粉紅色為共享三級緩存。
Brcelona/Agena集成了4.68億個晶體管,核心(Die)面積大約285平方毫米,Shanghai/Deneb的晶體管增加了62%,多達7.58億個,但核心面積卻減小了9.5%,只有258平方毫米,新工藝的好處可見一斑。

Phenom二代:淺藍色為單個核心與其二級緩存,粉紅色為共享三級緩存。
晶體管數(shù)量增加如此之多主要就是因為三級緩存的大幅擴容,這部分在整個核心里的面積比例也從大約六分之一提高到了足有三分之一。
<
關(guān)于三級緩存,AMD的態(tài)度是:
- 第一,三級緩存容量在服務(wù)器領(lǐng)域的作用更明顯,不過如果服務(wù)器和桌面處理器采用不同的架構(gòu),必然會提高生產(chǎn)難度和成本,故而帶到了桌面上;
- 第二,在桌面上,三級緩存從2MB增加到6MB可以帶來大約5%的性能提升,實際測試也證明了這一點;
- 第三,從前邊的數(shù)據(jù)看出,三級緩存增加了兩倍,但得益于生產(chǎn)工藝的改進,核心面積反而更小了,成本也更低。

Core i7 Die示意圖:四個核心一字排開,與Phenom II的方陣型不同。
熟悉Intel Nehalem Core i7處理器的朋友一定想到了,Intel也使用了同樣的大容量共享三級緩存設(shè)計,且容量多達8MB,也占據(jù)了整個核心面積的三分之一左右,不同之處在于Core i7每核心一級緩存和二級緩存只有64KB和256KB,都比Phenom/Phenom II少一半。

Phenom、Phenom II、Core i7、Core 2 Quad對比。
有趣的是,同樣基于45nm工藝的Core i7集成了7.31億個晶體管,比Phenom II略少,但核心面積卻稍大一些,為263平方毫米。
現(xiàn)在我們從成本的角度來算一筆帳,通過Phenom II X4的芯片結(jié)構(gòu)示意圖可以看出,三級緩存所占芯片面積比兩顆核心以及L1L2加起來還要多,如此一來即便是屏蔽了一顆核心的Phenom II X3,其成本也并不低,這對于主打性價比路線的AMD來說,利潤損失會比較大。

三級緩存所占芯片面積大于兩顆核心
于是,AMD在發(fā)布Phenom II X4、X3處理器之后,也在積極準備定位主流中低端的產(chǎn)品,用以取代征戰(zhàn)多年的Athlon 64 X2系列。由于L3成本較高,因此AMD將Phenom II X4的三級緩存徹底刪去(注意不是屏蔽),Athlon X4將會很快與大家見面。

Athlon X4處理器CPU-Z截圖(尚無法識別全部資料)
如此一來,我們就可以通過對比評測,輕松了解到AMD的Phenom II架構(gòu)處理器中,6M L3對性能的貢獻有多大,也能提前了解擁有完整L3但卻少一顆核心的Phenom II X3強呢,還是沒有L3的但卻有四顆核心的Athlon X4強?相信很多朋友都會挺感興趣的。
此次測試我們找到了AMD已上市的Phenom II 920(6M L3)和Phenom 9850(2M L3),還有一顆神秘的沒有L3的Athlon X4工程樣品,讓他們都工作在200*14=2.8GHz頻率下,這樣就能直觀的對比6M/2M/0M三級緩存所造成的性能差異。
另外還加入了剛剛發(fā)布的Phenom II X3 720處理器,它擁有完整的6M三級緩存,但少一顆核心,這樣可以反映出多一顆核心的貢獻大還是6M L3的貢獻更大?
|
PCPOP.COM泡泡網(wǎng)DIY評測室 | |
|
硬件系統(tǒng)配置 | |
|
處理器 |
|
|
主板 |
技嘉 790X-UD4 (790FX+SB750) DDR2 |
|
硬盤 |
西部數(shù)據(jù) velociraptor 300G 10000 RPM, 16M |
|
|
海盜船dominator 10000C5DF DDR2 800×2 |
|
|
ASUS EAH4870 (核心頻率750MHz 顯存頻率3600MHz) |
|
電源 |
海盜船 HX1000W 額定1000W |
|
顯示器 |
ASUS 24寸 M241H |
|
軟件系統(tǒng)配置 | |
|
|
Windows vista Ultimate SP1 32BIT |
|
驅(qū)動 |
AMD/ATI Catalyst 8.12 WHQL |
為了不使測試平臺的其它部分作為瓶頸,在系統(tǒng)方面采用了Vista 32bit SP1,主板方面選用了技嘉的790FX搭配HD4870顯卡進行輔助測試。最重要的內(nèi)存選用上,選用了性能甚至堪比DDR2的海盜船統(tǒng)治者10000C5DF,默認頻率為1250MHz CL5,但為接近AMD平臺的常規(guī)使用情況,降頻至1066MHz使用。
◎ Fritz 10 Benchmark 性能測試
這是一款國際象棋測試軟件,但它并不是獨立存在的,而是《Fritz9》這款獲得國際認可的國際象棋程序中的一個測試性能部分。由于國際象棋的運算大致仍舊是依靠電腦CPU的高速處理能力,將每一個可能的走法以窮舉算法預(yù)測,從中選擇勝算最大的非常好的走法。所以用它來衡量對比不同的PC系統(tǒng)中CPU的多線程運算能力也是有參考價值的。


Fritz這款國際象棋引擎模擬器,測試的是CPU的AI算法運算能力,在默認情況下,軟件是根據(jù)核心的數(shù)量,自動設(shè)置線程數(shù)進行計算。新一代Phenom II憑借工藝進步,三級緩存的加大,CPU處理能力得到小幅提高。但需要指出的是,性能提升不僅來自于三級緩存,同樣內(nèi)存帶寬的突破也不能否認。這點從沒有三緩的Athlon X4力壓上代旗艦9850就能看到。
◎ wPrime 性能測試
wPrime是一款與Super Pi相同的圓周率計算軟件,但與Super Pi只能支持單線程不同的是,wPrime最多可以支持八個線程,也就是說可以支持八核心處理器,并且測試多核心處理器性能時比Super Pi更準確。



這是一款取代SuperPI的新一代的純計算軟件,不過加入了多核的支持,軟件測試原理依舊是測試CPU整體的計算能力,由于牽涉到多核,所以內(nèi)存帶寬也會影響CPU的性能得分。新工藝下,性能的提升是毋容置疑的,這點很明顯能從測試得分看出來。而內(nèi)存帶寬對性能的影響,就不是從數(shù)據(jù)上直觀看到了。從CPU架構(gòu)上看,緩存對性能的影響很大,但Athlon X4的表現(xiàn),尤其是在大量運算過程中,力壓上代擁有完整3級緩存的9850,內(nèi)存帶寬的優(yōu)勢不言而喻。
◎ CineBench R10 性能測試
CineBench使用針對電影電視行業(yè)開發(fā)的Cinema 4D特效軟件引擎,可以測試CPU和顯卡的性能。Maxon公司表示,相對于之前的9.x版,R10版更能榨干系統(tǒng)的最后一點潛能,準確體現(xiàn)系統(tǒng)性能指標。最新R10版,支持XP、vista、MAC等,最高支持16核。

默認優(yōu)化線程模式:雙核處理器雙線同開,三核則三線同開,以此類推

在CineBench對比測試中,緩存對性能表現(xiàn)影響很大。即便是在核心數(shù)量占絕對劣勢的情況下,Phenom II X3 720比Athlon X4強上很多。從中可以看到緩存的作用。

OpenGL測試主要是依靠顯卡做渲染,CPU只其輔助作用,多核心效能得不到充分發(fā)揮,只有單核心效能強才能取得更好的成績,此時沒有L3的Althon X4發(fā)揮失常,而Phenom II X3的性能直逼X4。
● 應(yīng)用程序?qū)Ρ葴y試
◎ WINRAR壓縮軟件性能測試
WINRAR作為目前最常用的壓縮軟件備受大家喜愛,基本是每臺電腦的必備軟件。而大家也知道,WINRAR的壓縮效率和CPU的性能成等比關(guān)系,CPU運算能力越強,壓縮及解壓文件的速度就越快。


從WinRAR測試結(jié)果來看,內(nèi)存帶寬對解壓縮的性能表現(xiàn)影響較小,核心數(shù)量架構(gòu)效率與緩存的配合才是決定性因素。
◎ 高清X264編碼壓縮
高清視頻流行的今天,有多少人知道欣賞的720P高清電影是通過壓縮1080P視頻得來的,而關(guān)乎壓縮速度的最有效途徑就是使用的CPU以及支持的指令集。所以,筆者采用X264的編碼壓縮720P測試CPU的編碼能力。


從測試結(jié)果看,核心數(shù)量是決定內(nèi)存帶寬對視頻壓縮性能的影響并不大,DDR3和DDR2的性能差距在伯仲之間。從Phenom I代和II代間的性能表現(xiàn)來看,核心架構(gòu)的效率才是決定視頻壓縮性能的關(guān)鍵。
● 綜合性能對比測試
◎ everest性能測試
Everest是一套功能強大的系統(tǒng)分析評比工具,擁有電腦你能想到的各種設(shè)備的檢測,作為一款系統(tǒng)測試軟件,除了可以提供詳細的硬件信息外,還可以做產(chǎn)品的性能對比。其中內(nèi)存帶寬的測試具有代表性。


內(nèi)存讀寫方面,雖然平臺配置中除了CPU外均一樣,但由于內(nèi)存控制器集成在CPU內(nèi),所以帶寬的表現(xiàn)還是有差異的。從測試成績中看,新一代Phenom II整體內(nèi)存帶寬較phenom高出不少,相信45nm工藝下改進的不只是制程,內(nèi)存控制器的延時把控也有了不小提升。
◎ 3D Mark Vantage 測試
3DMarkVantage2008年4月28日發(fā)布,是業(yè)界第一套專門基于微軟DX10 API打造的綜合性基準測試工具,并能全面發(fā)揮多路顯卡、多核心處理器的優(yōu)勢,能在當前和未來一段時間內(nèi)滿足PC系統(tǒng)游戲性能測試需求。和3DMark05的DX9專用性質(zhì)類似,3DMark Vantage是專門為DX10顯卡量身打造的,而且只能運行在Windows vista SP1操作系統(tǒng)下。

由于此款軟件是針對3D性能的測試,所以只選用了測試項目中的CPU選項的得分進行對比。設(shè)置為性能模式,采用1280X1024進行測試。

Peformance模式下,CPU性能對vantage整體得分有一定的加成。由于3D Mark Vantage支持多核處理器,所以在這里單核效率的意義就不是很大了,擁有完整3級緩存的Phenom II X3 不敵Athlon x4也就不難理解了。

Peformance模式下,兩代Phenom處理器性能差距十分明顯,從測試成績分析,緩存對性能的提升有很大的加成,同時在更高內(nèi)存帶寬的幫助下,沒有3級緩存的Athlon X4領(lǐng)先9850顯得十分強悍,讓我們十分期待這顆未出生就奠定性價比之王的CPU。
◎ PCMark Vantage 性能測試
PCMark Vantage 是Futuremark發(fā)布的新一代基準測試軟件,并比較完美的對多核心處理器進行了優(yōu)化,而且是專為Windows vista 32/64-bit打造的,不再支持Windows 2000/XP。

PCMark Vantage可以衡量各種類型PC的綜合性能,主要分為三大部分進行:1、處理器測試:基于數(shù)據(jù)加密、解密、壓縮、解壓縮、圖形處理、音頻和視頻轉(zhuǎn)碼、文本編輯、網(wǎng)頁渲染、郵件功能、處理器人工智能游戲測試、聯(lián)系人創(chuàng)建與搜索。2、圖形測試:基于高清視頻播放、顯卡圖形處理、游戲測試。3、硬盤測試:使用Windows Defender、《Alan Wake》游戲、圖像導(dǎo)入、Windows vista啟動、視頻編輯、媒體中心使用、Windows Media Player搜索和歸類,以及以下程序的啟動:Office Word 2007、Adobe Photoshop CS2、Internet Explorer、Outlook 2007。
PCMark是一大堆日常應(yīng)用的合集,其中包括大量的多任務(wù)測試及多媒體視頻音頻測試,雖然多核心并不能發(fā)揮出全部性能,但優(yōu)化支持也很到位。

從成績看,內(nèi)存帶寬對PCMark Vantage得分影響不大,僅在內(nèi)存帶寬一項上有巨大優(yōu)勢,對其它項目的影響不大,當然,內(nèi)存帶寬的高低對整機性能有一定影響,這也是Athlon X4總分高出9850的原因。而緩存方面,可以說對性能的影響是明顯的,Phenom II X3力壓4核的615和9850就是明證。
◎ DX10游戲—《失落星球:殖民地》
作為首款DX10大作《失落星球:極限狀態(tài)》的資料片,《失落星球:殖民地》只是強化了網(wǎng)絡(luò)對戰(zhàn)功能、提供了更多對抗地圖,并未加入新的任務(wù)關(guān)卡,這讓單機游戲玩家失望不已,好在新的“過關(guān)斬將”模式有點新意,可以讓玩家直接挑戰(zhàn)前作任務(wù)關(guān)卡中的所有大小BOSS,而本游戲最酣暢淋漓的無疑就是BOSS戰(zhàn),另外還提供了“挑戰(zhàn)模式”、“競分模式”等更豐富的內(nèi)容與玩法。
測試方法:針對資料片的特性,游戲自帶的測試場景也作了些改變,還是分為室外和室內(nèi)兩個場景,但對于系統(tǒng)的要求更加苛刻:

面對著與日俱增的新游戲,再強大的CPU似乎已對性能影響不大,當主頻接同為2.8G時,4核處理器的表現(xiàn)在伯仲之間,3核因為核心數(shù)量劣勢表現(xiàn)不佳。
◎ DX10游戲—《孤島危機》
作為年度DX10游戲巨作Crysis的游戲畫面達到了當前PC系統(tǒng)所能承受的極限,超越了次世代平臺和之前所有的PC游戲,即便是搭配優(yōu)異的顯卡,在采用大分辨率開抗鋸齒的情況下,也只能勉強“瀏覽”游戲。
測試方法:Crysis Demo內(nèi)置了CPU和GPU兩個測試程序,我們使用CPU測試程序,這個程序會自動切換地圖內(nèi)的爆炸場景,激烈的爆炸場面嚴格的考驗著CPU渲染性能,運行一段時間得到穩(wěn)定的平均FPS值作為測試依據(jù)。


在低分辨率情況下,顯卡已經(jīng)不是瓶頸,而僅在于考驗CPU的運算能力。Crysis的兩個CPU測試場景,得出的結(jié)果表現(xiàn)基本一致,緩存對幀率的影響明顯。
至此,Phenom II家族中代表性CPU測試到此結(jié)束了,對所有測試成績分析對比后,我們可以得出以下結(jié)論:
-
雖然AMD處理器的架構(gòu)的特殊性,對緩存的依賴性不如Intel處理器那樣強烈,但大緩存也能夠提高性能;
-
三級緩存容量在大多數(shù)項目中對CPU性能都有影響,但只是量變并非質(zhì)變;
-
三級緩存只能作為輔助,對CPU性能起到?jīng)Q定性的作用是內(nèi)核架構(gòu);
-
Phenom II的性能提升,主要來自于內(nèi)存帶寬和三級緩存兩方面的貢獻。
-
Phenom II的單核效率,與三級緩存有很大的關(guān)系,緩存越大,性能表現(xiàn)越好;
-
在現(xiàn)今的多數(shù)應(yīng)用環(huán)境下,多核處理器并不能完全發(fā)揮所有性能,單核效率的高低才是決定電腦快慢的主因。
根據(jù)筆者的測試,分析出以下幾點:Phenom II的騰飛,與采用45nm工藝有密不可分的關(guān)系,先進的工藝,可以在有限的空間內(nèi)放置更多的晶體管,換句話說,Intel常用的提升CPU性能的方法——增加緩存容量,AMD這次也以彼之道,還施彼身,帶來性能提升。同時,新一代Phenom II的內(nèi)置內(nèi)存控制器較以往有了不少提升,采用專業(yè)內(nèi)存檢測工具發(fā)現(xiàn),在內(nèi)存同頻率同延時下,Phenom II的內(nèi)存控制器表現(xiàn)出的性能更猛。而稍感遺憾的是,Phenom II的核心架構(gòu),并沒有太大的改進,也沒有新指令集的加入,僅是小幅改進BUG而已。
緩存與核心誰更重要?通過測試結(jié)果分析,那就是根據(jù)應(yīng)用環(huán)境而定。現(xiàn)今的軟件環(huán)境,并非全面針對多核設(shè)計,不少軟件的運算速度取決于單核效率。像我們常見的游戲環(huán)境,即便是Crysis這種較新的游戲?qū)Χ嗪说闹С忠膊皇呛芎茫嗟厥且揽繂魏诵省S螒蛏写耍覀兂S玫能浖焕狻3R?guī)應(yīng)用中,多核心總有閑置的情況發(fā)生,這就是軟件環(huán)境所致,所以,若您想裝配一臺性價比十足的電腦,單核效率絕對是首選。
雖然現(xiàn)在4核處理器的價格并非漫天要價,且性能強勁,甚至能夠滿足未來1-2年的系統(tǒng)要求,但千元多的售價對普通人來說還需要掂量掂量。而AMD獨有的3核處理器如同一只奇葩,接近雙核處理器的價格,同時擁有接近4核處理器的性能,不失為一種選擇。<
關(guān)注我們


