極致性能 技嘉X58主板三通道內存實測
在奔騰4時代栽了跟頭的英特爾,痛定思痛,改變發展策略,根據自身特點出發,制定出鐘擺tick-tock(即英特爾芯片技術與微體系結構創新發展步調模式)發展方式。在過去的幾年中,tick-tock發展步伐遠遠地將競爭對手甩在身后。
系統中最重要的部件是什么?顯卡?NO,最重要的莫過于CPU和主板的合理搭配。CPU的代代更新,同步也加快了主板的發展,從酷睿2誕生起衍生的P965芯片組,到現在的nehalem衍生出的X58芯片組無不是這樣,唯有通過芯片組才能發揮出CPU全部功能。
此次nehalem的降臨,最大的改變就是拋棄了伴隨INTEL CPU十幾載的FSB,轉而采用先進的QPI(QuickPath Interconnect)內存控制器技術,終于將系統中的總線帶寬瓶頸徹底根除,那么集成內存控制器對系統性能的提升有多重要?用戶是否需要使用昂貴的DDR3內存使用3通道技術?本文將對此進行研究。
●FSB生命進入倒計時,學會生活在QPI時代
當我們習慣了FSB——前端總線(Front SIDE Bus,簡稱FSB),面對QPI時代的到來,以后再談論CPU連接到北橋芯片的總線時,QPI將是一個嶄新的朋友,作為取代FSB,成為新一代CPU和CPU、CPU與芯片組(CPU與內存)之間的連接總線,QuickPath Interconnect(簡稱QPI)的總線技術,Nehalem成為了推動FSB生命終結的死亡使者。
讓FSB去死的關鍵理由,就是總也喂不飽內存所需要帶寬,即使是配備再強的CPU,將前端總線頻率超至新高,用戶也不會明顯感覺到計算機整體速度的提升。即使是弱小的phenomX4,也依靠HT總線技術縮小其與酷睿2 yorkfield的性能差距,所以說QPI的誕生具有革命性的意義。
小提示:目前Intel處理器主流的前端總線頻率有800MHz、1066MHz、1333MHz幾種,進入2007年后,Intel在11月又將處理器前端總線提升至1600MHz(默認外頻400MHz),這比2003年最高端的800MHz FSB總線頻率整整提升了一倍。這樣高的前端總線頻率,其帶寬有多大呢?前端總線為1333MHz時,處理器與北橋之間的帶寬是10.67GB/s,而提升到1600MHz能達到12.80GB/s,增加了20%。
●FSB最大殺手——前端總線瓶頸
也許很多人會認為,Intel處理器的前端總線頻率已很高了,還有必要換嗎?作為Intel來說也許很高,但是對比內存帶寬、顯卡帶寬相比,CPU與芯片組的前端總線瓶頸依舊沒有根本的改變,例如:1333MHz的FSB所提供的內存帶寬是1333MHz×64bit/8=10667MB/s=10.67GB/s,其與雙通道的DDR2 667正好匹配,但如果使用雙通道的DDR2 800、DDR2 1066的內存,這時候FSB的帶寬就小于內存的帶寬。面對承擔普及DDR3、以遠遠領先競爭對手的Intel來說,這是無法容忍的,更何況X58帶來的三通道高頻率DDR3內存搭配了(Nehalem平臺DDR3 1333內存的帶寬可達32GB/s)FSB無法提供支持,面對這些問題,FSB必須被拋棄。

即使是QX9775這樣的雙路CPU帶寬也僅有12.8GB/s可用
●intel不能忍了——FSB以全面落后Hyper Transport
當全世界都對Intel InsIDE擁有非常好的印象的時候,作為Intel的CPU領域競爭對手,AMD推出的HyperTransport(HT)總線技術相比,FSB的帶寬瓶頸也很明顯。
小帖士:HT作為AMD主板CPU上廣為應用的一種端到端總線技術,它可在內存控制器、磁盤控制器以及PCI-E總線控制器之間提供更高的數據傳輸帶寬。HT 1.0在雙向32bit模式的總線帶寬為12.8GB/s,其帶寬便可匹敵目前最新的FSB帶寬。2004年AMD推出的HT 2.0規格,最大帶寬又由1.0規格的12.8GB/s提升到了22.4GB/s。而最新的HT 3.0又將工作頻率從HT 2.0最高的1.4GHz增到2.6GHz,提升幅度幾乎又達一倍。這樣,HT 3.0在2.6GHz高頻率32bit高位寬的運行模式下,它即可提供高達41.6GB/s的總線帶寬(即使在16bit位寬下它也能提供20.8GB/s帶寬)值得注意的是,HT 3.0技術應付近兩年內內存、顯卡和處理器的未來需要也沒有問題。
作為Intel來說,雖然CPU的市占率上它可以全面領先,崇尚技術的英特爾,面對這種帶寬上劣勢,雖然采取多種方法,但是并沒有能夠帶帶來根本的轉變,換句話來說,Intel假如可以將FSB提升到2133MHz,面對DDR3以及交火、SLI等多顯卡系統帶來的帶寬需求時,FSB依然沒有辦法滿足它們的帶寬需求,QPI必須被推到前臺。
● CPU集成內存控制器 內存進入三通道時代
CPU中集成內存控制器,是一把雙刃劍,雖然能提高系統的性能,主要是降低系統延時,但CPU的頻率提升因此變得很難,還有不小的制造成本。也正因此,集成內存控制器一直是個大家樂于討論的問題,孰優孰劣,一直爭論不休。不可否認的是,當AMD集成內存控制器,并通過HT總線連接系統的時候,已經縮小與Intel之間的技術差距。
在AMD推出集成內存控制器近5年后,英特爾終于將推出了集成內存控制器的CPU,而為了壓制競爭對手,保持技術領先者的姿態,一上來就引入了3通道DDR3,引領內存帶寬達到新的高度。
根據英特爾的資料,Nehalem的內存控制器為Integrated Memory Controller,簡稱IMC。規格上支持三通道DDR3內存,初期最高支持到1333MHz,不過像個別一線廠商的高端主板支持oc到1600MHz的規格。同時,IMC支持亂序讀取可以有效降低延遲,而且每通道均可獨立運行,無疑在一定程度上提高了兼容性問題。但稍感遺憾的是,Intel似乎沒有照顧低端用戶的意思,IMC僅支持目前價格昂貴的DDR3。
● 放棄傳統FSB 引入QuickPath技術
既然集成了IMC內存控制器,那么就需要能與之匹配連接到CPU核心的高速連接。英特爾將此技術命名為QPI(Quick Path Interconnect),和之前AMD的HT(Hyper Transport)頗為相像。
英特爾QPI技術提供點到點的高速鏈路來分配共享內存,從而充分釋放下一代英特爾45納米微架構(代號為Nehalem和Tukwila)的并行處理性能。這些全新設計的微架構將首次采用英特爾的QuickPath互聯系統,在整體性能上實現了重大改進。
不僅如此,現在QPI還有很大的升級彈性,未來的Nehalem和Tukwila微架構整合新的英特爾QuickPath技術之后,每個處理器核心都將擁有集成的內存控制器和高速互聯,把處理器和其他組件連接起來,動態可擴展的互聯帶寬,可以全面釋放Nehalem、Tukwila和未來英特爾多核處理器的性能。后面,我會給大家詳細解釋QPI的互聯技術用途。
當年技嘉P45-extreme的震撼還記憶猶新,現在脫胎于英特爾跨時代的X58芯片組的X58-extreme,以海藍色PCB、銀白色的散熱器上點綴著藍色GIGABYTE圖案靚麗出現在我們面前。
技嘉EX58-Extreme采用了X58+ICH10R芯片組的搭配。X58將是Intel最新的旗艦芯片組,是Nehalem系列處理器的優異搭檔。該主板采用全尺寸ATX大板,依照超耐久3設計理念,全板均使用了高品質的三洋固態電容、鐵素體電感,并在所有的供電部分采用了低阻抗MOSFET。
供電設計方面,該主板采用了技嘉雙六相供電設計,用料方面根據超耐久3代理念,每相供電均搭配日系固態電容、鐵素體電感和低阻抗MOSFET。
技嘉EX58-Extreme首個最令人矚目的Hybrid技術是水冷、熱管與散熱排混合的Hybrid Slient-Pipe 2,雖然有眾多品牌都采用此類的設計,但是技嘉堅持這樣的設計,給玩家系列烙上了一個旗艦樣式的標志。
Nehalem集成了內存控制器,CPU集成內存控制器的好處顯而易見,在優秀的內存控制器配合下,3通道內存可以發揮出強大性能,技嘉EX58-Extreme也應規范設計出6根DIMM插槽。

由于是sample原因,內存插槽配色略有差異,市售版本為藍白相間
技嘉EX58-Extreme在擴展性上,依托X58芯片組的架構優勢,并通過nvidia的技術授權,首次在主板上實現了通過非橋接芯片可以實現CrossFire與SLI的共存。
主板提供了三個顯卡插槽,分別是兩個藍色的PCI-E 16x插槽和一個橙色的PCI-E 8x插槽。在未增加NV200芯片的情況下,能夠做得滿足3路SLI的需要已經很不容易了。
磁盤擴展方面,依托技嘉SATA2芯片,可以在ICH10R原生6SATA2接口之外,額外增加出4個SATA2接口供用戶使用,對處于高清時代的我們,對磁盤容量的需求是永無止境的,這樣的設計無疑是很有必要的。
技嘉EX58-Extreme主板上能夠看到的發光LED越來越多,除了超頻需要使用的微動診斷外,還有技嘉倡導的DES節能技術。
對于一款主板來說,除了用料豪華,板載設備實用外,更為重要的是主板的靈魂——BIOS的設計。評價一款優秀的主板,勢必要看其BIOS的設計好壞。
在眾多主板的BIOS界面中,技嘉的BIOS是筆者十分推崇的。筆者認為,鑒別BIOS好壞的第一印象就需要一目了然。即使有再多的功能,若對用戶不能方便使用也是白搭。可以這么說,從P965開始,經過技嘉RD們幾代的研究,目前技嘉主板的BIOS可謂堪稱完美,每次的升級也僅是解決新芯片組與新硬件之間的兼容等小問題。舉個簡單的例子,BIOS就和寫稿一樣,每次的文章都要擬出提綱,不僅可以明確目標,也可以畫出文章框架,這樣的話文章不會出現大的偏差,只會次次又提高。BIOS也是這樣,在優秀底層架構的引導下,新主板的BIOS不會從頭開始,而是在厚實的經驗基礎上進行提高,出現問題一次次減少,每次的升級都是一次提高。而與之形成鮮明對比是通路主板,因為沒有研發實力,每塊主板的BIOS都是從頭開始,更無從談及進步!
EX58-Extreme BIOS繼承了技嘉主板優秀的傳統,從P45時代開始,BIOS界面有些小幅修改,超頻選項就不再是隱藏模式,打開BIOS左起第一個就是超頻界面。由于南橋和板載芯片較之前P45沒有變化,所以筆者主要介紹下nehalem下的超頻選項。
較之前的FSB超頻電壓,此次FSB的選項被QPI取代,但相對之前的電壓經驗,并不能直接套用到nehalem上,電壓的選擇還有待玩家們開發,相信隨著nehalem普及的深入,新的超頻技巧會放出。筆者接觸nehalem時間不長,所以不能說出普遍的超頻技巧,但經過近半個月的鉆研,從筆者接觸的nehalem來看,核心1.4v,CPU PLL 1.9V,QPI默認電壓下,nehalem普遍具有風冷4G+的能力。
根據nehalem的定位,intel官方說法是初期上市的3款nehalem除了頻率區別外,新加入的QPI總線帶寬也有差別,以區別產品的定位。
|
Core i7 920 |
Core i7 940 |
Core i7 Extreme Edition 965 | |
|
產品編碼 |
BX80601920 |
BX80601940 |
BX80601965 |
|
制程 |
45nm |
45nm |
45nm |
|
接口 |
LGA 1366 |
LGA 1366 |
LGA 1366 |
|
晶體管數 |
7.31億 |
7.31億 |
7.31億 |
|
核心線程數 |
4核8線程 |
4核8線程 |
4核8線程 |
|
主頻 |
2.66GHz |
2.93GHz |
3.2GHz |
|
二級緩存 |
4x256KB |
4x256KB |
4x256KB |
|
三級緩存 |
8MB |
8MB |
8MB |
|
QPI總線 |
4.8GT/s |
4.8GT/s |
6.4GT/s |
|
內存控制器 |
三通道DDR3-1066 |
三通道DDR3-1066 |
三通道DDR3-1066 |
|
TDP |
130W |
130W |
130W |
|
售價 |
284美元 |
562美元 |
999美元 |
為了驗證QPI總線的性能差別,筆者的測試方案如下,將nehalem的頻率統一設定在2.66GHz上,比較同頻率下不同QPI帶寬的新跟那個差異。由于集成內存控制器,intel芯片組第一次引入了CMD概念,在同頻下,測試內存CMD(1T、2T)間的性能差異。
|
硬件系統配置 | |
|
處理器 |
Core i7 Extreme Edition 965 (四核/2.66GHz/4x256KBytes L2/8M L3) Core i7 920 (四核/2.66GHz/4x256KBytes L2/8M L3 |
|
主板 |
技嘉EX58- extreme |
|
硬盤 |
西部數據 velociraptor (300GB, 10,000 RPM, 16M,SATA300) |
|
內存 |
海盜船 TR3X3G1333C9 3X1G DDR3 1333MHz (9-9-9-20) |
|
顯卡 |
nvidia 9800GTX+ |
|
電源 |
海盜船 corsair TX1000W |
|
顯示器 |
ASUS 24寸 |
|
軟件系統配置 | |
|
操作系統 |
Windows VISTA Ultimate SP1 32BIT |
|
顯示驅動 |
nvidia 180.42 |
為了不使測試平臺的其它部分作為瓶頸,選用了技嘉X58-extreme搭配9800GTX+進行輔助測試,為了不使內存帶寬成為瓶頸,使用海盜船1333排裝組成三通道測試內存帶寬,同時存儲方面使用目前在SATA硬盤中的神器velociraptor,將平臺性能發揮到最大。
CPU理論運算對比測試
◎ SuperPI性能測試
Super PI是由東京大學Kanada Lab.所制作的一款通過計算圓周率的來檢測處理器性能的工具,在測試里面可以有效的反映包括CPU在內的運算性能。在玩家群中,Super PI更是一個衡量CPU性能的標尺之一。

在Super Pi 8M的測試較量中,可以看到QPI對內存性能的影響比內存延時大的多,看來3通道內存還是對帶寬的敏感性比延時更強。
◎ EVERST 內存性能測試
我們采用了EVERST Ultimate軟件中的內存測試項目考驗雙款平臺的內存性能。這樣可以測試出CPU集成內存控制器對內存性能的影響。

看到成績結果后,要具體問題具體分析,在讀取、寫入和拷貝的對比中,對內存控制器負載最低的讀取性能差距較小,性能差異根據對內存控制器負責高低決定,負責最大的拷貝測試,差異更明顯。總體上看,QPI對性能的影響比重更大。
◎ Fritz 10 Benchmark 性能測試
這是一款國際象棋測試軟件,但它并不是獨立存在的,而是《Fritz9》這款獲得國際認可的國際象棋程序中的一個測試性能部分。由于國際象棋的運算大致仍舊是依靠電腦CPU的高速處理能力,將每一個可能的走法以窮舉算法預測,從中選擇勝算最大的非常好的走法。所以用它來衡量對比不同的PC系統中CPU的多線程運算能力也是有參考價值的。

由于Fritz主要是考驗CPU計算性能的軟件,內存在其中所占比重較小,但微弱的差異也能體現出QPI的功能,根據測試成績比例來看,QPI仍舊比CMD對性能的影響更高。
◎ ScienceMark 性能測試
ScienceMark是一款通過運行一些科學方程式來測試系統性能的工具。主要用于桌面臺式機和工作站上測試內存子系統,同時也用于測試服務器環境中的讀寫延時,當然,它對內存的帶寬及CPU與內存控制器之間的速度等也可進行測試。

從Sciencemark的測試結果看,所有成績都在同一水平,看來核心運算效率強勁前提下,對內存的要求不高。
● DX10游戲CPU性能測試—《孤島危機》
作為年度DX10游戲巨作Crysis的游戲畫面達到了當前PC系統所能承受的極限,超越了次世代平臺和之前所有的PC游戲,即便是搭配優異的顯卡,在采用大分辨率開抗鋸齒的情況下,也只能勉強“瀏覽”游戲。
測試方法:Crysis Demo內置了CPU和GPU兩個測試程序,我們使用CPU測試程序,這個程序會自動切換地圖內的爆炸場景,激烈的爆炸場面嚴格的考驗著CPU渲染性能,運行一段時間得到穩定的平均FPS值作為測試依據。


在低分辨率情況下,顯卡已經不是瓶頸,而僅僅在于CPU的運算能力。Crysis的兩個CPU測試場景,得出的結果表現基本一致。這點就讓人匪夷所思,Nehalem的性能提升是毋容置疑的,但為什么在對硬件要求甚高的crysis中無明顯作用呢?
筆者經過測試crysis,再次證明QPI的重要性遠比內存延時來的高,即使是QPI 6.4GB/s 2T的模式下,性能也比QPI4.8GB/s 1T模式下高出3幀左右。
4組QPI不同設置下的對比測試到此結束了,對所有的測試成績進行分析對比后,可以得出以下結論:
-
QPI對提升系統性能有很大幫助,在Sisoftware Sandra理論測試中,帶寬甚至突破了20GB/s大關,雖然實際應用時不可能達到如此之高,但帶寬大的好處顯而易見,如同開跑車在山地上和高速公路間的差異。
-
在QPI時代,QPI的頻率比內存延時對系統性能影響更大,優先提升QPI的頻率更加重要。
-
通過QPI,相比之前FSB時代,對內存的體質要求有所降低,即使因為內存體質只能工作在2T模式下,只要QPI頻率高,性能也不會削減太多。

目前QPI的最高倍頻只能設置在48,相信未來隨著BIOS的完善會有提高
雖然intel不是CPU集成內存控制器的先行者,但勤奮的intel不甘落后,在臥薪嘗膽多年后,集萬千寵愛于一身的Nehalem的內存控制器沒有讓我們失望,相比對手的集成內存控制器,性能優勢明顯。這次,Intel沒有給任何AMD還手的機會。
通過測試,看到系統性能,尤其是內存性能的巨大提升,nehalem+X58是非常值得推薦的。遺憾的是,在經濟不景氣的今天,X58只能是更少人的玩物,多數人只能望梅止渴。
關注我們


