智從何來?“數”說SNB的技術哲學
有著“智二代”美譽的英特爾酷睿(代碼:Sandy Bridge)處理器一上市便好評不斷,賣場里每日因此人滿為患。從Nehalem到Sandy Bridge,架構的更替帶來了太多令人匪夷所思的變化。如今互聯網上“視覺應用”大行其道——在線視頻、照片分享無疑是最熱門的應用,Sandy Bridge處理器無縫融合核芯顯卡,內置的InTru 3D技術和高速視頻同步技術在日常均可提供前所未有的視覺體驗,究竟“智二代”為何如此給力?讓我們換個角度出發,讓一組有趣的數字來揭示真相。
32
這個數字大家一定不陌生,因為按照英特爾的Tick-Tock發展模式,每兩年就會對芯片制造工藝進行升級,曾經輝煌的45nm技術已經成為過去時。Sandy Bridge采用了業內非常先進的32nm制造工藝,第二代高-k金屬柵極在晶體管中的采用,不僅大大提高了晶體管性能、降低了功耗,而且使漏電率降至新低。領先業界1年以上,英特爾早于2009年第四季度就采用這項新工藝進行量產。
在45nm晶體管中,高-k柵極的等效氧化層厚度為1.0nm。在32nm晶體管中,氧化層的厚度降低了10%,僅為0.9nm,而柵極長度則縮短為30nm,達到史上最小。這些變化對于提高芯片性能、縮小芯片尺寸至關重要,對于縮小集成電路(IC)尺寸、提高晶體管的性能至關重要。采用32nm制造工藝的芯片尺寸可比45nm產品降低大約70%,而在性能方面提高超過22%以上。與40年前相比, 32nm晶體管耗電量下降至之前的1/4000,單個晶體管的價格則下降至原價格的十萬分之一。
1+1
也許你要問,9.95億個晶體管,都用到哪里去了?這些晶體管開銷除了用于為處理器提升性能與增加新功能,還有一個重要用途是:無縫融合新一代HD Graphics(核芯顯卡),這就是“1+1”的含義。
眾所周知,英特爾于去年1月推出了基于32nm Westmere架構的2010酷睿處理器家族,除了提升運算效率并降低平臺功耗,2010酷睿還在功能整合方面取得了全新突破——顯示芯片不再放置于主板北橋芯片中,而是被CPU“吞并”變成其一部分。換句話說,2010酷睿首次實現了將CPU與GPU兩顆芯片封裝在同一塊基板上,并以高速的QPI總線為二者牽線搭橋。但是,在Sandy Bridge架構中,核芯顯卡不再以獨立的芯片形式呈現,而是完全融入這顆32nm芯片變成了處理器的一個功能模塊,從核心架構圖來看,這個模塊占據的芯片面積幾乎達到了1/4。
按照定位的不同,核芯顯卡分為HD Graphics 3000和HD Graphics 2000兩個型號,主要區別是前者擁有12個EU(執行單元),而后者只有6個。實測顯示,新一代核芯顯卡在3D性能上的提升極為明顯,擁有12個EU的HD Graphics 3000可全面壓制Radeon HD 4550 512MB,這說明其完全可匹敵主流級獨立顯卡。
2.0
有著兩年歷史的睿頻加速技術隨著Sandy Bridge的到來終于升級到了2.0版,這個令酷睿家族格外耀眼的神器再次迸發出新的活力,這次升級帶來了哪些亮點?
大家知道,前一代睿頻加速技術會根據處理器計算負載動態調節主頻,例如Core i7 980X處理器默認主頻3.33GHz,而經過智能加速之后最高可達3.6GHz,主頻提高后程序響應速度也隨之加快。作為一項限制措施,英特爾規定搭載第一代睿頻加速技術的處理器,在加速模式下TDP不得超過標稱值,因而主頻通常只能提高1~2bin,即133~266MHz,多線程模式下加速幅度則通常只有1bin。隨著并行計算正在成為未來趨勢,用戶越來越渴望他們的電腦在應對復雜的多任務處理時,也能表現得更為高效。這正是睿頻加速2.0技術變革的主要方向——加速模式更具彈性。
Sandy Bridge的睿頻加速技術2.0解除了加速模式下TDP不得超過標稱值的限制,它允許處理器短時間(15~25s)地運行在超過標稱TDP的頻率,只有當溫度達到設定閾值后,頻率才會隨之降低。需要注意的是,這是一個循環的過程:CPU加速→溫度升高→主頻降低→溫度降低→再次加速。以酷睿i5-2500T為例,當睿頻加速機制介入時最多能提升高達1GHz主頻,由2.3GHz至3.3GHz,這對CPU性能的幫助是極為顯著的。
值得一提的是,睿頻加速技術2.0并非僅限于CPU核心,其核芯顯卡也能從這套全新的體制中受益,例如酷睿i7-2600K的核芯顯卡 3000顯卡默認頻率為850MHz,加速狀態下可提高至1.35GHz。此外,CPU計算核心與核芯顯卡之間會根據負載的需求實時調整睿頻加速的側重點,當系統要求更強大的CPU運算能力時,更多的TDP資源會幫助CPU來獲得更高頻率;而當圖形運算負載顯著增加時,TDP資源又會向核芯顯卡傾斜以幫助其提高運行頻率。
0
為什么是0?其實這是一個字母“O”,也許你猜到了,這里要向大家介紹的是Sandy Bridge的環形總線技術。
在Nehalem時代,一種高效率的數據傳輸模式被引入,它就是以點對點交換為特征的QPI總線。由于不用經過任何中間環節,QPI總線可以為處理器提供充足的資源帶寬,這是FSB時代遠遠不可及的。隨著Sandy Bridge的到來,處理器達到了前所未有的整合度,為了更高效地進行資源調度,英特爾引入了一種在服務器領域被廣為采用的環形總線(Ring Bus)。
這種總線之所以得以采用,還要歸結于Sandy Bridge全新的LLC(Last Level Cache,末級緩存,即L3)緩存機制。不同于Nehalem和Westmere,Sandy Bridge的LLC是一個共享組件,處理器核心、核芯顯卡、系統助理(System Agent)都可以從中直接獲取數據,數據交換發生時,環會自動從路徑最短的節點接入以降低數據延遲。Sandy Bridge為什么會這么快?這就是其中因素之一。
995,126,547
這么大一個數字乍看讓人迷糊,不知你是否猜到它代表什么?沒錯,它是Sandy Bridge 的酷睿i7處理器的晶體管數量——多達9.95億個。盡管晶體管規模如此驚人,得益于優秀的制造工藝,處理器的整體功耗與發熱量依然在前一代產品的基礎上不升反降,酷睿i7 2600K處理器頻率高達3.4GHz,而TDP只有95W,與此同時性能也得到了大幅提高。
讓我們做個有趣的類比,如果一輛汽車擁有9.95億個配件,那么即使讓全球生產率最高的汽車制造商來裝配,也需要114年才能完成整個工程;如果將處理器比作國家,而晶體管就是這個國家的人口 ,那么Sandy Bridge處理器憑借9.95億“人口”將成為僅次于中國和印度的全球第三人口大國。
簡言之,睿頻加速技術2.0將第二代智能酷睿處理器的智能特性提升到一個新的高度,核芯顯卡、高速視頻同步技術以及InTru 3D則“非常給力”地詮釋了Sandy Bridge的視覺表現力,這種“智能+視覺”概念無疑開創了PC應用新境界。如此說來,Sandy Bridge是里程碑式的產品毫不為過,以上寥寥幾組數字也只能揭秘其眾多卓越技術的冰山一角。隨著數字時代的到來, 人們的日常工作與生活越來越需要Sandy Bridge這類智能芯片來提供強大的運算能力。智能計算,其實就在你我身邊。
關注我們


