摩爾定律不死!Intel雙核心深入剖析
雙核心來了。就像2002年的第一場雪,Intel在桌面平臺推動多核心處理器的進程,來得比所有人的預計都要早一些。在2005年3月1日~3月3日的春季IDF上,Intel一反最近幾年的保守態度,非常積極地介紹了從高端服務器的Itanium直到移動計算平臺的全系列雙核心處理器產品規劃,并且現場展示了雙核心處理器的實物以及演示平臺。
2005年4月14日~4月15日,在北京的春季IDF會議現場,我們終于親眼見到了Intel雙核心處理器的實物,同時也有幸深入了解了Intel在雙核心乃至未來多核心處理器方面的規劃。
短短4天之后,北京時間2005年4月19日,Intel在美國率先發布了雙核心Pentium至尊版處理器Pentium D 840,Dell、HP等PC廠商也同步推出配備Pentium D 840處理器的臺式機。

——當然,這一切都要歸功于AMD。如果不是AMD x86-64平臺在2003年~2004年間的巨大成功在使Intel出現一系列失誤的同時不得不修正對64位平臺普及時間表的預估;如果不是AMD的64位處理器在高端服務器和主流桌面平臺不斷蠶食Intel的市場份額;如果不是AMD高調力推雙核心處理器,Intel現在大概還在穩穩當當為4GHz的Pentium 4處理器做宣傳,準備到第三季度再發布雙核心處理器吧。

有競爭才有進步,雙核心時代的提前揭幕再次證明了這一點。
就在Intel正式發布Pentium EE 840之前,在2005年4月14日~15日北京春季IDF會議的現場,我們有幸目睹了基于這款產品的演示平臺,并且通過Intel的介紹和講解,對雙核心處理器的產品線分布有了更加深入的了解。
得益于平臺策略的全面推行,雙核心/多核心的話題在幾乎每一場的主題演講中都被提及,無論是作為“開場白”的前任CTO Pat Gelsinger的《創新之路》,還是移動事業部總經理浦大衛的《移動時代》,乃至數字家庭事業部副總裁兼消費電子事業部總經理格琳達·多柴克的《數字家庭進入千家萬戶》和數字企業事業部商用客戶機部總經理羅伯特·克魯柯的《數字企業》,無不將雙核心作為重點之一。
而在英特爾公司高級院士兼英特爾通信技術實驗室總監凱文·康的《想像未來……2015年的平臺》中,從多處理器到超線程技術,從雙內核、4內核到32內核,越來越多的內核將被集成到未來的處理器中,而運算平臺的并行程度也將隨之出現巨大的飛躍——站在2005年的春天看未來,Intel告訴我們,未來的處理器必然會包含越來越多的內核,而摩爾定律關于“芯片所集成的晶體管數量每18個月就將翻一番”的預言,也將在Intel制程技術的保障下至少再走10年。
這樣的預言和兩年、乃至一年以前Intel在IDF上為我們描繪的圖景有了很大的不同。那時候,Intel似乎更加熱衷于告訴我們未來處理器的頻率將會飆升到何其驚人的數字:4GHz、5GHz、10GHz……仿佛追隨摩爾定律增加的晶體管都是為了提升頻率而存在的。
但是今天,在Intel終于回歸用架構、性能作為劃分產品系列的標準之后,我們看到,摩爾定律為芯片增加的晶體管除了提高頻率之外有了更利于提升性能的用途——集成更多核心。
2005年4月15日下午,在以雙核心處理器為主題的技術講座中,Intel處理器應用高級工程師Benson Inkley先生為我們揭示了Intel在臺式機、工作站和服務器方面的雙核心規劃,并且剖析了雙核心、超線程在工作方式以及性能表現等方面的不同。
Benson Inkley先生首先向我們講解了雙核心不同的物理結構——并列雙核心與分離雙核心(說明一點,這是筆者總結出來的稱呼,并非Intel官方說法)。

在90nm的Pentium D處理器中,兩個物理核心緊密相連,分別擁有各自獨立的內核及二級緩存。而在未來的多芯片處理器中,兩個(或者更多)核心分離排布同樣擁有各自獨立的內核及二級緩存——Inkley先生表示,這種結構將應用于65nm工藝的多核心處理器中。而在65nm之后,Inkley先生表示,也許這些分離的核心又將連結到一起,回歸Pentium D的結構,這樣做的原因,則是出于設計效率和優化方面的考慮(通俗一點就是良率),對于最終用戶來說,他們看到的其實都是一樣的處理器——一片蓋著金屬蓋子的覆晶材料基板。
最先與我們見面的,也就是4月19日正式發布的,乃是桌面級的Pentium D處理器家族,它包括2.8GHz的Pentium D 820、3.0GHz的Pentium D 830和3.2GHz的Pentium Extreme Edition 840,它們的FSB都是800MHz,擁有兩個獨立的1MB二級緩存,支持Intel EM64T 64位擴展技術和基于底層安全技術的Execute Disable Bit(XDB)技術。和現在的90nm Pentium 4處理器一樣,Pentium D采用LGA 775接口。
在Pentium D家族中,惟一不同的是Pentium EE 840,它支持超線程技術,開啟后能在兩個物理核心的基礎上實現4顆邏輯處理器,進一步提高系統的并行程度。在IDF的現場,我們看到了基于Pentium EE 840的演示平臺。從Tt機箱透明的側板看進去,我們看到Pentium EE 840的散熱系統相當碩大。
這個演示平臺仍然是32位的Windows XP Professional+SP2的操作系統,沒有安裝什么軟件。通過操作系統的任務管理器,我們可以看到系統中有4顆邏輯處理器,頻率都是3200MHz。當通過Intel提供的Maximum Power Program for SmithfieldXE Processor軟件將兩個核心的負載都提升到100%時,我們看到4顆邏輯處理器都在滿負荷運行;將核心0的負載降低到50%后,我們看到整體的CPU占用變成了75%,核心0的一顆邏輯處理器滿負荷運轉,而另一顆則處于空閑狀態——由此我們也看到了現有操作系統在線程調度方面的大致表現。
另一個雙核心演示平臺則通過繁重的視頻壓縮任務來體現多核心并行處理的優勢。用Adobe Premiere Pro同時壓縮兩段視頻剪輯,現在看來似乎是Mission Impossible,但是對于開啟超線程的Pentium EE 840平臺,這樣的任務卻顯得異常輕松。
和現有的Pentium 4處理器相比,Pentium D在核心架構上并無不同,只是包含了兩個Pentium 4的核心,并且提供獨立的總線接口。因此,在多指令并行處理方面,Pentium D將具有比Pentium 4更高的效率,而如果是為超線程技術優化的同時包含整數和浮點運算的多指令并發執行,則Pentium EE 840的性能將得到最充分的發揮。
這里要針對Pentium D的命名替Intel進行一些澄清。Pentium D這個名稱甫一出現,有關“D”的含義的猜測就接踵而至,歸納起來,一種認為“D”代表了“DualCore(雙核心)”的意思,另一種則認為“D”代表“Desktop(桌面)”——就像Pentium M中的“M”可以理解為“Mobile”一樣,還有一種推測則基于“D”是字母表中第四個字母,因此是Pentium 4的新寫法……
技術講座結束之后我們專程就這個問題請教了Benson Inkley先生,他的反應看起來顯得有些困惑:“我們并沒有賦予它(D)任何特定的意思,Pentium D就是Pentium D,一個代號而已,它不代表任何含義。”在了解到我們對“名分”的重視之后,他對這種猜測表示了理解:“Pentium D不代表任何含義,當然,從反面來說,你可以賦予它任何的含義。”——這就是Intel對Pentium D命名的官方解釋。
在90nm的Smithfield之后,65nm的Presler核心將以分離雙核心結構登場,這種結構的好處在于能夠用任意單核心進行組合,從而提高良率。在架構方面,構成Presler核心的每個獨立的Cedar Mill內核都會將二級緩存容量提升到2MB,同時支持HTT、EM64T和XDB,仍然沿用LGA 775接口,除此之外,就Presler和Pentium D的結構框圖對比而言,我們還看不到更多的改進——從這里我們可以看出,目前的Pentium 4處理器的下一個內核自然非Cedar Mill莫屬了。
對于一些媒體在介紹雙核心時提到的將兩顆核心的二級緩存合并而產生的共享二級緩存的雙核心處理器版本,Inkley先生予以了否認。他表示,目前Intel并沒有規劃這類產品——當然,也許這樣的設計會在未來的產品中出現。由于這種結構涉及到二級緩存的命中率問題,Inkley先生進行了進一步的解釋,無論Smithfield還是Presler,獨立的二級緩存之間都有數據通道相連,如果核心0需要的數據恰巧位于核心1的二級緩存中,那么這個數據將可以很快被復制到核心0的二級緩存里,以供核心0調用。
在服務器平臺,現有的雙路至強(Xeon DP)平臺將從2006年起導入Dempsey處理器,配合E7520芯片組構成Bensley平臺。Dempsey處理器在結構和特性上類似于Presler,接口則采用LGA 771。
Bensley平臺采用了雙總線結構,每顆Dempsey處理器通過一條獨立的總線和E7520芯片組通信,而在處理器內部,每個核心仍葆有獨立的總線接口。Inkley先生表示,獨立的總線將帶來更高效的數據傳輸。
更高端的多路至強(Xeon MP)平臺則將由Paxville處理器搭配E8500/E8850芯片組構成Truland平臺。盡管計劃在2006年第一季度推出,Paxville處理器仍然采用90nm工藝而不是更“新潮”的65nm。它支持HTT、EM64T和XDB,接口類型不詳。
Truland和前面介紹的所有平臺最大的不同,乃是Paxville的兩個核心的總線接口合二為一,采用了共享總線的模式。由于Truland平臺支持最多4顆Paxville處理器,而每顆處理器又包含兩個獨立的核心,再加上超線程技術派生出的邏輯處理器,Truland平臺將擁有最多16個邏輯處理器!Inkley先生表示,考慮到總線和芯片組物理上的負荷能力,E8500芯片組允許在每條總線上有最多兩顆處理器——這就是性能和設計能力折中的結果。
Inkley先生解釋道,如果像Bensley平臺那樣,每顆處理器都使用一條獨立的總線,那么E8500芯片組需要提供最多4條總線來和處理器通信,這在芯片組本身和主板的設計上都存在很大的困難;而如果4顆處理器共用同一條總線,一方面系統性能將低到不可接受,另一方面這條總線的負載也絕非目前芯片組和主板的設計水平所能滿足。
因此,在處理器內部將兩個核心的總線接口整合,再通過共享總線的方式來取得性能和設計上的均衡,就構成了Xeon MP在雙核心時代的第一步,而層層整合的總線是否會影響雙核心Xeon MP平臺性能的發揮,目前我們還不得而知。
至于多處理器的仲裁,也就是由哪顆處理器擔當Boot strap來引導系統,則根據處理器的數量和位置有所不同,并且還會隨處理器版本升級而改變——如果某一顆處理器的Stepping版本更新,則系統會將它識別為Boot strap。
曾經寄托了Intel 64位運算神話的安騰(Itanium)平臺也將在今年第四季度迎來雙核心的Montecito處理器,它采用90nm工藝,支持4組并發線程,擁有兩個1MB的二級指令緩存和兩個13MB的三級緩存——這樣它內核外部的緩存容量就將達到空前的28MB,其晶體管數量也高達172000萬個!
關注我們


