專訪NV&天河1A:中國驕傲 世界驕傲!
泡泡網顯卡頻道1月22日 2013年1月17日—中國天津—國家超級計算天津中心—今日,天津經濟技術開發區、國家超級計算天津中心以及視覺計算技術行業領袖NVIDIA®(英偉達?)公司正式舉行簽署儀式,三方將共同打造聯合實驗室。天津經濟技術開發區管理委員會副主任張國盛先生、國家超級計算天津中心劉光明主任以及NVIDIA公司PSG全球副總裁Shanker Trivedi先生共同出席了此次儀式。三方合作將共同致力于提升國內超級計算機技術整體水平,同時也為中國超級計算機領域培養更多優秀人才而努力。
天津經濟技術開發區管理委員會副主任張國盛先生與NVIDIA公司PSG全球副總裁Shanker Trivedi先生高層會談
如今,高性能計算已經成為世界高新技術領域的戰略制高點,是科技競爭力和綜合國力的重要標志。中國最近幾年在硬件、軟件和應用方面取得了重大進展,大大提升了超級計算的水平。此次天津經濟技術開發區、國家超級計算天津中心以及NVIDIA攜手打造的聯合實驗室將對NVIDIA一系列技術包括CUDA, OpenACC, Cloud Supercomputing技術等進行開發和應用的研究。進一步提升國內超級計算機技術整體水平,培養更多的超級計算機技術人才,從而有力帶動中國的科技進步和經濟、社會發展,為人類的科技進步做貢獻。
2006年,天津經濟技術開發區成為繼深圳和上海浦東之后,帶動中國經濟騰飛的"第三增長極"。天津經濟技術開發區致力于成為天津濱海新區綜合配套改革試驗的先行先試區、中國北方對外開放的門戶、高水平的現代制造業和研發轉化基地、宜居生態型新城區;致力于構建一個能夠吸引、容納各種先進經濟要素、經濟實體,有利于創造更多精神和物質財富,資源豐富、充滿活力、欣欣向榮、和諧發展的中國新經濟平臺。
依托現代制造業迅猛發展,天津經濟技術開發區對裝備制造、電子信息、生物醫藥等主導產業投入巨資,進行重點研發,并建立起公共研發平臺。京、津兩地的200多所高等院校也源源不斷地為天津開發區提供充足的人才資源。2010年,國家超級計算天津中心在天津經濟技術開發區正式建成我國自主研發的“天河一號A”超級計算機,在LINPACK基準測試中,該計算機性能高達2.507 Petaflops,當年即榮登全球超算性能榜首位置。
“天河一號A”也是國家超級計算天津中心首度與NVIDIA合作,將大規模并行GPU與多核CPU相結合,在性能、尺寸以及功耗等方面均取得了巨大進步,是當代異構計算的典型代表。該系統采用了7168顆NVIDIA Tesla M2050 GPU以及14,336顆CPU,不僅為超級計算機的性能大幅提升,同時也保證了超級計算機的功耗得到更好地控制。
NVIDIA針對于高性能計算的解決方案相比競爭對手更為成熟并且風險更低,全球的科學家與研究人員正在利用NVIDIA GPU來解決最復雜的難題,這些難題涵蓋了從氣候建模和量子物理學到攻克癌癥等所有范圍。NVIDIA CUDA架構讓GPU不僅能夠用于處理圖像像素,而且還能夠用于處理數值數據。NVIDIA GPU通過利用CUDA技術,編程移植更具便捷性,從而讓超級計算更加高效、更易于普及。
NVIDIA公司PSG全球副總裁Shanker Trivedi先生表示:“GPU正在以一種深遠的方式重新定義高性能計算,在去年發布的五百強超級計算機榜單中,有超過50臺系統采用了NVIDIA GPU。我們將通過與國家超級計算天津中心共同打造聯合實驗室的形式,共同推動科研工作者發現效率的提升、協助解決全世界最復雜科學難題,同時也會將“天河一號A”的性能廣泛應用于各行各業的設計和研發中。”
國家超級計算天津中心劉光明主任與NVIDIA公司PSG中國副總裁Ashok Pandy先生簽約共建聯合實驗室儀式
隨著行業用戶需求的增加,高性能計算的需求也將會呈現穩定攀升的趨勢。“天河一號A”的成功,為超級計算行業指明了一條具有“中國特色”全新發展方向。此次國家超級計算天津中心與NVIDIA的再度攜手預示著NVIDIA對中國超級計算的高度關注,強強聯手將會再次為中國超級計算行業帶來新的突破。對中國未來超級計算人才培養提供非常好的溫床,助力超級計算的蓬勃發展。我們堅信,隨著國家超級計算天津中心與NVIDIA的不斷深入合作,在未來將會有越來越多的“天河一號A”在實際生產生活中得以應用,成為各領域科學計算的重要工具!
簽約儀式舉行之后,媒體來到位于天津市濱河新區的國家超級計算天津中心。
國家超級計算天津中心:天河
天河由胡錦濤總書記題名
天河1A曾經是世界上最強的超級計算機
機組實拍
國家超級計算天津中心應用研發部孟祥飛部長為媒體講解天河1A特性
應用演示
天河1A擁有大量自主研發技術,最核心的互聯組件均由國防科技大學研制。也就是說,除了CPU和GPU,其他配件都是自行設計并制造的。和個人PC不同,超級計算機中CPU、GPU并不是性能的全部,如何將數千顆CPU和GPU連接在一起,進行高效率的計算和通信才是重中之重。而自主研發的天河1A在這方面處于世界頂尖水準。
在參觀并了解天河1A超級計算機之后,國家超級計算天津中心劉光明主任和NVIDIA®(英偉達?)公司PSG全球副總裁Shanker Trivedi接受了媒體采訪,首先是國家超算天津中心劉光明的部分。
媒體:從天河一號A的配置上來看,主要采用了三種處理器,分別是Intel處理器、Tesla還有自主研發的飛騰1000。這三種不同架構的處理器各自不同的工作是什么?
國家超級計算天津中心劉光明主任:河一號當時提出來一個異構融合的結構,通俗地講,就是CPU+GPU的組合,它的過程實際上是因為2005年到2007年,國防科技大學研究通用CPU和GPU加速器的結合來提高超級計算機的計算性能。這個問題的來由是什么呢?大家可以看到,不管是當前國際上還是自主研發的這種通用CPU,這些都是千萬億級計算機,或者更高級別的計算機,用通用CPU計算機去做的話很難做,因為規模大,功耗大,而且使用起來不一定很好。一個典型的例子,2011年下半年,當時美國IBM承擔了一個美國計算機的研究項目,完全都是通用CPU的方法去構建最快計算機,結果這個項目流產了。研制它的費用很高,做出的機器規模也比較大占地規模大,功耗也比較大。實際上這之前,國防科技大學2005年到2007年就在研究,用通用CPU與GPU加速器結合,當時我們自己做了一個流處理器,結合起來之后發現有很大一類高性能計算機的應用,像流體力學、氣動力學、FFT、CFD的東西,包括還有很多算法都適合這種結構,解決很多復雜的數學問題,這種結構是適用的。后來,在2009年的時候,天河一號做第一期的時候,當時因為要做一個實用性能比較高的系統,所以就選用了AMD的GPU來替代當時國防科技大學自己研究的流處理器,這樣就誕生了當時的天河一號,這個機器當時排名是世界第五,亞洲第一。
后來我們發現了Tesla 2050,因為AMD的GPU沒有ECC校驗,而Tesla有ECC校驗,所以在2010年的時候,我們做了一個升級,GPU換成了NVIDIA的,同時高速互聯系統換成我們自己的了,我們自己銀河的高速互聯,我們自己強化的操作系統,升級了之后又做了一些優化,做出了天河一號A,整個過程是這樣的。
另外天河一號A是怎么工作的?整體上這個系統分成兩部分,一部分是Intel的CPU加上NVIDIA的GPU構成了一個現在新的系統,這個系統在整個所有天河系統的7/8,另外1/8的部分是用的我們自己的CPU,飛騰1000,這套系統應該說是實驗優化的環境,我們有很多科技計算的程序,一些應用都在這上面做測試,做實驗,有一些應用也是一種實際的應用,不斷的調試,測試,完善。
天河1A的核心技術均為自主研發并且處于全球領先水平
媒體:在性能前10名的HPC里面有6個不是用混合架構的系統,我不知道您對這個如何評價,有6臺這樣的設備出現在最尖端的HPC的系統里面。
國家超級計算天津中心劉光明主任:國際上出現一個傾向,2010年10月之后,中國的天河一號A獲得世界靠前之后,同時中國的曙光是世界第三,實際上歐美日政府對它的關注度提升了。國外建新的超算中心,投資一個新的機器這個周期比較長。天河一號A出來之后,政府追加了一些投資,有些投資可能提前執行了,是在原來的基礎上把它擴充了。所以你看到,去年6月份出的三臺都是天河一號A之前的,比較容易做,從政府投資,技術上來講都比較容易,這是你所看到的前10臺。實際上它存在的問題呢,就是要再擴大的話,比較受限,只能滿足當前的需要。
媒體:我是有一個關于應用方面的問題想請教一下兩位,剛才NVIDIA的領導也提到了,未來會把基于Kepler方面的應用推到成千上萬個應用,同時今天也成立了這樣一個聯合的實驗室,我覺得未來如何推動異構的編程可能是未來應用很重要的點,我想請教一下兩位,在NVIDIA方面,我們在推動異構編程方面未來重點的方向是什么。在劉主任這方面,給我們大家分享一些關于異構編程和應用這方面的經驗。
國家超級計算天津中心劉光明主任:在我們操作中心來講,天河一號A這種異構結構幾個典型的應用還是應用得不錯的,最典型的石油勘探數據處理,經過天河一號A,已經完成了具有自主知識產權的石油三維歷史偏移。這個軟件過去是掌握在國外人手上,國外公司手上,對于我們來講是高價政策,你要買價格很高,有的東西還不賣給你,他自己用還不賣。我們現在通過天河一號A,從2011年年初開始,跟東方物探進行合作,持續做了兩年的時間,整體性能從通用CPU的版本上升到CPU+GPU的版本,整體性能提升了大概六倍。同時我們在這個基礎上又做了一個基于計算系統做的優化,磁盤的數據處理系統變成一個基于內存的。另外包括現在的氣動力學,大飛機的仿真,說得更通俗一點就是數字風洞的處理,還包括一些典型的應用,包括還有一些源的分析等等這些,現在應用都不錯。
我們這次跟NVIDIA成立一個聯合實驗室,主要是兩個方面,一個方面就是在異構結構上,在優化,用他們一些新的軟件,提升用戶使用的效率,這是一個方面。第二個層次,基于天河一號A新的通信處理技術,硬件和軟件,剛剛講的云計算,物聯網,包括智慧城市,包括三網合一。這一塊兒我們想跟NVIDIA,在這幾個方面進行合作。落在濱海開發區,帶動本地高端信息產業的發展,也做一個示范,帶動我們國家在這些領域的快速發展。
剛才記者會上展示過過,人臉識別,這應該是NVIDIA的專長,做人臉的識別,圖象處理是非常擅長的,這方面的應用,智慧城市來講,國家安全方面有很好的應用前景。PC方面的合作之外,基于現在云計算這一大類新興產業方面的發展,合作,還有很好的合作前景,也可以產生很好的合作效益。
實際上我們今天合作,包括云計算,在新興產業方面怎么再上一個新臺階。那一塊兒作為媒體來講,天河一號獲得世界靠前之后,我們實際上客觀的講,我跟很多媒體都說,我們實現一個重大的轉身,或者叫華麗轉身,一定是要上一個新的臺階做應用,做產業發展,其實天津給我們這個平臺,起到了很好的科技招商,產業聚集作用。基于國家投資建設的超級計算中心,再結合各個部委現在支持建的云計算中心,或者叫數據中心,構建一個整體。前面的數據中心和云計算中心承擔數據的搜集和用戶的服務,數據的挖掘和分析是基于超級計算中心,這么一個模式和這么一個整體來講,可以形成一個很好的生產力,要形成一個真正的生產力,不是停留在一個凈資產上,只是做HPC大家去算一算。我跟很多參觀的人講,天河一號A能干什么呢,通常的講是“算天算地算人”,把這三件事,三個“算”做成之后,才是真正國家關心的生產力,不是一個金字塔上大家看到的世界靠前。我們現在跟有很強優勢的國外的公司、單位合作,目的就是實現強強結合,充分利用國外的技術優勢,利用我們自己的優勢,實現強強結合,達到雙贏,最終的目的當然是推動我們國家向新的生產方式轉變,推進濱海新區,開發區來講,實際上是生產方式轉變,新的增長點一個很關鍵的問題。
接下來是NVIDIA公司PSG全球副總裁Shanker Trivedi先生回答部分的內容:
媒體:近年來在HPC應用方面,NVIDIA的比例越來越大,現在全世界500強的計算機大概有1/10之多用了NVIDIA的加速卡,未來NVIDIA在這方面有什么計劃?
NVIDIA®(英偉達?)公司PSG全球副總裁Shanker Trivedi先生:天河一號A向全世界證明了異構超級計算是一個非常好的科學計算,超級計算中心發展的方向。接下來全世界超算中心,紛紛采用了GPU加速并行計算這樣的體系結構,像美國的高性能超算中心、德國的超算中心,都是在他們國家或者是地區最大的系統,這些系統都紛紛的采用了GPU加速并行計算,而傳統的超級計算CPU只貢獻了整個高性能計算的10%左右,甚至還要更小,但是GPU貢獻了大部分,甚至是80%,90%,很多很多都是計算性能是從GPU貢獻出來的。對于未來更重要的,我們在硬件體系結構上的發展,都做了非常多預先的研究。
更重要的是,我們現在有300個以上應用軟件。大量的應用軟件,解決科學問題的工具已經可以在CPU+GPU這樣的異構體系上運行。未來高性能加速計算的方向,已經是一個超算的新紀元,我們可以看到,這是大家公認的,被科學界,被學術界,被產業界廣泛采用的一個體系結構。
關于未來,我留了最后一點,剛才談了第一點性能,我們的性能非常好,第二關于應用軟件,我們很多。最后一點非常非常重要,為什么大家被逼得沒辦法走這條路,因為摩爾定律要把計算機每十年漲一千倍,現在漲一千倍不是玩笑,但是同時電力消耗非常非常大,現在我們可以用新的異構計算加速的方式,為未來大大的節省超算中心構建的成本,同時節省功耗,降低能源功耗,節省費用。
媒體:我是有一個關于應用方面的問題想請教一下兩位,剛才NVIDIA的領導也提到了,未來會把基于Kepler方面的應用推到成千上萬個應用,同時今天也成立了這樣一個聯合的實驗室,我覺得未來如何推動異構的編程可能是未來應用很重要的點,我想請教一下兩位,在NVIDIA方面,我們在推動異構編程方面未來重點的方向是什么。在劉主任這方面,給我們大家分享一些關于異構編程和應用這方面的經驗。
NVIDIA®(英偉達?)公司PSG全球副總裁Shanker Trivedi先生:
一般是三種方法來做這種異構上的編程:第一類談到應用,存在了很多年的,甚至幾十年的應用,對于這樣一類應用,我們建議采用一種直接編程的方法,編程的標準在OpenACC。OpenACC是一個國際標準,這是開放的,很多人都可以采用的標準的編譯的方法,這種方法可以使得傳統的,存在這么久的軟件可以最小的改動,因為寫這個程序的人有可能都不在了,他可以以最快的方法編到GPU和CPU上,異構的平臺上進行計算,同時加速。舉一個例子,在美國的能源實驗室里,他們有一個很大的應用,這個軟件應用叫S3D,類似像核聚變這樣的應用,這個程序有100萬行的程序,只改了400行,只改了非常非常小的程序量,大約只有萬分之四,通過編譯器編譯,得到了六倍速度的提升。
第二種方法,這些新的應用,我們建議用CUDA GPU并行編程的方法,這個架構模型我們可能大家都熟悉,CUDA可能大家都熟悉,實際上就是把傳統的C語言,類似其他的高性能通用編程語言進行一點點擴展,只是稍微做了一些語法方法的擴展,大家寫程序的方法不變,這樣重新寫出來的程序效率可以大大的提升,可以在這個程序上跑。什么樣的程序多了呢?像信號處理,圖象處理,還有一些科技計算,用這樣的方法來提升計算的效率。
最后一種方法,用一些很多科研機構庫函數的方法,NVIDIA提供了很多系統級的庫函數,還有很多是大學、科研機構,還有網上做了很到的庫函數。舉一個例子,一些很傳統的中間件,你調他的庫函數的話,用這樣的方法來提升,他們那些函數已經是GPU上的,寫程序的人并不用關心他們是怎么實現的,只是調用這些名稱和函數來做就好了。
所以總結一下,就是用三種方法,對于長期存在已有的程序,我們推薦用OpenACC,但是對于新程序,或者對性能有追求,一定要求特別高性能的可以用CUDA來進行改寫,對于其他一些傳統的,比較規范的程序,調用大量函數的,可以用調用庫函數的方法來做。
通過NVIDA先進的GPU計算技術,如今的超級計算機邁入新時代,在推動人類社會進步上做出了巨大貢獻。對于天河1A來說,它的建立不僅僅是打造我國超算的標志性產品,更是將設備投入到實際應用之中去,成功完成多個計算任務,創造了商業價值。考慮到能耗成本,這在過去單純采取CPU為主要處理器的計算設備中是難以想象的。而借助NVIDIA高性能圖形計算加速芯片,天河1A完成了這樣的奇跡:實現盈利,自給自足。
天河1號A超級計算機不僅是中國的驕傲:它是中國自主研發超級計算機系統的成功案例,證明了我國超算的技術實力,震驚世界,并且成功登上了性能世界靠前超級計算機的王座。天河1A更是世界的驕傲,它開創了GPU加速計算的先河,為全球超級計算機機構立下了榜樣,讓超級計算機從此進入到一個全新紀元。■<
關注我們



