GPU爭奪霸權!NVIDIA談超級計算機發展
● Tesla基于NVIDIA CUDA,該技術最顯著的特點就是能夠利用GPU的并行計算能力,在大規模、高帶寬計算中有著極大的優勢。 但是,面對串行計算密集型任務,Tesla是否有解決辦法呢?
Andy Keane:GPU及其內部的CUDA架構是專為并行計算而設計的。
串行計算是一種有很大區別的架構,這種架構的設計目的是為了解決不同的問題。CPU執行指令的方式就是一個接著另一個地執行。CPU中有許多能夠加速串行計算的技術。高速緩存、無次序執行、超標量技術、分支預測……均為抽取指令的技術或一系列指令的串行級并行機制。CPU對片上高速緩存的設計與容量的依賴也非常大。如果程序大小與CPU高速緩存容量不匹配,那么該程序在CPU上的運行速度將會很慢。
GPU內部的并行計算架構圍繞兩個基本概念而設計。首先,程序中的數據可分成許多個部分,而為數眾多的核群可以并行地處理這些數據。第二個架構方面的設想是,數據將不與高速緩存匹配。例如在圖形計算或石油天然氣數據處理上,數據量可能會達到兆字節甚至是太字節,用高速緩存來容納如此巨大的數據量幾乎是不切實際的。考慮到這兩點設想,GPU被設計為能夠使用數以千計的線程,所有線程均并行地執行,能夠訪問巨大容量的本地存儲器。在最新的Tesla產品中,每顆GPU均配備4GB存儲器,可容納待執行的數據。同時針對反復使用的數據,還設有較小的片上存儲空間,GPU所配備的巨大容量存儲器等同于CPU內部的高速緩存,只是容量大了許多倍而已。
● 獲取軟件時,中國的超級計算機用戶要么購買商業軟件解決方案,要么自己開發,或者在商業軟件解決方案的基礎上進行二次開發。 CUDA與獨立軟件供應商之間有一定的合作,你有沒有成熟的軟件應用程序推薦給用戶使用? CUDA怎樣幫助這些想要自己開發軟件的用戶?
Andy Keane:我們與打算發布超級計算軟件的獨立軟件供應商都進行了積極的開發工作。分子動力學領域的《NAMD/VMD》以及《GROMACS》是為群集GPU發布的兩個應用程序例子。在美國的超級計算展會上,我們還展示了許多用于石油天然氣領域地震處理、量子化學以及Ansys有限元設計的應用程序。
對于想要自己設計和開發應用程序的開發人員,用于CUDA架構的并行計算開發C語言編譯器可從NVIDIA網站上免費下載。Portland Group的Fortran等其它編譯器也正在陸續推出。有很多來自NVIDIA以及其它來源的程序庫,這些庫使應用程序更易于開發。針對這些不懂C語言或Fortran的開發人員,Accelereyes以及Wolfram(Mathematica)等公司還提供了GPU加速版的軟件。因此你可以看到,利用GPU計算優勢的方式有許多種。
關注我們



