GPU已成為中科院及清華大學科研工具
挑戰(zhàn)
過程工業(yè)是以物質(zhì)和能量的轉(zhuǎn)化為核心的基礎(chǔ)產(chǎn)業(yè)門類,包括了化工、冶金、鋼鐵、能源和環(huán)保等影響國計民生的重要行業(yè),目前占中國GDP的近1/6。但這些產(chǎn)業(yè)也面臨著能耗和資源消耗量大、污染嚴重等嚴峻的挑戰(zhàn)。探索和引領(lǐng)優(yōu)化工藝流程的新技術(shù),提升生產(chǎn)效率和產(chǎn)品附加值,正日益成為這些行業(yè)競爭的焦點之一。計算機模擬技術(shù)在此大有用武之地,而模擬對象的復雜性決定了它對超級計算的迫切需求。而基于CPU的傳統(tǒng)超級計算設(shè)備購置成本高,實驗周期長,使企業(yè)既有成本壓力帶來的顧慮,又難以適應快速變幻的市場節(jié)奏,極大地限制了模擬技術(shù)在過程工程中的應用。寶鋼、中石化、中石油等中國過程工業(yè)的龍頭企業(yè)一直致力于探索與應用既能實現(xiàn)工藝流程優(yōu)化,又能節(jié)約成本,提升效率的最新技術(shù)。
解決方案
為解決這一難題,中科院過程所經(jīng)過長期探索,逐步認識到多尺度結(jié)構(gòu)和離散化是許多工程問題的共同特征,由此建立了相應的通用算法框架和專門的硬件體系結(jié)構(gòu),通過模擬對象、軟件和硬件的結(jié)構(gòu)一致性實現(xiàn)高效能、低成本的超級計算。而2007年NVIDIA(英偉達)CUDA和Tesla GPU的發(fā)布為由商用部件搭建此類系統(tǒng)提供了可能。過程所敏銳地抓住了這個機遇,于2009年成功搭建了主要基于NVIDIA(英偉達)TeslaGPU的多尺度離散模擬并行計算系統(tǒng),單精度峰值超過每秒1000萬億次浮點運算。為過程模擬提供了強大而實用的工具從而服務于節(jié)能減耗和工藝流程優(yōu)化。目前過程所正與聯(lián)想和曙光合作將為國內(nèi)近十家用戶分別建立百萬億次級GPU+CPU異構(gòu)并行系統(tǒng),實現(xiàn)其在過程工程、信息技術(shù)和基礎(chǔ)科學研究等多個領(lǐng)域的應用。
成效
與以前單純的CPU平臺相比,應用NVIDIA(英偉達)Tesla GPU(圖形處理器)的新平臺不僅成本大幅降低,還能較高提升計算機效率,如某大企業(yè)冶金過程的離散粒子模擬的速度提升了50倍。
中國科學院過程工程研究所研究員、超級計算系統(tǒng)項目負責人葛蔚說:“通過GPU對相關(guān)軟件和硬件能力的提升,不僅能耗大幅降低,還可以使某種化工反應器模擬時間從一天縮短到2分鐘。這是一個革命性的進展。”
利用GPU超級計算系統(tǒng),過程所已成功開展了多相流動直接數(shù)值模擬、材料和納微系統(tǒng)微觀模擬和生物大分子動態(tài)行為模擬等應用,證明了多尺度離散化并行計算模式的優(yōu)勢和前景。例如,對過程工業(yè)中常用的流態(tài)化反應器,通過模擬方法上的改進,該系統(tǒng)已能按接近實時的速度從毫米級的顆粒尺度模擬米級的宏觀行為。這種能力在某清潔汽油生產(chǎn)工藝的開發(fā)和優(yōu)化中已經(jīng)并將進一步發(fā)揮重要作用。該系統(tǒng)也正應用于縫洞型油藏的驅(qū)采過程模擬。
采用該系統(tǒng)的96個GPU,對含有100微米左右縫隙的0.16平方米的巖石樣本,直接數(shù)值模擬的速度達到了4秒鐘計算物理上的1小時,從而能有效替代能費時費力的物理實驗。而對于冶金過程,該系統(tǒng)甚至能對數(shù)千立方米的高爐中厘米級的礦石物料進行全系統(tǒng)的三維動態(tài)模擬。如采用120個GPU,5個小時就能復現(xiàn)一個完整的布料過程。目前該系統(tǒng)已在寶鋼新型鋼渣處理工藝的開發(fā)中得到實際應用。在上述過程中,NVIDIA(英偉達)GT200 GPU的實際單精度速度普遍達到了CPU核的三十倍以上,甚至超過百倍,應用效果非常顯著。
關(guān)注我們



