天河一號(hào)A稱霸!超級(jí)計(jì)算未來屬于GPU
泡泡網(wǎng)顯卡頻道11月3日 隨著中國國防科技大學(xué)研制的“天河一號(hào)A”正式對(duì)外公布之后,采用GPU加速的超級(jí)計(jì)算機(jī)如愿以償?shù)牡琼擳OP500首席寶座,成為目前世界上最快的電腦,這對(duì)于GPU并行計(jì)算可以說是一座里程碑。詳情參閱“"天河一號(hào)A"榮登世界超級(jí)計(jì)算機(jī)榜首”一文。
“天河一號(hào)A”強(qiáng)大的運(yùn)算能力,主要來原因NVIDIA公司最新的Tesla GPU產(chǎn)品,NVIDIA在2006年發(fā)布了CUDA運(yùn)行架構(gòu)之后,經(jīng)過將近4年的時(shí)間,Tesla GPU計(jì)算已經(jīng)真真正正幫助到了中國超級(jí)計(jì)算機(jī)產(chǎn)業(yè)的發(fā)展,“天河一號(hào)A”、“星云”正是在NVIDIA的大力支持下,才獲得了舉世矚目的成就。
NVIDIA GPU計(jì)算事業(yè)部總經(jīng)理Andy Keane
NVIDIA中國區(qū)PSG高級(jí)銷售經(jīng)理謝強(qiáng)先生
為了進(jìn)一步了解GPU加速在超級(jí)計(jì)算中所扮演的角色,筆者有幸對(duì)NVIDIA GPU計(jì)算事業(yè)部總經(jīng)理Andy Keane先生做了一個(gè)簡短的專訪,下面就將此次專訪的主要內(nèi)容整理出來,供有興趣的朋友們參考。
記者:像這種CPU+GPU異構(gòu)計(jì)算架構(gòu)的超級(jí)計(jì)算機(jī),使用了很多顆GPU,同時(shí)也使用了更多的多核心CPU,他們都擁有龐大的運(yùn)算能力,那么在其最終實(shí)際運(yùn)算量當(dāng)中,大概有百分之多少是GPU貢獻(xiàn)的,有多少是CPU貢獻(xiàn)的?
Andy Keane:不同的超級(jí)計(jì)算機(jī),其互聯(lián)網(wǎng)絡(luò)和結(jié)構(gòu)有所不同,但大概來看的話,CPU運(yùn)算量占20%,GPU占到80%。
記者:那就是說,GPU的運(yùn)算量要比CPU大很多,以后的比例會(huì)繼續(xù)提高嗎?是不是意味著以后不需要太強(qiáng)的CPU,只需要能夠管理的GPU就可以了?
Andy Keane:在系統(tǒng)的設(shè)計(jì)中,實(shí)際上是一個(gè)設(shè)計(jì)平衡的問題,一定要在各個(gè)環(huán)節(jié)里達(dá)到平衡,比如說你的GPU速度越快,就意味著你需要快速的CPU的速度,還有網(wǎng)絡(luò)的速度以及內(nèi)存的大小,是需要達(dá)到一個(gè)平衡的。也就是說更快的GPU還是需要更快的CPU支持。
最新的中國超級(jí)計(jì)算機(jī)排行榜單
記者:我們今天看到中國的TOP100里面前三名都采用了Tesla的GPU,但是我們發(fā)現(xiàn)效率有很大的不同,第一名(天河一號(hào)A)最高,達(dá)到53%,第三名(中科院工程研究所)才達(dá)到18.5%,這個(gè)第三名也用到了GPU加速的互聯(lián)技術(shù)。從GPU采用角度來說,NVIDIA公司對(duì)混合計(jì)算的效率有什么看法,或者說對(duì)于未來采用混合技術(shù)的開發(fā)人員有什么忠告,采用什么樣的架構(gòu)來保證混合計(jì)算體系架構(gòu)的一個(gè)更高效率?
Andy Keane:系統(tǒng)的實(shí)際運(yùn)行效率是由它所要運(yùn)行的應(yīng)用所決定的,你剛才提到的,效率比較低的第三套系統(tǒng),它大多的工作就是處理分子動(dòng)力學(xué)和離子仿真。它的應(yīng)用就導(dǎo)致你需要對(duì)它的架構(gòu)進(jìn)行一些特殊的設(shè)計(jì)。新的天河一號(hào)A它主要面臨的應(yīng)用,是希望能夠廣泛的應(yīng)用,我們也需要進(jìn)行不同系統(tǒng)的設(shè)計(jì)。所有超性能計(jì)算機(jī)會(huì)用于不同的終端,只是現(xiàn)在比較普遍的衡量他們性能的標(biāo)準(zhǔn)都是Linpack值。
謝強(qiáng):我補(bǔ)充一下,高性能計(jì)算機(jī)設(shè)計(jì)體制結(jié)構(gòu)的兩種方式:一種是有應(yīng)用主導(dǎo),然后設(shè)計(jì)計(jì)算機(jī);第二種是我要設(shè)計(jì)一種通用的高性能計(jì)算機(jī)。所以大家設(shè)計(jì)計(jì)算體系結(jié)構(gòu)的思想是不一樣的。比如中科院的方式,他們是先有了應(yīng)用,先有了離子仿真和分子動(dòng)力學(xué)的應(yīng)用,完全是按照他們的應(yīng)用,他們的應(yīng)用在上面跑的效率最好。但是非常不幸的是,今天世界排名只用Linpack的測試軟件,中科院的系統(tǒng)設(shè)計(jì)不是為了跑Linpack設(shè)計(jì)的機(jī)器,他們是為了自己的分子動(dòng)力學(xué)和離子仿真設(shè)計(jì)的機(jī)器,這樣就導(dǎo)致用同一個(gè)測試程序測試的時(shí)候,結(jié)果會(huì)有比較大的差異。但是天河這臺(tái)機(jī)器是為了不同的應(yīng)用,它的設(shè)計(jì)更通用一些。
記者:看起來Tesla的效率是挺高的,但與純CPU系統(tǒng)的超級(jí)計(jì)算機(jī)70%-80%的效率相比還是有一定的差距。
謝強(qiáng):他們自己(中科院工程研究所)的應(yīng)用效率是非常高的,可能能達(dá)到70%、80%,甚至80%、90%,非常高的效率。為什么會(huì)有這樣的原因呢?分子動(dòng)力學(xué)和他們那種計(jì)算模式,在不同的節(jié)點(diǎn)之間做計(jì)算的時(shí)候沒有節(jié)點(diǎn)之間的通訊,而Linpack的程序節(jié)點(diǎn)之間是有通訊的。應(yīng)用不一樣,是造成這個(gè)問題最主要的原因。但是目前大家沒有更好的衡量高性能計(jì)算的方式,Linpack已經(jīng)是不錯(cuò)的了,大家默認(rèn)Linpack測試了,不斷你是什么結(jié)構(gòu)設(shè)計(jì)的機(jī)器,都用這個(gè)來測試,這樣大家都有一個(gè)排名了。
記者:我們知道“天河一號(hào)”去年發(fā)布的時(shí)候,它是中國TOP100的第一名,那時(shí)候他用的是AMD的HD4870X2,可能很多人會(huì)有疑問,到今年怎么都換成Tesla,我們也知道一些原因,想請(qǐng)NVIDIA具體給我們闡述一下,“天河一號(hào)A”基于什么樣的考慮讓他們最后把AMD的4870X2換成了Tesla?
Andy Keane:最主要的原因就是軟件,NVIDIA公司提供了一個(gè)范圍非常廣的編程環(huán)境,使開發(fā)人員的能力得到很大的加強(qiáng),所以說,主要還是提供了非常良好的編程環(huán)境。人們一般情況下會(huì)更多的關(guān)注語言,就系統(tǒng)而言真正關(guān)注的有兩類人:一個(gè)是應(yīng)用開發(fā)人員;另一類是對(duì)IT系統(tǒng)進(jìn)行維護(hù)的人員。我們支持的ECC,首先它可以進(jìn)行很好的SMI的管理,另外它也有一些軟件工具,幫我們更好的管理集群。一方面可以進(jìn)行很好的應(yīng)用開發(fā),另一方面還可以管理集群,所以這兩者加在一起才使得系統(tǒng)表現(xiàn)的如此出色。一方面你要考慮這個(gè)系統(tǒng)是誰建造的,另外一方面還要考慮,是誰讓建好的系統(tǒng)能夠得以應(yīng)用,這兩個(gè)因素缺一不可。
像“天河一號(hào)A”里面用了7000多個(gè)GPU,放到一個(gè)系統(tǒng)中,除了開發(fā)應(yīng)用技術(shù)之外,還有管理、維護(hù)的大量工作,而我們正好有這樣管理、維護(hù)的技術(shù),可以幫他們更好的管理。
記者:今天我們看到基于Tesla為主的計(jì)算系統(tǒng),業(yè)內(nèi)知名和第三的都是來自于中國的GPU異構(gòu)計(jì)算的系統(tǒng),但是從全球超級(jí)計(jì)算機(jī)TOP500強(qiáng)來看的話,采用GPU混合計(jì)算系統(tǒng)卻很少見,好像中國現(xiàn)在比較熱衷于GPU異構(gòu)計(jì)算系統(tǒng)的開發(fā),而且越做越大。NVIDIA公司怎么看待中國在GPU異構(gòu)計(jì)算系統(tǒng)上的表現(xiàn),跟國際上的其他企業(yè)有什么不同?
Andy Keane:如果你看全球500強(qiáng)這些企業(yè),目前可能只有4臺(tái)計(jì)算機(jī)用的是加GPU的異構(gòu)計(jì)算方式,現(xiàn)在第三臺(tái)超性能計(jì)算機(jī)是中科院IPE,在北京建的一臺(tái)計(jì)算機(jī)。中國確實(shí)是最早先使用GPU的國家,另外,中國應(yīng)用GPU的確歷史最悠久,中科院也有一系列的規(guī)劃,更廣泛的使用在GPU系統(tǒng)中。但是在其他的企業(yè),他們首先是進(jìn)行小規(guī)模的GPU安裝,之后再遷移到自己基于CPU的大的系統(tǒng)平臺(tái)上,這是在國外的做法。(國外也有很多小型GPU超級(jí)計(jì)算機(jī),但都未能進(jìn)入TOP500強(qiáng))
我相信在11月份發(fā)布的500強(qiáng)的企業(yè)中,你會(huì)看到更多的企業(yè)在使用CPU+GPU異構(gòu)處理方式,當(dāng)然在中國的企業(yè)的名字已經(jīng)發(fā)布了,但是其他很多的使用混合處理器的企業(yè)將會(huì)在11月發(fā)布,基本上都是國外的企業(yè)。為什么呢?因?yàn)镃PU+GPU有獨(dú)特的優(yōu)勢,包括高性能以及高能效比兩方面。
中國超級(jí)計(jì)算機(jī)除了“天河一號(hào)A”外,“星云”目前排行世界第二
記者:是否可以認(rèn)為中國在基于GPU的應(yīng)用開發(fā)也走在世界的前面?比如基于使用CUDA的這種編程環(huán)境,中國混合編程的團(tuán)隊(duì)或者技術(shù)實(shí)力,你怎么看待它在全世界的水平?
Andy Keane:沒錯(cuò),可以這么說,就像剛才提到的中科院的IPE高性能計(jì)算的應(yīng)用,這是一個(gè)例子,還有很多其他的例子,中科院還有很多其他的引用。
其實(shí),高性能計(jì)算是兩個(gè)問題:一是,高性能計(jì)算讓計(jì)算技術(shù)加速,本身是加速的問題;二是在應(yīng)用上了,我們希望所有的科學(xué)家也好,工程師也好,都能夠應(yīng)用這樣高性能計(jì)算的工具,來解決生活當(dāng)中所面臨的問題。一個(gè)是本身加速的問題,另外一個(gè)就是應(yīng)用的問題。
記者:現(xiàn)階段,中國在高性能計(jì)算上排名比較靠前,是不是說現(xiàn)在中國在高性能計(jì)算方面處在領(lǐng)先的地位,你對(duì)未來中國的高性能計(jì)算怎么看呢?
Andy Keane:毫無疑問中國占據(jù)了領(lǐng)先地位。新的500強(qiáng)將會(huì)在1個(gè)月之后發(fā)布,我相信對(duì)于應(yīng)用來說,不僅僅是因?yàn)閼?yīng)用了GPU,在系統(tǒng)設(shè)計(jì)以及架構(gòu)的安排上也是發(fā)揮了一定的作用,只有這兩點(diǎn)綜合起來,才能夠讓你的應(yīng)用處于領(lǐng)先的地位。對(duì)于任何行業(yè)來說,如果你想成為行業(yè)領(lǐng)先的企業(yè)的話,其中一個(gè)方式就是采用最新的技術(shù)。
所以我相信,你看到Intel和NVIDIA公司兩家企業(yè),兩個(gè)觀點(diǎn)是具有非常鮮明對(duì)比的,比如說Intel的觀點(diǎn)就是對(duì)過去的一種延續(xù),一步一步的延續(xù)到未來。但是對(duì)于NVIDIA公司來說,尤其是中國的高性能計(jì)算,因?yàn)椴捎玫氖亲钚碌募夹g(shù),也獲得了最新技術(shù)帶來的優(yōu)勢。所以,在中國三大大型計(jì)算機(jī)的應(yīng)用,就是因?yàn)椴捎昧诵碌募夹g(shù),使他們能夠把這個(gè)優(yōu)勢應(yīng)用到最好。
記者:現(xiàn)在異構(gòu)計(jì)算越來越流行了,GPU的帶寬能比CPU的帶寬高好幾倍,這么高,可能對(duì)每一個(gè)節(jié)點(diǎn)之間的互聯(lián)也造成了很大的壓力。在NVIDIA公司看來,目前的這種MPI的架構(gòu)是不是已經(jīng)達(dá)到一種瓶頸了,或者說在某些方向已經(jīng)影響了互聯(lián)的操作,未來有沒有可能出現(xiàn)新的語言架構(gòu)替代MPI?不知道NVIDIA怎么看來這個(gè)問題?
Andy Keane:計(jì)算本身是了解整個(gè)過程中存在什么樣的局限和限制,之后讓軟件工程師或者計(jì)算機(jī)工程師尋找一些方法來跨越這些局限。所以,你剛才所提出的那個(gè)因素,應(yīng)該是一個(gè)非常關(guān)鍵的因素,使得超級(jí)計(jì)算機(jī)可以大規(guī)模的進(jìn)行靈活的擴(kuò)展,主要是它跨越了互聯(lián)項(xiàng)目的一些局限。如果這個(gè)系統(tǒng)是用Linpack來測量的話,因?yàn)橐獋鬟f很多的數(shù)據(jù),所以整個(gè)網(wǎng)絡(luò)上會(huì)面臨很大的數(shù)據(jù)壓力。
根據(jù)我過去26年在計(jì)算領(lǐng)域的一些經(jīng)驗(yàn)和體會(huì),你們還會(huì)繼續(xù)看到,這個(gè)行業(yè)在不斷的發(fā)展,將會(huì)有更多的創(chuàng)意,一個(gè)接一個(gè)而來,你們接下來還會(huì)看到更多的創(chuàng)意和創(chuàng)新。比如說我們的處理器速度越來越快,這就意味著我們需要的總線數(shù)量也就越來越多,他們之間的互聯(lián)性應(yīng)該也是越來越好。不管怎么樣,總會(huì)存在一定的局限和瓶頸,但是我們的工程師會(huì)想各種的辦法跨越這些局限。
所以說,現(xiàn)在和過去的差異在哪里?你在新的系統(tǒng)中,我們用的是中國基本的技術(shù),把它應(yīng)用在高性能計(jì)算機(jī)中,使它的速度更快,而且擴(kuò)展性更高。
記者:以前NVIDIA公司自己也設(shè)計(jì)編程,從顯卡到后來的CUDA編程,NVIDIA公司越來越多的進(jìn)入標(biāo)準(zhǔn)領(lǐng)域,以后高性能計(jì)算里面也會(huì)涉及到標(biāo)準(zhǔn),比如MPI也是一種標(biāo)準(zhǔn)。你們作為主導(dǎo)GPU混合計(jì)算的領(lǐng)頭企業(yè),是否會(huì)提出一些更好的互聯(lián)標(biāo)準(zhǔn)或者互聯(lián)語言架構(gòu),比如像CUDA這樣的GPU技術(shù)混合架構(gòu)?
Andy Keane:從CUDA向系統(tǒng)級(jí)別這樣的轉(zhuǎn)換,在這個(gè)過程中,我們將和大量的合作伙伴一起來做,比如說HP、IBM,我們都會(huì)和他們一起做。就MPI來說,用這個(gè)例子你就可以理解了,比如說我們會(huì)和MPI整個(gè)開發(fā)者社區(qū)一起努力,同時(shí)也會(huì)把他們擴(kuò)展到CUDA或者其他的軟件,和他們進(jìn)行結(jié)合。這個(gè)過程,一方面我們會(huì)在MPI一起和開發(fā)社區(qū)努力,同時(shí)我們也會(huì)考慮如何融合其他的軟件。這是一個(gè)合作的過程,我們會(huì)做貢獻(xiàn),也會(huì)做出我們這一部分的努力。
記者:在你的履歷里面,有在英特爾里面工作過,我們也知道,英特爾也在開發(fā)類似于顯卡的內(nèi)核架構(gòu)的這種產(chǎn)品,可能它組裝的是一種統(tǒng)一的編程架構(gòu),因?yàn)樗际荴86。從英偉達(dá)來看的話,怎么看未來分支的狀況?一種是傳統(tǒng)的CPU的多核的架構(gòu),你怎么看待未來的這種競爭?
Andy Keane:即便是英特爾這邊的發(fā)言人,他們?cè)诿枋鑫磥泶嬖诘膯栴}時(shí)候,已經(jīng)描述很好了,對(duì)于大型的超性能計(jì)算機(jī)來說,最主要的不是和X86兼容不兼容的問題,而是它的能源的問題。所以我們看一下計(jì)算系統(tǒng)的未來,在過去以及在未來都會(huì)經(jīng)歷多種過渡,比如說從低一級(jí)向高一級(jí)性能的過渡,成本也有一定的變化。你看一下超級(jí)計(jì)算系統(tǒng)的歷史,我們之前從主機(jī)逐漸發(fā)展到Deck Alpha,之后到A1860,一直到現(xiàn)在的X86,最后這一步主要是出于低成本的考慮,同時(shí)也希望能夠降低電耗,但是它的耗電量還是比較高的。所以說,我們接下來要面臨的新的問題是什么呢?低成本是一個(gè)考慮,另外能耗怎么能夠降低,是目前的一個(gè)挑戰(zhàn)。
剛才我們看到的是過去的一些變化,看未來得話,我們要分析一下,未來面臨什么樣的挑戰(zhàn)呢?兩個(gè)挑戰(zhàn):一是編程的挑戰(zhàn),用什么語言呢?也許是基于CUDA語言的架構(gòu),當(dāng)然我們也會(huì)考慮其他的語言,不僅僅局限于CUDA,這是一個(gè)挑戰(zhàn);另外,也是英特爾和NVIDIA公司不太一樣的地方。如果把 X86核拿出來之后,如果要進(jìn)行大型擴(kuò)展的話,應(yīng)用起來冷卻是一個(gè)很重要的問題。我們的首席科學(xué)家Bill Dally也提出了很多的證據(jù)和數(shù)據(jù),如果想進(jìn)行進(jìn)一步的發(fā)展和改變的話,首先我們要考慮平衡好能耗,還有高性能計(jì)算之間的關(guān)系。你要基于什么樣的架構(gòu),而且這個(gè)架構(gòu)一定是非常節(jié)能的架構(gòu),才能繼續(xù)發(fā)展高性能計(jì)算。X86是不可以實(shí)現(xiàn)的,也許是未來的GPU或者其他的技術(shù)。
所以說,超性能計(jì)算跟手機(jī)也一樣,我們也看到手機(jī)在不斷的發(fā)展,有的手機(jī)用PC的操作系統(tǒng),比如X86的核,有的是用內(nèi)建的操作系統(tǒng),但是它能夠提供瀏覽網(wǎng)頁和收發(fā)E-mail的功能。一些舊的系統(tǒng)我們可以摒棄,不是說要完全沿用下來,我們一定要進(jìn)行創(chuàng)新,這樣才能夠解決功能上的問題,我想這也是高性能計(jì)算未來的發(fā)展趨勢吧。

CUDA并不是編程語言,而是一種體系架構(gòu)
記者:NVIDIA公司的產(chǎn)品現(xiàn)在對(duì)于OPENCL標(biāo)準(zhǔn)兼容性如何?在未來的話,你們?cè)趺纯创齇PENCL標(biāo)準(zhǔn)在未來編程方面的前景?
Andy Keane:我們的主營業(yè)務(wù)就是賣GPU,至于軟件,我們的獨(dú)立供應(yīng)商用什么的軟件,用什么樣的語言,對(duì)我們有什么要求,我們就按照他們的語言來進(jìn)行運(yùn)用,包括OpenCL、CUDA、Fortune,Pascal以及JAVA,我們都是根據(jù)他們的語言來應(yīng)用GPU。所以我們的競爭對(duì)手,他們一般在做宣傳的時(shí)候會(huì)說什么什么是你的選擇,比如說OPENCL,他會(huì)說OPENCL是你們的選擇,但是我們也看到了,我們是可以支持多種語言的OPENCL、CUDA、Pascal以及JAVA。不管軟件供應(yīng)商有什么樣的要求,我們根據(jù)他們的要求就提供什么樣的GPU,包括一些產(chǎn)品的驅(qū)動(dòng)也好,雙精度也好,其他擴(kuò)展的功能也好,我們都可以去網(wǎng)站上免費(fèi)下載。不管是開發(fā)商有什么樣的需求,我們都會(huì)提供,都是可以兼容的。
金洋:再補(bǔ)充一點(diǎn),有些人認(rèn)為OPENCL是開放的,我們CUDA是不開放的,其實(shí)實(shí)際并不是這樣的,我們這邊非常支持OPENCL的標(biāo)準(zhǔn),他們可能只有一個(gè)OPENCL,我們是唯一一家可以使用的、支持OPENCL計(jì)算的廠家。除了OPENCL之外,如果我們的消費(fèi)者要用到其他的語言,C++、CUDA、JAVA的語言,我們都可以提供支持,我們GPU支持所有可以實(shí)現(xiàn)的語言。所以我們并不是決策者,決定哪種語言我們支持,決策者是用戶,他們需要什么樣的語言,我們提供什么樣的語言。而且OPENCL組織的主席是NVIDIA公司現(xiàn)在的副總裁,可以說OPENCL在NVIDIA公司不斷的推廣,不斷的支持下,OPENCL才可以得以壯大。所以我們對(duì)于OPENCL和對(duì)于其他語言的支持,我們都會(huì)全力的支持,任何一種用戶會(huì)用到的語言,可以實(shí)現(xiàn)GPU高性能計(jì)算的規(guī)模性的發(fā)展,我們NVIDIA公司GPU都是支持的。 <
記者:Tesla作為NVIDIA公司比較新的產(chǎn)品線,一推出就很受歡迎,尤其是Fermi架構(gòu)的Tesla一經(jīng)發(fā)布,就有很多超級(jí)計(jì)算機(jī)使用。Fermi架構(gòu)擁有GeForce、Quadro和Tesla三條產(chǎn)品線,那么那么能不能方便透露一下,在Fermi架構(gòu)的GPU當(dāng)中,Tesla出貨的比例大概是多少?
Andy Keane:這個(gè)不太方便透露,也沒有一個(gè)具體的數(shù)字,因?yàn)檫@是三條完全不同的產(chǎn)品線,面向的用戶群也是截然不同,用戶基數(shù)更是差很多,根本無法相提并論。
記者:或者從銷售額來說。
謝強(qiáng):如果從消費(fèi)類市場,從量上來講,消費(fèi)類市場是專業(yè)工程圖片卡市場的10倍,這是說10:1的市場,而不是說我們的銷量。專業(yè)圖卡的市場又會(huì)是高性能計(jì)算的10倍,這是在量上這樣的一個(gè)區(qū)分,希望能夠給你們一個(gè)幫助。可能沒有一手的數(shù)據(jù),因?yàn)镕ermi這個(gè)產(chǎn)品剛剛出來,其實(shí)發(fā)貨才一個(gè)季度,差不多從6月份開發(fā)發(fā)貨,這段時(shí)間應(yīng)該沒有準(zhǔn)確的基于Fermi的產(chǎn)品數(shù)據(jù),從我們公司上一代產(chǎn)品來講,差不多是這樣的比例。這是最好的回答,希望能夠幫到你們。
金洋:數(shù)字可能沒有辦法透露,但至少在中國,以及全球Quadro產(chǎn)品以及Tesla高性能計(jì)算市場份額來講,我們都有絕對(duì)的優(yōu)勢。
目前的Tesla產(chǎn)品都采用了最高端GPU
記者:現(xiàn)在開拓的產(chǎn)品主要針對(duì)每一代優(yōu)異的GDP來做的,未來會(huì)不會(huì)像Quadro一樣做一些多條產(chǎn)品線,比如中高低端都有Tesla的產(chǎn)品?
Andy Keane:是這樣的,我們將會(huì)在未來逐漸推出不同級(jí)別的應(yīng)用,實(shí)際上我們現(xiàn)在的產(chǎn)品開發(fā)基本上根據(jù)客戶的需求,比如說他們有什么樣的性能需求,針對(duì)他們的需求,我們開發(fā)一些產(chǎn)品。比如說,現(xiàn)在客戶要求的是性能一定要卓越,而且能夠做更高的計(jì)算以及應(yīng)用,這也是我們?yōu)槭裁撮_發(fā)目前的應(yīng)用。
在未來計(jì)算機(jī)會(huì)有不同的發(fā)展趨勢,比如之前說到的高性能計(jì)算機(jī),這是一個(gè)應(yīng)用。另外也有個(gè)人高性能計(jì)算的應(yīng)用。在第二種類別中,我們可能用的GPU相對(duì)來說性能稍微低一些,但是它更好的能夠和工作站結(jié)合,不用說和服務(wù)器結(jié)合,像這種大型的超級(jí)應(yīng)用一樣。
記者:現(xiàn)在國內(nèi)更多的開始應(yīng)用Tesla的產(chǎn)品,現(xiàn)在基于Fermi架構(gòu)的Tesla產(chǎn)品在國內(nèi)的銷售和訂單情況是怎么樣的?客戶在使用產(chǎn)品之后,他們集中反饋的情況是什么樣的?
Andy Keane:我沒有一些具體的數(shù)字,但是毫無疑問,美國是我們的第一大市場,中國是我們的第二大市場,而且這個(gè)市場在不斷的發(fā)展壯大,成長的速度也是非常快的。為什么有這么大的發(fā)展呢?主要是因?yàn)橐恍┮龑?dǎo)性的或者說一些比較大型的試點(diǎn)超級(jí)計(jì)算機(jī)的應(yīng)用系統(tǒng)的推出,使人們看到了,利用這個(gè)新的技術(shù)能夠給他們帶來什么樣的潛力,所以它的發(fā)展才會(huì)非常快,目前也是非常快。
用戶的反饋意見是非常積極的,我們把之前應(yīng)用的一些弊端或者說一些性能得以進(jìn)一步的加強(qiáng),比如說它的雙精度,以及ECC、緩存、IO接口都進(jìn)行了性能上的提高。總的來說,我們從Tesla 10系列產(chǎn)品中進(jìn)行性能的加強(qiáng),對(duì)Tesla 10系列產(chǎn)品系列的應(yīng)用中的一些經(jīng)驗(yàn)和教訓(xùn),我們進(jìn)行了改進(jìn)之后,用到Fermi架構(gòu)之中。之后,我們會(huì)把在Fermi架構(gòu)應(yīng)用中出現(xiàn)的一些經(jīng)驗(yàn)和教訓(xùn),經(jīng)過改進(jìn)之后,再應(yīng)用到Tesla中。我們的目標(biāo)是,希望隨著一代一代產(chǎn)品的推出,它的應(yīng)用和性能能力得到很大的加強(qiáng)。
記者:NVIDIA公司現(xiàn)在開始特別注重架構(gòu),每隔兩年更新一次,我看你上午演講,07年、09年、10年、13年都有推出這樣新的架構(gòu),我們知道Intel有一個(gè)tick-tock的戰(zhàn)略,NVIDIA公司是不是也會(huì)朝這樣的方向去運(yùn)作?
Andy Keane:Intel的tick-tock只是在業(yè)界戰(zhàn)略當(dāng)中起的一個(gè)名字,制程的改進(jìn)是一步一步的來,很多供應(yīng)商都是這樣的做,包括TSMC、EMC、intel、摩托羅拉,剛開始的時(shí)候,逐漸改進(jìn)到40納米,之后再進(jìn)行微調(diào),再往下一步發(fā)展就是32納米。所以說tick-tock的描述,就是對(duì)半導(dǎo)體晶片的一個(gè)描述,其實(shí)每一家都是這樣做的,只是Intel給了它一個(gè)戰(zhàn)略性的營銷概念,廣告的語言吧。■<
關(guān)注我們


