專訪黃仁勛:CUDA-X86效率遠勝多核CPU
記者:為何此次大會會要公布路線圖?
黃仁勛:因為人們很想知道。
NVIDIA下兩代GPU路線圖
記者:昨天在開場的Keynote演講上你提到了下一代產品Kepler以及更下一代的產品的Maxwell,并且您也提到了針對Tesla產品,最終Maxwell在雙精度運算每瓦特性能上將會有16倍以上的提升,那么您對未來的GPU在雙精度運算性能與功耗之間的平衡是怎么看?
黃仁勛:現在的問題越來越有針對性了。可能是1:0.5,也許是2:3,也許是其他的比例。這些都是可能的答案,因為我還需要等待最終的設計完成。如果結論是1:0.5的比例的話,也許我將會在GPU中不知更多的SM單元,但是如果每個SM不能夠充分的被利用,我也可能會減少SM單元,但是每個SM單元的效能上進行提升。
再加上在制程以及顯存等方面的選擇,讓這個問題的答案更加復雜了。這個答案只有在打樣的一年到半年前左右才能夠真正揭曉。
記者:您談到Maxwell與Tesla的提升大約為16倍的性能功耗比,這個提升主要體現在性能上提升上還是功耗的控制上?
黃仁勛:不止16倍,Tesla到Fermi,大致提升3-4倍,Fermi到Kepler的提升大概3-4倍,Kepler到Maxwell的提升大致3-4倍。
這個提升主要體現在性能上,因為功耗一定的。對于整機而言,1000w是一個極限。我們的設計理念中不會過于強調晶體管的單個性能。這正是并行計算的優(yōu)勢所在,隨著工藝的提升,晶體管的功耗會越來越低,我們就可以放入更多的晶體管,每個晶體管的性能會有提升,但是并不是
記者:未來會不會將IO加入到GPU的設計之中?
黃仁勛:這是個好主意,我們也正在進行相關的嘗試。最大的問題不是物理上的接口問題,而是邏輯接口的問題,目前IO都是直接與系統(tǒng)存儲相連,點用數據是需要從系統(tǒng)內存通過IO再到GPU,這個過程非常浪費。我認為PCI-E更為適合,PCI-E的貸款足夠進行大規(guī)模數據傳輸。主要的瓶頸還是系統(tǒng)內存。我希望在未來可以從DMA直接到內存,不通過CPU。性能提升不只一翻。
關注我們



