NV帕斯卡架構(gòu)白皮書:GP100規(guī)格曝光
關(guān)于下代架構(gòu)“帕斯卡”(Pascal)的產(chǎn)品,NVIDIA目前只宣布了一款大核心的高性能計(jì)算卡Tesla P100,其他各種GeForce游戲卡都還得等一段時(shí)間,不過近日,NVIDIA很慷慨地公布了一份帕斯卡架構(gòu)白皮書,幾乎完全公開了GP100核心與Tesla P100的各種規(guī)格。

GP100是帕斯卡家族的旗艦核心,預(yù)計(jì)桌面上的GTX 1080 Ti、新版GTX Titan X也會(huì)使用它。

它采用臺(tái)積電16nm FinFET工藝制造,集成了153億個(gè)晶體管,比麥克斯韋GM200多了超過90%,核心面積達(dá)610平方毫米,只比28nm工藝的GM200大了區(qū)區(qū)9平方毫米。
完整的GP100核心擁有60個(gè)SM(流式多處理器)單元,Tesla P100只開啟了其中的56個(gè)。每個(gè)SM單元內(nèi)有64個(gè)FP32單精度CUDA核心(麥克斯韋、開普勒架構(gòu)分別有128個(gè)、192個(gè)),總計(jì)3840個(gè)。

每個(gè)SM單元分為兩部分,每部分有32個(gè)FP32 CUDA核心、一個(gè)指令緩沖器、一個(gè)Warp調(diào)度器、兩個(gè)分派單元。
GP100核心每個(gè)SM單元的CUDA核心數(shù)量雖然只有麥克斯韋架構(gòu)的一半,但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個(gè)SM單元內(nèi)還有32個(gè)FP64雙精度CUDA核心,總計(jì)1920個(gè),是單精度的1/2,這種比例可以更好地配合GP100核心新的數(shù)據(jù)路徑配置,更高效地處理雙精度負(fù)載。
GP100核心還有統(tǒng)一的4096KB二級(jí)緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB,可以減少對(duì)GPU DRAM的請(qǐng)求,從而降低整體功耗、內(nèi)存帶寬,提升性能。
整個(gè)核心還配備了240個(gè)紋理單元。
Tesla P100計(jì)算卡擁有3584個(gè)FP32單精度、1792個(gè)FP64雙精度CUDA核心,核心基礎(chǔ)頻率1328MHz,加速頻率高達(dá)1480MHz,峰值單精度性能10600GFlops,比起上代提升了足足55%,而雙精度性能也達(dá)到了5300GFlops,是開普勒架構(gòu)的3.2倍,更是麥克斯韋架構(gòu)的25.2倍。
它搭配了4096-bit HBM2高帶寬顯存,容量16GB,熱設(shè)計(jì)功耗300W。■
關(guān)注我們


