能否推倒i7?AMD推土機CPU架構全解析
通過前面的介紹我們可以知道,Intel的同步多線程技術實際上并不能提升CPU的理論運算性能,只是消除了CPU等待指令時的瓶頸,在部分應用中提升了效能。這樣HT技術就存在很大的局限性,如果主內存不再是瓶頸,SMT的執行單元就過剩了,而一個SMT核心也就不再比一個單純的核心更高效,畢竟SMT核心需要增加一些電路設計,比一個單純的核心成本要高一些。
所以AMD并沒有照搬Intel的做法走SMT路線,也不是繼續暴力增加CPU的物理核心數目,CPU的未來并不是只有這兩條路可走,于是AMD有了一個新的想法:Intel是把一顆物理核心虛擬成兩顆來用,而AMD是把兩顆物理核心組合成一顆大核心來用——這顆大核心的官方名稱叫做“推土機模塊”。
為什么要把兩顆核心合成一顆來用呢?有兩個好處,一是可以共享運算單元和緩存,提升效能;二是共享之后會節約晶體管(重復單元合二為一),而不是像SMT那樣增加晶體管(兩份寄存器)。
AMD認為,隨著CPU的物理內核數目越來越多(4/6/8核甚至更多),CPU的核心面積也會越來越大,功耗成倍增加。傳統CMP暴力復制核心的方式會造成大量重復性的電路。而減少冗余電路的最好方法就是整合,把兩顆核心整合在一起,共用一套指令發射器和解碼器還有緩存。
相信細心的讀者已經發現了,AMD并不是簡單的把兩顆核心放在了一起,而是有所精簡——兩顆核心的整數運算單元都被完整的保留了下來,而浮點運算單元只留了一份,這又是為什么呢?
數據顯示,存在于服務器和超級計算機上80%的操作都是純粹的整數運算,CPU的浮點運算器利用率很低,所以AMD在開發新一代CPU架構時強化了整數運算而忽視浮點運算。
另一方面,隨著CPU和GPU異構計算應用越來越多,GPU將會越來越多的負擔起浮點運算的操作,預計未來3-5年的時間內,據大多數浮點運算都將會交給最擅長做浮點運算的GPU,這也就是推土機加強整數運算而精簡浮點運算的真正目的,雖然推土機CPU并未整合GPU(因為它定位高端,不論企業還是玩家都需要最強的CPU和GPU),但下一代APU Trinity將會使用推土機的CPU核心加HD6900 4D架構的GPU核心,推土機架構依然在為Fusion APU而準備著,可以說AMD繼64bit、整合內存控制器、HT總線、三個層級緩存之后,又一次采用創新的設計理念引領業界,走在了巨頭Intel前面!
關注我們



