能否推倒i7?AMD推土機CPU架構全解析
分享
AMD推土機架構的設計理念不難理解,但更多人擔心的是其核心執行效率,畢竟這些年來AMD在效能方面改進緩慢。如果CPU內核效率不行的話,整體架構再怎么優秀也不會有很好的綜合表現。現在我們就來看看推土機內核相對于羿龍有何改進?
根據AMD官方發布的Bulldozer架構資料,推土機模塊的指令解碼寬度將從K7/K8/K10的每時鐘周期三條微指令提升為四條。
推土機的前端指令解碼和分派模塊
這里我們把一個推土機的模塊看作是一顆核心的話,里面有兩個獨立的整數核心,每一個都擁有自己的指令、數據緩存。雖然兩個整數運算核心要比K10的三個少,但實際上其中任何一個核心的運算能力都要強于Phenom II。
Intel的Core架構無論整數或者浮點,都采用了統一的Scheduler(調度)派發指令。推土機構架使用獨立的整數和浮點派發器,而且整數派發器有兩個,對應推土機模塊里面的兩顆核心。
推土機模塊和K10微架構對比圖
推土機模塊的兩個核心支持執行兩個線程,會共享對延遲要求較高的功能、平緩突發和低效應用、線程間動態分配資源,好處是比兩個線程共享一個核心更高的伸縮性和可預測性、多線程負載的吞吐優勢、單線程時所有共享資源均可訪問、以少得多的面積和功耗提供物理核心80%的性能。
推土機模塊的浮點運算單元是兩個128位的FMAC(乘加運算器),這兩個運算器可以被兩個整數核心共享,如果其中一個整數核心獲得的線程支持純粹的整數操作,那么另外一個核心就可以獲得全部的浮點執行資源。
這樣設計的結果就是,推土機的單核效能將會比Phenom II強不少,而多核效能部分,整數運算能力很強,而浮點運算能力也不會太弱。
0人已贊
關注我們



