圖形與計算那些事 AMD次世代架構解析
分享
最后,再來強調一下AMD拋棄5D/4D VLIW改用全新GCN架構的意義
理想狀態下毫不相干的四組線程執行情況
在VLIW的理想情況下,4個線程分別各自獨立且毫不相關,可以看到新架構和VLIW的執行情況和類似,理論上效率都是100%。
非理想狀態下,條件相關線程延遲執行
但對于VLIW架構來說,不理想的情況就是遇到相關的指令流,比如兩個綠色線程,前三個線程可在一個周期內執行,最下方的藍色只能獨立執行。而對于新架構來說,則不存在這樣的問題。也就是說,采用硬件調度之后,GCN和SIMD可以允許選擇不同的線程亂序執行,這些線程可以來自同一任務,也可以是不同任務。當然,這種“亂序”也不是絕對的,基本的流程還是要遵守的,比如各個線程之間的指令必須按順序執行,不能打亂也不能分割。
以上就是AMD官方提供的數據,HD7970的理論運算能力相比HD6970提升不過30%,但在GPU計算應用當中的性能提升相當顯著,可達兩倍以上!尤其在AES加密解密算法中,速度達到了4倍以上,架構的威力可見一斑!
HD7900會在WinZIP當中有更好的加密壓縮解壓性能
高清視頻實時防抖處理
AMD在努力:支持GPU計算的軟件越來越多
以往的VLIW架構在并行任務處理方面處于劣勢,并且很依賴編譯器和API的支持,擴展到OpenCL也受到很大限制。經過硬件架構的調整,新的GCN架構在并行計算方面有了很大提高。編譯壓力減輕,硬件調度的加入使編譯器擺脫了調度任務;其次是程序優化和支持語言擴充更見容易;最后是不用在生成VLIW指令和相關調度信息,新架構最底層的ISA也更加簡單。
2人已贊
第1頁:Radeon是一款好顯卡,但不是顆好GPU第2頁:成也微軟敗也微軟:XBOX360阻礙顯卡/游戲發展第3頁:從X1900XTX談起:用3:1黃金架構做計算第4頁:HD2900XT走向不歸路:超長指令集的弊端第5頁:HD4870的救贖:暴力擴充流處理器第6頁:HD5870的輝煌:在錯誤的道路上越走越遠第7頁:HD6870的一小步:雙超線程分配處理器第8頁:HD6970曇花一現:北方群島5D改4D返璞歸真第9頁:GPU的一大步:NVIDIA G80圖形架構解析第10頁:真正的并行計算架構:GT200只為計算優化第11頁:DX11與并行計算的完美結合:GF100/110的野心第12頁:HD7970華麗登場:曲面細分性能大幅提升第13頁:GCN架構的精髓:流處理器完全重新設計第14頁:GCN架構的緩存:照搬GF100的設計?第15頁:Tihiti其他方面的改進:AMD真是個激進派第16頁:GCN架構的真正意義:GPU計算效能大增第17頁:全文總結:浴火重生,新的開始新的期待
關注我們



