三風扇五熱管!影馳GTX580黑將版測試
● 流處理器數量提升
大家已經知道,GTX580從某種角度上來說是GTX480的改進版本,首先是彌補了GTX480在流處理器數量上的遺憾,從GTX480的480個流處理器提升到了512個流處理器,這樣在顯卡的3D性能上就有進一步的提升。
看過我們之前的GTX480架構解析的朋友應該知道,GTX480是通過在GF100核心上屏蔽了一組SM(流處理器簇)將原本的512個流處理器降到480個的。而在這個架構中,一個SM并不只是有32個流處理器,還包含16/48KB的動態分配緩存、4個紋理單元和一個多形體引擎。所以,GTX580相對于GTX480從硬件規格上來看并不僅僅是提升了32個流處理器,準確的說是提升了一個SM。
● 16/48KB動態分配緩存
GF100/GF110核心的緩存設計非常有意思,采用的是L1和共享緩存動態分配總容量為64KB緩存的設計,這部分緩存可配置為16KB的一級緩存+48KB共享緩存,或者是48KB一級緩存+16KB共享緩存。這種劃分方式完全是動態執行的,一個時鐘周期之后可自動根據任務需要即時切換而不需要程序主動干預。
一級緩存與共享緩存是互補的,共享緩存能夠為明確界定存取數據的算法提升存取速度,而一級緩存則能夠為一些不規則的算法提升存儲器存取速度。在這些不規則算法中,事先并不知道數據地址。
● 4個紋理單元
顧名思義,紋理單元就是專門用于渲染3D物體表面紋理的模塊,在圖形紋理越來越復雜的今天,紋理單元的重要性不言而喻。GTX580因為相對于GTX480增加了一組SM,所以紋理單元數量也得到了相應的增加。
在GF100/110架構中,每一組SM中包含4個紋理單元,完整版的核心中一共有16個SM,所以GTX580一共擁有64個紋理單元,而GTX480由于屏蔽了一組SM,所以只有60個紋理單元。
值得一提的是,GF100/110架構中的紋理單元直接集成到了SM內部,且每組SM中擁有獨立的紋理緩存(4個紋理單元共享這部分獨立的紋理緩存),這樣的設計打破了之前紋理單元一直被設計在SM外圍的傳統,有效的提升了紋理效率。雖然從紋理單元的數量方面來說看起來比GT200架構還少,但實際效率卻高很多。
關注我們



