原生與橋接PCIE芯片技術深入分析解析
我們發現,在實際應用中原生方案并沒有表現出過人的優勢,性能上與采用HSI的橋接方案相當,并沒有出現理論測試中那種成績上的飛躍,也沒有體現出PCI-Express的設計特點。這又是為什么呢?
首先,在實際應用中有效的可利用的PCI-Express的帶寬比理論帶寬重要的多。PCI-Express的有效帶寬計算公式如下:有效數據帶寬 = 總線帶寬 ×[請求大小/(請求大小+附加信息包詳細程度)]× 效率。
由于顯卡具備輸出端的工作特點,GPU在實際操作過程中的數據傳輸往往傾斜于上行,也就是從總線向GPU內部傳輸數據,這就使得PCI-Express×16巨大的下行數據傳輸能力在大多數時間成為了擺設。
由于橋接+現有芯片的方案提供了4GB左右的數據傳輸能力,相對而言已經能夠達到PCI-Express上行數據的傳輸能力,這就使得NVIDIA的產品在實際應用中并不會受到比ATI更多的來自數據傳輸的限制。
其次,NVIDIA的GPU支持最大單次64byte的數據請求包,并能為這個請求附加20byte左右的附加信息包,更大的數據傳輸包以及附加信息包可以保證盡可能大的數據請求以及對更加完整的對請求的附加描述。

盡管附加描述包的出現會占用一定的帶寬,但是對于較大量的單次數據傳輸而言,詳盡的請求附加描述可以保證盡可能正確有效的內容發送,其結果就是相應的應請求發送的單次數據完整適應度的增加。
這種設計保證了數據傳輸通道可以被高效率的利用,使得HSI方案所提供的數據帶寬能夠被完全利用。相對的,ATI的GPU所支持的數據請求包的大小僅為32byte,這大大限制了ATI的GPU利用數據傳輸通道的能力。據稱,ATI的GPU對于PCI-Express帶寬的有效利用律僅僅達到了65%,即2.5GB/S。
最后,由于在設計的時候充分考慮到了多余互連層帶來得潛伏期的問題,NVIDIA的HSI芯片的設計潛伏期大大低于芯片組和PCI-Express的潛伏期。更高的響應速度可以使HSI先于芯片組和總線做出反應,不會影響到數據傳輸的過程。因此NVIDIA的產品中并沒有出現明顯的ATI所預言的添加互連層帶來的數據傳輸周期延遲問題。
關注我們


