AMD 發表了一篇關於 Stable Diffusion 的文章,藉由將 AI 的學習庫從 Python 預設的 PyTorch 替換為 Microsoft Olive 和 Microsoft ML,RX 7900 XTX 的每秒迭代速度(Iteration/sec,簡稱 it/s)將可以從 1.87 飆升到 18.59,逼近 NVIDIA GeForce RTX 4080 的 19.41 it/s。
Stable Diffusion 是一款開源的 AI 算圖軟體,玩家只要安裝之後,便可以用自己的主機進行「詠唱」,並生成自己想要的照片。也因為軟體依賴的效能來源是自己的顯示卡,顯示卡對於 AI 運算的效能高低便會直接影響照片的生成速度。
由於 Stable Diffusion 是開源軟體,任何人都可以取得原始碼並發行修改後的版本,在網路上流傳的版本眾多,AMD 本次使用是目前最廣為人知的「Automatic1111」,雖然通用性最好,但此版本無法原生對應 AMD 驅動,玩家必須使用迂迴的方式載入驅動,也造成效能表現相當不理想。
根據知名工作站軟體測試網站 Puget Systems 的數據,目前對 AMD 顯卡最友善的 Stable Diffusion 版本為 SHARK, RX 7900 XTX 的效率可以達 20.76 it/s,遠超卡皇 NVIDIA GeForce RTX 4090 的 15.24 it/s。
反觀在 Automatic1111 上 ,RX 7900 XTX 的官方數據僅 1.87 it/s,在 Puget System 上也只有 4.67 it/s,甚至比得分為 8.62 it/s 的 RTX 3060 Ti 還不如。
這次 AMD 發表的內容大幅改善這效能方面的遺憾,即便導入 Microsoft Olive 和 Microsoft ML 在執行步驟上還是比不上讓 Python 自動安裝驅動工具來得方便就是了,可至少能夠發揮旗艦卡該有的水準。
此外,由於 RX 7900 XTX 經過多次降價的關係,目前台灣的售價都已經低於 4 萬,作為對比 NVIDIA 的 RTX 4080 多數價格卻都還在 4.2 萬以上,也意外讓 RX 7900 XTX 在 AI 運算上有著相當不錯的性價比。