從物件細節、材質、到粒子、流體的模擬,電腦目前已經能夠駕輕就熟的處理這些 3D 渲染所需的元素。然而這些元素要被「看到」,就得靠光線的演繹。
真實環境中,人眼觀察物體時並非只接收到物體本身反射出的直接光源,而是還包括環境中光線與其他物體多次互動後反射到該物體上再進入人眼。因此若要達成逼真的 3D 渲染畫面,就得詳細追蹤光線經過各種物體反射之後再傳達到人眼中的情形,計算的光線數越多畫面才會越真實,數量甚至可達上億條之譜,必須耗用極其龐大的運算資源才可達成。若要在遊戲中呈現光線追蹤的畫面成果,那麼 GPU 的即時處理的能力就非常重要了。
Turing 架構改善了傳統渲染模式,並融合光線追蹤和人工智智慧,打造所向披靡的「超級渲染」核心。
首先看到 Turing 架構的流處理器模組構造,除了傳統負責處理浮點運算的單元之外,這次加入了整數運算的單元,同時每個流處理器單元都有專屬的 L1 快取並共享多達 6MB 的 L2 快取,而搭配的緩衝記憶體也升級為時脈更高、訊號更純淨的 GDDR6,因此可大幅增加處理效率,可達 Pascal 架構的 1.5 倍以上。
隨著流處理器進化,Turing 架構也導入兩款新型態的著色方式。
面對數以萬計的物件,Mesh Shading 可根據物件在視野中的位置和大小,給予合適的細節等級,演示的範例中可以看到飛船通常是玩家操控的主物件,因此靠近飛船和特別大的隕石就會被描繪的較為細緻(藍色、紫色、黑色等),而較遠或較小的隕石就用比較粗略的方式著色(紅色、橘色等),藉此提高著色效率又能維持一定的著色細緻度。
Variable Rate Shading 則是針對畫面改變的狀況動態調整著色優先級,減少不必要的著色資源浪費。如賽車遊戲中玩家操控的車輛和遠方的景物因為幾乎不太會變動,所以完成著色後沿用即可,而這輛附近的路況因為會不斷變動,則需要花費後續資源處理著色事宜。
Turing 架構的重頭戲: RT 核心將原本在 Pascal 架構由流處理器負責的光線追蹤程序拉出來獨立處理,加速運算光線在3D環境中的傳遞狀況,每秒最高可處理 100 億條光線路徑。
另外 Turing 架構也整併了 Tensor 核心,提供每秒約 500 兆次的 Tensor 運算作業能力,藉此運用人工智慧與深度學習強化畫面表現。
NVIDIA NGX 技術的 DLSS (Deep Learning Super Sample,深度學習超級採樣),運用已訓練完成的神經網絡,搭配經過 64 倍採樣的場景,套用適當的顏色來創建更平滑的邊緣並提高圖像品質,與其他反鋸齒模式相比,DLSS 不僅畫質更為精細,同時也減少偽成像造成的閃爍或疊影,上方可參考《Final Fantasy XV》的畫面比較。而且由於 DLSS 是靠 Tensor 核心處理,原本的流處理器模組無須再負擔反鋸齒運算,也帶來較好的效能表現,在同樣畫質要求下,GeForce RTX 2080 Ti 使用 DLSS 的表現可達 GeForce GTX 1080 Ti 使用 TAA 的兩倍。
由於 DLSS 的反鋸齒方式不同於以往,加上需要相當規模的超級電腦先行訓練適用於不同遊戲場景的神經網絡,因此 NVIDIA 願意免費與遊戲開發者合作將 DLSS 導入遊戲內,目前已確定這幾款遊戲將支援 DLSS。
隨著架構更新,整合於 GeForce Experience 內的 NVIDIA Ansel 也善用 Turing 架構的功能,包括 Ansel RT 可渲染更精細、逼真、光線更豐富的遊戲截圖,以及 Ansel AI Up-Res 運用人工智慧提升截圖解析度。
綜合以上資訊,Turing 架構之所以強大,在於流處理器模組、RT 核心和 Tensor 核心這些單元能夠妥善運用運算資源,同步分工處理畫面所需的元素,進而提高處理效率,真的是歷來最大的技術躍進,這也是 NVIDIA 以 GeForce RTX 命名取代 GeForce GTX 做為頂級遊戲卡的主要原因。
雖然目前因為微軟尚未正式發行 DirectX Raytracing API 的關係,導致我們目前無法探究光線追蹤的實際表現,不過目前已有不少遊戲宣布將陸續導入 NVIDIA RTX 相關技術(包括光線追蹤、DLSS),大家就拭目以待吧。欲得知更多性能相關資訊,敬請持續關注。