更多

    全新 Ada Lovelace 架構 NVIDIA 正式發布 GeForce RTX 40 系列

    NVIDIA 於 GTC 2022 的主題演講上,正式發布全新 Ada Lovelace 架構,將應用於期待已久的 GeForce RTX 40 系列,本文將為大家介紹新架構的特性,RTX 40 系列顯示卡的資訊會於另一文章報道。

    NVIDIA CEO 黃仁勳於 GTC 2022 大會的主題演講上,正式發布期待已久的 GeForce RTX 40 系列 GPU,採用全新 Ada Lovelace 架構,其 SM、RT 以及 Tensor 核心全面提升。首先是 SM(Streaming Multiprocessor,串流多處理器),Ada Lovelace 提供高達 90 TLOPS 的 FP32 浮點運算能力,是上代 40 TFLOPS 的雙倍以上。GPU 採用 TSMC 4N 製程生產,內建多達 760 億個電晶體,較上代的 280 億個增長逾 1.7 倍。

    Ada Lovelace 加入 Shader Execution Reordering(著色器執行重新排序)技術,就像 CPU 的 Out-of-order execution 技術一樣,即時重新安排著色工作負載,號稱令光線追蹤的速度提升 2 至 3 倍。RT 核心升級為第三代,加入 Opacity Micro-Map Engine 與 Micro-Mesh Engine 兩個硬體單位,前者可提升幾何光線追蹤速度,後者則可增加幾何豐富度。Ada Lovelace 的峰值 RT-TFLOP 效能可達上代的 2.8 倍,RTX 4090 可達 191 RT-TFLOPS,較上代最高的 78 RT-TFLOPS 顯著提升。

    Tensor 核心亦升級為第四代,加入全新 FP8(8-bit Floating Point)Tensor Engine,RTX 4090 號稱提供達 1.32 PetaFLOPS 的 Tensor 運算效能,足足是上代的 5 倍之多。Ada Lovelace 支援全新一代 DLSS 3(Deep Learning Super Sampling)技術,包含四個元件:Optical Flow Accelerator(光流加速器)、Motion Vector(動態向量)、Generation Convolutional Autoencoder(卷積自動編碼器人工智慧畫格產生器),以及 Reflex 超低延遲流程。

    DLSS 3 會處理新畫格和前一個畫格,以了解場景的變化,光流加速器為神經網路提供畫格之間的像素方向和速度,每一組畫格以及幾何和像素動態向量會匯入產生中間畫格的神經網,因此 DLSS 3 毋須處理繪圖流程即可產生全新畫格,號稱比傳統渲染方式提升高達 4 倍效能。由於 DLSS 3 能在不涉及遊戲的情況下產生新畫格,即使是受限於 CPU 效能的遊戲,仍可受益於 DLSS 3,官方稱在《Microsoft Flight Simulator》可提升 FPS 達一倍。

    您會感興趣的內容

    相關文章