日前美國政府公布晶片出口管制的修訂,並於 4 月 4 日生效。新修訂厚達 166 頁,還提出「調整後峰值性能 (APP)」不得超過 70 加權 TeraFLOPS 上限的要求,不少媒體傳出連 NVIDIA 針對中國市場的 RTX 4090 D 顯示卡和 H20 數據中心加速晶片都受到限制。NVIDIA 隨即聯絡傳媒澄清有關上限的計算方法,表示兩款現時符合規管限制的產品均不受影響。
據 Tom’s Hardware 引述 NVIDIA 的澄清,指修訂後的規則只針對電腦系統,而並非個別 GPU,更具體來說是針對有記憶體連貫性的系統,如 4 路 DGX H100 系統。而 RTX 4090 D 和 H20 這些已符合規管要求的 GPU 就不受影響。
另一個重要細節是「調整後峰值性能」適用於 FP64,而且是經過「加權」的,會依據系統使用的是向量還是非向量處理器來進行縮放,向量處理器乘以 0.9,非向量處理器乘以 0.3,所以 FP64 加權效能在 NVIDIA Tensor 核心與 CPU 之下會獲得不同數值。要確定系統的「調整後峰值性能 (APP)」和「加權 TeraFLOPS (WT)」需要計算系統的 FP64 總吞吐量,並按不同類型處理器乘以不同加權值計算出來。
根據 Tom’s Hardware 報道,RTX 4090 D 在這個計算方法下只有 1.15 加權 TeraFLOPS,所以未有超過 70 加權 TeraFLOPS 上限。