更多

    【AWS re:Invent 22】Nitro v5、Graviton3E 攻 HPC 市場

    Eric Chong
    Eric Chong
    商業・科技・創業・編輯

    幾間公共雲平台中,AWS 是最先研發晶片的一間,今年大會 re:Invent 2022 發表後續產品,包括網絡晶片 Nitro v5、ARM 處理器 Graviton3E、AI 訓練晶片 Inferentia2,以及多個新 HPC 執行個體。AWS 還提出 SRD 網絡協定,取代傳統 TCP,加快伺服器之間的傳送數據效率。

    AWS 效用運算高級副總裁 Peter Desantis 稱,企業要求高效能運算,但同時考慮成本和安全,新硬件產品和執行個體的研發過程,以這三個目標為原則。

    新網絡晶片 Nitro v5 繼續由旗下的 Annapurna Labs 開發,較前一代 v4 的每秒封包量 (Packet Per Second,PPS) 提升 60% 、降低 30% 時延,以及減少 40% 耗能。新執行個體 C7gn 採用 Nitro v5 晶片配 Graviton3E,網絡效能有 200Gbps,較前一代提升 50%,最多設 64 vCPU 及 128GB 記憶體。Desantis 表示,C7gn 提供超高的網絡頻寬、網絡封包效率和價格效能,適用於網絡密集型工作負載,如天氣預測、生命科學、工業工程等。

    至於新處理器 Graviton3E 為去年推出的 Graviton3 的改良版,針對運算浮點數效能開發,效能提升 35%。由於高效能運算大多涉及處理浮點數,Graviton3E 將加強效能並減低成本。將在明年推出的 Hpc7g 執行個體,採用 Graviton3E 和 Nitro v5 ,較前一代 Hpc6a 的效能提高 20% 。

    AWS 又推出用於 Inf2 執行個體、專門訓練超大型深度學習神經網絡模型的推論晶片 Inferentia2 。Desantis 表示,自然語言模型參數幾何級數增長,令訓練時間和成本大增,Inferentia2 可支援訓練 1,750 億個參數的模型,與前一代相比提升 4 倍傳輸量和降低 10 倍時延,亦較 GPU 訓練耗能低 45% 。

    即使處理器或其他專設晶片效能大幅提升,網絡效能仍是整體表現的樽頸。AWS 幾年前提出取代業界沿用多年的 TCP 網絡協定,今年發表 SRD(Scalable Reliable Datagram),用於內部網絡,加快虛擬機器之間的數據傳送。Desantis 指出,TCP 協定只能點對點連線,而且要順序傳送網絡封包,雖然可靠但造成延誤。SRD 改用多點連線,毋須順序傳送封包,自動在終點集齊,突破了網絡樽頸。TCP 目前傳送速度 5Gbps,而 SRD 可快 5 倍至 25Gbps。

    他還補充,AWS 將在內部網絡逐步改用 SRD 協定,包括 HPC 的 EFA、儲存的 EBS ,以及網絡的 ENA。

    您會感興趣的內容

    相關文章