更多

    商湯 AI 運算力望增至 30EFLOPS 美國限制晶片出口或改用中國產品頂上

    Eric Chong
    Eric Chong
    商業・科技・創業・編輯

    美國多次收緊人工智能( AI )晶片向中國出口的條件,令中國的人工智能運算能力受到一定限制。即使如此,商湯仍然預期公司整體運算能力繼續增加,兩年後從目前約 12EFLOPS 增至 30EFLOPS。商湯科技董事長和行政總裁徐立稱,之後會加碼採購中國產晶片。

    近年,商湯不斷增加其 AI 系統的運算能力,由 2022 年底的 5EFLOPS 加至 2023 年底的 12EFLOPS,營運 45,000 張 GPU。徐立的目標是在兩年後將運算能力增加超過一倍的 30EFLOPS。商湯旗下的運算平台目前集中在中國上海臨港的人工智能運算中心(AIDC),效能有 8.4EFLOPS,近年亦在深圳、廣州、重慶、福建等城市擴展。

    根據 TOP500 最新公布 2024 年 6 月超級電腦排名榜,排首位 Frontier 的運算效能為 1.206EFLOPS。換言之,商湯所擁有的運算能力較最快的超級電腦多近 10 倍。

    徐立稱,目前的 GPU 以 NVIDIA 的 A800、H800 為主,惟美國限制晶片出口肯定會對業務發展有衝擊。但有多個方法代替,其中之一是改用中國生產的晶片。

    商湯現時擁有 12EFLOPS 運算能力,僅約五分之一採用中國 AI 晶片。不過,徐立表明會擴大使用比例,兩年後目標增至 30EFLOPS 時會有一半晶片由中國產品支援,如華為的昇騰、寒武紀等。中國晶片性價比高,相比 NVIDIA 每張 GPU 只有約七成運算能力,但價格則是一半,成本有競爭優勢。不過最後還是要視乎中國廠商的供貨進度。

    未來兩年新增的運算能力將擴充至中國其他地區,不再集中在上海,如深圳前海和福州。其中前海深港人工智能運算中心在今年初啟用,支援包括香港在內的客戶。徐立直言,香港營運成本高,難以建立具成本效益的數據中心,但香港的 AI 市場前景好,關鍵是改變行業與 AI 的生產關係。商湯將在今月底發表支援廣東話的《商量》大型語言模型。

    另一方法是開發更具效益的 AI 模型,減低消耗運算能力。徐立表示,大型語言模型愈來愈大,推理成本也漸高。而相對較小的模型只選用合適的數據集,例如有關係的數據,亦能具備更有效的推理能力。同時,將 AI 運算推向終端和邊緣設備,在日日新 5.0 推出終端與雲端協同方案,在兩者之間判斷合適的運算環境,估計超過八成運算都能在終端上處理,顯著降低推理成本。又推出企業級大型語言模型一體機的邊緣設備,以在地部署方式減少使用雲端運算資源。

    最新影片

    您會感興趣的內容

    相關文章