LLM

商湯日日新有 4.0 新版本　辦公小浣熊分析數據一問即答

2024-02-02

商湯科技宣布「日日新 SenseNova」推出 4.0 新版本。官方指其知識更全面、推理能力更高，而且生成能力更強，同時支持跨模態互換。其中，該公司更基於新發布的商量大語言模型 Function call & Assistants API 開發了數據分析工具「辦公小浣熊」。

業界動向

商湯開源大型語言模型 InternLM2　一次可讀 30 萬中文字

2024-01-17

商湯科技（ SenseTime ）發布新一代大型語言模型 InternLM2 （書生·浦語 2.0），並繼續開源提供免費商用授權。 InternLM2 包含 7B 及 20B 兩種參數規格及基座、對話等版本，支援 20 萬 tokens 的上下文，能夠一次過接受及處理約 30 萬中文字。

人工智能

微軟 GitHub 開源 DeepSpeed Chat　簡化訓練類似 ChatGPT 千億級模型

2023-04-15

訓練 GPT 般大型語言模型的時間和資金成本極高，並非一般人和企業可負擔。微軟在 GitHub 開源 DeepSpeed Chat，將千億級大型模型的訓練成本和花費時間驟降 15 倍。以 1,750 億參數模型為例，在 Azure 上 64x NVIDIA A100 GPU 可在 20 小時完成訓練，花費約 5,120 美元。

人工智能

呼籲暫停 AI 開發卻大手購入 GPU　Elon Musk 據報在 Twitter 成立部門發展 LLM

2023-04-12

早前 Elon Musk 聯同其他科技界名人，一同聯署呼籲發展 AI 的科企應暫停開發 6 個月，商議如何規範 AI 開發。不過這位前首富似乎另有一份劇本。據 Business Insider 報道，Elon Musk 在控制 Twitter 的 X Corp 成立了個 AI 開發專案部門，並且大手購入約 10,000 張 GPU，準備發展大型語言模型。

新聞

乘 AIGC 熱潮再出擊　Facebook 發表 LLaMA 大語言模型

2023-02-25

Facebook 前年改名 Meta 發展元宇宙事業，投入大量資金還未見成果。但近日科技界轉軚，紛紛投資到人工智能生成內容 AIGC，Meta 也要展示他們也在那方面的能力，發表具備 650 億個參數的大語言模型 LLaMA。

自從今年四月走訪意大利出席「波隆那童書展」，了解過世界對童書出版的重視程度，在香港推出兒童漫畫，重點應該放在推出英文版的機會上，但首先仍需要建立一定數量的書庫。那個時候，我們已開始三套漫畫的製作工作，同時間也為明年暑假推出的新書項目作準備。一轉眼過了兩個月，到了六月底、七月初，所有打算趕在書展推出的新書，都會排在這個檔期進利最後的校對和印刷工作，我們的三套漫畫初稿，也差不多同一時間出現在我的案頭，再加上每月月初，都是《PCM》月刊的埋版時間，一時之間，待處理和修改的稿件檔案，堆得如山般高！雖然現在出版界都改用了電腦排版，一版版的稿件都只是屏幕前的電子檔案，但連續幾星期每日十多小時坐在屏幕前，也絕對不是好受的經驗。

PCM 專欄

LLM

最新文章