多年來以 AI 掛帥、以 AI First 作口號的 Google 多個月來遭受 Microsoft + OpenAI 步步進迫,今日凌晨舉行的 Google I/O 就為 Google 反擊拉開戰幔。Google CEO Sundar Pichai 稱以勇敢和負責任態度,重新構思所有核心產品,整合生成式 AI 功能。
Sundar Pichai 指 Google 開發 AI 有 4 項原則,包括:改善知識和學習、加速創作和生產力、推動其他創新和負責任地開發和部署。以下是 Google I/O ’23 中有關生成式人 AI 的重點。
發表 PaLM 2 模型
新一代人工智能模型,依大小分為四種規模:Gecko(壁虎)、Otter(水獺)、Bison(野牛)和 Unicorn(獨角獸),最小的 Gecko 甚至可以在手機上離線執行。PaLM 2 以超過 100 種語言來訓練,並可針以特定知識來微調,例如網絡安全或醫療。例如可以閱讀 X 光片列舉出觀察到的病狀。PaLM 2 和相關的 API 經已提供預覽。
Duet AI for Workspace: Help me Write/Organize/Visualize
整合到 Google Workspace 中的生成功能,Gmail、Docs、Sheets 和 Sildes 都可用到,例如由人工智能代寫電郵、建立數據表、生成圖片給幻燈片等。下月開始可信測試人員可以開始試用這些功能,並會加多 6 種生成式 AI 功能。今年稍後就會擴展至所有商業和消費者用戶。
預覽 Sidekick
Google Workspace 的未來功能,能按工作提供提示詞建議、從其他用戶提供的資料表中找出資料,或自動生成演示片的講稿。
交談式人工智能 Bard
- 全面在 PaLM 2 模型上運行,提升編程、偵錯和解釋程式碼能力,支援超過 20 種編程語言,並能直接部署到 Colab。
- 即日開始 Bard 支援深色主題,將回答匯出到電郵或 Google Docs 文件。
- 數星期內回答會提供更多圖像資料
- 數月內整合到 Google Lens,能以影像作提示資料
- 提供更多 Google 服務作答案,例如地圖位置,並能將資料製成表單,然後匯出到 Google Sheets
- 與 Adobe 合作未來幾個月整合 Adobe Firefly 來生成圖像
- 英語版即日開放至超過 180 個國家(撰文香港未支援)
- 即日起新增支援日文及韓文,並將擴展至 40 種語言,包括中文
Google 搜尋嵌入生成式 AI
可以在搜尋列以自然語言句子來提問,搜尋時除了列出相關網站,還同時生成介紹文章,回答會提供資料來源,與及可以深入了解的建議問題。回覆還可結合 Google 網上商店服務提供購物意見。用戶又可以向 Google 搜尋提出生成表格等內容。
導航路線沉浸式視點
這 Google Map 功能是去年發表的沉浸式視點的進化版,讓用戶先以 3D 鳥瞰視點,預覽 Google 建議的路線風光、空氣質素、未來幾小時交通和天氣狀況。這功能會由今年夏季開始推出,今年年底 15 個城市可用,包括倫敦、紐約、三藩市、東京等。
Magic Editor
Google Photo 功能讓用戶可以修改圖片,移除和搬移相中物件、改變天色和燈光等。移動物件後 AI 甚至能自動填補內容。這功能今年稍後推出。
以浮水印及元數據分辨合成內容
為了讓民眾容易分辨生成式 AI 生成的內容的兩套技術,浮水印直接將資料嵌入生成出來的內容裡,而元數據(Metadata)就讓內容創作者將額外訊息關聯到原作中。Google 會確保他們的 AI 生成圖像都會附有元數據。
Gemini 模型
Google DeepMind 團隊訓練中的新一代基礎模型,提供多模式、高效整合工具和 API,並為未來創新而開發。