更多

    【WWDC 24】Siri 新時代.人工智能滲透系統層面 Apple Intelligence 能追上人工智能列車嗎?

    Mickey Chan
    Mickey Chan
    愛模擬飛行、希望終有一日回到單車上的宅,眼鏡娘控。座右銘: 1.膽固醇跟美味是成正比的; 2.所有人都可以騙,但絕對不能騙自己; 3.賣掉的貨才是錢,不賣的收藏品不值一文; 4.踩單車,是為了吃更多美食! 5.正義的話語,不一定出自正義之人的口;

    在今日凌晨的 WWDC 主題演講中,Apple 終於揭示他們的人工智能 Apple Intelligence,就是要建立一套功能強大、直觀易用、整合到系統各層面、了解用戶個人背景以提供適切功能,更要著重私隱的個人智能系統,利用生成式人工智能來提升用戶體驗。不過這個蘋果智能又能否拉近飈速發展的人工智能趨趨勢,滿足用戶的需要呢?

    該有就有的個人智能系統

    Apple Intelligence 的功能可說得上全面,憑著深入了解文件、郵件和訊息的內容,提供過往難以做到的功能,包括:

    • 在郵件、備忘錄、Pages 和使用標準文字編輯框的第三方應用中提供人工智能「重寫」、「校對」和「彙整」三項寫作工具功能,能夠按對象和目的來調整文章語調,檢查文法、拼字和句子結構,將長篇甚至多篇文章彙整摘要、清單、表格;
    • 在郵件和訊息中抽出需要優先處理的電郵和短訊;
    • 智能回覆只需點擊幾個選項就能回覆電郵短訊;
    • 優先通知只將最重要、需優先處理的通知顯示在鎖定畫面;
    • 在備忘錄和電話 App 加入錄音、謄寫和摘要功能,總結通話內容;
    • 圖像遊樂場(Image Playground)與 Genmoji:用戶可以混合時、地、人等主題槪念,輔以文字提示,簡單點擊幾下就能生成有趣的插圖、動畫、掃描、頭像或切合回覆的 Emoji。用戶可以在備忘錄、Keynotes、Freeform、Pages 和整合了 Image Playground API 的第三方軟件使用到圖像遊樂場,亦可以透過 Apple Pencil 的圖像魔術棒(Image Wand)調用;
    • 用戶可以在相片 App 以自然語言來搜尋想要的照片,這對分享照片和製作相簿和回憶錄相當有用。用戶更可以用自然語言來搜尋影片中的特定片段;
    • Clean Up 工具就像 Google 相簿的魔術橡皮擦功能一樣,清除照片中不想要的雜物,以凸顯主體;
    • 用戶可以用更自然說話,以文字或語音的方式來向 Siri 查詢或工作,配備 Apple Intelligence 的 Siri 更能跨程式執行任務,例如設定鬧鐘、查詢設定行事曆的方法、調整屏幕顯示模式,或以一句指令從相簿找尋照片自動以電郵傳送給朋友等;
    • 新 Siri 不單改用了新圖示,在啟動和接收用戶輸入時,還新增了環繞屏幕的彩色邊框作提示。

    勝在軟硬件一手包辦

    從上述的功能來看, Apple Intelligence 的功能似乎是「該有就有」,並沒有神奇的創新。不過這些功能的背後就展現了 Apple 才做得到的優勢。

    由於 Apple 一手包辦硬件和軟件的開發,所以可以做到一些其他品牌難以做到的整合,例如新 Siri 具有屏幕感知能力,能夠根據畫面上的內容來了解動作的執行對象。例如有客戶用短訊通知他新辦公室的地址,用戶只要對 Siri 說:「Add this address to his contact card」就能將新地址加入該客戶的聯絡人資料中,Siri 能明白 this 和 his 是指甚麼。

    另外,因為 Apple Intelligence 深入地整合到系統當中,不單官方應用,第三方應用也能呼叫相同的人工智能功能,用戶不需要在不同 App 之間跳來跳去,用起來自然更就手。

    新 Siri 又能運用儲存在裝置內的資料如電郵或訊息來智能地完成要求,例如用戶對 Siri 要求「播放 Jamie 推介的 Podcast 節目」,不需要說誰是 Jamie 也不用自己去找她甚麼時候以甚麼方式來推介,Siri 就會自己去找尋然後播放。

    裝置為主.雲端為輔.強調私隱

    Apple 多年來強調他們的設計著重私隱,雖然 Apple Intelligence 很多地方都是裝置內人工智能,不過無論小手機或是 Mac 機,進行圖像生成或大量文件整理仍然會感到吃力,需要用上雲端伺服器輔助,但這就衍生私隱問題。Apple 就推出了一套 Private Cloud Compute 框架,在提供具彈性和可擴展規模之下,將 Apple 裝置的私隱和保安要求擴展至雲端。

    Private Cloud Compute 採用加密的方式存送資料到採用 Apple 自家研發晶片的伺服器,應用程式不能在沒有紀錄下與伺服器渠通。而獨立審查員就可以檢查 Apple Silicon 伺服器上的程式碼以確定沒有私隱問題。

    整合 ChatGPT 港人或不能用

    雖然看來 Apple Intelligence 很全面,不過實際上與眾多 AI 科企相比仍有距離,Apple 就會在今年稍後時間在 iOS 18、iPadOS 18 和 macOS 15 Sequoia 中整合 OpenAI 的 ChatGPT,並且採用最新的 GPT-4o 模型,用戶在使用寫作功能時,可以在同一個介面調用 ChatGPT 來回應,以取得更全面的文件和圖像理解功能,而不需要在其他程式間轉來轉去。

    用戶毋須註冊 OpenAI 帳戶就能調用 ChatGPT 免費使用,不過相信限額會與使用 ChatGPT App 時相同。而已經付費 ChatGPT Plus 的訂戶亦可以選擇連結帳戶,可以用到付費的功能,例如生成圖像。

    使用 ChatGPT 時也會將文件和圖片上傳到 ChatGPT 伺服器,由於 GPT-4o 是多模態模型,所以相信回答會比 Siri 全面得多。而在私隱方面, Apple 指不會將用戶 IP 提供給 OpenAI,ChatGPT 也不會保存用戶請求。

    不過 ChatGPT 不是 Apple 唯一的選擇,他們表示將來也會整合其他人工智能。

    由於 ChatGPT 服務不支援中國、香港和澳門,相信日後即使 Apple 整合了 ChatGPT,香港的 Apple 用戶亦未必能用得到。

    試用 Apple Intelligence 硬件語言有要求

    Apple Intelligence 要到今年秋季才讓用戶透過 iOS 18、iPadOS 18 和 macOS 15 Sequoia 來免費試用,用戶需要將裝置設定為 U.S. English。部分功能和更多語言支援就要等到明年。支援的裝置包括 iPhone 15 Pro 和 iPhone 15 Pro Max,與及備有 Apple M 系列處理器的 iPad 和 Mac 機。

    功能只屬基本未能追上多模態水平

    從 Apple 的介紹可以看出 Apple Intelligence 功能頗為基本,只是去年的生成式人工智能水平,似乎並非多模態人工智能,也沒有提供像 Google Gemini 或 Microsoft Copilot 的大型上下文窗口讓用戶上傳檔案去做分析。

    當 GPT-4o ChatGPT 和 Google Gemini 都會在今年下半年陸續引入能同時分析文字、音頻、圖像、影片的多模態人工智能,提供真正人工智能助理能力的時候,Apple Intelligence 到今年秋天仍然維持在文字、語音轉文字和屏幕截圖這種等級的人工智能能力,顯然仍然落後。似乎 Apple 要真正趕上生成式工智能的列車,需要再趕趕工,或者利用手上龐大的現金流來尋求外援了。

    最新影片

    您會感興趣的內容

    相關文章