AI 機械人製造商 Figure 日前宣布與 OpenAI 合作後,昨日推出首條影片,展示他們的 Figure 01 機械人整合了 OpenAI 的人工智能後,具備了語音至語音推理能力(speech-to-speech reasoning),能夠理解視覺和語言,透過學習來作出種種複雜的動作,與人進行互動。
Figure 01 身高 168 公分,體重約 59 公斤,可以提起約 20 公斤物件,以時速 4.3 公里步行。從片中可以看到 Figure 01 能夠描述所見到的情景,計劃未來的行動,反映記憶下來的內容,並作出口頭說明。Figure 01 運用理解圖像和文字的大規模多模式模型,基於神經網狀視覺運動變換策略進行精密操作,描述周圍環境,進行常識推理,回應含糊的要求。
片中 Figure 01 理解甚麼是人類能吃的並遞上蘋果,一邊說明剛才所做的事(記憶反映)同時又明白甚麼是垃圾,並根據所見直接產生動作收拾枱面,最後評價自己的工作水平。