Google DeepMind 推出新 AI 模型 助機器人上網解題

記者黃仁杰/編譯

Google DeepMind 宣布推出升級版的 AI 模型,讓機器人不僅能處理更複雜的任務,甚至能透過網路搜尋獲取所需資訊。DeepMind 機器人部門主管 Carolina Parada 在記者會上表示,新模型能幫助機器人在實際行動前「思考多個步驟」,展現更接近人類的推理與解題能力。

Poland Google company office 123rf
Google DeepMind 宣布推出升級版的 AI 模型,讓機器人不僅能處理更複雜的任務,甚至能透過網路搜尋獲取所需資訊。(圖/科技島資料照)

從單一步驟到多步推理 任務涵蓋日常生活

這套系統由新推出的 Gemini Robotics 1.5 與具身推理模型 Gemini Robotics-ER 1.5 驅動,是今年三月所發表模型的升級版。除了能執行摺紙、開拉鍊這類單一指令,機器人現在還能將衣物依深淺顏色分類、根據倫敦天氣收拾行李,甚至透過網路搜尋當地規範,協助民眾將垃圾、廚餘和回收物正確分類。Parada 強調,這次更新讓機器人「從單一步驟執行,邁向真正理解並解決實體任務的問題能力。」

AI結合網路搜尋 轉化資訊成操作指令

Gemini Robotics-ER 1.5 能幫助機器人理解環境,並透過 Google 搜尋獲取額外資訊。隨後,它會將搜尋結果轉化成自然語言指令交由 Gemini Robotics 1.5,利用其視覺與語言理解能力逐步完成動作。例如,若垃圾分類規則因地區不同,機器人便能根據最新搜尋資訊自動調整處理方式,展現更強的適應性。

跨機型共享技能 推動機器人學習合作

更新的另一大亮點是機器人間的技能共享。Google DeepMind 測試發現,ALOHA2 機械臂學到的任務,可以直接套用到雙臂 Franka 機器人,甚至移植到 Apptronik 的人形機器人 Apollo 上。這意味著,一個模型就能操控多種機器人,且在一台機器人學會技能後,可以迅速轉移到另一台機器人。DeepMind 工程師 Kanishka Rao 指出,這不僅能提升不同機型的兼容性,也加快機器人整體學習與進化的速度。

目前,Google DeepMind 已透過 Gemini API 在 Google AI Studio 對開發者開放 Gemini Robotics-ER 1.5,而 Gemini Robotics 1.5 則僅向特定合作夥伴釋出。

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button