Google DeepMind開放Project Genie測試!「世界模型」技術比李飛飛更厲害?

記者鄧天心/綜合報導

Google DeepMind旗下AI計畫「Project Genie」自週四起,開放美國地區的Google AI Ultra訂閱者搶先體驗。使用者僅需輸入簡單的文字指令或上傳圖像,系統便能自動生成可實際操作與探索的互動遊戲世界。

該工具整合了Google最新的Genie 3世界模型、Nano Banana Pro影像生成模型以及Gemini系統,DeepMind表示,目前的開放測試要收集第一線用戶的回饋與訓練數據,持續優化並加速世界模型技術的迭代開發。

(圖/Google Labs Project Genie 官網)
Google DeepMind旗下AI計畫「Project Genie」自週四起,開放美國地區的Google AI Ultra訂閱者搶先體驗。使用者僅需輸入簡單的文字指令或上傳圖像,系統便能自動生成可實際操作與探索的互動遊戲世界。(圖/Google Labs Project Genie 官網)

延伸閱讀:

馬斯克傳重組三大事業帝國!SpaceX、xAI、特斯拉醞釀世紀大合併

所謂的世界模型是指能對環境建立內部表徵,並預測未來結果與規劃行動的AI系統,DeepMind計畫先從電子遊戲等娛樂領域切入市場,最終目標是將此技術延伸至模擬環境,用於訓練機器人的反應能力,進而邁向通用人工智慧(AGI)的終極目標。

目前全球已掀起世界模型競爭熱潮,多位重量級大咖紛紛進場,人工智慧專家李飛飛(Fei-FeiLi)創辦的World Labs已於去年底推出首款商業產品Marble;AI影片生成新創Runway近期也發表了自家的世界模型;此外,Meta前首席科學家楊立昆(Yann Le Cun)所創辦的AMI Labs同樣將此領域列為核心研發重點。

不過,DeepMind研究人員坦言該工具目前還在實驗階段,系統表現有時令人驚艷,能生成完美的互動世界,有時則會出現莫名其妙的錯誤,操作上,使用者需先提供環境與主角的文字描述進行「世界素描(World sketch)」,Nano Banana Pro會據此生成影像,Genie再以此為起點構建互動世界,測試發現,雖然能成功修改細節,但偶爾會出錯,例如要求綠色頭髮卻生成紫色。

此外,使用者也可以利用真實照片作為基底,但成效不一,一旦對影像滿意,Project Genie僅需數秒即可生成可探索的世界,然而受限於計算成本,目前每回合僅開放60秒的生成與探索時間,弗魯赫特解釋,由於Genie 3是自回歸模型(Auto-regressivemodel),需要消耗極大的算力,限制時長是為了能讓更多人同時體驗。

在安全性方面,系統已建置嚴格的防護牆(Guardrails),無法生成裸露、涉及迪士尼或其他版權IP的內容,互動性也是DeepMind目前的改進重點,測試中曾出現角色穿牆而過的狀況,且導航操控(使用WASD鍵)有時反應遲鈍或指向錯誤,弗魯赫特強調,這只是一個實驗性的原型,未來團隊將致力於提升寫實度與互動能力。

資料來源:techcrunch

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button