Google DeepMind開放Project Genie測試！「世界模型」技術比李飛飛更厲害？

2026-01-30

記者鄧天心／綜合報導

Google DeepMind旗下AI計畫「Project Genie」自週四起，開放美國地區的Google AI Ultra訂閱者搶先體驗。使用者僅需輸入簡單的文字指令或上傳圖像，系統便能自動生成可實際操作與探索的互動遊戲世界。

該工具整合了Google最新的Genie 3世界模型、Nano Banana Pro影像生成模型以及Gemini系統，DeepMind表示，目前的開放測試要收集第一線用戶的回饋與訓練數據，持續優化並加速世界模型技術的迭代開發。

Google DeepMind旗下AI計畫「Project Genie」自週四起，開放美國地區的Google AI Ultra訂閱者搶先體驗。使用者僅需輸入簡單的文字指令或上傳圖像，系統便能自動生成可實際操作與探索的互動遊戲世界。（圖／Google Labs Project Genie 官網）

延伸閱讀：

所謂的世界模型是指能對環境建立內部表徵，並預測未來結果與規劃行動的AI系統，DeepMind計畫先從電子遊戲等娛樂領域切入市場，最終目標是將此技術延伸至模擬環境，用於訓練機器人的反應能力，進而邁向通用人工智慧（AGI）的終極目標。

目前全球已掀起世界模型競爭熱潮，多位重量級大咖紛紛進場，人工智慧專家李飛飛（Fei-FeiLi）創辦的World Labs已於去年底推出首款商業產品Marble；AI影片生成新創Runway近期也發表了自家的世界模型；此外，Meta前首席科學家楊立昆（Yann Le Cun）所創辦的AMI Labs同樣將此領域列為核心研發重點。

不過，DeepMind研究人員坦言該工具目前還在實驗階段，系統表現有時令人驚艷，能生成完美的互動世界，有時則會出現莫名其妙的錯誤，操作上，使用者需先提供環境與主角的文字描述進行「世界素描（World sketch）」，Nano Banana Pro會據此生成影像，Genie再以此為起點構建互動世界，測試發現，雖然能成功修改細節，但偶爾會出錯，例如要求綠色頭髮卻生成紫色。

此外，使用者也可以利用真實照片作為基底，但成效不一，一旦對影像滿意，Project Genie僅需數秒即可生成可探索的世界，然而受限於計算成本，目前每回合僅開放60秒的生成與探索時間，弗魯赫特解釋，由於Genie 3是自回歸模型（Auto-regressivemodel），需要消耗極大的算力，限制時長是為了能讓更多人同時體驗。

在安全性方面，系統已建置嚴格的防護牆（Guardrails），無法生成裸露、涉及迪士尼或其他版權IP的內容，互動性也是DeepMind目前的改進重點，測試中曾出現角色穿牆而過的狀況，且導航操控（使用WASD鍵）有時反應遲鈍或指向錯誤，弗魯赫特強調，這只是一個實驗性的原型，未來團隊將致力於提升寫實度與互動能力。

資料來源：techcrunch