Google最新AI Gemini 2.5可以幫你逛網站!點連結、自動填表都不是問題
記者鄧天心/綜合報導
Google再度升級自家的AI能力,最新推出的Gemini 2.5「Computer Use」模型,現已開放API預覽,能讓AI真正「學會用電腦」,這項新技術建立在Gemini 2.5 Pro基礎之上,讓AI不僅能理解文字與對話,還能直接操作電腦畫面。
Google表示,這個模型能觀察並操控使用者介面,理論上可用於各種情境,像是自動整理檔案、開啟雲端應用、填寫表單或製作報表,成為能替使用者親自動手的AI助手。

延伸閱讀:
黃仁勳揭秘與OpenAI新合作!首度「直接採購」晶片 自建AI雲端基礎設施
若進一步整合企業內部工具與系統,AI甚至可能成為「虛擬助理工程師」,自動完成繁瑣的數位例行任務,這項技術的關鍵,在於模型不只是語言理解,而能將輸入指令轉化為具體的電腦操作步驟,換句話說,它更像一個能看懂畫面、判斷按鈕位置、並模擬使用者動作的「智慧代理」。
企業過去主要利用AI來生成行銷素材、撰寫文件或回覆客服;未來,Gemini 2.5「Computer Use」可能直接操作CRM、會計或ERP系統,執行任務層級的自動化。
對開發者而言,目前開放的API預覽版提供了實驗性機會,可測試AI在不同軟體環境中的行為與安全邊界。Google强調,系統設計中包含多層安全控制,確保模型在獲得明確授權的環境下執行操作,不會擅自改動使用者資料。
從文字生成到圖像識別,再到「懂得用電腦」的智慧代理,這次的更新標誌著AI正邁向更人性化也更實務的方向。對一般使用者來說,未來也許不需再親手開啟應用程式、點擊選項,只要一句指令:「幫我整理這份資料」,電腦便能由AI自動完成,Gemini 2.5「Computer Use」不只是技術升級,更像是人機互動邁入新階段的開始,AI將不只是回答問題的助手,而是實際能「代勞」的工作夥伴。
資料來源:The Keyword