最強反擊!Google推Gemini 3.5 Flash與AI代理 迎戰OpenAI

記者鄧天心/綜合報導

Google在週二舉辦的年度I/O開發者大會上,正式發表新一代Gemini系列模型以及一款旨在模擬物理世界的新型模型。當前市場正高度關注估值飆升、且最快預計於今年進行IPO的OpenAI與Anthropic,Google在模型開發賽道上全力加速,試圖在緊咬對手的同時,向其龐大的用戶群推出更多具備主動代理能力的Agent服務。

(圖/擷取自Google官方網站)
Google推全新AI代理與Omni世界模型。(圖/擷取自Google官方直播影片)

在Google的AI戰略中,Gemini模型家族與相關工具一直居於核心地位,執行長Sundar Pichai在週二大會前的媒體簡報中指出,本次發表亮點之一的輕量化模型Gemini 3.5 Flash不僅具備頂尖運算能力,速度更是極快。更重要的是,其營運成本僅有同級前一版模型的一半,在某些特定情境下甚至能壓低到近三分之一。

「AI履歷健檢」看見自己優勢:https://campaign.1111.com.tw/resume-review/
更多科技工作請上科技專區:https://techplus.1111.com.tw/

此外,官方也強化了Gemini 3.5 Flash的資安防護機制,使其大幅降低生成有害內容的機率,並減少誤判而拒絕回答安全指令的情況。這款新模型即日起將直接作為全球Gemini App與搜尋中AI模式的預設模型,至於運算量更大的高階版本Gemini 3.5 Pro,目前雖然已在內部投入使用,但預計要到下個月才會開放給更多人使用。

除了底層模型的升級,Google也在Agent領域祭出新招,正式發表通用型AI代理工具「Gemini Spark」。這款內建於Gemini App的功能具備跨應用程式的資訊推理能力,目標是在使用者的授權與引導下主動代勞,協助梳理數位生活。Gemini Spark目前仍處於測試階段,預計下週起優先開放給受信任的測試人員以及Google AI Ultra訂閱用戶體驗。

傳統搜尋用戶逐漸轉向聊天機器人,加上華爾街在Google資本支出暴增後對其產品整合效益的嚴格檢視,這類能深入整合各項產品的Agent服務,顯然成為Google向市場證明其變現與留客能力的關鍵棋子。

特別是近期Anthropic發表了據傳威力強大、甚至找出全球軟體基礎設施數千個未知漏洞的Mythos模型,這也讓市場對AI技術的預期標準被推得更高。

為了與競品做出技術差異,Google的AI產品線這次正式導入名為Omni的「世界模型(World model)」,這類通常用於機器人技術與遊戲領域、並由DeepMind深耕多年的技術,核心在於能夠模擬物理環境,並根據使用者的操作來預測下一步的畫面變化。

Omni將全面支援圖片與音訊輸入,並導入Flash模型、Gemini App、Google Flow與YouTube Shorts等平台,主打讓使用者能更輕鬆地編輯影片並創造更寫實的影像。未來只需要上傳自己拍攝的影片,接著直接透過對話要求Omni改變畫面走向,AI就能直接調整裡面的動作,甚至直接加入全新的角色或物件,都不是問題。

延伸閱讀:

【AI工具】最強影片生成AI?Google推Gemini Omni 主打影片可連續微調

資料來源:cnbc

Loading

發佈留言

Back to top button