Google發表Gemini 3.1輕量版 成本僅Pro版八分之一
記者鄧天心/綜合報導
Google宣布推出人工智慧模型Gemini 3.1 Flash-Lite,主打低成本與高速度,針對需大規模部署推理及多模態能力的開發者設計。隨著該模型問世,Google已完成Gemini 3系列的分層佈局,讓企業能接續2月發表的Gemini 3.1 Pro,依據需求彈性配置資源。

在AI應用中,延遲程度決定使用者體驗,Gemini 3.1 Flash-Lite優化了「首個代幣生成時間」(Time to First Token),根據測試,其反應速度比前代Gemini 2.5 Flash快2.5倍,每秒輸出達363個代幣。Google DeepMind研究副總裁卡夫庫歐魯(Koray Kavukcuoglu)表示,這項進展來自底層工程的優化,使AI反應接近即時。
此外,新模型引入「思考等級」(Thinking Levels)功能,開發者可依任務難易動態調整,簡單的分類或情緒分析可調低等級以降低成本;複雜的程式碼探索則可調高等級,讓模型在輸出前進行深層邏輯推演。
更多科技工作請上科技專區:https://techplus.1111.com.tw/
性能數據與結構化輸出
雖然定位為輕量化版本,但Flash-Lite在Arena.ai排行榜獲得1432分的Elo評分。具體指標顯示,其科學知識(GPQA Diamond)準確率為86.9%、多模態理解(MMMU-Pro)為76.8%。
在企業重視的結構化輸出(如JSON、SQL)方面,Flash-Lite在Live Code Bench測試中獲得72.0%的成績。相較於GPT-5 mini,Flash-Lite在維持性能的同時,具備更高的速度與成本優勢。
在Google的體系中,3.1 Pro定位為處理深度認知的大腦,在測試全新邏輯的ARC-AGI-2中獲得77.1%評分,適合高風險決策。Flash-Lite則類似反射神經,負責翻譯、標記與審核等重複性任務,能以94%的準確度引導任務路徑。
定價策略 重塑AI成本結構
Flash-Lite定價為每百萬輸入代幣0.25美元、輸出1.50美元,低於競爭對手Claude 4.5 Haiku。與同系列的3.1 Pro相比,在處理長文本(逾20萬代幣)時,Flash-Lite成本僅約其八分之一。企業可採取混合架構,由Pro版本負責初步規劃,再將高頻執行工作移交予Flash-Lite。
目前Gemini 3.1系列已於Google AI Studio及Vertex AI上線。儘管專有模型在客製化上與開源模型(如阿里巴巴Qwen3.5)路徑不同,但其提供的資訊安全與企業級保障仍是核心競爭力。
延伸閱讀:
OpenAI GPT-5.4將登場!能「極限推理」、處理百萬長文本
資料來源:venture beat
![]()
