Google發表Gemini 3.1輕量版成本僅Pro版八分之一

2026-03-05

記者鄧天心／綜合報導

Google宣布推出人工智慧模型Gemini 3.1 Flash-Lite，主打低成本與高速度，針對需大規模部署推理及多模態能力的開發者設計。隨著該模型問世，Google已完成Gemini 3系列的分層佈局，讓企業能接續2月發表的Gemini 3.1 Pro，依據需求彈性配置資源。

Google推出Gemini 3.1 Flash-Lite 成本更低、速度更快。（圖／擷取自Google AI Studio）

在AI應用中，延遲程度決定使用者體驗，Gemini 3.1 Flash-Lite優化了「首個代幣生成時間」（Time to First Token），根據測試，其反應速度比前代Gemini 2.5 Flash快2.5倍，每秒輸出達363個代幣。Google DeepMind研究副總裁卡夫庫歐魯（Koray Kavukcuoglu）表示，這項進展來自底層工程的優化，使AI反應接近即時。

此外，新模型引入「思考等級」（Thinking Levels）功能，開發者可依任務難易動態調整，簡單的分類或情緒分析可調低等級以降低成本；複雜的程式碼探索則可調高等級，讓模型在輸出前進行深層邏輯推演。

更多科技工作請上科技專區：https://techplus.1111.com.tw/

性能數據與結構化輸出

雖然定位為輕量化版本，但Flash-Lite在Arena.ai排行榜獲得1432分的Elo評分。具體指標顯示，其科學知識（GPQA Diamond）準確率為86.9%、多模態理解（MMMU-Pro）為76.8%。

在企業重視的結構化輸出（如JSON、SQL）方面，Flash-Lite在Live Code Bench測試中獲得72.0%的成績。相較於GPT-5 mini，Flash-Lite在維持性能的同時，具備更高的速度與成本優勢。

在Google的體系中，3.1 Pro定位為處理深度認知的大腦，在測試全新邏輯的ARC-AGI-2中獲得77.1%評分，適合高風險決策。Flash-Lite則類似反射神經，負責翻譯、標記與審核等重複性任務，能以94%的準確度引導任務路徑。

定價策略重塑AI成本結構

Flash-Lite定價為每百萬輸入代幣0.25美元、輸出1.50美元，低於競爭對手Claude 4.5 Haiku。與同系列的3.1 Pro相比，在處理長文本（逾20萬代幣）時，Flash-Lite成本僅約其八分之一。企業可採取混合架構，由Pro版本負責初步規劃，再將高頻執行工作移交予Flash-Lite。

目前Gemini 3.1系列已於Google AI Studio及Vertex AI上線。儘管專有模型在客製化上與開源模型（如阿里巴巴Qwen3.5）路徑不同，但其提供的資訊安全與企業級保障仍是核心競爭力。

Google發表Gemini 3.1輕量版成本僅Pro版八分之一

性能數據與結構化輸出

定價策略重塑AI成本結構

推薦工作

發佈留言取消回覆

體驗刺激黑市交易！《監獄商店模擬器》究竟該討好囚犯還是巴結獄警

哥布林女僕來了！合作清潔遊戲《Goblin Cleanup》2027 年登陸家機及 Switch 2

「新應材」再度投資臺灣！砸45億元擴大產能3類人才就業機會增

中興大學14組生技團隊進軍亞洲生技大展 AI醫療、抗癌新藥成亮點

AI科技結合鏡片升級！依視路發表2026系列新品打造全新視覺體驗

最新科技新聞快訊不錯過!!

性能數據與結構化輸出

定價策略 重塑AI成本結構

推薦工作

延伸閱讀

「新應材」再度投資臺灣！砸45億元擴大產能3類人才就業機會增

AI科技結合鏡片升級！依視路發表2026系列新品 打造全新視覺體驗

2028年全球半導體設備銷售額預估達2295億美元新高 設備市場可望連續5年成長

聊天機器人成治療新助手！AI打造全天候心理支持 仍難取代真人

增肌不必狂吃！間歇性斷食「同樣長肌肉」還減少脂肪增加

印度一個月誕生第二隻AI獨角獸！AI新創Emergent估值達15億美元

發佈留言 取消回覆

定價策略重塑AI成本結構

AI科技結合鏡片升級！依視路發表2026系列新品打造全新視覺體驗

2028年全球半導體設備銷售額預估達2295億美元新高設備市場可望連續5年成長

聊天機器人成治療新助手！AI打造全天候心理支持仍難取代真人

發佈留言取消回覆