免費的還跟GPT-5一樣強?DeepSeek新推AI推理模型V3.2 數理測驗拿金牌

記者鄧天心/綜合報導

中國AI新創DeepSeek發佈兩款新模型DeepSeek-V3.2與DeepSeek-V3.2-Speciale,號稱在推理、寫程式和工具使用等測試中,表現可以追上甚至在部分項目超過OpenAI GPT-5和Google Gemini 3 Pro,最大賣點是「性能接近封閉旗艦、但維持開源和低成本」,對開發者和企業來說,這代表不用一定綁在單一雲端服務,也有機會用開源模型做出接近頂級商用模型的AI產品。​

1764748970700
DeepSeek新模型強勢登場。(圖/deepseek)

延伸閱讀:

這個工程師不用下班!亞馬遜推新AI工具Kiro 能長時間連續寫code

DeepSeek-V3.2是給一般應用用的主力版本,在數學推理、程式題、代理任務與工具調用等公開測試中,整體分數被評估已能與GPT-5和Gemini 3 Pro同一級距,V3.2-Speciale則偏向「比賽等級」版本,在AIME和奧林匹亞風格的數學與資訊測試中拿到接近金牌水準的分數,但推理成本較高。​

技術上,V3.2系列沿用Mixture-of-Experts多專家架構,總參數高達約6710億,新引入的DeepSeek Sparse Attention則是專門優化長文本,讓模型在處理長對話、長文件時速度更快、記憶體壓力更小,但推理品質仍接近傳統全注意力設計。​

DeepSeek在V3.2上大幅強化了「思考+用工具」,讓模型學會先拆解問題,再決定要不要呼叫搜尋、程式執行或其他外部工具。​目前V3.2基礎模型已開源並上架多個模型平台,企業可以自行下載、微調與私有部署;Speciale則維持API使用模式。

V3.2系列讓開源陣營首次在實力上真正貼近GPT-5等,未來高階AI應用不再只有付費用封閉模型一條路,開源模型有機會成為更有優勢的競爭對手。​

資料來源:DeepSeek

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button