DeepSeek低調升級R1 性能直追OpenAI與Google

2025-06-02

記者鄧天心／綜合報導

中國AI新創公司DeepSeek近日悄悄升級了R1推理模型，進這次名為R1-0528的「小幅版本升級」提升了模型的推理能力，整體表現逼近OpenAI的o3及Google的Gemini 2.5 Pro等頂尖模型。

1748849452930 — 中國AI新創公司DeepSeek近日悄悄升級了R1推理模型，進這次名為R1-0528的「小幅版本升級」提升了模型的推理能力，整體表現逼近OpenAI的o3及Google的Gemini 2.5 Pro等頂尖模型。（圖／deepseek官方網站）

Hugging Face的人工智慧研究員Adina Yakefu向CNBC表示，DeepSeek的最新升級讓大家看到他們更好的推理能力、數學技巧，並提升了與Gemini和o3等領先模型的競爭力。

除了推理能力的提升，R1-0528版本還減少了「幻覺」的機率，並改善了「vibe coding」的體驗。在程式碼生成能力的評估工具LiveCodeBench排行榜上，升級後的DeepSeek R1模型僅次於OpenAI的o3 mini模型，但優於OpenAI的k mini模型及阿里巴巴的Qwen 3模型。

此次升級延續了DeepSeek R1初次發布時的低調作風，公司並未發布正式聲明，僅在Hugging Face上釋出更新，DeepSeek發言人週三在一個微信群組中提及公司已完成一次「小型試用升級」，使用者可以開始測試新版本。

DeepSeek先前才以免費開源的R1推理模型一戰成名，該模型在效能上媲美甚至超越Meta和OpenAI等競爭對手的產品，且成本更低，R1模型的推出一度導致中國以外的科技股下跌，並挑戰了AI規模化需要龐大運算資源和投資的假設，也讓市場驚訝，引發大家對美國大型科技公司在基礎設施上過度支出的疑慮，導致包括AI龍頭Nvidia在內的美國主要科技股損失數十億美元市值。

在美國對頂尖晶片出口限制下，反而加速了其競爭對手AI技術的發展，有分析指出，一年前AI領域的領先者絕大多數是美國公司，但如今已有近十家中國公司的模型達到或超越大多數美國實驗室目前大型語言模型的水平。