DeepSeek登《Nature》打臉「上億訓練費」說法公開成本僅29萬元

2025-09-19

記者鄧天心／綜合報導

中國AI新創公司DeepSeek再次成為焦點，該公司在本週發表於《自然》（Nature）的論文中透露，旗下R1模型的訓練成本僅為29.4萬美元，遠低於美國OpenAI等業者動輒上億美元的規模。

DeepSeek總部位於杭州，今年1月，該公司首次推出低成本AI模型，就曾引發市場震盪，一度威脅到輝達（Nvidia）等主要AI巨頭的地位，根據論文揭露，R1模型以512顆輝達H800晶片進行訓練，僅耗時80小時，最終花費29.4萬美元，美國OpenAI執行長Sam Altman曾在2023年表示，基礎模型的訓練成本「遠超過1億美元」，雖未公布細節，但數字落差相當驚人。

1758250312940 — 中國AI新創公司DeepSeek再次成為焦點，該公司在本週發表於《自然》（Nature）的論文中透露，旗下R1模型的訓練成本僅為29.4萬美元，遠低於美國OpenAI等業者動輒上億美元的規模。（圖／Nature）

延伸閱讀：

AI瀏覽器時代來了！Google Chrome宣布全面加入Gemini

不過，DeepSeek的技術來源與成本已多次受到質疑，H800晶片原本是輝達專為中國市場設計的「替代產品」，因為美國自2022年底起禁止更高階的H100和A100出口至中國。今年6月，美方官員甚至指稱DeepSeek仍設法取得「大量」H100晶片，但輝達隨即否認，強調DeepSeek只能合法使用H800，不過，該公司也在論文補充資料中首次承認，研發初期確實動用了部分A100晶片做小規模實驗。

研究團隊解釋：「我們在R1初期測試時，曾使用A100 GPU進行小模型實驗，正式訓練則是在512顆H800晶片上完成。」這也側面印證，DeepSeek是少數早期掌握A100超算資源的中國團隊。

此外，針對外界質疑DeepSeek「蒸餾」OpenAI模型，即透過技術模仿方式縮小開發成本，公司雖未正面回應，但最新論文已首度間接觸及相關爭議。

資料來源：Nature