DeepSeek登《Nature》打臉「上億訓練費」說法 公開成本僅29萬元

記者鄧天心/綜合報導

中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。

DeepSeek總部位於杭州,今年1月,該公司首次推出低成本AI模型,就曾引發市場震盪,一度威脅到輝達(Nvidia)等主要AI巨頭的地位,根據論文揭露,R1模型以512顆輝達H800晶片進行訓練,僅耗時80小時,最終花費29.4萬美元,美國OpenAI執行長Sam Altman曾在2023年表示,基礎模型的訓練成本「遠超過1億美元」,雖未公布細節,但數字落差相當驚人。

1758250312940
中國AI新創公司DeepSeek再次成為焦點,該公司在本週發表於《自然》(Nature)的論文中透露,旗下R1模型的訓練成本僅為29.4萬美元,遠低於美國OpenAI等業者動輒上億美元的規模。(圖/Nature)

延伸閱讀:

AI瀏覽器時代來了!Google Chrome宣布全面加入Gemini

不過,DeepSeek的技術來源與成本已多次受到質疑,H800晶片原本是輝達專為中國市場設計的「替代產品」,因為美國自2022年底起禁止更高階的H100和A100出口至中國。今年6月,美方官員甚至指稱DeepSeek仍設法取得「大量」H100晶片,但輝達隨即否認,強調DeepSeek只能合法使用H800,不過,該公司也在論文補充資料中首次承認,研發初期確實動用了部分A100晶片做小規模實驗。

研究團隊解釋:「我們在R1初期測試時,曾使用A100 GPU進行小模型實驗,正式訓練則是在512顆H800晶片上完成。」這也側面印證,DeepSeek是少數早期掌握A100超算資源的中國團隊。

此外,針對外界質疑DeepSeek「蒸餾」OpenAI模型,即透過技術模仿方式縮小開發成本,公司雖未正面回應,但最新論文已首度間接觸及相關爭議。

資料來源:Nature

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button