DeepSeek新旗艦模型未提供輝達、超微優化測試 轉向華為等中國晶片商
記者黃仁杰/編譯
路透社獨家報導,兩名知情人士透露,中國人工智慧實驗室DeepSeek在即將推出的新一代旗艦模型發布前,未依循慣例向美國晶片大廠提供預先版本進行效能優化測試,改為優先讓中國本土供應商取得早期存取權,顯示其策略出現明顯轉向。

消息指出,DeepSeek原預計在農曆新年前後發布重大更新版本V4,但此次並未向輝達(Nvidia)與超微(AMD)提供模型測試權限,反而讓包括華為在內的中國晶片商提前數週進行軟體優化。
依照產業慣例,AI開發商通常會在大型模型發布前,將預發布版本提供給主要晶片供應商,以確保模型能在主流硬體平台上順暢運行。DeepSeek過去也曾與輝達技術團隊密切合作。不過此次輝達與超微皆未獲得存取權。兩家公司拒絕評論,DeepSeek與華為則未回應置評請求。
更多科技工作請上科技專區:https://techplus.1111.com.tw/
路透無法立即確認DeepSeek此舉的具體原因。研究機構Creative Strategies執行長班・巴賈林(Ben Bajarin)表示,此舉對輝達與超微在通用資料加速器市場的實質影響有限,「多數企業並未實際部署DeepSeek,它更多是一種基準測試模型。」他補充,隨著新一代AI程式開發工具出現,軟體在不同硬體上的優化時間已從數月縮短至數週。
巴賈林也認為,此舉可能是中國政府更廣泛策略的一部分,旨在讓美國硬體與模型在中國市場處於不利地位。
此發展背景,是先前有美國川普政府高層官員向路透透露,DeepSeek最新AI模型實際上是以輝達最先進的Blackwell晶片,在中國境內資料中心進行訓練,恐涉及違反美國出口管制。該官員還指出,DeepSeek可能會移除相關技術指標,並對外宣稱模型是使用華為晶片訓練。
自2025年1月爆紅以來,DeepSeek模型在開源平台Hugging Face的下載量已超過7,500萬次,帶動一波中國開源AI模型浪潮。過去一年內,該平台上中國模型的下載量已超越其他國家。
中國開源模型的快速崛起,也讓華府再次辯論是否應持續放寬對中國出口先進AI晶片。美國去年允許輝達H20與超微MI308等專為AI推論設計的晶片恢復對中出貨,但對更高階處理器的出口仍維持限制。目前尚不清楚DeepSeek是否已取得購買相關美國晶片的許可。
來源:路透社
![]()






