DeepSeek發表新模型V4聲稱推理表現「世界級水準」 能否再現去年震撼?

記者彭夢竺/編譯

中國人工智慧新創公司DeepSeek於24日發布了備受矚目的新模型V4預覽版。一年前,這家當時默默無聞的公司曾以強大性能震驚全球AI界,如今新模型再度宣戰,聲稱具備足以與OpenAI、Anthropic及Google抗衡的實力。

DeepSeek於24日發布了備受矚目的新模型V4預覽版。(圖/AI生成)
DeepSeek於24日發布了備受矚目的新模型V4預覽版。(圖/AI生成)

強化推理與自主代理 V4主打編碼與長文本效率

DeepSeek在發表會中強調,V4模型在推理能力與代理能力上有重大升級,能更自主地代為執行任務(如撰寫程式碼)。此外,新模型也提升了處理大量「標記」的效率,這對於AI理解複雜指令與長文本資訊至關重要。

從R1到V4 DeepSeek成為中國AI熱潮的指標企業

2025年,DeepSeek發布了R1模型,以極低成本達成接近產業頂尖的性能,成功奠定了其在中國AI熱潮中的領頭羊地位。

當時R1的成功曾導致美國AI概念股大跌,引發市場對數據中心龐大投資必要性的質疑,同時也提振了外界對中國技術實力的信心,使中美科技競賽更加白熱化。

更多科技工作請上科技專區:https://techplus.1111.com.tw/
科技社群討論區:https://pei.com.tw/feed/c/tech-plus

分析師:市場已預期競爭 V4難引發先前般的恐慌

雖然V4性能強勁,但MorningStar高級股權分析師蘇(Ivan Su)認為,這次不太可能再現先前的市場狂熱。他指出:「R1震撼了美國市場,是因為沒人料到中國模型能達到那種水準;V4只是延續了這個趨勢,而趨勢通常不像突發衝擊那樣能成為頭條新聞。」市場早已消化了中國AI模型既具競爭力且使用成本更低的現實。

開源策略對抗美國出口管制 DeepSeek與華為聯手

與大多數不對外開放原始碼的美國模型不同,DeepSeek的V4延續了開源策略,目的在透過快速擴展應用場景(從電子商務到機器人)來與美國競爭。這也反映出中國企業在華盛頓出口管制下,難以取得輝達(Nvidia)或超微(AMD)頂尖晶片的限制。

為了克服硬體屏障,DeepSeek與華為展開深度合作。華為24日時表示,透過Supernode(超級節點)技術,將大批昇騰950(Ascend 950)晶片組成叢集,為V4提供算力支援。

Counterpoint Research分析師Wei Sun指出,V4運行在華為與寒武紀(Cambricon)等國產晶片上,這證明了中國AI體系正逐步擺脫對輝達的依賴,對中國國內普及與全球AI發展具有更深遠的影響。

開源領域稱霸!推理能力宣稱已達「世界級」

儘管Anthropic的Claude、OpenAI的ChatGPT與Google的Gemini目前仍穩坐產業界塔尖,但中國企業已在開源系統領域展現統治力。DeepSeek發表聲明稱,V4在開源模型中擁有最強的代理編碼能力,推理表現也達到了世界級水準。

雖然在研究論文中承認其百科知識仍略遜於Google的Gemini,但已超越其他開源對手。

抄襲爭議如影隨形 美方指控中國發動工業級竊密

然而,DeepSeek的崛起也伴隨著質疑。

Anthropic與OpenAI先前曾指控DeepSeek非法提取其模型能力。白宮科學技術政策辦公室主任克拉茨歐斯(Michael Kratsios)也發出備忘錄,指控中國實體正進行「工業規模級」的行動,試圖從美國公司竊取前沿AI模型技術。

儘管備忘錄未點名深言,但在中美緊張局勢下,DeepSeek再度成為爭議焦點。只不過,目前DeepSeek尚未對相關指控作出回應。

資料來源:CNN

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button