DeepSeek年底推AI代理人 正面挑戰OpenAI霸主地位

記者鄧天心/綜合報導

中國AI新秀DeepSeek現在正全力開發一款更厲害的「AI代理人」模型,直接向OpenAI這些美國大廠下戰帖,想在AI進入「會做事、會動腦」的新時代搶得先機,根據業界人士透露,創辦人梁文鋒已經訂下明確目標,要團隊趕在今年第四季公開這款全新產品,並計畫在2025年底前讓更多人能實際用上,對DeepSeek來說,這不只是技術突破,更是從年初R1引起話題後,真正讓AI能落地、能執行的關鍵一步,大家都睜大眼睛在看,DeepSeek這次是不是真的能從「會說」變成「會做」,讓AI從實驗室走進辦公室和日常生活。

這款新模型的核心在於降低使用門檻,使用者只需給出極簡指令,系統便能自動把任務拆解、規劃與執行,完成包含多步驟在內的複雜工作,它會從過往行動中「學習與改進」,使任務完成的效率與穩定性隨時間不斷提升,這不再只是回一句答案的聊天機器人,而是能替用戶把事辦好的數位代理人,從工作流程設計、資料分析,到寫程式與除錯,甚至跨應用的協作場景,都是這一代產品的想定用途。

1757042471248
中國AI新秀DeepSeek現在正全力開發一款更厲害的「AI代理人」模型,直接向OpenAI這些美國大廠下戰帖。(圖/DeepSeek)

延伸閱讀:

Google Photos再升級!免費用戶也能用AI把照片變短片

近月來,OpenAI、Anthropic、微軟等公司相繼推出代理人工具,目標都是簡化個人與企業作業流程,真正把AI變成「會做事」的助手,產業內的共識逐漸明確,下一個里程碑不再只是模型在紙面上的表現,而是「能否在真實環境裡把事做好」,因此,研究度假方案、規劃專案流程,或自動撰寫並修復可運行的程式碼,成為新一代代理人服務的核心驗收場景;投行與顧問圈也多次點名,企業生產力的提升將是此波AI應用的關鍵驅動。

時機點對DeepSeek格外關鍵,R1在今年1月橫空出世,以「模擬人類推理」能力引發關注;外界盛傳其開發成本僅需數百萬美元,卻在多項基準測試中直逼甚至一度超越OpenAI的產品。也正因為R1的聲量居高不下,後繼者(外界多以R2稱之)備受期待,不過,R1之後,DeepSeek對外更新相對克制,並未採用高頻迭代的策略。有觀點認為這與梁文鋒「把事情做到位」的風格有關;也有市場聲音猜測,模型訓練與工程化落地仍在攻堅,無論背後原因為何,這次轉向「代理人平台」的訊號已相當清楚,公司希望把「會思考」的能力,延伸成「會執行」的能力,讓技術成果在實務中產生可衡量的價值。

就中國本土的相對位勢而言,DeepSeek近一年走的是「穩健推進」路線,與阿里巴巴、騰訊等巨頭頻繁釋出的模型迭代形成對比,像阿里巴巴的通義千問(Qwen)系列,憑藉快速升級與廣泛應用,已累積穩定的使用者與開發者口碑,若DeepSeek能在代理人領域推出真正可用、可部署、可帶來投資報酬的方案,將有機會在「效率、成本與可落地性」三者上做出差異化,縮短與大廠在生態與資源層面的距離。

資料來源:BloombergThe Washington TimesCNET

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button