突破LLM瓶頸！阿里巴巴領投20億人民幣押注「世界模型」新勢力

2026-04-10

記者彭夢竺／編譯

隨著大型語言模型（LLM）的局限性逐漸顯現，阿里巴巴雲端運算正將目光投向一種新型的AI。這類技術目的是在更真實地模擬現實世界，與目前以文本為基礎的聊天機器人截然不同，被視為推動機器人與自駕技術發展的關鍵。

阿里領投20億人民幣注入B輪融資

阿里巴巴宣布，領投中國AI影片生成工具「Vidu」背後的開發商—生數科技（ShengShu）高達20億人民幣的B輪融資，這次參與投資的還包括好未來（TAL Education）與百度風投（Baidu Ventures）。

這距離生數科技上次獲得6億人民幣融資僅約2個月，顯示市場對該領域的高度熱情。

更多科技工作請上科技專區：https://techplus.1111.com.tw/
科技社群討論區：https://pei.com.tw/feed/c/tech-plus

邁向物理世界打造「通用世界模型」

生數科技表示，這筆資金將用於研發「通用世界模型（General World Model）」。不同於主要依賴文本訓練的LLM，世界模型透過視覺、音頻及觸覺等多模態數據，試圖捕捉物理世界的運作規律。

該公司的目標是打破數位世界（如遊戲、AI影片）與物理世界（如自動駕駛、機器人）之間的隔閡，實現「感知與行動」的無縫連結。

影片生成技術領先 Vidu全球排名躋身前十

生數科技於今年1月發布的「Vidu Q3 Pro」模型，在「人工智慧分析（Artificial Analysis）」的全球影片生成排名中位列前10。

值得注意的是，生數科技早在OpenAI推出目前已暫停服務的Sora之前，就已向全球開放Vidu。

目前該技術在與快手（Kuaishou）及字節跳動（ByteDance）等強敵的競爭中，展現了強大的研發實力。

鎖定具身智能阿里廣泛布局3D與影片模型

阿里巴巴近期正密集投資相關新創。除了生數科技，阿里上個月還領投了3D生成平台Tripo AI的5,000萬美元融資，以及去年9月對影片生成新創PixVerse投入6,000萬美元。

這些投資共同指向一個趨勢：AI技術正從平面文本轉向具備物理空間感的3D與世界模型。生數科技透露，已與多家開發「具身智能（Embodied AI）」的公司建立戰略合作，應用範圍涵蓋工業、商業及家居場景。

世界模型是實現人類等級智能的最後拼圖

外媒《Wired》雜誌共同創辦人凱文凱利（Kevin Kelly）近期指出，世界模型對機器人技術至關重要。他認為，要複製人類智能需要3大支柱：推理能力、對物理世界的理解以及持續學習。

目前的聊天機器人已解決了知識傳遞的難題，而「世界模型」則是當前最需要突破的關鍵領域。隨著阿里巴巴等科技巨頭的重金投入，AI的進化正進入下一個更具實體感的階段。

資料來源：CNBC

2026-04-10

突破LLM瓶頸！阿里巴巴領投20億人民幣押注「世界模型」新勢力

阿里領投20億人民幣注入B輪融資

邁向物理世界打造「通用世界模型」

影片生成技術領先 Vidu全球排名躋身前十

鎖定具身智能阿里廣泛布局3D與影片模型

世界模型是實現人類等級智能的最後拼圖

推薦工作

發佈留言取消回覆

科技冷知識／Facebook最初竟是哈佛限定的「點名簿」？創辦6天就吃官司

讓AI走出機房！國研院智慧機器人中心沙崙揭牌

挖角大神果然有用！Meta下載量暴衝87% 「會寫遊戲」的Muse Spark厲害在哪？

ChatGPT百元方案終於來了！5月底前還有「限時不限速」目標鎖定工程師