突破LLM瓶頸!阿里巴巴領投20億人民幣 押注「世界模型」新勢力

記者彭夢竺/編譯

隨著大型語言模型(LLM)的局限性逐漸顯現,阿里巴巴雲端運算正將目光投向一種新型的AI。這類技術目的是在更真實地模擬現實世界,與目前以文本為基礎的聊天機器人截然不同,被視為推動機器人與自駕技術發展的關鍵。

阿里巴巴 Alibab。(圖/123RF)
阿里巴巴 Alibab。(圖/123RF)

阿里領投20億人民幣注入B輪融資

阿里巴巴宣布,領投中國AI影片生成工具「Vidu」背後的開發商—生數科技(ShengShu)高達20億人民幣的B輪融資,這次參與投資的還包括好未來(TAL Education)與百度風投(Baidu Ventures)。

這距離生數科技上次獲得6億人民幣融資僅約2個月,顯示市場對該領域的高度熱情。

更多科技工作請上科技專區:https://techplus.1111.com.tw/
科技社群討論區:https://pei.com.tw/feed/c/tech-plus

邁向物理世界 打造「通用世界模型」

生數科技表示,這筆資金將用於研發「通用世界模型(General World Model)」。不同於主要依賴文本訓練的LLM,世界模型透過視覺、音頻及觸覺等多模態數據,試圖捕捉物理世界的運作規律。

該公司的目標是打破數位世界(如遊戲、AI影片)與物理世界(如自動駕駛、機器人)之間的隔閡,實現「感知與行動」的無縫連結。

影片生成技術領先 Vidu全球排名躋身前十

生數科技於今年1月發布的「Vidu Q3 Pro」模型,在「人工智慧分析(Artificial Analysis)」的全球影片生成排名中位列前10。

值得注意的是,生數科技早在OpenAI推出目前已暫停服務的Sora之前,就已向全球開放Vidu。

目前該技術在與快手(Kuaishou)及字節跳動(ByteDance)等強敵的競爭中,展現了強大的研發實力。

鎖定具身智能 阿里廣泛布局3D與影片模型

阿里巴巴近期正密集投資相關新創。除了生數科技,阿里上個月還領投了3D生成平台Tripo AI的5,000萬美元融資,以及去年9月對影片生成新創PixVerse投入6,000萬美元。

這些投資共同指向一個趨勢:AI技術正從平面文本轉向具備物理空間感的3D與世界模型。生數科技透露,已與多家開發「具身智能(Embodied AI)」的公司建立戰略合作,應用範圍涵蓋工業、商業及家居場景。

世界模型是實現人類等級智能的最後拼圖

外媒《Wired》雜誌共同創辦人凱文凱利(Kevin Kelly)近期指出,世界模型對機器人技術至關重要。他認為,要複製人類智能需要3大支柱:推理能力、對物理世界的理解以及持續學習。

目前的聊天機器人已解決了知識傳遞的難題,而「世界模型」則是當前最需要突破的關鍵領域。隨著阿里巴巴等科技巨頭的重金投入,AI的進化正進入下一個更具實體感的階段。

資料來源:CNBC

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button