AI代理人表現不如預期?矽谷大舉搶建「虛擬訓練場」

記者鄧天心/綜合報導

最近最紅的就是「AI代理人」了,像ChatGPT Agent和Perplexity Comet這類產品,雖然常常登上媒體,大家都討論它們未來有多厲害,可是實際上,當你要這些AI真的幫你處理需要多步驟的複雜任務,或者應用在真實的工作場景時,你會發現它們還是「力不從心」,表現跟大家的想像有一段距離,這也讓整個產業開始思考:或許光有AI代理人還不夠,真正的突破點,可能是在「模擬訓練環境」這塊。

像是你現在可能會聽說,OpenAI、Perplexity這些矽谷大公司,以及許多新創,都在全力投資打造AI專屬的「虛擬訓練場」,讓AI不只會回答問題,而是能在一個模擬現實的空間裡不斷練習、拆解流程、學習真正的決策與行動。

這感覺就像是以前AI靠「標註資料」學會認圖、認字,現在則升級成AI要真正學會「做事」,「強化學習(RL)環境」,讓AI能在軟體沙盒裡反覆練習、拆解流程,甚至跨部門協作。

1758511203719
AI代理人很紅,但訓練環境才是下一波產業革命關鍵。(圖/OpenAI)

延伸閱讀:

蘋果副總裁親揭 自研晶片如何重塑iPhone未來版圖

這種RL環境在產業中迅速受到青睞,如同過去資料標註推升AI識別能力,如今誰能供應標準化、可擴展的「訓練舞台」,誰就可能成為下個「Scale AI」。新創公司Mechanize、Prime Intellect紛紛投入此領域,資料標註龍頭Mercor、Surge也拉高投資,除了自建也搶攻第三方供應市場,Anthropic據報討論一年內對RL環境投入超過10億美元,顯現大廠力拚搶灘決心。

生態系整體熱絡,不只有新創和老字號供應商競逐,還有越來越多企業客製平臺、雲端加速器與人才協作組織陸續到位。不過,行業觀察家提醒,強化學習環境雖解鎖任務分解、可控評測等優勢,但也帶來「獎勵駭客」等新風險,AI可能為求任務分數而繞過真正目標,泛化和可靠性之間仍需持續驗證。

與過去AlphaGo為主的封閉場域不同,如今的AI代理人要面對通用軟體與多變工作流,需要更高層次的環境設計與評估能力。同時,基於大型語言模型的AI,有機會藉由「環境+行動學習」跨足工具組合與多步驟自動決策,為業界解鎖新可能.

投資人和產業期待這波「環境戰」催生具規模、可評測的新基礎設施,不只是熱錢爭奪,更是誰能解決真實落地、標準與成本控管的競賽。環境是否能有效縮短AI從展示到實際派上用場的時程?可能還有待觀察。

資料來源:TechCrunchThe Information

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button