百度開源新AI模型 稱效能超越GPT-5與Gemini

記者鄧天心/綜合報導

中國搜尋引擎巨頭百度(BaiduInc.)本週一發布全新人工智慧模型ERNIE‑4.5‑VL‑28B‑A3B‑Thinking,官方提到在多項視覺理解測試中超越Google與OpenAI的最新系統,所需運算資源僅為對手的一小部分。這款模型被視為百度在全球AI競爭中的新一輪攻勢,標誌著多模態人工智慧(能同時理解文字、影像與影片等資訊)競爭進入新階段。

根據百度的技術說明,ERNIE‑4.5‑VL‑28B‑A3B‑Thinking總參數為280億個,但在運行時僅啟動約30億個,透過精密路由架構自動挑選最適合的子網路參與運算,這種設計讓模型即使在文件理解、圖表分析與影像推理等任務上表現不輸更大型的系統,同時大幅降低記憶體與電力消耗,被外界視為「以小博大」的高效AI代表作。

c29ae2bd 26a5 4bcb ae40 59469c023c52
中國搜尋引擎巨頭百度(BaiduInc.)本週一發布全新人工智慧模型ERNIE‑4.5‑VL‑28B‑A3B‑Thinking,官方提到在多項視覺理解測試中超越Google與OpenAI的最新系統,所需運算資源僅為對手的一小部分。(圖/AI生成)

延伸閱讀:

Google Drive的Gemini可幫你的PDF摘要成音檔了 這邊看教學

這款AI最特別的地方,是它能「動態放大縮小」圖片,就像我們看圖時會先看整體,再仔細看細節一樣。舉例來說,如果要分析一張複雜的工程圖,它會先看全貌,再聚焦到某個零件,找出問題。這種能力讓它在處理文件、圖表或工業檢測時,比傳統AI更靈活。

這款模型雖然有280億個參數(可以想像成AI的「腦細胞」),但實際運作時只會啟動30億個,靠的是「混合專家」(MoE)架構。簡單來說,就是讓AI只用最需要的「腦細胞」來處理任務,省電又省資源。這意味著企業只要一張高階顯卡就能運行,不用買一堆昂貴的硬體。

百度把這款模型用「Apache 2.0」授權釋出,代表任何人都可以免費下載、修改,甚至用在商業產品上。這和Google、OpenAI等公司限制較多的授權方式不一樣,對企業和開發者來說更友善。

百度官方提到,這款模型在文件理解、圖表分析等測試中,表現比Google的Gemini和OpenAI的GPT-5還要好。不過,目前還沒有第三方獨立驗證,所以實際效果如何,還需要更多測試。

這款AI特別適合需要處理大量文件、圖表或影像的企業,像是金融、物流、製造業等。它能自動分析文件、找出圖表中的問題,甚至在工廠裡幫忙檢測產品瑕疵。而且因為它運行成本低,中小企業也能負擔得起。

百度預計在11月13日的「Baidu World 2025」大會上,進一步展示這款模型的應用。如果它的表現真的像宣稱的這麼好,可能會改變AI市場的競爭格局,讓更多企業有機會用上高效、低成本的AI工具。

資料來源:venture beatZDNET

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button