百度開源新AI模型稱效能超越GPT-5與Gemini

2025-11-13

記者鄧天心／綜合報導

中國搜尋引擎巨頭百度（BaiduInc.）本週一發布全新人工智慧模型ERNIE‑4.5‑VL‑28B‑A3B‑Thinking，官方提到在多項視覺理解測試中超越Google與OpenAI的最新系統，所需運算資源僅為對手的一小部分。這款模型被視為百度在全球AI競爭中的新一輪攻勢，標誌著多模態人工智慧（能同時理解文字、影像與影片等資訊）競爭進入新階段。

根據百度的技術說明，ERNIE‑4.5‑VL‑28B‑A3B‑Thinking總參數為280億個，但在運行時僅啟動約30億個，透過精密路由架構自動挑選最適合的子網路參與運算，這種設計讓模型即使在文件理解、圖表分析與影像推理等任務上表現不輸更大型的系統，同時大幅降低記憶體與電力消耗，被外界視為「以小博大」的高效AI代表作。

c29ae2bd 26a5 4bcb ae40 59469c023c52 — 中國搜尋引擎巨頭百度（BaiduInc.）本週一發布全新人工智慧模型ERNIE‑4.5‑VL‑28B‑A3B‑Thinking，官方提到在多項視覺理解測試中超越Google與OpenAI的最新系統，所需運算資源僅為對手的一小部分。（圖／AI生成）

延伸閱讀：

Google Drive的Gemini可幫你的PDF摘要成音檔了這邊看教學

這款AI最特別的地方，是它能「動態放大縮小」圖片，就像我們看圖時會先看整體，再仔細看細節一樣。舉例來說，如果要分析一張複雜的工程圖，它會先看全貌，再聚焦到某個零件，找出問題。這種能力讓它在處理文件、圖表或工業檢測時，比傳統AI更靈活。

這款模型雖然有280億個參數（可以想像成AI的「腦細胞」），但實際運作時只會啟動30億個，靠的是「混合專家」（MoE）架構。簡單來說，就是讓AI只用最需要的「腦細胞」來處理任務，省電又省資源。這意味著企業只要一張高階顯卡就能運行，不用買一堆昂貴的硬體。

百度把這款模型用「Apache 2.0」授權釋出，代表任何人都可以免費下載、修改，甚至用在商業產品上。這和Google、OpenAI等公司限制較多的授權方式不一樣，對企業和開發者來說更友善。

百度官方提到，這款模型在文件理解、圖表分析等測試中，表現比Google的Gemini和OpenAI的GPT-5還要好。不過，目前還沒有第三方獨立驗證，所以實際效果如何，還需要更多測試。

這款AI特別適合需要處理大量文件、圖表或影像的企業，像是金融、物流、製造業等。它能自動分析文件、找出圖表中的問題，甚至在工廠裡幫忙檢測產品瑕疵。而且因為它運行成本低，中小企業也能負擔得起。

百度預計在11月13日的「Baidu World 2025」大會上，進一步展示這款模型的應用。如果它的表現真的像宣稱的這麼好，可能會改變AI市場的競爭格局，讓更多企業有機會用上高效、低成本的AI工具。

資料來源：venture beat、ZDNET

在 Google News 上追蹤我們

標籤

2025-11-13

發佈留言取消回覆

很抱歉，必須登入網站才能發佈留言。