COMPUTEX 2026/AI代理工具改變資料中心架構 陳立武:CPU與GPU比例將趨近1:1

記者黃仁杰/台北報導

COMPUTEX 2026開展首日,英特爾(Intel)執行長陳立武(Lip-Bu Tan)登台進行主題演講表示,隨著AI代理工具(AI Agent)逐步從生成內容走向實際執行任務,資料中心運算架構正迎來重大轉變。過去由GPU主導的AI運算模式,未來將更加依賴CPU負責協調、管理與執行工作流程,CPU與GPU的配置比例也將從過去約1比8,逐步朝接近1比1發展。

S 20275223
陳立武(Lip-Bu Tan)表示,隨著AI代理工具(AI Agent)逐步從生成內容走向實際執行任務,資料中心運算架構正迎來重大轉變。(圖/記者黃仁杰攝)

陳立武指出,AI正重塑個人電腦、邊緣運算、資料中心及新興智慧應用等四大運算生態系,而未來無論是人類使用者或數位代理工具,都將需要針對不同工作負載打造的CPU、GPU與客製化晶片(ASIC)解決方案。

在主題演講中,英特爾資料中心團隊進一步說明,傳統AI推論主要透過大型語言模型(LLM)產生回應,大部分運算時間集中在模型推論階段,因此高度依賴GPU運算資源。然而,AI代理工具的運作方式與傳統聊天機器人截然不同,其核心在於自主規劃任務、呼叫工具、讀寫檔案、驗證結果並持續執行工作流程。

英特爾表示,當AI代理工具執行任務時,會不斷進行思考、規劃、執行與反思等循環,並可能同時啟動多個代理工具協同工作。這些工作涉及大量資料處理、工具調用與系統協調,正是CPU擅長處理的領域,因此也讓CPU重新成為AI基礎設施的重要角色。

「AI履歷健檢」看見自己優勢:https://campaign.1111.com.tw/resume-review/

更多科技工作請上科技專區:https://techplus.1111.com.tw/

為說明這項變化,英特爾現場展示傳統AI推論與AI代理工具的差異。以撰寫程式碼為例,在傳統AI推論架構下,大部分運算負載集中於GPU,CPU與GPU需求比例約為1比7;但在AI代理工具架構中,包含程式碼檢查、網頁擷取、編譯與單元測試等工作皆由CPU執行,使CPU與GPU的運算需求逐漸趨近對等。

英特爾指出,過去資料中心大致可區分為兩種型態,一種是以CPU為主的企業基礎設施,另一種則是以GPU為核心的AI訓練叢集。然而當AI代理工具開始進入企業工作流程後,兩者之間的界線正逐漸模糊。未來AI基礎設施不只是訓練模型,更重要的是讓AI實際投入工作,而這將進一步推升CPU需求。

為因應相關趨勢,英特爾於COMPUTEX推出新一代Xeon 6 E-core處理器。該產品採用Intel 18A製程技術,單顆處理器最高搭載288個效率核心(E-core)與576MB L3快取記憶體,主打高密度與高能效運算環境。

英特爾表示,若採用兩顆處理器配置的伺服器,最高可達576個CPU核心。若以32U部署空間計算,可配置超過3.6萬個CPU核心。依據英特爾內部測試,採用Xeon 6 E-core的機櫃最高可支援約15萬個AI代理工具同時運作。

陳立武表示,AI代理工具正推動新一波運算需求成長,也改變資料中心對運算資源的配置方式。未來資料中心將不再只是GPU主導的AI工廠,而是由CPU、GPU與各類加速器共同組成的異質運算架構,以支援大規模AI推論與智慧應用發展。

Loading

發佈留言

Back to top button