結盟輝達!英特爾推新Gaudi 3機架伺服器 適用小型、精密型AI模型

記者孫敬/編譯

根據外媒的消息,英特爾(Intel)計劃推出一款全新的Gaudi 3機架伺服器,採用自家Gaudi 3 AI晶片與輝達(NVIDIA)的Blackwell B200 GPU,並整合在同一機架中銷售。

延伸閱讀:台積電亞利桑那廠區內部曝光 EUV機台打造輝達Blackwell晶片

Intel Gaudi 3
英特爾Gaudi 3機架伺服器性能解析介紹圖。(圖/SemiAnalysis)

英特爾Gaudi 3專攻解碼,輝達B200負責前填運算

Blackwell B200 GPU由於具備高效能特性,最適合處理運算需求更為密集的「前填」(Prefill)運算階段,特別是在全內容(Full Context)下執行大規模矩陣乘法運算。

Gaudi 3 AI晶片則被定位為處理後續「解碼」(Decode)部分的運算引擎,利用在記憶體頻寬和乙太網路為中心的橫向擴展(Scale-Out)方面的優勢。據稱,這種機架規模的組合在處理小型、高密集AI模型時,預填充效能比單純採用B200的基準配置快上1.7倍,但尚未經第三方驗證。這個做法英特爾得以將Gaudi平台作為輝達生態系統中的高性價比解碼引擎進行捆綁銷售,有效地將其商業化。

英特爾Gaudi AI平台成熟度還不足以應對市場

Gaudi 3機架伺服器在網路架構方面,採用Broadcom Tomahawk 5 51.2 Tb/s 交換器,以確保系統內所有節點之間的全連接。每個運算托盤(Compute Tray)配備兩顆Xeon CPU、四顆Gaudi 3 AI晶片,並利用 NVIDIA ConnectX-7 400 GbE網卡(NICs)進行高速互連,同時還配有一塊NVIDIA BlueField-3 DPU,整個機架共有十六個運算托盤。

然而,儘管硬體配置優異,該報導指出Gaudi AI平台的軟體堆疊成熟度仍不足,這可能會限制被應用的範圍。由於Gaudi架構預計將在未來幾個月內逐步退場,業界對於這套機架規模解決方案能否獲得主流應用,仍持保留態度。

資料來源:wccftech

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button