挑戰輝達 AMD潛在120 萬 GPU 超級電腦大訂單
編譯/莊閔棻
超微半導體(AMD) 可能很快將挑戰輝達在資料中心 GPU 市場的主導地位,傳在最近的一項開發中,一家客戶與 AMD 商談創建一個由 120 萬個 GPU 組成的 AI 訓練叢集(AI training cluster),其性能可能比當前最快的超級電腦 Frontier 強大 30 倍,為AMD 帶來市場占有率的重大轉變,截至2023 年,AMD 的市占率還不到 2%,而輝達的市占率則高達 98%。
AMD透露AI訓練叢集規模驚人
據報導,AMD 資料中心解決方案總經理 Forrest Norrod 在接受專訪時透露,客戶認真詢問了建立規模空前的 AI 訓練叢集的可能性,目前的AI訓練叢集通常由數千個GPU組成,但客戶提出的規模「令人難以置信」,將帶來人工智慧(AI)開發能力的重大飛躍。
更多新聞:黃仁勳最強後盾 財務長功不可沒
創造龐大AI訓練叢集的挑戰
然而創建如此龐大的AI訓練叢集的過程充滿了挑戰,AI 訓練需要低延遲才能提供及時結果,需要消耗大量電量,且也必須考慮硬體故障。大多數伺服器的運行利用率約為 20%,並處理遠端電腦中的數千個小型非同步作業,然而AI訓練的興起,正在導致伺服器結構發生重大變化,為了跟上機器學習模型和演算法的步伐,AI資料中心必須配備專門為此工作設計的大量運算能力,AI訓練本質上是一項大型同步作業,需要叢集中的每個節點盡可能快速地來回傳遞訊息。
AMD的潛力和市場機會
鑑於 AMD 目前的市場佔有率較小,其進入這一高風險市場的潛力尤其令人著迷,基於輝達對自己的進步保持沉默,AMD 成為人們關注的焦點,想知道該公司是否能抓住這個巨大的機會,擬議中的超級電腦雖然看似古怪,但也反映出科技業大力投資AI的意願日益增強。Norrod指出,「非常清醒的人」正在考慮,在此類AI訓練叢集上花費高達 1000 億美元,突顯了AI和機器學習領域的高風險和巨大潛力。
AI基礎設施開發競賽加劇
隨著公司努力在快速發展的科技世界中保持競爭力,開發更強大的AI基礎設施的競賽持續加劇,AMD 能否利用這個機會顛覆輝達還有待觀察,但AI進步領域的一場令人興奮的競賽已經準備開始。
參考資料:techspot
瀏覽 365 次