阿里雲自行研發HPN 企圖甩開輝達技術

2024-07-01

編譯／戴偉丞

網路設計在大型語言模型（LLM）的訓練過程中扮演極為關鍵的角色，而阿里雲的工程師兼研究員翟迪南所發布名為「阿里巴巴HPN：用於大型語言模型訓練的數據中心網絡」的研究論文，揭示了阿里雲自行研發的高性能網路（HPN）如何解決傳統乙太網路技術中的瓶頸。

翟團隊HPN的設計

傳統雲端運算只能提供速度低於10G的資料傳輸速度，同時更需要面臨LLM訓練過程中負載超過400G的週期性突發狀況。為此，翟迪南與其研究團隊開發了阿里雲HPN，使用雙平面架構以減少傳統數據中心常見的過載狀況，並且讓系統能夠精準地選擇數據傳輸流向。在翟迪南團隊所設計的HPN中，每個資料中心裝有1875個主機，每台主機又載有8個GPU，每個GPU又配有2個連接埠網卡。

更多新聞：阿里雲再度大降價！吸引AI客戶加劇市場競爭

逐步擺脫輝達技術

即便阿里雲放棄了輝達（Nvidia）高速GPU互連技術「NVLink」，但鑑於GPU間的傳輸仍需大量頻寬，因此在主機內部網路仍是以輝達專有的技術進行運作。同時阿里雲也採用51.2 Tb/sec 乙太網路單晶片ToR交換機，雖然能夠使晶片運作更為穩定，但是也伴隨著散熱冷卻的需求，而市面上卻沒有適合的散熱系統，因此阿里雲將自行研發符合需求的散熱裝置。

翟迪南團隊的HPN設計也並非完美無瑕，其中複雜的佈線結構可能導致在進行網路連接埠、ToR交換機、網卡的連接時產生混淆。但是即便如此，該HPN可能還是會比NVLink還要便宜，除了節省成本外，還能夠在美中科技戰中巧妙地避開輝達的技術。

資料來源：Tom’s Hardware、芯智訊

瀏覽 514 次

標籤

2024-07-01

阿里雲自行研發HPN 企圖甩開輝達技術

翟團隊HPN的設計

逐步擺脫輝達技術

推薦工作

發佈留言取消回覆

AI紅隊只花三個月訓練開源模型竟破解微軟防毒Defender

數字王國送暖！助罕病青年「蝸牛仔」打造AI 虛擬分身延伸愛與夢想

騎士團尖叫吧！華碩ROG攜手初音未來推聯名陣容再掀蒼綠狂潮

大摩擬對金融公司收費未來手機支付連結銀行可能要付錢

AI寫程式幫倒忙？拖慢進度19%、資深工程師仍誤以為變快了

最新科技新聞快訊不錯過!!

最新科技新聞快訊不錯過!!

翟團隊HPN的設計

逐步擺脫輝達技術

推薦工作

延伸閱讀

地球上最大火星隕石將拍賣！估價上看400萬美元、蘇富比紐約登場

劍指人形機器人主導權！三星擬加入韓國主權AI基礎模型計畫

10年內人形機器人成為家庭幫手 Figure AI：未來機器人會和人類一樣多

廣宇轉型布局「軸向馬達」 搶攻人形機器人、電動機車市場

代工大廠緯創研發大樓開工動土 要打造內湖「AI科技廊道」

電動自行車告別「線制」 TILER無線充電系統成未來趨勢

發佈留言 取消回覆

廣宇轉型布局「軸向馬達」搶攻人形機器人、電動機車市場

代工大廠緯創研發大樓開工動土要打造內湖「AI科技廊道」

發佈留言取消回覆