華為絕地反攻!發表UCM軟體加速AI運算以擺脫美晶片制裁
記者孫敬/編譯
在美中科技戰的持續延燒下,華為近日推出一款名為「推理數據記憶管理器」(Unified Cache Manager;UCM)的全新軟體工具,目標是在不依賴HBM(高頻寬記憶體)的情況下,大幅提升大型語言模型(LLM)的訓練與推論速度 。
延伸閱讀:挑戰輝達CUDA生態系 華為將開源昇騰AI軟體工具包

智慧分層儲存,AI效能最高提升22倍
華為高層在上海舉行的「金融AI推理應用落地與發展論壇」上表示 ,UCM是一款演算法,能根據不同類型記憶體(包括HBM、標準DRAM和SSD)的延遲特性,以及不同AI應用的延遲需求來分配數據,從而提高推論效率 。這項策略也展現了中國科技公司如何利用軟體創新來彌補硬體限制 。
華為副總裁;同時是資料儲存產品線總裁周躍峰則指出,UCM已在實際測試中證明其有效性,推論延遲最高可降低90%,系統吞吐量更可提升多達22倍。華為計畫在9月將UCM開源 ,會在其線上開發者社群中先行發布,隨後再向更廣泛的向產業開放。
目前,HBM的市場由SK海力士、三星和美光等外國供應商所主導,大多數公司仍處於第二代HBM晶片(HBM2)的試產和基礎設施擴建階段,SK海力士則已經在出貨HBM4。
近期,中國已敦促國內企業避免使用輝達為其市場推出的H20晶片,以及美國供應商AMD的產品。華為在對抗輝達的過程中扮演關鍵角色,除了推出UCM外,也計畫將其人工智慧處理器應用程式開發工具套件CANN開源 ,直接挑戰NVIDIA的CUDA生態系 。
資料來源:南華早報