Google發表AI記憶體壓縮算法「TurboQuant」 號稱壓縮又不失真

記者鄧天心/綜合報導

Google發表最新超高效AI記憶體壓縮算法TurboQuant,引發科技圈熱議,由於其極致壓縮特性與經典美劇《矽谷群瞎傳》中的技術神似,網友紛紛將其戲稱為現實版的「魔笛手」(Pied Piper)。

Google(圖/123RF)
Google發表TurboQuant挑戰AI極限壓縮。(圖/123RF)

HBO影集《矽谷群瞎傳》(Silicon Valley)於2014年至2019年間熱播,劇中虛構的新創公司魔笛手憑藉一套近乎無損的壓縮算法,在科技大廠競爭與融資困境中突圍,巧合的是,Google Research推出的TurboQuant同樣主打在不損失品質的前提下實現極限壓縮,並針對當前AI系統的核心瓶頸進行優化。

Google研究人員說明,TurboQuant是一種能在不影響性能的情況下,大幅縮減AI工作記憶體的新穎方法,該技術利用向量量化(Vector Quantization)清理AI處理過程中的快取瓶頸,讓系統在佔用更少空間並維持精確度的同時,能處理與記憶更多資訊。

更多科技工作請上科技專區:https://techplus.1111.com.tw/

Google預計於下個月的ICLR 2026大會正式發表研究成果,核心技術包含PolarQuant量化方法以及名為QJL的訓練優化方案。雖然其背後的數學邏輯極其複雜,但若能成功應用於現實環境,TurboQuant預計能將AI運行時的工作記憶體(KV cache)需求降低至少6倍,顯著削減AI的運算成本。

Cloudflare執行長馬修·普林斯(Matthew Prince)評價此突破為Google的「DeepSeek時刻」,意指該技術效法中國AI模型DeepSeek帶來的效率革命,證明在資源受限的條件下,仍能透過算法優化達成具競爭力的性能。

不過專家提醒,TurboQuant目前仍處於實驗室階段,尚未大規模部署,與影劇中顛覆運算規則的魔笛手仍有距離,此外,該技術主要針對推理階段進行優化,對於需要海量顯示記憶體(RAM)支持的模型訓練階段幫助有限,目前尚無法完全解決AI產業面臨的硬體短缺危機。

延伸閱讀:

AI引爆需求!中國晶片成長超乎預期 2028年成熟製程市佔將達42%

資料來源:techcrunch

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button