手勢不用教也能懂?蘋果新 AI 達成「零樣本」手勢識別突破

記者孟圓琦/編譯

蘋果(Apple)機器學習研究團隊在近日,發表了一項名為「EMBridge」的最新研究成果,展示了一種能夠識別「未曾見過」之手勢的 AI 模型訓練框架。該項技術透過跨模態表徵學習(Cross-Modal Representation Learning),成功橋接了肌電圖(EMG)訊號,以及手部姿勢數據間的間隙,為未來穿戴式裝置的互動邏輯開闢了全新路徑。這篇論文預計將於今年 4 月的 ICLR 2026 國際會議上正式發表。

為了減少因將相似手勢視為否定而導致的訓練誤差,研究人員教會模型識別姿勢何時代表相似的手部配置,從而使其能夠為這些姿勢生成軟目標,而不是將它們視為完全無關。(圖/AI生成)
為了減少因將相似手勢視為否定而導致的訓練誤差,研究人員教會模型識別姿勢何時代表相似的手部配置,從而使其能夠為這些姿勢生成軟目標,而不是將它們視為完全無關。(圖/AI生成)

肌電圖(EMG)技術,主要用於測量肌肉收縮時產生的電活動,過去多見於醫療診斷與義肢控制。隨著擴增實境(AR)與虛擬實境(VR)技術的普及,包含 Meta 在內的科技巨頭,皆積極投入相關穿戴裝置的研發。而蘋果此次提出的 EMBridge 框架,核心突破在於其「零樣本」(Zero-shot)手勢分類能力,意即模型在未事先學習特定手勢數據的情況下,仍能透過肌肉訊號精準判斷使用者的意圖。

更多科技工作請上科技專區:https://techplus.1111.com.tw/

舉例來說,Meta 的 Ray-Ban Display 眼鏡採用了 EMG 技術,Meta 稱之為神經帶,這是一種戴在手腕上的設備,根據該公司的描述,它可以「解讀你的肌肉訊號來操控 Meta Ray-Ban Display 的功能」。(圖/擷取自Meta Store Support YT)
舉例來說,Meta 的 Ray-Ban Display 眼鏡採用了 EMG 技術,Meta 稱之為神經帶,這是一種戴在手腕上的設備,根據該公司的描述,它可以「解讀你的肌肉訊號來操控 Meta Ray-Ban Display 的功能」。(圖/擷取自Meta Store Support YT)

在實驗過程中,研究人員使用了包含 370 小時肌電訊號與同步手部姿勢數據的「emg2pose」大型數據集,以及「NinaPro」數據集進行測試。研究團隊採用跨模態架構,先分別對 EMG 和手勢姿勢進行預訓練,隨後透過對齊機制讓 EMG 編碼器學習姿勢編碼器的特徵。此外,研究人員還引入了遮蓋姿勢重建技術,要求模型僅憑 EMG 資訊還原被隱藏的手部姿勢,進一步強化了系統的泛化能力。

研究結果顯示,EMBridge 在多項基準測試中均優於現有方法,且僅需使用 40% 的訓練數據即可達成卓越的識別效果。研究團隊指出,該框架在解決相似手勢的誤判問題上表現優異,能自動識別手型結構相似的姿勢並進行軟目標(Soft targets)處理,而非將其視為完全無關的錯誤訊號。

儘管該研究報告未指名任何特定的產品應用,但市場分析指出,此技術未來極有可能整合至 Apple Watch 或傳聞中的智慧眼鏡。透過監測腕部的肌肉活動,使用者將能以極其細微且直覺的手勢控制 Apple Vision Pro、iPhone 或 Mac。

蘋果在論文中總結道,EMBridge 是首個在穿戴式 EMG 訊號上實現零樣本手勢分類的框架,這標誌著穿戴式人機互動(HCI)技術正朝向實用化與高度通用化邁進了一大步。

延伸閱讀:
599美元震撼市場!外媒評測MacBook Neo:體驗極佳的平價入門神機
Gemin結合Google「這4大」神器 讓生產力直接原地起飛、效率神助攻

資料來源:9to5mac

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button