手勢不用教也能懂？蘋果新 AI 達成「零樣本」手勢識別突破

2026-03-11

記者孟圓琦／編譯

蘋果（Apple）機器學習研究團隊在近日，發表了一項名為「EMBridge」的最新研究成果，展示了一種能夠識別「未曾見過」之手勢的 AI 模型訓練框架。該項技術透過跨模態表徵學習（Cross-Modal Representation Learning），成功橋接了肌電圖（EMG）訊號，以及手部姿勢數據間的間隙，為未來穿戴式裝置的互動邏輯開闢了全新路徑。這篇論文預計將於今年 4 月的 ICLR 2026 國際會議上正式發表。

為了減少因將相似手勢視為否定而導致的訓練誤差，研究人員教會模型識別姿勢何時代表相似的手部配置，從而使其能夠為這些姿勢生成軟目標，而不是將它們視為完全無關。（圖／AI生成）

肌電圖（EMG）技術，主要用於測量肌肉收縮時產生的電活動，過去多見於醫療診斷與義肢控制。隨著擴增實境（AR）與虛擬實境（VR）技術的普及，包含 Meta 在內的科技巨頭，皆積極投入相關穿戴裝置的研發。而蘋果此次提出的 EMBridge 框架，核心突破在於其「零樣本」（Zero-shot）手勢分類能力，意即模型在未事先學習特定手勢數據的情況下，仍能透過肌肉訊號精準判斷使用者的意圖。

更多科技工作請上科技專區：https://techplus.1111.com.tw/

舉例來說，Meta 的 Ray-Ban Display 眼鏡採用了 EMG 技術，Meta 稱之為神經帶，這是一種戴在手腕上的設備，根據該公司的描述，它可以「解讀你的肌肉訊號來操控 Meta Ray-Ban Display 的功能」。（圖／擷取自Meta Store Support YT）

在實驗過程中，研究人員使用了包含 370 小時肌電訊號與同步手部姿勢數據的「emg2pose」大型數據集，以及「NinaPro」數據集進行測試。研究團隊採用跨模態架構，先分別對 EMG 和手勢姿勢進行預訓練，隨後透過對齊機制讓 EMG 編碼器學習姿勢編碼器的特徵。此外，研究人員還引入了遮蓋姿勢重建技術，要求模型僅憑 EMG 資訊還原被隱藏的手部姿勢，進一步強化了系統的泛化能力。

研究結果顯示，EMBridge 在多項基準測試中均優於現有方法，且僅需使用 40% 的訓練數據即可達成卓越的識別效果。研究團隊指出，該框架在解決相似手勢的誤判問題上表現優異，能自動識別手型結構相似的姿勢並進行軟目標（Soft targets）處理，而非將其視為完全無關的錯誤訊號。

儘管該研究報告未指名任何特定的產品應用，但市場分析指出，此技術未來極有可能整合至 Apple Watch 或傳聞中的智慧眼鏡。透過監測腕部的肌肉活動，使用者將能以極其細微且直覺的手勢控制 Apple Vision Pro、iPhone 或 Mac。

蘋果在論文中總結道，EMBridge 是首個在穿戴式 EMG 訊號上實現零樣本手勢分類的框架，這標誌著穿戴式人機互動（HCI）技術正朝向實用化與高度通用化邁進了一大步。

延伸閱讀：
599美元震撼市場！外媒評測MacBook Neo：體驗極佳的平價入門神機
Gemin結合Google「這4大」神器讓生產力直接原地起飛、效率神助攻

資料來源：9to5mac

標籤

2026-03-11

手勢不用教也能懂？蘋果新 AI 達成「零樣本」手勢識別突破

推薦工作

發佈留言取消回覆

數學有救了！ChatGPT推70款動態圖表讓你更快懂數理概念

審美疲勞了嗎？Pixel 11 Pro Fold渲染圖曝光遭批設計陳舊且邊框過厚