Meta發表電腦視覺模型I-JEPA　可超越「生成式」學習

2023-06-16

記者／竹二

Meta近日發佈了最新的電腦視覺模型I-JEPA（Image Joint Embedding Predictive Architecture），特色在於能夠關注真正的圖像重點，並以更少的GPU訓練時間就可獲得比當前生成式模型更好的效能，以人類理解世界的方式高層次預測缺失的資訊，而不被像素級不重要的細節困住。

0616 4 — Meta首席人工智慧科學家Yann LeCun。（圖／截取自Meta）

這項模型是由Meta首席人工智慧科學家Yann LeCun所提出的一種新的人工智慧模型架構，根據Meta的說明，I-JEPA在多項電腦視覺任務的表現都較當前廣泛使用的電腦模型高上不少，而且計算效率也更好，可以在不需要大量微調的情況下，用在許多不同的應用程式。

研究團隊使用16個A100 GPU，以72小時訓練了一個6.32億參數的視覺Transformer模型，發現在ImageNet資料集中的少樣本分類任務效能的表現，超越當前所有模型。研究人員指出，其他方法通常會需要2到10倍的GPU訓練時間，而且在使用相同資料訓練時，錯誤率通常會多更多。

據悉，I-JEPA可以維持高效能的原因，就在於能夠以更像人類理解抽象表示的方式，來預測缺失的資訊，能夠學習有用的表示，避開生成式方法的侷限。研究人員分析，以往生成式方法是透過刪除和扭曲模型輸入的部分內容來進行學習，像是抹除照片的一部分，或是隱藏文字段落中的某些單字，接著要求模型嘗試預測丟失的像素和單字，來達成訓練目的，這造成生成式方法一個明顯的缺點，就是嘗試填補每一個缺失的資訊，變得過於關注不重要的細節。

而I-JEPA預訓練則是非常高效，不需要使用複雜的資料增強方法，經過實驗證實，能夠學習出強大的語義表示，在ImageNet-1K的線性探索和半監督評估上，超越了像素和權杖重建方法，且在低階的視覺任務，像是物體計數和深度預測上表現得更好。

標籤

2023-06-16

Meta發表電腦視覺模型I-JEPA　可超越「生成式」學習

推薦工作

發佈留言取消回覆

術士免費試玩！《暗黑破壞神IV》第 14 賽季「死亡甦醒」7 月 1 日開戰

90 年代日本長野驚魂！心理恐怖新作《Wasabi》捕抓嫌犯細微表情、揭開真相

別再死背提示詞了！現在開始打造你的 AI 工作流｜專家論點【鄭緯筌 Vista】

Steam史上最貴遊戲！《感謝您的購買》要價千元美金內容空洞遭諷「詐騙」

夏天曬太陽也難補足維生素D 專家提醒：北英國居民全年普遍維生素D不足

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

夏天曬太陽也難補足維生素D 專家提醒：北英國居民全年普遍維生素D不足

睡眠不足破壞大腦重要記憶 咖啡因有望恢復功能缺陷

AI精神病三大成因 聊天機器人「過度迎合用戶」恐加劇危險妄想

Anthropic控阿里巴巴蒸餾攻擊 2.5萬假帳號狂跟AI模型互動2880萬次

企業擁抱AI衝擊就業市場 瑞士初階工作機會大減

多重物理量、太空運算成新戰場 聯發科蔡明介：半導體迎下個「史普尼克時刻」

發佈留言 取消回覆

睡眠不足破壞大腦重要記憶咖啡因有望恢復功能缺陷

AI精神病三大成因聊天機器人「過度迎合用戶」恐加劇危險妄想

企業擁抱AI衝擊就業市場瑞士初階工作機會大減

多重物理量、太空運算成新戰場聯發科蔡明介：半導體迎下個「史普尼克時刻」

發佈留言取消回覆