打擊AI幻覺！OpenAI「過程監督」訓練正確推理

2023-06-01

編譯／莊閔棻

openai 166982479 fb link — OpenAI開發新型模型訓練方法以解決人工智慧（AI）「幻覺」問題。（示意圖／123RF）

OpenAI宣布為了對抗人工智慧（AI）「幻覺」問題，他們採用了一種名為「過程監督」（process supervision）的新模型訓練方法。「過程監督」和「結果監督」（outcome supervision）不同，這種方法將讓AI更注重於「正確的推理過程」。

根據《CNBC》的報導，OpenAI 對抗捏造的潛在新策略是：訓練 AI 模型在推理答案時，在每個正確步驟上進行自我獎勵，以學習正確的推理過程，而不是只在得到正確的答案時給予獎勵。研究人員表示，這可能會訓練出更好的AI，因為該策略鼓勵模型按照更類似人類的「思考」的方式進行推理。

OpenAI 的數學論文生成器（mathgen）研究員 Karl Cobbe 就表示：「檢測和減輕一個模型的邏輯錯誤或幻覺，是建構通用人工智慧（AGI）的關鍵步驟。」他指出，雖然這個「過程監督」方法不是OpenAI 發明的，但該公司正在推動其發展。他說：「這項研究是為了解決幻覺問題，使模型在解決具有挑戰性的推理問題上，有更強的能力。」

OpenAI 研究人員表示：「即使是最先進的模型也容易生成假消息，因為它們在確定時，就會有捏造事實的傾向。而在需要多步驟推理的領域，這些幻覺問題又更嚴重，因為只要有一個邏輯錯誤，就可能會破壞整個解決方案。」Cobbe 表示，OpenAI 已經發布一個附帶的數據集，其中包含用於訓練研究論文中提到模型的 80萬個人工標記。

為了讓大型語言模型可以給出類似人類的回應，不論是OpenAI還是Google都一直在尋找解決方案。不過，因為數據被模型消化的方式不可預測，因此AI創造出非事實回應的「幻覺」問題到目前都還無法解決。在AI界，解決「幻覺」問題已經成為行業中的一大重點。
參考資料：CNBC

瀏覽 22,027 次

標籤

2023-06-01

打擊AI幻覺！OpenAI「過程監督」訓練正確推理

推薦工作

發佈留言取消回覆

Gartner揭密未來AI趨勢：決策從人輔助走向全自動「感知分析」成關鍵！

科技浪｜AI時代的雲端新勢力：Neoclouds是什麽？ | 專訪 GMI Cloud 創辦人兼CEO–Alex Yeh

AI浪潮來襲！晶彩科技王子越：產業挑戰與機會並存三大生存戰略應戰

PAPAYA 電腦教室 |只有老人才用 PPT 做簡報？新世代 AI 簡報神器 Gamma 讓你告別石器時代邁向新世紀！

【懶人包】盤點5大數位心靈伴侶從低成本沙盤演練到無負擔戀愛體驗

最新科技新聞快訊不錯過!!

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

Gartner揭密未來AI趨勢：決策從人輔助走向全自動 「感知分析」成關鍵！

AI浪潮來襲！晶彩科技王子越：產業挑戰與機會並存 三大生存戰略應戰

【懶人包】盤點5大數位心靈伴侶 從低成本沙盤演練到無負擔戀愛體驗

比特幣破歷史新高 彭云嫻揭三大動能：聯準會、鏈上結構、台幣匯率成關鍵

AI WAVE SHOW月底登場！3天看懂300項AI產品如何改變生活

高齡科技產業拚今年產值3000億 吳誠文：組臺灣隊、AI應用落地

發佈留言 取消回覆

Gartner揭密未來AI趨勢：決策從人輔助走向全自動「感知分析」成關鍵！

AI浪潮來襲！晶彩科技王子越：產業挑戰與機會並存三大生存戰略應戰

【懶人包】盤點5大數位心靈伴侶從低成本沙盤演練到無負擔戀愛體驗

比特幣破歷史新高彭云嫻揭三大動能：聯準會、鏈上結構、台幣匯率成關鍵

高齡科技產業拚今年產值3000億吳誠文：組臺灣隊、AI應用落地

發佈留言取消回覆