OpenAI推漏洞賞金　不含惡意引導越獄行為

2023-04-13

編譯／莊閔棻

人工智慧新創公司OpenAI推出了一個漏洞賞金，鼓勵公眾找出其人工智慧服務的漏洞，包括ChatGPT。獎勵範圍從200美元到20,000美元不等，報告可透過眾包網路安全平台Bugcrowd提交。要注意的是，如果是「故意引導」的「越獄」行為，則不包含在內。

open ai 198666119 fb link normal none — OpenAI推出了一個漏洞賞金，鼓勵公眾找出其人工智慧服務的漏洞。示意圖／123RF

根據《The Verge》的報導，OpenAI提供的賞金不包括對ChatGPT越獄或使其產生惡意程式碼或文本的獎勵。 OpenAI的Bugcrowd頁面說：「與模型提示和響應內容有關的問題嚴格來說不在範圍之內，也不會得到獎勵。」

相信大家都知道，如果有意要破解ChatGPT，讓其變的「邪惡」，其實是有方法的。只要在系統中輸入精心設計的場景，使其能夠繞過自身的安全過濾器，就可能可以讓機器人扮演其「邪惡的雙胞胎」，並讓用戶引出其他被禁止的反應，如仇恨言論或製造武器的指示等。

然而，對於OpenAI來說，這樣的「模型安全問題並不適合在Bug賞金計畫中出現，因為它們不是可以直接修復的單獨的、不連續的Bug。」該公司指出：「解決這些問題往往涉及大量的研究和更廣泛的方法」，因此，對於這類問題的報告應通過該公司的模型反饋頁面提交。

雖然這種越獄行為顯示了人工智慧系統更廣泛的漏洞，但與傳統的安全故障相比，它們對OpenAI來說可能不是直接的一個問題。上個月，一個被稱為rez0的駭客就揭示了ChatGPT API的80個「秘密外掛程式」，也就是該公司的聊天機器人尚未發布或實驗性的功能。隨後，Rez0指出，該漏洞在他們在推特上披露後一天內就被修補了。

對此政策，推特用戶似乎很看好。有用戶就說：「如果他們有一個付費的#BugBounty計畫，我肯定群眾可以幫助他們抓出這些邊緣案例。」

參考資料：The Verge

標籤

2023-04-13

OpenAI推漏洞賞金　不含惡意引導越獄行為

推薦工作

發佈留言取消回覆

晶片缺貨恐延續至2028年三星與五大資料中心業者簽長期供貨合約

血糖偏高怎麼辦？15種方法「助穩定血糖」這情況快就醫

搶攻軍民兩用市場！雷虎科技攜 Shield AI 於屏東完成無人船自主協同驗證

腸道運輸太緩慢恐釀菌群生長糞便停留時間牽動致癌風險

隱私優先！Even Realities G2智慧眼鏡支援 35 種語言翻譯與懸浮顯示、8月重磅登台

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

AI求職供需落差怎解？產業人才認定指引搭起企業與人才橋樑

AWS營收創逾四年最快成長 亞馬遜再加碼AI投資至2200億美元

Claude模型測試意外越界 Anthropic發現3起未授權存取

Sea攜手OpenAI在台舉辦AI黑客松 培育AI人才接軌全球技術生態

iOS 27測試版還有後手？爆料傳 5 大隱藏新功能倒數登場

Anthropic傳打造德州AI資料中心 Google提供數十億美元擔保

發佈留言 取消回覆

AWS營收創逾四年最快成長亞馬遜再加碼AI投資至2200億美元

Sea攜手OpenAI在台舉辦AI黑客松培育AI人才接軌全球技術生態

發佈留言取消回覆