Google公布生成式AI抓漏獎勵 計畫擴大標準曝光
記者/竹二
生成式AI發展以來,雖說強大的功能令人驚嘆,但偶會發生的錯誤與漏洞,各家科技廠開始祭出抓漏計畫。Google也在近日宣布擴大針對AI系統的抓漏獎勵計畫,公開旗下AI產品的安全漏洞通報獎勵標準,向外徵求提供Google Bard等生成式AI服務的漏洞資訊。
Google跟進微軟,祭出AI抓漏獎勵計畫
繼微軟之後,Google也跟進腳步推出了AI抓漏計畫,但其實Google先前就已經將AI系統納入了漏洞獎勵計畫,也與DEFCON在今年9月共同主持了LLM Hackathon競賽,測試Google的AI服務,並在近日首度公開了AI產品的抓漏獎勵標準。
更多新聞:微軟公布新抓漏計畫 針對Bing AI功能祭出漏洞獎勵
根據Google的說法,他們的AI抓漏類別包含提示攻擊、訓練資料汲取、操縱模型、對抗性擾動,以及模型竊取等,像是利用提示來影響模型的行為或輸出,重建與汲取包含敏感資訊的訓練資料,可以改變模型行為,或是可竊取模型權重與結構等關鍵資訊的安全漏洞,都在獎勵之列。
Google擴大獎勵計畫,新增生成式AI類別
不僅如此,Google也在擴大AI漏洞獎勵計畫,新增了生成式AI類別,因為新的技術需要新的漏洞報告準則,正在重新審視如何分類與提報AI漏洞,相較於傳統的安全漏洞,生成式AI出現了不同的問題,像是偏見、操縱或是資料誤解等。
隨著Google將生成式AI整合到產品與功能中,他們也正全面性地預測與測試潛在風險,並仰賴外部研究人員協助Google發現並解決新的漏洞。據了解,Google內部已設立了AI紅隊(AI Red Team),專門模擬針對AI系統的攻擊行動,並發布報告說明駭客最可能攻陷的途徑。
瀏覽 3,004 次