Google公布生成式AI抓漏獎勵　計畫擴大標準曝光

2023-10-30

記者／竹二

生成式AI發展以來，雖說強大的功能令人驚嘆，但偶會發生的錯誤與漏洞，各家科技廠開始祭出抓漏計畫。Google也在近日宣布擴大針對AI系統的抓漏獎勵計畫，公開旗下AI產品的安全漏洞通報獎勵標準，向外徵求提供Google Bard等生成式AI服務的漏洞資訊。

Google跟進微軟，祭出AI抓漏獎勵計畫

繼微軟之後，Google也跟進腳步推出了AI抓漏計畫，但其實Google先前就已經將AI系統納入了漏洞獎勵計畫，也與DEFCON在今年9月共同主持了LLM Hackathon競賽，測試Google的AI服務，並在近日首度公開了AI產品的抓漏獎勵標準。

根據Google的說法，他們的AI抓漏類別包含提示攻擊、訓練資料汲取、操縱模型、對抗性擾動，以及模型竊取等，像是利用提示來影響模型的行為或輸出，重建與汲取包含敏感資訊的訓練資料，可以改變模型行為，或是可竊取模型權重與結構等關鍵資訊的安全漏洞，都在獎勵之列。

Google擴大獎勵計畫，新增生成式AI類別

不僅如此，Google也在擴大AI漏洞獎勵計畫，新增了生成式AI類別，因為新的技術需要新的漏洞報告準則，正在重新審視如何分類與提報AI漏洞，相較於傳統的安全漏洞，生成式AI出現了不同的問題，像是偏見、操縱或是資料誤解等。

隨著Google將生成式AI整合到產品與功能中，他們也正全面性地預測與測試潛在風險，並仰賴外部研究人員協助Google發現並解決新的漏洞。據了解，Google內部已設立了AI紅隊（AI Red Team），專門模擬針對AI系統的攻擊行動，並發布報告說明駭客最可能攻陷的途徑。

標籤

2023-10-30

推薦工作