工程師最愛的AI「Claude」在駭客比賽殺紅眼 打敗多數人類頂尖高手
記者鄧天心/綜合報導
在學生駭客比賽的榜單上,由Anthropic公司開發的AI語言模型Claude,在幾乎沒有人類協助之下,表現超越了大多數參賽者,連負責賽是的官方紅隊成員都感到驚訝,這些實驗數據還沒公開之前,Anthropic接受知名媒體Axios報導分享這件事,接下來也準備在DEF CON全球駭客大會上發表這項成果。

延伸閱讀:狠甩馬斯克!科技巨頭黃仁勳榮登《財星》最具影響力商界人物
故事要從Anthropic資安紅隊成員Keane Lucas說起,今年春天他突然心血來潮,決定讓Claude參加由卡內基美隆大學舉辦的PicoCTF學生駭客賽,全球最大的學生「解題奪旗」資安比賽,參賽者需破解惡意軟體、闖過系統防線,以及解密檔案等。
Lucas只是單純把比賽題目直接提交給Claude,甚至還遇到題目需要外部工具協助時才動手安裝,最終,Claude大部分題目都輕鬆過關,名次直接衝進前3%。
之後,Lucas陸續讓Claude參加更多駭客賽事,只用最新的AI模型和簡單協助,例如幫忙安裝小軟體,全部交給Claude來解決,一次比賽中,Claude在10分鐘內連解11道題,又用10分鐘再解5題,當時一度衝到第4名,如果不是因為Lucas開場搬沙發、遲到幾分鐘,Claude還有機會衝到第一。
目前駭客圈各大比賽都出現大量AI代理人身影,比如「Hack the Box」賽事裡,八組AI隊有五組幾乎全解所有題目,而能做到這點的人類團隊不到八分之一,另一款由新創公司和美國國防高等研究計畫署(DARPA)開發的AI Xbow,更成為全球漏洞懸賞榜首的第一款全自動滲透攻擊系統。
Anthropic的資安專家Lucas坦言:「AI成長的速度真的讓人難以置信。」
但AI還是有弱點。例如有個比賽題目,只是在終端機窗口中秀出一堆游動的魚動畫,人類很容易用快捷鍵跳過,AI卻完全看不懂,當機一樣無法動彈,有些更高階的比賽,AI團隊同樣會卡在最後的難關,理由至今也還不清楚。
目前Anthropic團隊其實有些擔心,整個資安社群還沒意識到AI技術已經在主動安全測試上進步這麼快,同時也意味著AI防禦端的潛力巨大,Anthropic紅隊負責人Logan Graham強調:「很快AI模型會在資安攻防兩端的表現都比過去更強大。現在開始訓練讓AI守護系統,是時候了。」
資料來源:Axios