工程師最愛的AI「Claude」在駭客比賽殺紅眼打敗多數人類頂尖高手

2025-08-07

記者鄧天心／綜合報導

在學生駭客比賽的榜單上，由Anthropic公司開發的AI語言模型Claude，在幾乎沒有人類協助之下，表現超越了大多數參賽者，連負責賽是的官方紅隊成員都感到驚訝，這些實驗數據還沒公開之前，Anthropic接受知名媒體Axios報導分享這件事，接下來也準備在DEF CON全球駭客大會上發表這項成果。

1754545677316 — Anthropic的Claude打敗人類選手。（圖／Claude）

延伸閱讀：狠甩馬斯克！科技巨頭黃仁勳榮登《財星》最具影響力商界人物

故事要從Anthropic資安紅隊成員Keane Lucas說起，今年春天他突然心血來潮，決定讓Claude參加由卡內基美隆大學舉辦的PicoCTF學生駭客賽，全球最大的學生「解題奪旗」資安比賽，參賽者需破解惡意軟體、闖過系統防線，以及解密檔案等。

Lucas只是單純把比賽題目直接提交給Claude，甚至還遇到題目需要外部工具協助時才動手安裝，最終，Claude大部分題目都輕鬆過關，名次直接衝進前3%。

之後，Lucas陸續讓Claude參加更多駭客賽事，只用最新的AI模型和簡單協助，例如幫忙安裝小軟體，全部交給Claude來解決，一次比賽中，Claude在10分鐘內連解11道題，又用10分鐘再解5題，當時一度衝到第4名，如果不是因為Lucas開場搬沙發、遲到幾分鐘，Claude還有機會衝到第一。

目前駭客圈各大比賽都出現大量AI代理人身影，比如「Hack the Box」賽事裡，八組AI隊有五組幾乎全解所有題目，而能做到這點的人類團隊不到八分之一，另一款由新創公司和美國國防高等研究計畫署（DARPA）開發的AI Xbow，更成為全球漏洞懸賞榜首的第一款全自動滲透攻擊系統。

Anthropic的資安專家Lucas坦言：「AI成長的速度真的讓人難以置信。」

但AI還是有弱點。例如有個比賽題目，只是在終端機窗口中秀出一堆游動的魚動畫，人類很容易用快捷鍵跳過，AI卻完全看不懂，當機一樣無法動彈，有些更高階的比賽，AI團隊同樣會卡在最後的難關，理由至今也還不清楚。

目前Anthropic團隊其實有些擔心，整個資安社群還沒意識到AI技術已經在主動安全測試上進步這麼快，同時也意味著AI防禦端的潛力巨大，Anthropic紅隊負責人Logan Graham強調：「很快AI模型會在資安攻防兩端的表現都比過去更強大。現在開始訓練讓AI守護系統，是時候了。」

資料來源：Axios

在 Google News 上追蹤我們

標籤

2025-08-07

發佈留言取消回覆

很抱歉，必須登入網站才能發佈留言。