《紐時》封鎖OpenAI網路爬蟲 AI巨頭計畫受挫
編譯/莊閔棻
《紐約時報》似乎已經封鎖 OpenAI 的網路爬蟲,讓該公司無法再使用該出版物的內容訓練其人工智慧(AI)。雖然當《紐時》在月初更新其服務條款時,還並未對其 robots.txt 進行任何更改,但現在,該出版物已經在其 robots.txt 上封鎖OpenAI 專為抓取網路資料推出的爬蟲程式 GPTBot 。robots.txt用來通知搜尋引擎爬蟲,哪些內容是不應被搜尋引擎漫遊器取得的,而哪些是可以被取得的。
《紐時》更新其服務條款,針對OpenAI
據外媒報導,《紐時》這次的修改似乎是針對OpenAI的,讓該公司無法再使用其資料。早在8月初,《紐時》就先發制人,更新其服務條款,禁止其內容,包括文本、照片、圖像、音頻/影片、外觀和感覺、後設資料或合集,被用於開發「任何軟體程式,包括但不限於訓練機器學習或AI系統」。更新後的條款現在還規定,未經《紐時》的書面許可,不得使用在該出版物上使用網站爬蟲等自動化工具。
《紐時》考慮採取法律行動
此外,《紐時》似乎也考慮與其他作者一起對 OpenAI 侵犯知識產權的行為採取法律行動。若是《紐時》真的提起訴訟,就可能會引起連鎖效應,讓其他公司和網站也試圖採取類似的措施保護他們的作品。專家表示,一但訴訟提起,OpenAI 可能需要為每件使用的未經授權內容支付高達 15 萬美元的費用。
OpenAI「非法」使用所有人的內容
為訓練GPT-3.5 和 GPT-4 等語言模型,OpenAI 透過網路資料抓取機器人,從網路收集第三方數據訓練 GPT 模型。但問題是,OpenAI 使用的不只有免費、無版權的內容,其中還包括受版權保護的內容,這讓版權所有者感到憤怒。
《紐時》為Google破例
不過,即使《紐時》禁止其他公司使用自家內容,該出版商也在2023年 2 月份與Google簽署一項價值 1 億美元的協議,並允許這家搜尋引擎巨頭在未來三年內在其部分平台上展示《紐時》的內容。因此,也不排除《紐時》是要OpenAI 或微軟等其他公司和其達成獨立協議的可能。
參考資料:The Verge
瀏覽 1,171 次