創作變成訓練 AI 資料能提告？從紐約時報提告 OpenAI 看生成式內容對原創者的挑戰

2024-01-08

記者／孫敬 Archer Sun

就在 OpenAI 開啟「2023 生成式 AI 元年」，帶動一眾科技巨頭如 Google、微軟相繼參與 AI 應用開發，期望 AI 能結合自己的服務創造更大的產業影響力。就在全球熱衷 AI 帶來的便利性時，近期 OpenAI 和微軟遭《紐約時報》指控在沒有經過授權的情況下，擅自使用《紐約時報》的內容來訓練 AI 模型。

生成式 AI 之所以強大，來自它背後龐大的資料庫訓練，那身在台灣的我們，如果我們的作品也在未被告知的情況下，被生成式 AI 業者拿去當作訓練的資料，能怎麼辦？

更多新聞：從OpenAI 事件到倡議監管　回顧2023 AI重大事件

The New York Times — 紐約時報告上 OpenAI 和微軟未經授權使用自家媒體資料訓練 AI。（圖：Shutterstock）

OpenAI、微軟遭炎上！媒體、創作者內容被擅自拿來訓練 AI 模型

美國知名新聞業者《紐約時報》去年 12 月底公開表示，已對 OpenAI、微軟提告，因為這兩間科技公司在沒有付費、取得授權的情況下，大量使用《紐約時報》的報導內容訓練 AI。《紐約時報》對比了從 OpenAI 和自家媒體產出的內容，稱兩者有高度的重疊，認為此舉壓縮《紐約時報》的付費訂閱服務，而且生成式 AI 參照了《紐約時報》資料給出的建議還出現錯誤，影響了《紐約時報》品牌商譽。雖然沒有公開具體索賠金額，但《紐約時報》已向 OpenAI、微軟提出總計「數十億美元價值」的法定、實際認列損失，並要求刪除含《紐約時報》在內的 AI 機器模型資料。

OpenAI 發言人赫爾德（Lindsey Held）曾透過電子郵件回應《紐約時報》的控告，「我們尊重創作者和內容擁有者的權益，積極的與他們合作，以確保在人工智慧的新模式下獲得收益」「我們與《紐約時報》的對談正往著有建設性的方向前進，對於事件這樣的發展我們感到驚訝和失望」，微軟則沒有對《紐約時報》的發言做出回應。

早在去年 4 月《紐約時報》便開始跟 OpenAI 商討資源的交換方式，達成資料引用的合作，但最後並沒有達成協議，現今包含路透社、BBC、CNN 在內等媒體，已經設立了爬蟲防止 OpenAI 抓取網站的新聞內容。

資料被拿去訓練 AI 怎麼解？台灣資訊智慧財產權協會理事長陳家駿給出答案

創作者的內容和作品被當作訓練 AI 模型的資料，這究竟告不告的成？從這一兩年國外創作者向 OpenAI 跟微軟提告作品被拿來訓練 AI 案例，只能說有很高的機會「不會贏」。以美國著作權局（United States Copyright Office）對 AI 內容生成與再製的解釋為例，其認為在「創新性」基準上要有增加「新的東西」來改變原有的型態，且沒有改變原著作的用途，意思有點類似動畫、動漫圈常提到的「二創」概念。OpenAI 跟微軟面對生成式 AI 創作的作品，指出使用的是受版權保護的作品，來當作 AI 的資料是在「合理範圍」，也滿足了創新性的條件，因此認定引用內容或作品再製是符合使用原則。

那台灣法規對訓練生成式 AI 使用的資料規範，究竟態度為何？根據「經濟部智慧財產局」《智慧財產權月刊 298 期》作者；台灣資訊智慧財產權協會理事長陳家駿觀點，生成式 AI 工具服務商或使用者是否構成侵權的困難點，在於雙方都有參與到「AI 內容產製」的過程，服務商沒有主體上認知的侵權行為，僅能作間接侵權的角色。

經濟部智慧財產局：從美國人工智慧擴散模型訴訟案，談生成式AI圖像之著作侵權議題 — 經濟部智慧財產局曾對生成式 AI 著作侵權議題發表月刊。（圖：經濟部智慧財產局）

使用者僅輸入指令生成創作，並非侵害重製或衍生著作構成要件的主體，很難在主觀上認定服務商、使用者之間，有意侵害原創作者的著作權，但畢竟雙方都有參與其中，服務商提供的服務有控制、引導使用者的能力，並在生成創作、作品中獲得實質的經濟收益，可能會構成智財法當中的「分工侵權」，不過最終是否成立侵權還有待法院進一步釐清。

標籤

2024-01-08

創作變成訓練 AI 資料能提告？從紐約時報提告 OpenAI 看生成式內容對原創者的挑戰

OpenAI、微軟遭炎上！媒體、創作者內容被擅自拿來訓練 AI 模型

資料被拿去訓練 AI 怎麼解？台灣資訊智慧財產權協會理事長陳家駿給出答案

推薦工作

發佈留言取消回覆

數發部免費AI算力服務開放申請新增Gemma 4等多種最新模型

地表最強內顯要來了？！英特爾聯手輝達打造最強晶片傳2028強勢登場

不想天天吃雞蛋！七種高蛋白早餐「營養又有飽足感」

Siri AI升級恐加劇記憶體吃緊三星、SK海力士可望成最大受惠者

氣候危機衝擊！18億兒童遭受乾旱威脅 2.42億學童因天災中斷教育

最新科技新聞快訊不錯過!!

OpenAI、微軟遭炎上！媒體、創作者內容被擅自拿來訓練 AI 模型

資料被拿去訓練 AI 怎麼解？台灣資訊智慧財產權協會理事長陳家駿給出答案

推薦工作

延伸閱讀

數發部免費AI算力服務開放申請 新增Gemma 4等多種最新模型

Siri AI升級恐加劇記憶體吃緊 三星、SK海力士可望成最大受惠者

企業搶攻AI搜尋曝光！消費者卻不完全信任 網路比10年前更不人性化

Gemini與Claude急速追趕 ChatGPT市占首度跌破五成

Anthropic無預警斷供Fable大模型 意外引爆開源AI黃金時代

傳美國暫緩DeepSeek列出口黑名單 逾百家中國企業涉國安風險仍未遭制裁

發佈留言 取消回覆

數發部免費AI算力服務開放申請新增Gemma 4等多種最新模型

Siri AI升級恐加劇記憶體吃緊三星、SK海力士可望成最大受惠者

企業搶攻AI搜尋曝光！消費者卻不完全信任網路比10年前更不人性化

Anthropic無預警斷供Fable大模型意外引爆開源AI黃金時代

傳美國暫緩DeepSeek列出口黑名單逾百家中國企業涉國安風險仍未遭制裁

發佈留言取消回覆