ChatGPT吉卜力生圖爭議〉偷資料後請夠好律師就行？AI侵權訴訟的底層真相

2025/3/31編按：OpenAI近期推出ChatGPT生成吉卜力風格圖片的功能，引發AI創作與著作權爭議。日媒引述日本橋下綜合法律事務所律師說明，雖然風格模仿本身不受版權保護，但若內容與吉卜力角色或場景高度相似，可能構成侵權。此外，AI未經授權訓練版權作品也存法律風險。藝術家與法律專家呼籲加強監管，確保創作者權益。

回顧2024年八月，曾參與《黑豹》、《復仇者聯盟》和《雷神》等作的概念藝術家歐提茲（Karla Ortiz）領著創作社群一同告上Stability AI。雖然初步獲得地方法官支持創作者繼續推進侵權訴訟，實際上這場內容創作者對AI模型商的戰役，要繼續贏仍有許多挑戰。為什麼？原因竟是科技圈的「暗黑」手法：先偷資料再請夠好律師，可能重現？

最近一連串與生成式AI相關的訴訟案件搬上台面後，又帶來全球創作人的討論與擔憂。

Stability AI因為圖像遭到藝術家控告、Claude因為歌詞被音樂出版商控告、OpenAI因爲文字被作家與媒體控告、GitHub因為程式碼被開發者控告，類似訴訟正在各地漸次開展。

其中，創作者控告Stability AI的案件尤受關注，因為這不同於Getty Images這類圖庫公司控告Stability AI，而是由曾參與《黑豹》、《復仇者聯盟》和《雷神》等作的概念藝術家歐提茲（Karla Ortiz）和其他創作們所發起。

法官：AI公司未取得創作者同意使用其作品

根據《The Hollywood Reporter》報導，上週美國地方法官歐瑞克（William Orrick）認同創作者所提部分論點，拒絕駁回其對Stability AI的控告，支持創作者繼續推進侵權訴訟。

雖然法官沒有處理訓練模型是否屬於合理使用的議題，但歐瑞克認為，AI公司未經同意，便將藝術家們的創作儲存在其系統之中，此舉侵犯後者權利。

看來此案似乎法官展現了支持創作者的作為，但是對創作者來說，與AI的戰役仍然不容易。為什麼？

首先，機器侵占任務帶來的自動化焦慮（automation anxiety），已經讓白領工作者戰戰兢兢。

不過，即便是看似最不容易被AI挑戰的創作者，同樣無法置身事外。就像程式碼撰寫有GitHub Copilot、Codeium輔助，無論是文字、圖像、聲音或者影音，都出現對應的AI工具，文字有ChatGPT，圖像有Midjourney、音樂有sudo、影音也有Runway。

然而，這些科技公司所開發出的AI工具，其實是站在前人的肩膀上，正是因為小說家、作曲家、畫家孜孜矻矻地創作，並將作品流傳於世，OpenAI、Anthropic和Midjourney等公司才能利用這些作品訓練其模型。

AI是減少門檻的好工具，還是內容小偷？

對一般人來說，這些AI工具無疑是弭平創作門檻的福音，但對創作者來說，這卻是赤裸裸的偷竊，因此，從2022年底生成式AI映入一般民眾眼簾之際，創作者與AI公司之戰便全面打響。

但舉證一點也不容易。他們要先從以億計算的圖像資料集中，找出自己的作品，接著得鑽進技術討論之海，釐清深度學習（deep learning）究竟只是學走資料表現出的模式（pattern），還是真的把自身創作化為權重，讓使用者有辦法透過咒語重製。最後，創作者還得跟法院解釋，為何把圖像資料用來訓練模型構成侵權，而不是辯方所說的合理使用。

歐瑞克認為，新創Stability AI開發出的以文生圖（text-to-image）模型，在接受使用者所下的指令後，有辦法創造出高度接近真實的圖像，這類AI創作背後大幅仰賴受版權保護的作品，且讓模型能夠回應這類指令的意圖，開發工具就在促進侵權。

Stability AI主要利用LAION資料集訓練其模型，這份資料集並不直接儲存圖像，而是以圖像網址和描述的成對文字（pair）所組合而成，對應兩者後，模型因此能夠「理解」圖像的語意概念。舉例來說，某張有大隊人馬參與馬拉松的照片，其對應文字就有可能是奔跑、馬拉松和人潮。

先前有開發者打造搜尋工具，讓藝術家們能夠確認自己的創作是否被納入資料集中。因為LAION資料集並不直接儲存圖像本身，因此創作怒火主要集中在透過LAION打造服務的AI公司上。

新創公司Stability AI。取自X@StabilityAI

施密特：先偷資料再請律師處理

不只有以文生圖公司面臨訴訟，具有不同模態能力的模型，背後代表對應的資料，而這些資料，都可能未經授權。

從Google前執行長與董事長、現在大量投資AI新創的施密特（Eric Schmidt）近期發言，或許能夠一瞥為何科技新創為何先斬後奏，未經同意便運用他人資料。

在近期惹起許多非議的史丹佛大學課程演講時，施密特指出大語言模型能力進步，已經有辦法將使用者寫下的文字化為行動，他向學生舉例，可以向大語言模型下令，請它再現一版TikTok（Make me a copy of TikTok），並「偷走用戶和音樂，加入我的偏好，接著在30秒內寫好程式碼。」

正因為大語言模型已經從文字對話上升到能夠處理多模態、擁有成為AI代理人的潛力，因此無論是打造網頁介面，還是增加其他功能，大語言模型都能完成。

開拓視野，隨時出發！訂閱《遠見》一年，即刻帶走25吋亞諾納行李箱，裝下你的大未來>>

後續補充說明時，施密特強調，他的發言重點並不是求非法竊取音樂，但如果是矽谷創業家，若最後產品取得成功，可以再找來一群律師收拾殘局。「但如果沒人使用你的產品，那你到底有沒有偷走所有內容，便不再重要。」

單看施密特的發言，或許能將其視為一位科技老兵的個人想法。然而，施密特不是普通的科技老兵，他投資了開發出Claude的Anthropic、打造出Stable Diffusion的Stability AI，同時也是著力於開發AI基礎模型的新創Mistral AI、Inflection AI和French AI startup H等公司的重要投資人。

人工智慧模型商和創作者之間的爭戰，也讓人聯想到先前後者與盜版商的多年搏鬥。開發者認為將資料用來訓練模型為合理使用，且若模性表現提升，不只對公司有益，從社會角度也有一起進步的效果存在。相似的，海盜黨（Pirate Party）同樣主張應該變革著作權，藉此促進社會福祉。

對創作者來說，正因為有多年累積出的品味、經驗和美學，方能培養出獨樹一幟的風格，但AI工具提供者卻沒先過問作者，只是粗暴地將作品們納入資料集，藉此訓練模型，使用者也因此方能迅速在AI創作時，靈活調度藝術家的風格。

對創作者來說，這場戰役仍很艱辛。