2025/3/31編按:OpenAI近期推出ChatGPT生成吉卜力風格圖片的功能,引發AI創作與著作權爭議。日媒引述日本橋下綜合法律事務所律師說明,雖然風格模仿本身不受版權保護,但若內容與吉卜力角色或場景高度相似,可能構成侵權。此外,AI未經授權訓練版權作品也存法律風險。藝術家與法律專家呼籲加強監管,確保創作者權益。
回顧2024年八月,曾參與《黑豹》、《復仇者聯盟》和《雷神》等作的概念藝術家歐提茲(Karla Ortiz)領著創作社群一同告上Stability AI。雖然初步獲得地方法官支持創作者繼續推進侵權訴訟,實際上這場內容創作者對AI模型商的戰役,要繼續贏仍有許多挑戰。為什麼?原因竟是科技圈的「暗黑」手法:先偷資料再請夠好律師,可能重現?
最近一連串與生成式AI相關的訴訟案件搬上台面後,又帶來全球創作人的討論與擔憂。
Stability AI因為圖像遭到藝術家控告、Claude因為歌詞被音樂出版商控告、OpenAI因爲文字被作家與媒體控告、GitHub因為程式碼被開發者控告,類似訴訟正在各地漸次開展。
其中,創作者控告Stability AI的案件尤受關注,因為這不同於Getty Images這類圖庫公司控告Stability AI,而是由曾參與《黑豹》、《復仇者聯盟》和《雷神》等作的概念藝術家歐提茲(Karla Ortiz)和其他創作們所發起。
法官:AI公司未取得創作者同意使用其作品
根據《The Hollywood Reporter》報導,上週美國地方法官歐瑞克(William Orrick)認同創作者所提部分論點,拒絕駁回其對Stability AI的控告,支持創作者繼續推進侵權訴訟。
雖然法官沒有處理訓練模型是否屬於合理使用的議題,但歐瑞克認為,AI公司未經同意,便將藝術家們的創作儲存在其系統之中,此舉侵犯後者權利。
看來此案似乎法官展現了支持創作者的作為,但是對創作者來說,與AI的戰役仍然不容易。為什麼?
首先,機器侵占任務帶來的自動化焦慮(automation anxiety),已經讓白領工作者戰戰兢兢。
不過,即便是看似最不容易被AI挑戰的創作者,同樣無法置身事外。就像程式碼撰寫有GitHub Copilot、Codeium輔助,無論是文字、圖像、聲音或者影音,都出現對應的AI工具,文字有ChatGPT,圖像有Midjourney、音樂有sudo、影音也有Runway。
然而,這些科技公司所開發出的AI工具,其實是站在前人的肩膀上,正是因為小說家、作曲家、畫家孜孜矻矻地創作,並將作品流傳於世,OpenAI、Anthropic和Midjourney等公司才能利用這些作品訓練其模型。
AI是減少門檻的好工具,還是內容小偷?
對一般人來說,這些AI工具無疑是弭平創作門檻的福音,但對創作者來說,這卻是赤裸裸的偷竊,因此,從2022年底生成式AI映入一般民眾眼簾之際,創作者與AI公司之戰便全面打響。
但舉證一點也不容易。他們要先從以億計算的圖像資料集中,找出自己的作品,接著得鑽進技術討論之海,釐清深度學習(deep learning)究竟只是學走資料表現出的模式(pattern),還是真的把自身創作化為權重,讓使用者有辦法透過咒語重製。最後,創作者還得跟法院解釋,為何把圖像資料用來訓練模型構成侵權,而不是辯方所說的合理使用。
歐瑞克認為,新創Stability AI開發出的以文生圖(text-to-image)模型,在接受使用者所下的指令後,有辦法創造出高度接近真實的圖像,這類AI創作背後大幅仰賴受版權保護的作品,且讓模型能夠回應這類指令的意圖,開發工具就在促進侵權。
Stability AI主要利用LAION資料集訓練其模型,這份資料集並不直接儲存圖像,而是以圖像網址和描述的成對文字(pair)所組合而成,對應兩者後,模型因此能夠「理解」圖像的語意概念。舉例來說,某張有大隊人馬參與馬拉松的照片,其對應文字就有可能是奔跑、馬拉松和人潮。
先前有開發者打造搜尋工具,讓藝術家們能夠確認自己的創作是否被納入資料集中。因為LAION資料集並不直接儲存圖像本身,因此創作怒火主要集中在透過LAION打造服務的AI公司上。
施密特:先偷資料再請律師處理
不只有以文生圖公司面臨訴訟,具有不同模態能力的模型,背後代表對應的資料,而這些資料,都可能未經授權。
從Google前執行長與董事長、現在大量投資AI新創的施密特(Eric Schmidt)近期發言,或許能夠一瞥為何科技新創為何先斬後奏,未經同意便運用他人資料。
在近期惹起許多非議的史丹佛大學課程演講時,施密特指出大語言模型能力進步,已經有辦法將使用者寫下的文字化為行動,他向學生舉例,可以向大語言模型下令,請它再現一版TikTok(Make me a copy of TikTok),並「偷走用戶和音樂,加入我的偏好,接著在30秒內寫好程式碼。」
正因為大語言模型已經從文字對話上升到能夠處理多模態、擁有成為AI代理人的潛力,因此無論是打造網頁介面,還是增加其他功能,大語言模型都能完成。
後續補充說明時,施密特強調,他的發言重點並不是求非法竊取音樂,但如果是矽谷創業家,若最後產品取得成功,可以再找來一群律師收拾殘局。「但如果沒人使用你的產品,那你到底有沒有偷走所有內容,便不再重要。」
單看施密特的發言,或許能將其視為一位科技老兵的個人想法。然而,施密特不是普通的科技老兵,他投資了開發出Claude的Anthropic、打造出Stable Diffusion的Stability AI,同時也是著力於開發AI基礎模型的新創Mistral AI、Inflection AI和French AI startup H等公司的重要投資人。
人工智慧模型商和創作者之間的爭戰,也讓人聯想到先前後者與盜版商的多年搏鬥。開發者認為將資料用來訓練模型為合理使用,且若模性表現提升,不只對公司有益,從社會角度也有一起進步的效果存在。相似的,海盜黨(Pirate Party)同樣主張應該變革著作權,藉此促進社會福祉。
對創作者來說,正因為有多年累積出的品味、經驗和美學,方能培養出獨樹一幟的風格,但AI工具提供者卻沒先過問作者,只是粗暴地將作品們納入資料集,藉此訓練模型,使用者也因此方能迅速在AI創作時,靈活調度藝術家的風格。
對創作者來說,這場戰役仍很艱辛。