訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

Sora是什麼?為何尚未上市,就震驚好萊塢?全球工作衝擊一次解析

傅莞淇
user

傅莞淇

2024-03-18

瀏覽數 34,450+

只需隨意寫文字,Sora就能轉化為栩栩如生的短片。取自OpenAI
只需隨意寫文字,Sora就能轉化為栩栩如生的短片。取自OpenAI
00:00
00:00

本文出自 2024 / 4月號雜誌 全民搶當碳金富翁

只需隨意寫文字,Sora就能轉化為栩栩如生的短片。這個由OpenAI於近期研發的新AI工具,2月方釋出實測短片,就驚嚇到好萊塢影業大亨,決定暫停擴大自家工作室。到底它功能多強?何時可下載安裝?問世後,誰的工作將不保?誰卻可能靠AI提升競爭力《遠見》彙整業內真實說法,提出解析。

2月中旬,因ChatGPT一戰成名的OpenAI釋出由Sora生成的一系列實測示範短片,瞬間引爆輿論。影業大亨為此暫止耗資八億美元的工作室擴建計畫,諸多學者提出技術恐遭濫用、左右民主大選的警告。業界人士在分析中自問:這為影片製作產業敲響了喪鐘嗎?

而引發這些反應的AI模型「Sora」,甚至還沒正式開放大眾使用。

在此之前,其實業界早已出現AI短片生成工具,例如Runway、Pika等,就已經證實可以透過AI來協助生成影片,並具備一定程度的微調力。例如,使用Runway的動態筆刷,可以控制特定影像範圍的移動方向。

但Sora將影片生成戰役提升至前所未見的層級。先前亮相的模型大多只能生成3~4秒或十來秒的影片,Sora可據單次指令生成長達60秒的短片。且畫面更加細緻、仿真,人物動作也更加流暢。簡單來說,Sora生成的影片更像是真實世界的取景,人眼幾乎難以辨識這是AI模型生成的內容。

Sora生成的影片更像是真實世界的取景,人眼幾乎難以辨識這是AI模型生成的內容。取自OpenAI

Sora生成的影片更像是真實世界的取景,人眼幾乎難以辨識這是AI模型生成的內容。取自OpenAI

但這對非從事影音產業的人來說,具有什麼意義?60秒的短片除了上傳抖音等平台,還能做什麼?有了Sora,下一步會是什麼?

Sora背後原理解析

Sora源自日文「天空」,有創造潛力無窮的含意。Sora可以文字指令、單張圖像或影片為基礎,生成複雜場景與其中的動態角色。據OpenAI解釋,結合了大語言模型與擴散模型的Sora「不僅理解使用者的指令內容,也理解這些事物在物理世界中存在的狀況」。

這或許就是Sora生成的內容看來如此真實的原因。現實世界的物體運動具有延續性,人類孩童自實際經驗中慢慢學習物理定律。例如陽光能穿透玻璃,但不會穿過水泥牆壁。在池塘拍打水面,漣漪會持續往外推送、但逐漸變得微弱。Sora的神經網路也觀看了非常大量的影片,從中學習現實世界的運作方式。

因而,它能夠仿真地生成「穿過東京郊區的火車車窗上的倒影」,也能生成「海洋生物優游於沉入水中的紐約市區」這樣的虛構場景。

Sora能夠仿真地生成「海洋生物優游於沉入水中的紐約市區」這樣的虛構場景。取自OpenAI

Sora能夠仿真地生成「海洋生物優游於沉入水中的紐約市區」這樣的虛構場景。取自OpenAI

未來3年,20萬個娛樂產業工作機會將因AI受衝擊

不難想像影片創作者受到的心理衝擊。Sora預覽短片才發布短短天,好萊塢知名製片及導演派瑞(Tyler Perry)就受訪透露,自己已經中止了籌備4年的工作室擴張計畫。他指出,有了這樣的AI生成力,搭建場景、甚至是出外景可能都不再必要,而這將對娛樂產業的就業市場帶來廣泛影響。

派瑞對《好萊塢報導》(THR)表示,當他看著Sora生成的內容時,「我立刻想到產業中每個會因此受到影響的人……我想影響會遍及我們產業的每個角落。」他進一步建議應有某些保護娛樂產業的規範,「否則我看不出來我們如何能存活。」

擔憂的人絕非只有他一位。根據美國概念藝術協會與動畫協會在2023年底委託進行的一項普查,全美娛樂產業接受訪談的300位主管,認為未來3年將有20萬個工作受到AI衝擊。其中視覺特效與後製工作可能最受威脅,但音效工程師、配音員也料將受到影響。超過九成受訪者認為,生成式AI在娛樂產業中的角色將愈發吃重。

Sora尚未問世,原來是OpenAI還沒搞定業內人士?

其實,Sora尚未正式上市的其中一個原因,是OpenAI還在徵詢設計師、製片人等業界人士回饋,以了解Sora可如何輔助、賦能數位內容製作工作。

樂觀者認為,Sora這類AI工具,讓影音內容創作權,不再把持於少數擁有大筆資金的工作室手中,加速了藝術創作的民主化。

例如,即便Sora目前還不能下載或安裝,已有一群充滿熱情與實驗精神的藝術家善加利用手上各類工具,以零元預算將50段AI生成影片拼接成一部完整長片《Our T2 Remake》。這部戲仿《魔鬼終結者2》(Terminator 2: Judgment Day),有趣的是每隔2~3分鐘,就會過渡到另一種影像風格,但敘事線仍保持一致。

年度激省!$3,680 帶回24期遠見+高質感行李箱

影/《Our T2 Remake》預告片

誰將因Sora獲益?個人內容創作者和新創

另外,資源較有限的獨立網路內容生產者,倒是有可能因為這波生成AI風潮獲益。

如為線上創作者打造的學習平台「Creator Now」在2023年9月對2千多名創作者的普查顯示,高達97%受訪者已在創作過程中使用AI。將近六成創作者會與ChatGPT等AI機器人激盪創意靈感,44%受訪者肯定AI提升了生產力。

但影片生成模型絕不僅只可造福線上創作者。在Sora展示影片公開後不久,北京大學與深圳AI公司兔展便聯合發起「Open-Sora」計畫,欲透過開源社群力量,複製出Sora模型。

兔展執行長董少靈直言,該計畫的目標不是為了讓人人都能以低成本生成高品質影片,抖音上的娛樂短片「不是我們的所思所想」。他解釋,「我們希望深植中國產業,賦能中國產業升級。」

軟體及網站開發公司竑盛科技創辦人康程泰觀察,AI生成影片的商業性應用於台灣尚屬萌芽階段,但社群平台上已經相當盛行。從寫程式到做簡報,竑盛自身工作流程也已引入多種AI工具,「大家已經非常習慣用AI工具做輔助。」

康程泰表示,目前軟體與數位內容產業對這些AI生成力特別有感,但只要是涉及電腦作業的任務,實則都在影響範圍內。「以前『會』與『不會』是兩件事,但未來這兩者的差距會變得非常小。」康程泰指出,「當每個人都『會』,你要怎麼做出差異性?」

OpenAI技術長坦承,Sora仍可能遭濫用

OpenAI技術長穆拉蒂(Mira Murati)承認,降低Sora遭濫用的風險也是延遲發布模型的原因之一。目前團隊還在研擬限制生成的規範,並設法降低生成成本。預計2024年可對大眾釋出。

如果2023年是影片生成模型嶄露頭角的一年,2024年可能是競爭白熱化的一年。矽谷知名創投a16z在AI領域的投資夥伴摩爾(Justine Moore)盤點,在2023年初,還沒有任何文字轉影片的模型存在。到年末時,已有超過20個公開產品。摩爾認為,這般進展顯示我們正處於大規模轉型的早期階段。

OpenAI技術長穆拉蒂承認,降低Sora遭濫用的風險也是延遲發布模型的原因之一。取自OpenAI

OpenAI技術長穆拉蒂承認,降低Sora遭濫用的風險也是延遲發布模型的原因之一。取自OpenAI

目前尚有缺陷

乍看下近乎完美的Sora內容,依然有著不少缺陷與錯誤。行駛在路上的車輛會突然變色,被牛腳踩到的瓷杯沒有破碎,手指過多的問題也沒有完全解決。仔細觀察,影片中人物的肢體動作依然有些奇怪,不像真人活動的樣態。

但許多人不會如此細心地審視在網路上隨手滑到的影片,更別提是花費額外心力檢查影片真實性。因而,就算有數位浮水印等標示機制,許多學者仍憂心假政見、假醜聞影片會輕易流竄,左右民主選舉,包括11月將登場的美國總統大選。 

從ChatGPT問世開始,一波波的AI取代人類焦慮言論,已在網上蔓延。不過,早在2016年,南韓圍棋棋王李世乭已經比絕大多數人更早親身體會過AI的威力。

在五戰四敗不敵AlphaGo後,李世乭於三年後宣布退休。他對媒體表示,引退的一大原因是他了解到無論自己多麼努力勝過其他棋士,他依然不是世界最強,因為「有一個東西是無法被擊敗的」。

Sora可生成高度真實的影片,這確實令人印象深刻。但若一切順利,它未來能做的事將比這多上許多。也許在不久的未來,各行各業的專業人士,都有機會體會到李世乭當年在圍棋棋盤上的感受。

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務