由OpenAI開發的Sora,近期公布另一波展示影片。實測人士就包括了曾在夢工廠製作動畫的業內高手。此外,奧特曼近期去好萊塢兜售這個AI影音模型,已引起諸多片廠高度興趣。難道,下部好萊塢大片,就將由它來擔當製作?到底創作者實測最新成果為何?市場商機多大?
2月以文字轉影片模型「Sora」生成範例技驚四座的OpenAI,三月底再度釋出更新資訊。內容依然是展示影片,並非眾所期盼的公眾使用權。但這次Sora是交到專業創意工作者手上實驗,成品更加細緻、具敘事性,進一步揭示影片生成模型應用於行銷廣告及藝術創作的潛能。
在OpenAI發布的文章〈Sora: first impressions〉中,實驗使用Sora的藝術家、電影製作人等創意工作者共公開了7部成品。與先前OpenAI釋出的範例相比,新的作品在創意性和完整度都有大幅提升。
OpenAI在2月公布的範例影片多為擬真短影片,沒有配音,就像是從遊戲中隨機擷取的一段畫面。但這批出自專業創意工作者的作品,經過人為編排、點綴,完成度已經相當高。
其中特別引人注目的敘事作品可能是《Air Head》。這段片長不及1分半鐘的短片,講述了虛構角色Alex的人生故事。Alex的頭部是顆黃色氣球,但他仍然在與他人及地球壯麗景色的互動中,逐漸找到自己的認同。
《Air Head》的作者為多倫多多媒體製作公司「shy kids」。背後團隊共有3人,既是樂團也是電影製作者的shy kids,先前就曾用開源生成工具Stable WarpFusion製作過自己的音樂MV。這次也親自打造《Air Head》的旁白與配樂,並進行必要的後製編修。
shy kids表示,影片(及影像)生成工具的一大問題,是很難維持生成角色與背景的一致性。因而他們想在《Air Head》中嘗試能在多大的限度上講述同一個角色的故事。成員伍德曼(Walter Woodman)對《MIT科技評論》(MIT Technology Review)表示,他認為結果表現不俗。
業界實測指出,人跟機器合作,可讓Sora更強大
伍德曼也認為,諸如旁白、配樂等人為的補充及配合,讓成品感覺更生動。是人與機器的合作,釋放出Sora的更大潛力。
另一部也相當有趣的作品,來自跨域藝術家史蒂文森(Don Allen Stevenson III)。他曾任職於夢工廠動畫,先前也受OpenAI邀請試驗過文生圖模型DALL-E 2。
史蒂文森的短片是一段國家地理雜誌風格的幻想野生動物紀錄片《BEYOND our REALITY》,介紹飛天豬、長頸鹿紅鶴與鰻魚貓等真實動物的嵌合體。他表示,考慮到這將是許多人對Sora影片的「第一印象」(first impression),他想傳遞的明顯訊息是:這不是真的。
史蒂文森對Sora評價頗高。他認為,現在已有許多影音工具可以精準地編輯、控制視覺效果,Sora的難以預測性,反而是這項新工具有趣之處,可生成超乎作者想像的素材。
史蒂文森舉例,他原本想像的「狐狸烏鴉」有四條腿,但Sora生成的只有兩條腿,看起來似乎還更好。他解釋,「我喜歡擁有少一點控制權,我喜歡這其中的混亂感。」
大多時間,史蒂文森都以一人工作室的型態活動,作品範圍有其限制。但Sora拓展了創造可能性、補充獨立創作者未竟的技能缺口,令他感到「一個過往無法想像的創意敘事新時代正在開展」。
鎖定名導及大片廠,OpenAI推動Sora打進好萊塢
據《彭博》(Bloomberg)、《金融時報》(FT)等媒體報導,近來OpenAI執行長奧特曼(Sam Altman)與營運長萊特凱普(Brad Lightcap)前進好萊塢兜售自家Sora,已向派拉蒙、環球與華納兄弟探索(WBD)等大片廠進行了展示簡報。相關消息指出,部分片廠展露興趣,但尚未談到合作及授權那一步。
先前Sora首度公開露面,在影視產業引發不小議論。一名好萊塢高層向半島電視(Al Jazeera)描述,自己看見Sora的反應就和每個人一樣,「我的下巴掉到地上。就像是我們看見了自己的謀殺者,但同時又很美麗。既令人印象深刻又令人害怕。」
在今日影音內容主宰資訊平台的環境中,由文字生成影片的AI工具重要性不言而喻。可以更加快速、簡單地製作影片的需求正在提升。根據市調公司MarketsAndMarkets估計,至2027年底,文字轉影片模型的全球市場規模將達9億美元。
若再結合OpenAI最新發表的語音生成工具「Voice Engine」(目前同樣僅有展示,未開放公眾使用),應用層面更加廣泛。從產品展示、教學、員工培訓、企業行銷到客戶服務等多種目的,都可能發布適用不同年齡層、地區及語種的多種版本影音內容。
目前,考量業界可能的反彈與遭濫用的風險,OpenAI在影音生成工具上小心推進。外界推測,OpenAI此舉除了想先爭取好萊塢知名人士背書支持,也可能由於Sora目前使用成本高,故先鎖定最有資源大規模使用的客戶。或許Sora初期會以專業性工具的方式有限釋出。
但影音生成模型大戰方興未艾。訓練資料的版權問題、創作者補償方案,以及如何攔阻假資訊在美國選舉年大肆蔓延,將令企業及監管單位持續苦尋解方好一陣子。