OpenAI推AI版抖音:Sora App!是什麼?可下載?

曾子軒
user

曾子軒

2025-10-01

瀏覽數 550+

OpenAI於台灣時間10/1正式釋出第二代影音生成模型Sora 2。取自OpenAI
OpenAI於台灣時間10/1正式釋出第二代影音生成模型Sora 2。取自OpenAI

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

ChatGPT定義AI產品的OpenAI,在輝達黃仁勳宣布投資加持後,發展也神速。台灣時間今日(10/1)正式釋出第二代影音生成模型Sora 2,同時推出獨立社交應用程式「Sora App」,主打讓消費者以AI生成的影音彼此交流,直搗直接面向消費者的社群媒體腹地。Sora 2有哪些更新?Sora是否能開創AI新社群媒體?Sora 2對比Google Veo 3又有哪些特色?《遠見》一文帶您看。

左打Google Veo 3,Sora 2強調遵循物理法則和連貫性 

「Sora 2開啟了我們進入影音的GPT─3.5時刻。」這是OpenAI內部描述第二代影音生成模型Sora 2,賦予它的高度。

OpenAI研究科學家、Sora負責人比爾(Bill Peebles)指出,對比前一代Sora 1,Sora 2生成的影音,有三大升級:更加貼近物理法則、生成內容可以影音同步、可控性與敘事連貫性大幅提升。

比爾在OpenAI的直播中提到,Sora 2大幅提升了對物理世界的理解,不像Sora 1會為了完成指令扭曲現實。

舉例來說,利用Sora 1生成籃球影片時,倘若球員投籃沒有命中籃筐,下一幕可能會是籃球違背現實,瞬間移動進入籃筐。但在Sora 2中,球會真實地從籃板反彈。

比爾另外提到,Sora 2更擅長處理複雜且動態的場景,例如奧運體操動作、在滑水板上後空翻等,代表這款模型從單純生成影音,進化為更加貼近現實世界運作邏輯的模擬器(simulator)。

另外,Sora 2和Google的Veo 3一樣,將宣傳重點放在同時生成影片與音訊,可以產出包含多語言對話、環境音與音效的完整場景,對專業創作者來說,有望大幅降低後製配音的門檻,也提升AI生成內容的沉浸感。

最後,同樣與Veo 3相似的是,Sora 2大幅加強使用者的可控性(controllability)和敘事連貫性。Sora 2能夠更加精準遵循複雜指令,一次性生成包含多個鏡頭,但又能記得故事或場景的整體狀態,解決過往模型難以維持敘事連貫性的痛點。

除了上述三大進化以外,比爾也補充,Sora 2另外增加名為客串(Cameo)的新功能,使用者可以上傳一段短片,接著將其中出現的人物與角色鑲嵌進利用Sora 2生成的影片中。「它的運作原理是觀察任何一段短片,⋯⋯模型能夠深入理解它,接著將其加到提示裡,就好像它只是另一個文字標籤一樣。」

利用Sora 2生成OpenAI執行長奧特曼的影片片段。Sora

利用Sora 2生成OpenAI執行長奧特曼的影片片段。Sora

右踢臉書、抖音,Sora App已可在美加地區下載

如果說Sora 2是技術彈藥,另推出的Sora App則是嘗試將這些技術彈藥轉化為面向消費者的新入口。

目前OpenAI已提供Sora App的下載網址:https://openai.com/zh-Hans-CN/sora/ 但目前先開放美國與加拿大地區,尚未開放台灣地區下載。


這款App的介面與互動與其他影音平台如TikTok相似,同樣強調短影音和演算法推薦,但核心規則卻有著極大差異:它是一個純AI內容創作的封閉平台。

Sora工程團隊的工程師湯瑪斯(Thomas Dimson)表示,Sora應用程式的所有內容都將由AI生成,「它不是由機器人發布的,而是由人類發布的,但全部都是 AI 生成的。它給人一種非常、非常有趣的感覺。」

不過,人們使用Sora應用程式,彼此查看對方利用AI生成的內容,真的有吸引力嗎?在一個真實生活內容飽和的時代,一個完全由AI生成影片構成的平台,真的能吸引用戶並培養出真實的人際連結嗎?

有趣的是,這個疑慮,就連OpenAI團隊自己也曾有過。

湯瑪斯坦承,最初執行專案時,也曾懷疑過利用AI生成的動態消息,是否會讓使用者與真實的人際關係脫節。

然而,團隊的疑慮在運用Sora 2的客串功能(Cameo)後,便煙消雲散。

「它感覺像是一種新的媒介,一種與朋友聯繫的新方式。」湯瑪斯解釋,擁有客串功能以後,瀏覽動態消息時的心態完全不同,不再只是被動觀看,而是會主動思考,會如何將自己或者其他人加入到影片裡,操作模式有著很大的變化。

「我們注意到,隨著時間推移,很多社群媒體總體上已經偏離了朋友和家庭聯繫的理念。」因為AI讓創作變得更加容易,他認為從人們在創作同時與親友交流的角度出發,有機會吸引到使用者。

比爾更將Sora應用程式的體驗形容為「幾乎像是一種新的訊息形式」,強調與朋友共同體驗的重要性。官方部落格也提到,內部測試時,員工們普遍回饋「Cameo是讓這一切感覺與眾不同且有趣的關鍵」,甚至有同事因此在公司內結交了新朋友。

訂閱即享投資必讀好書三選二《巨人思維》、《長期買進》、《12個經濟指標,讓你投資無往不利》

Sora App已經開放iOS用戶下載,Android版則尚未推出。取自App Store

Sora App已經開放iOS用戶下載,Android版則尚未推出。取自App Store

對OpenAI而言,Sora App的吸引力核心,並非AI內容本身的光怪陸離,而是如何藉著客串功能,將這些虛構場景,轉化為用戶與朋友之間個人化表達、互動與共同創作的畫布。他們押注的是,當創作的門檻趨近於零時,這種新形態的「生成式社交」將能回歸社群媒體的初衷,以一種前所未有的趣味方式,重新拉近人與人之間的距離。

為了確保用戶安全與控制權,Sora App設計了詳盡的權限系統,用戶可決定誰能使用自己的形象客串,也可以隨時撤銷或刪除相關影片。

在平台哲學上,Sora App強調創作而非消費內容。透過「混音」(Remix)功能鼓勵二次創作,演算法也優先推薦來自朋友的內容,意圖建立一個以人際連結為核心、避免末日滾動(doomscrolling)的健康社群。

技術趨同、回歸生態系,OpenAI的願景牌是否能夠持續吸睛? 

若將Sora 2與Google Veo 3並列檢視,可以發現,在技術領域上,雙方正朝著同樣的終點線奔馳;但在商業與生態系的棋盤上,他們卻走上了截然不同的道路。

首先,兩者側重的模型進化重點幾乎如出一轍。

OpenAI在Sora 2中強調的增強可控性、透過模擬貼近真實世界、遵循物理法則(the laws of physics),與Google Veo 3的方向重疊。

Google DeepMind產品副總裁柯林斯(Eli Collins)在介紹Veo 3時便明確指出,模型對物理世界的理解更深入、創作者最需要讓模型能精準貼近構想的可控性;另外,整合原生音訊、更自然的動態模擬,也沒有任何差異。

畢竟,世界模型、多模態、高擬真度,本就是通往更強大AI的必經路徑。

然而,技術的趨同,反而凸顯了OpenAI和Google手握資產的巨大分歧。

OpenAI推AI版抖音:Sora App!是什麼?可下載?_img_1

OpenAI推AI版抖音:Sora App!是什麼?可下載?_img_1

OpenAI擅長將技術與宏大甚至帶有哲學意味的願景連結,在其官方論述中,Sora 2不只是單純模型進化,或者提升生產力的工具,而是邁向AGI的關鍵一步。

OpenAI宣稱,通用世界模擬器和機器人Agent將從根本上重塑社會,而Sora將為世界帶來「喜悅、創造力和連結」。他們沒有著墨在提升生產力上,而是探索人類想像力的邊界,聽來更為崇高。

相比之下,Google的論述則非常務實,Veo 3的價值被牢牢地錨定在創作者生態系中,希望讓創作者們擁有更強大的武器、更高效地產出內容。

至於Sora應用程式,則要回到兩間公司所處的位置。

Google的商業模式和動輒破十億的產品,決定了其AI模型的整合方式鑲嵌與賦能,讓現有帝國更強大。但OpenAI在消費端與企業端一直像座孤島,沒有辦法串連資料,更缺乏原生的接觸點。

因此,它需要拋出願景、包裝產品以便打動市場,這次切入社群媒體,也是主動創造消費者入口的挑戰。

雖然如同OpenAI幾位工程師所說,內部試用時,的確感受到生成式社交的趣味,但想要維繫與親友真實連結,或者追蹤意見領袖優質內容,又或者單純需要有趣內容打發時間的使用者,真的會想要利用AI,生成與親友的互動影片嗎?目前還無法輕易斷言,Sora App究竟能夠提供哪些無可替代的價值。

OpenAI同時推進模型與消費者端產品的進度。OpenAI YouTube直播。

OpenAI同時推進模型與消費者端產品的進度。OpenAI YouTube直播。

除了策略以外,OpenAI在溝通層面的高明之處也值得關注。他們擅長定義的修辭,將Sora 2的發布稱為影片生成的GPT─3.5時刻,巧妙地運用自家成功的IP,替新產品的市場地位一錘定音。

同時,OpenAI也擅長從反面視角切入,當所有企業都在強調AI模型的能力時,OpenAI卻強調Sora 2能模擬「失手的投籃」,並稱「模擬失敗的能力極其重要」,雖然仍然在講物理擬真度,但表述方式顯得更為深刻。

最重要、也最關鍵的,或許是自曝其短的真誠。《AI霸主》作者奧森(Parmy Olson)指出,OpenAI執行長奧特曼(Sam Altman)非常擅長主動提及AI的潛在危害,藉此降低外界的敵意,建立一種「我們知道問題所在,並正在努力解決」的真誠形象。

此次Sora App的發布,團隊也主動探討社交媒體帶來的危害,並試圖提出解方。人們想到負責任的AI、提倡監管AI時,很容易想起奧特曼的臉龐,卻忘記他同時呼籲不該過度監管AI,或者在社群媒體上暗示,AI情感依附的風險或許並沒有被想像得那麼嚴重。

OpenAI與奧特曼的宣傳與包裝策略,一直是產業觀察者津津樂道的案例。在Google、Anthropic等強敵環伺之下,他們仍能遊走於微軟、NVIDIA甚至政治人物之間,並持續成功募資。即使暫且不談技術演進,僅憑這套成熟的商業操作手法,OpenAI也已是值得關注的公司之一。

憑藉顛覆性的願景與靈活的溝通手腕,OpenAI試圖在巨頭的包圍中開闢新大陸。AI大戰早已超越單純的技術軍備競賽,邁向敘事框架、商業模式與生態系布局的全面戰爭。

你可能也喜歡

科技股入場須知 一次掌握市場動態
數位專題

科技股入場須知 一次掌握市場動態

科技股投資日益成為趨勢,投資人瞭解市場動態成關鍵。近日《黃仁勳傳》作者史帝芬・維特訪台,在與張善政的對談中揭示輝達在桃園建立新總部如何彰顯台灣在全球半導體產業中的地位,與旺宏電子吳敏求一同解析台灣

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務