Sora App是什麼？竟讓奧特曼來台北逛街？怎麼用？

這週，台灣社群瘋傳各種OpenAI執行長奧特曼在台北逛街，吃美食的偽AI短影音！原來都是Sora App做出來的。以ChatGPT定義AI產品的OpenAI，在輝達黃仁勳宣布投資加持後，發展也神速。台灣時間今日（10/1）正式釋出第二代影音生成模型Sora 2，同時推出獨立社交應用程式「Sora App」，主打讓消費者以AI生成的影音彼此交流，直搗直接面向消費者的社群媒體腹地。Sora 2有哪些更新？Sora是否能開創AI新社群媒體？Sora 2對比Google Veo 3又有哪些特色？《遠見》一文帶您看。

左打Google Veo 3，Sora 2強調遵循物理法則和連貫性

「Sora 2開啟了我們進入影音的GPT─3.5時刻。」這是OpenAI內部描述第二代影音生成模型Sora 2，賦予它的高度。

OpenAI研究科學家、Sora負責人比爾（Bill Peebles）指出，對比前一代Sora 1，Sora 2生成的影音，有三大升級：更加貼近物理法則、生成內容可以影音同步、可控性與敘事連貫性大幅提升。

比爾在OpenAI的直播中提到，Sora 2大幅提升了對物理世界的理解，不像Sora 1會為了完成指令扭曲現實。

舉例來說，利用Sora 1生成籃球影片時，倘若球員投籃沒有命中籃筐，下一幕可能會是籃球違背現實，瞬間移動進入籃筐。但在Sora 2中，球會真實地從籃板反彈。

比爾另外提到，Sora 2更擅長處理複雜且動態的場景，例如奧運體操動作、在滑水板上後空翻等，代表這款模型從單純生成影音，進化為更加貼近現實世界運作邏輯的模擬器（simulator）。

另外，Sora 2和Google的Veo 3一樣，將宣傳重點放在同時生成影片與音訊，可以產出包含多語言對話、環境音與音效的完整場景，對專業創作者來說，有望大幅降低後製配音的門檻，也提升AI生成內容的沉浸感。

最後，同樣與Veo 3相似的是，Sora 2大幅加強使用者的可控性（controllability）和敘事連貫性。Sora 2能夠更加精準遵循複雜指令，一次性生成包含多個鏡頭，但又能記得故事或場景的整體狀態，解決過往模型難以維持敘事連貫性的痛點。

除了上述三大進化以外，比爾也補充，Sora 2另外增加名為客串（Cameo）的新功能，使用者可以上傳一段短片，接著將其中出現的人物與角色鑲嵌進利用Sora 2生成的影片中。「它的運作原理是觀察任何一段短片，⋯⋯模型能夠深入理解它，接著將其加到提示裡，就好像它只是另一個文字標籤一樣。」

利用Sora 2生成OpenAI執行長奧特曼的影片片段。Sora

右踢臉書、抖音，Sora App已可在美加地區下載

如果說Sora 2是技術彈藥，另推出的Sora App則是嘗試將這些技術彈藥轉化為面向消費者的新入口。

目前OpenAI已提供Sora App的下載網址：https://openai.com/zh-Hans-CN/sora/ 但目前先開放美國與加拿大地區，尚未開放台灣地區下載。

這款App的介面與互動與其他影音平台如TikTok相似，同樣強調短影音和演算法推薦，但核心規則卻有著極大差異：它是一個純AI內容創作的封閉平台。

Sora工程團隊的工程師湯瑪斯（Thomas Dimson）表示，Sora應用程式的所有內容都將由AI生成，「它不是由機器人發布的，而是由人類發布的，但全部都是 AI 生成的。它給人一種非常、非常有趣的感覺。」

不過，人們使用Sora應用程式，彼此查看對方利用AI生成的內容，真的有吸引力嗎？在一個真實生活內容飽和的時代，一個完全由AI生成影片構成的平台，真的能吸引用戶並培養出真實的人際連結嗎？

有趣的是，這個疑慮，就連OpenAI團隊自己也曾有過。

湯瑪斯坦承，最初執行專案時，也曾懷疑過利用AI生成的動態消息，是否會讓使用者與真實的人際關係脫節。

然而，團隊的疑慮在運用Sora 2的客串功能（Cameo）後，便煙消雲散。

「它感覺像是一種新的媒介，一種與朋友聯繫的新方式。」湯瑪斯解釋，擁有客串功能以後，瀏覽動態消息時的心態完全不同，不再只是被動觀看，而是會主動思考，會如何將自己或者其他人加入到影片裡，操作模式有著很大的變化。

「我們注意到，隨著時間推移，很多社群媒體總體上已經偏離了朋友和家庭聯繫的理念。」因為AI讓創作變得更加容易，他認為從人們在創作同時與親友交流的角度出發，有機會吸引到使用者。

比爾更將Sora應用程式的體驗形容為「幾乎像是一種新的訊息形式」，強調與朋友共同體驗的重要性。官方部落格也提到，內部測試時，員工們普遍回饋「Cameo是讓這一切感覺與眾不同且有趣的關鍵」，甚至有同事因此在公司內結交了新朋友。

第二屆遠見ESG醫療永續獎說明會現正報名中>>詳細報獎方式、獲獎亮點分析

Sora App已經開放iOS用戶下載，Android版則尚未推出。取自App Store

對OpenAI而言，Sora App的吸引力核心，並非AI內容本身的光怪陸離，而是如何藉著客串功能，將這些虛構場景，轉化為用戶與朋友之間個人化表達、互動與共同創作的畫布。他們押注的是，當創作的門檻趨近於零時，這種新形態的「生成式社交」將能回歸社群媒體的初衷，以一種前所未有的趣味方式，重新拉近人與人之間的距離。

為了確保用戶安全與控制權，Sora App設計了詳盡的權限系統，用戶可決定誰能使用自己的形象客串，也可以隨時撤銷或刪除相關影片。

在平台哲學上，Sora App強調創作而非消費內容。透過「混音」（Remix）功能鼓勵二次創作，演算法也優先推薦來自朋友的內容，意圖建立一個以人際連結為核心、避免末日滾動（doomscrolling）的健康社群。

技術趨同、回歸生態系，OpenAI的願景牌是否能夠持續吸睛？

若將Sora 2與Google Veo 3並列檢視，可以發現，在技術領域上，雙方正朝著同樣的終點線奔馳；但在商業與生態系的棋盤上，他們卻走上了截然不同的道路。

首先，兩者側重的模型進化重點幾乎如出一轍。

OpenAI在Sora 2中強調的增強可控性、透過模擬貼近真實世界、遵循物理法則（the laws of physics），與Google Veo 3的方向重疊。

Google DeepMind產品副總裁柯林斯（Eli Collins）在介紹Veo 3時便明確指出，模型對物理世界的理解更深入、創作者最需要讓模型能精準貼近構想的可控性；另外，整合原生音訊、更自然的動態模擬，也沒有任何差異。

畢竟，世界模型、多模態、高擬真度，本就是通往更強大AI的必經路徑。

然而，技術的趨同，反而凸顯了OpenAI和Google手握資產的巨大分歧。

Sora App是什麼？竟讓奧特曼來台北逛街？怎麼用？_img_1

OpenAI擅長將技術與宏大甚至帶有哲學意味的願景連結，在其官方論述中，Sora 2不只是單純模型進化，或者提升生產力的工具，而是邁向AGI的關鍵一步。

OpenAI宣稱，通用世界模擬器和機器人Agent將從根本上重塑社會，而Sora將為世界帶來「喜悅、創造力和連結」。他們沒有著墨在提升生產力上，而是探索人類想像力的邊界，聽來更為崇高。

相比之下，Google的論述則非常務實，Veo 3的價值被牢牢地錨定在創作者生態系中，希望讓創作者們擁有更強大的武器、更高效地產出內容。

至於Sora應用程式，則要回到兩間公司所處的位置。

Google的商業模式和動輒破十億的產品，決定了其AI模型的整合方式鑲嵌與賦能，讓現有帝國更強大。但OpenAI在消費端與企業端一直像座孤島，沒有辦法串連資料，更缺乏原生的接觸點。

因此，它需要拋出願景、包裝產品以便打動市場，這次切入社群媒體，也是主動創造消費者入口的挑戰。

雖然如同OpenAI幾位工程師所說，內部試用時，的確感受到生成式社交的趣味，但想要維繫與親友真實連結，或者追蹤意見領袖優質內容，又或者單純需要有趣內容打發時間的使用者，真的會想要利用AI，生成與親友的互動影片嗎？目前還無法輕易斷言，Sora App究竟能夠提供哪些無可替代的價值。

OpenAI同時推進模型與消費者端產品的進度。OpenAI YouTube直播。

除了策略以外，OpenAI在溝通層面的高明之處也值得關注。他們擅長定義的修辭，將Sora 2的發布稱為影片生成的GPT─3.5時刻，巧妙地運用自家成功的IP，替新產品的市場地位一錘定音。

同時，OpenAI也擅長從反面視角切入，當所有企業都在強調AI模型的能力時，OpenAI卻強調Sora 2能模擬「失手的投籃」，並稱「模擬失敗的能力極其重要」，雖然仍然在講物理擬真度，但表述方式顯得更為深刻。

最重要、也最關鍵的，或許是自曝其短的真誠。《AI霸主》作者奧森（Parmy Olson）指出，OpenAI執行長奧特曼（Sam Altman）非常擅長主動提及AI的潛在危害，藉此降低外界的敵意，建立一種「我們知道問題所在，並正在努力解決」的真誠形象。

此次Sora App的發布，團隊也主動探討社交媒體帶來的危害，並試圖提出解方。人們想到負責任的AI、提倡監管AI時，很容易想起奧特曼的臉龐，卻忘記他同時呼籲不該過度監管AI，或者在社群媒體上暗示，AI情感依附的風險或許並沒有被想像得那麼嚴重。

OpenAI與奧特曼的宣傳與包裝策略，一直是產業觀察者津津樂道的案例。在Google、Anthropic等強敵環伺之下，他們仍能遊走於微軟、NVIDIA甚至政治人物之間，並持續成功募資。即使暫且不談技術演進，僅憑這套成熟的商業操作手法，OpenAI也已是值得關注的公司之一。

憑藉顛覆性的願景與靈活的溝通手腕，OpenAI試圖在巨頭的包圍中開闢新大陸。AI大戰早已超越單純的技術軍備競賽，邁向敘事框架、商業模式與生態系布局的全面戰爭。