在傳統上崇尚開源研究(Open Source)交流的AI社群中,OpenAI、Anthropic等公司主張,閉源(Closed Source)較能防止模型遭到惡意濫用。這是壟斷市場的藉口,還是保障社會安全的妥協?在DeepSeek衝擊後,開源社群可能將如何發展?
在中國AI公司「深度求索」打入一劑強心針後,近來AI模型開源陣營相當活躍。
由出身Google、Apple及Meta等公司的工程師們主導的新AI平台「Oumi」在1月底啟動,目標是將AI模型及其資料完整開放給大眾,加速全球協作研發。目前已獲得麻省理工學院、普林斯頓、劍橋與牛津等13所名校支持。
Oumi is trending on GitHub 🤯
— Oumi (@Oumi_PBC) February 3, 2025
We’re blown away by the response we’ve received since launching last week and can’t wait to work with this community to build truly open AI.
The community is already so strong (@rsalakhu, @atalwalkar, @prfsanjeevarora, @svlevine, @AnimaAnandkumar,… pic.twitter.com/o33VigqLUo
在DeepSeek的啟示下,Oumi採取分散性進路。整合各大學校與研究機構的算力資源,在單一環境中提供一套完整打造、評估與部署基礎模型的工具包,讓研究人員們得以更透明、快速地推進AI研究。
艾倫人工智慧研究所(Ai2)與Mistral也同在1月30日釋出新的開源模型Tülu 3 405B以及Small 3 24B。其中Tülu 3 405B的能力比擬GPT 4o,卻高度開放,連訓練程式碼、數據也一併開源。
2月初,歐盟宣布「OpenEuroLLM」計畫。要打造一系列符合歐盟法規及價值觀的開放多語言LLM,協助歐洲企業擴大應用AI技術。雖然千萬等級歐元的預算較為保守,但在DeepSeek的成功基礎上,可聚焦於發展特化、垂直應用的AI模型。
就連閉源陣營領先者OpenAI的執行長奧特曼(Sam Altman)也在Reddit上承認,「我個人認為我們站在歷史上錯誤的一側,需要想出不同的開源策略。」但他也表示,公司內部對此意見分歧,開源也並非高度優先事項。
開源陣營一片活絡,但仍不乏戒慎聲音。例如,Google前執行長施密特(Eric Schmidt)與MakerMaker.AI共同創辦人阿裘達(Dhaval Adjodah)投書《華盛頓郵報》,對中國企業成為開源陣營領袖的現況表達憂心。
他們指出,美國在閉源模型上位居領先,但若要保持競爭力,就必須發展出活躍的開源生態系。
史丹佛大學教授吳恩達(Andrew Ng)亦直言,中國與美國在生成式人工智慧賽道上的差距已迅速縮小,「如果美國持續抑制開源,中國將會主導供應鏈的這一部分,許多企業最終將採用反映中國價值觀而非美國價值觀的模型。」
開放研究成果與保護本國競爭力之間的緊張關係難解。DeepSeek同時挑動中美、開閉源之間的競爭,更讓矛盾進一步激化。
低價、開源打開DeepSeek知名度
概地來說,開源指的是將程式碼開放給所有人使用與修改的軟體。在AI模型範疇中,幾項關鍵要件包括訓練數據、程式碼與權重。目前主流模型中,Meta、Mistral與近來大紅的DeepSeek屬於光譜中較開源的那端,OpenAI與Anthropic則位於較閉源那端。
DeepSeek、Llama等模型雖通稱開源,但並不符合最嚴格的開源條件標準。例如DeepSeek並未開源訓練資料與部分微調細節,研究員並無法完全完整知道模型是如何訓練出來的,但已足以讓大眾複製及部署模型自用。
開、閉源模式長期共存,之間也並非嚴格互斥。例如,許多團隊會在開源模型的基礎上,打造出更垂直、專精的模型,這樣的模型可能僅供企業內部自行應用,或是成為收費服務。
DeepSeek釋出權重、開出更低廉的取用成本,一方面大舉提振在西方的知名度,衝擊閉源模型供應商的商業模式,一方面也鼓勵更多應用百花齊放。開源平台Hugging Face上已有六百多個根據R1基礎打造的模型,許多企業也跟進建構自己的模型服務。
開源vs.閉源,國安與共好兩難全?
長期以來,開放研究成果讓各AI團隊得以互相交流,加速了人工智慧的整體進展。不僅DeepSeek的成就是築構在前人打下的基礎上,OpenAI的明星產品ChatGPT也是自Google內部的研究成果Transformer衍生而來。
這是開源陣營的主要論點。模型愈是開放,愈能促進社群協作與創新,透明度與可信賴度也較高。這可避免強大技術被少數科技巨頭壟斷,也能擴大技術採用規模與速度。著名創投家、科技樂觀主義者安德森(Marc Andreessen)認為,由多數人彼此檢查的開源進路,比政府監管更能有效保障AI安全。
但閉源支持者亦有其考量。例如,在2024年馬斯克與OpenAI的分歧走上法律訴訟一途時,同為知名創投家的柯斯拉(Vinod Khosla)便在X的交鋒中反問安德森「你會開放曼哈頓計劃嗎?」
柯斯拉指出,美、中正處於科技戰中,人工智慧是必須勝利的戰場。先進技術有如核武,開放細節有危及國家安全的風險。開源與否,成了國安的嚴肅問題。
將模型閉源,也能降低技術遭到惡意濫用的風險。就像軟體至今無法滴水不漏地防堵資安攻擊,模型也幾乎不可能完全擋掉越獄攻擊。閉源陣營代表Anthropic在此投注不少心力,但DeepSeek的安全漏洞似乎頗是令人憂心。
根據思科(Cisco)與賓州大學合作進行的安全風險評估,DeepSeek R1在面對50個意在生成有害回應的惡意指令時,沒有擋下任何一個。也就是在網路犯罪、錯誤訊息等有害行為測試下,攻擊DeepSeek的成功率是百分之百。
研究人員擔心,DeepSeek較低的訓練成本,可能表示在安全防護領域的成本也縮減。隨著更多企業引入DeepSeek模型,相關風險更加嚴重。
美中科技競賽加速,DeepSeek效應有待明朗
開源本就是新興競爭者挑戰閉源供應者既有市場地位的策略之一。開源策略的一大風險是獲利能力難有保障,但DeepSeek、Meta目前也都沒有靠大語言模型牟利的壓力。
DeepSeek殺入西方開源生態系,看似對經營已久的Meta造成威脅。但《彭博》分析,祖克柏(Mark Zuckerberg)是複製競爭者點子、並將之推進大眾市場的能手。從取自Snapchat的限時動態,到基本上借鏡Twitter架構的Threads,都是成功案例。如今DeepSeek也已開源,Meta料將能取用其成果,降低自家營運成本。
理論上,DeepSeek的決定能造福其他資本較有限的國家打造自己的AI模型。但美、中科技競賽也隨之加速。雙邊在人工智慧的合作上將更加受限,逐漸形成兩大AI世界陣營。夾在中間的國家們,也更加為難。