今年年初的科技圈,空氣中還瀰漫著DeepSeek掀起的騷動。這家來自中國的AI新創,以顛覆性的姿態闖入全球視野,其模型不僅性能卓越,訓練成本更是低到令人咋舌,應用程式也一度登頂應用程式排行榜。半年過去,當初的衝擊波逐漸平息,DeepSeek的光環是否依舊?
在中美科技對抗的背景下,川普稱呼DeepSeek的崛起,是對美國企業的一記警鐘,矽谷創投a16z創辦人安德森(Marc Andreessen)更稱DeepSeek的崛起為AI競賽中的「史普尼克時刻」(Sputnik moment)。
DeepSeek究竟是曇花一現的挑戰者,還是在巨頭環伺的格局中找到了自己的生存之道?
答案並非黑白分明,它的故事已不再是驚心動魄的突襲,現在更像一場一場關於技術、市場與地緣政治的長跑。
DeepSeek讓企業紛紛將模型地端化
DeepSeek的影響力並未消散,而是從引發市場恐慌的表層,逐漸滲透到產業深處。
「若要說影響力,我認為它(DeepSeek)不像年初那麼大。」台灣AI新創亞太智能機器(APMIC)創辦人吳柏翰認為,市場的激情已經冷卻。
然而,他話鋒一轉,指出DeepSeek更深遠的貢獻:「它做到『推理模型地端化』這件事,讓大家都能夠實現。」
因為DeepSeek的開源,讓AI技術更加民主化,企業找到花費鉅資調用OpenAI、Google的API以外,能夠在地端部署模型的替代選擇。
吳柏翰分析,「過去要訓練一個具備良好邏輯能力的COT(Chain-of-Thought)模型,對資料量的要求大概要到幾十萬筆。(DeepSeek)之後就只需要約一萬筆資料。」
對資源有限的中小企業與垂直領域的創新者來說,DeepSeek的意義在於,能夠以可負擔的成本,打造專屬於自己的行業AI。
這股力量,在開源社群的版圖變遷中有著清晰印證。
根據Artificial Analysis發布的《2025上半年AI採用調查》,DeepSeek在開源LLM領域的使用率,從2024年的0%,大幅攀升至53%,一舉反超了長期的領導者Meta Llama系列。
AI大師吳恩達(Andrew Ng)也評論,當美國頂尖公司還在為其閉源模型的獨門秘方爭搶人才時,中國的AI生態圈正在上演一場殘酷的場達爾文式的生死之爭。
他形容,DeepSeek、月之暗面(Kimi模型)、阿里巴巴(通義千問模型)、智譜AI(GLM模型)等中國公司,在激烈的市場競爭中互相壓價、開源模型、爭搶客戶,這種殘酷的淘汰賽雖然會讓許多參與者倒下,但也淬鍊出極具戰鬥力的強者。
There is now a path for China to surpass the U.S. in AI. Even though the U.S. is still ahead, China has tremendous momentum with its vibrant open-weights model ecosystem and aggressive moves in semiconductor design and manufacturing. In the startup world, we know momentum…
— Andrew Ng (@AndrewYNg) July 31, 2025
晶片禁令讓DeepSeek施展不開
只是,在開源世界高奏凱歌的同時,兩道無形的枷鎖正緊緊束縛著DeepSeek。
「我們面臨的問題從來不是錢,而是高端芯片被禁運。」其創辦人梁文鋒接受《36氪》受訪時的一句話,便提及DeepSeek的困境。
本月(9),DeepSeek在國際頂級期刊《自然》上發表的論文,提到其早期模型依賴NVIDIA H800晶片,更首次承認在研發初期曾使用過已被禁運的、更為強大的A100晶片。
隨著美國政府收緊AI晶片出口,讓DeepSeek的發展更為不利。
面對封鎖,DeepSeek也有應對之策。在其8月發布的V3.1模型中,就有針對下一代中國國產晶片,提出不同的精度格式(UE8M0 FP8),可以看出DeepSeek試圖在美國畫下的科技壁壘之外,開闢出新的算力路徑。
與此同時,信任鴻溝也不斷加深。
從年初加拿大資安公司揭露其程式碼潛藏後門的疑慮,到近期《華盛頓郵報》引述CrowdStrike的研究,指其模型在替自稱來自台灣、西藏、法輪功和伊蘭國的使用者撰寫程式碼時,成果會有更多漏洞,讓西方用戶的疑慮與日俱增。
Artificial Analysis同一份調查報告也顯示,全球用戶過半數只願意在「非中國基礎設施」上使用中國模型;與OpenAI齊名的Anthropic也在本月發表針對中國企業的禁止銷售令,徹底將中美AI戰爭的不信任檯面化。
不過,面對外部的圍堵與內部的壓力,DeepSeek仍持續向前。
根據彭博社報導,梁文鋒已親自下達指令,要求團隊在2025年底前推出能夠自主完成多步驟複雜任務,如規劃行程、撰寫程式碼的AI Agent系統。這一戰略目標直指OpenAI、微軟等全球領導者的核心戰場。
回頭審視DeepSeek近期的技術路線,可以看出公司針對AI Agent的佈局。
DeepSeek在R1模型之後,並未急於推出另一款轟動市場的基礎模型,而是專注持續改善V3系列,尤其是在JSON格式輸出、函數調用等與工具整合、任務自動化息息相關的功能。
這些看似微小的迭代,都是在為更廣大的AI代理生態打下基礎。
DeepSeek還熱門嗎?或者已過時?
那麼,回到最初的問題:一年之後,DeepSeek的聲勢究竟是盛是衰?
答案是,也不是。
它不再是憑藉低價奇襲華爾街的黑天鵝,而是進化為一個在開源領域深刻影響開發者生態的重要玩家。
DeepSeek向世界證明,在這場資本與算力的豪門遊戲裡,還存在一條以開源和極致效率為核心的另一條路。
然而,前方的道路依舊險阻重重。晶片禁令仍扼住其發展咽喉,而信任的鴻溝則是其全球化之路上難以迴避的挑戰。
DeepSeek的未來,不僅取決於中國國產晶片能否撐起其技術野心,更要看它能否在日益分裂的世界中,找到重建信任之道。
半年前的史普尼克時刻已成過往,DeepSeek當下所在的戰場,更加考驗智慧與耐力。它的浮沉,仍是觀察全球AI權力版圖演變的最佳櫥窗。