Anthropic剛發布的Opus 4.7模型威力強大,Claude Code的聲勢更是力壓Codex與Gemini,逼得Google DeepMind再度成立「突擊隊」救急,就連Google創辦人布林,都決定親自下場督軍。過去曾在AlphaFold、Gemini等專案大放異彩,只在關鍵時刻組成的突擊隊究竟是什麼?
Google DeepMind最近又組了一支新的「突擊隊」(strike team)。
根據《The Information》報導,新成立的突擊隊集中火力,希望增加AI模型的程式碼撰寫工作,並聚焦長時間的開發任務,例如撰寫一套新的軟體、閱讀多個檔案、理解使用者意圖,接著完成程式。
自2022年底OpenAI開放大眾使用ChatGPT、掀起新一波AI浪潮後,隔年便回歸辦公室的Google共同創辦人布林(Sergey Brin),也參與這支突擊隊。
Google DeepMind技術長暨首席AI架構師武庫格魯(Koray Kavukcuoglu)也在名單內,帶隊者則是先前負責模型預訓練的研究工程師博吉奧(Sebastian Borgeaud)。
布林在內部備忘錄裡寫道:「若想在最後衝刺中勝出,當務之急是跨越自主執行能力的鴻溝,並使模型蛻變為程式碼開發的核心戰力。」
不過,具體來說,Google DeepMind的突擊隊如何運作?

平時發散研究,關鍵時刻換檔
在即將出版的《無限機器》中,作者馬拉比(Sebastian Mallaby)仔細梳理哈薩比斯(Demis Hassabis)的成長故事,以及他如何一手組建DeepMind,其後又如何努力帶動團隊與OpenAI、Anthropic等對手競爭。
書中也鉅細靡遺地描述DeepMind在開發不同專案時曾遇上的瓶頸,以及最後如何克服挑戰、完成任務的歷程。其中,突擊隊便是DeepMind先前面臨重要時刻時,特別組成的任務編組。
接受《遠見》專訪時,馬拉比解釋,DeepMind長期並存兩種運作邏輯。
一種是由下而上的「藍天科學」(blue sky science),研究員可以自由探索、發表論文,沿著不同方向嘗試。另一種則是由上而下集中的「專案突擊隊」模式。
當哈薩比斯判斷某項技術已經成熟、只要投入更多資源就有機會打出決定性成果時,組織就會從前者切換到後者。
馬拉比指出,這其實就是哈薩比斯一路以來的「探索與開發」(exploration and exploitation),平時保留自由探索的空間,關鍵時刻再集中資源衝刺突破。
利用AI成功預測蛋白質結構、並且讓哈薩比斯得到諾貝爾獎的AlphaFold,可說是突擊隊的絕佳成功案例。
2018年,目標預測蛋白質結構的AlphaFold專案,在團隊的努力之下,已經能夠準確預測蛋白質結構中60%主要原子位置,若以預測蛋白質結構的重要國際評比「CASP競賽」衡量DeepMind的研發成果,已足以領先群雄。
然而,哈薩比斯並不滿意,他希望能將準確度提升到有如X光晶體學那樣精準。
影/紀錄片《The Thinking Game》詳細描述DeepMind如何打造出AlphaFold,破解生物學領域中重要的蛋白質結構預測難題。
2018年夏天,哈薩比斯毫無預警地走進蛋白質研究團隊,聽取進度報告之後,他出聲質疑。
後來和哈薩比斯共享諾貝爾獎桂冠的瓊珀(John Jumper)回憶,當時AlphaFold團隊的研究計畫,大略只是延續原本做法,結果哈薩比斯質問:「我們到底要不要解決這個問題?」
當時的團隊負責人席尼爾(Andrew Senior)反駁,他認為哈薩比斯設定的目標太難達成,而且,AlphaFold的既有表現,已經有望能在CASP競賽奪冠,恰好能夠替專案完美收尾。
然而,哈薩比斯卻不接受這個答案,因為他的野心不在於登上競賽榜首,他渴望完全解決蛋白質結構預測挑戰。
後來,隨著直接摺疊等新方向逐漸浮現成果,再加上CASP告捷,哈薩比斯決定將蛋白質研究團隊人數翻倍,並且轉為突擊隊模式,由瓊珀取代席尼爾,負責帶領團隊。
擴編後的團隊展開一場長達數月的黑客松,研究員圍在白板前推敲想法、快速測試各種演算法,再從眾多方向中收斂出最佳方案。瓊珀負責逐一檢視實驗結果,推動有潛力的方向繼續前進,若沒有成果也會及早收手。
這種先廣泛探索、接著集中開發最佳方案的方法,讓AlphaFold最終達成目標,這便是突擊隊模式火力全開的威力。
不論職位高低,只看能否改善結果
Google與其他企業開始大語言模型戰爭後,也不只一次組建突擊隊。
2023年夏天,Google DeepMind投入Gemini 1.5的預訓練與進階版本開發時,以及OpenAI在2024年9月預告將推出o1,在推理模型上搶先一步後,Google DeepMind都曾經啟動突擊隊。
雖然突擊隊會召集不同部門、不同職位的成員,但運作邏輯相當明確。
所有人都必須將精力集中在同一個模型或同一項任務上,不能同時參與其他專案;任何人都能提出改善方案並進行測試,但最後採用與否,只看是否真的能夠提升模型表現。
考量到算力資源珍貴,突擊隊也要求先小規模測試改善方案,再用統一標準評估結果,確認確實有效後,才會正式納入模型開發流程。
與OpenAI競爭推理模型表現時,突擊隊由沙澤爾(Noam Shazeer)與雷伊(Jack Rei)帶隊,原本只希望招募40名志願研究員,最後吸引150人報名。
不過,由於DeepMind和Google Brain合併,雙方的工作習慣不同,突擊隊由上而下的大規模協作,開始時並不順利,直到以模型表現為導向的制度開始發揮作用,團隊才逐漸站穩腳步。
馬拉比解釋,山景城的Google Brain不太具備由上而下的管理體制,非常熟悉由下而上的模式。相較之下,DeepMind保有由上而下指揮突擊隊的元素。所幸,隨著團隊合併日長,雙方文化差異逐漸縮小,這套做法也已成功融入向哈薩比斯匯報的Google團隊裡。
細究突擊隊的運作模式,不是單純徵調精英、集體加班,有明確的運作流程,以及高度一致的目標,還有只問結果不問提出想法者出身的判斷標準。這也是突擊隊能夠在壓力升高、日程緊迫時能夠發揮作用的原因。

如今,Google為了推升程式碼生成模型,再度組建突擊隊,背後的競爭壓力明顯。
若不論對外銷售、只看內部使用,Anthropic已把Claude Code整合進工程師的日常工作,甚至公開宣稱公司幾乎100%的程式碼都已使用AI。
對比之下,Google財務長今年2月表示,Google約有50%的程式碼由coding agent產出,兩者之間仍有不小差距。
接下來就看Google能否再次複製成功經驗,再一次透過突擊隊力挽狂瀾。