經過漫長的等待及炒作,OpenAI終於推出的GPT-5顯然距離「通用人工智慧」還有大幅落差。這次產品更新,對OpenAI及人工智慧的前景有何意義?研究團隊認為要達到AGI,還有哪些關卡得克服?
在中國開源模型連發、Anthropic及Google搶先推出表現亮眼的前沿模型夾擊下,OpenAI在八月更新外界期待已久的「GPT-5」,作為旗艦產品ChatGPT的基礎系統。
自GPT-4發布以來,兩年間OpenAI持續追求「通用人工智慧」(AGI)之夢,不僅成功吸引巨額投資,也逼著業界朝向更先進的「超智慧」前進。
稍早,OpenAI執行長奧特曼(Sam Altman)在訪談中描述自己使用GPT-5的經驗,宣稱新系統完美回答了自己無法回答的問題,令他感覺「這一刻到來了」,「在這件事上,我感覺自己比不上AI。」
這番言論及其他跡象,誘導外界預期即將發布的新模型,可能是朝向相當人類智慧水平的人工智慧的一大躍進。OpenAI直接宣布已經達陣,似乎也不無可能。
然而,最終發布的模型與其說是技術突破,不如說是產品優化。GPT-5最大的特色是結合原先的主模型與o系列的推理模型,使用者不再需要手動選取模型,ChatGPT可以使用新開發的自動切換器,根據指令性質為用戶挑選適合的模型提供服務。
這對沒有緊跟模型能力發展的使用者來說,是簡化使用者體驗的一大福音。但對於已經養成精準選用模型習慣的重度用戶來說,觸發推理能力的門檻不明,輸出的模型不再透明,也引來反彈聲音。對此,OpenAI已表示將改善UI,並提升GPT-5選用模型的準確度。
這次更新,也是OpenAI首度向免費用戶開放推理模型。加上API價格亦有顯著調降,可見得運行推理模型的成本降低,以及OpenAI透過此舉鞏固市場、擴大實際應用的策略意味。
比起GPT-5,2024年發布的推理強化模型o1可能是更大的技術突破。GPT-5在AGI基準測試ARC-AGI-2上,也輸給近期亦開放免費使用的Grok 4。GPT-5在整體綜合表現及使用者體驗上有所提升,但難以匹配近期持續炒作的變革性熱度。
推理能力尚待完善,學習、創新力亦是AGI指標
奧特曼表示,公司依然持續前進AGI,即使他「有點討厭AGI這個詞,因為每個人現在都用以指涉不太一樣的事物。」他承認,目前GPT-5還無法從發現的新事物中學習,「對我來說,這是AGI應該具有的能力。」
七月底時,主導OpenAI研究的研究總監陳信翰(Mark Chen)與推理模型的主要推手、首席科學家帕喬基(Jakub Pachocki)接受《MIT科技評論》(MIT Technology Review)專訪,也分享了他們對AGI的想法。
帕喬基特別關注自動化研究、協助科學家開發新技術的前景。陳信翰則指出,模型可以自主工作的時間是一大指標;這指的是模型可以自行推進任務進展,而不會陷入死路的時間長度。
目前構成前沿模型的一大基石是所謂的「推理」能力。這讓模型能夠將困難、複雜的問題拆解成較可應付的小步驟,但這依然不是一般人類具備的推理能力。例如,模型依然無法將自己擁有的龐大知識體,做出有效率的連結。
帕喬基認為,「我們可能還處在推理典範的初步階段。」OpenAI正在研究如何讓模型可以進行長期學習、探索,並產生新的想法。陳信翰並直言,「我們絕對還沒有解決推理問題。」
AGI宣傳可能放緩?現實應用還有龐大潛力
開發GPT-5的坎坷歷程及延宕,顯示基礎模型能力的下一次大躍進可能得來不易。靠著拉升訓練數據與算力來提升模型表現的「擴展定律」(scaling laws)依然重要,但不是唯一或最關鍵的考量因素。
前進先進人工智慧的下一段路程,可能會看見更多在價格、效能、產品體驗等面向的綜合性改善。這不如AGI論述來得刺激有趣,但可能對深化現實應用更有幫助。
艾倫人工智慧研究所(AI2)AI科學家蘭伯特(Nathan Lambert)預期,模型在基準測試上的能力進展會稍微放緩,但在效能表現上還沒有出現明顯的瓶頸。較容易催生能力跳躍的低垂果實已摘完,但也有新工具可以協助持續推進前沿研發。
如OpenAI營運長萊特卡普(Brad Lightcap)表示,AGI應具備推理、思考、解決問題與使用工具等能力,且能學習新事物、提出新想法,因而現在的系統還稱不上是AGI。但他也認為,即使OpenAI現在停止研發,以現有的模型能力等級,也還有大量新產品、新的應用方式等著被開發利用。