免費仔成GPT-5最大受惠者？OpenAI前進AGI之路不如預期

經過漫長的等待及炒作，OpenAI終於推出的GPT-5顯然距離「通用人工智慧」還有大幅落差。這次產品更新，對OpenAI及人工智慧的前景有何意義？研究團隊認為要達到AGI，還有哪些關卡得克服？

在中國開源模型連發、Anthropic及Google搶先推出表現亮眼的前沿模型夾擊下，OpenAI在八月更新外界期待已久的「GPT-5」，作為旗艦產品ChatGPT的基礎系統。

自GPT-4發布以來，兩年間OpenAI持續追求「通用人工智慧」（AGI）之夢，不僅成功吸引巨額投資，也逼著業界朝向更先進的「超智慧」前進。

稍早，OpenAI執行長奧特曼（Sam Altman）在訪談中描述自己使用GPT-5的經驗，宣稱新系統完美回答了自己無法回答的問題，令他感覺「這一刻到來了」，「在這件事上，我感覺自己比不上AI。」

這番言論及其他跡象，誘導外界預期即將發布的新模型，可能是朝向相當人類智慧水平的人工智慧的一大躍進。OpenAI直接宣布已經達陣，似乎也不無可能。

然而，最終發布的模型與其說是技術突破，不如說是產品優化。GPT-5最大的特色是結合原先的主模型與o系列的推理模型，使用者不再需要手動選取模型，ChatGPT可以使用新開發的自動切換器，根據指令性質為用戶挑選適合的模型提供服務。

這對沒有緊跟模型能力發展的使用者來說，是簡化使用者體驗的一大福音。但對於已經養成精準選用模型習慣的重度用戶來說，觸發推理能力的門檻不明，輸出的模型不再透明，也引來反彈聲音。對此，OpenAI已表示將改善UI，並提升GPT-5選用模型的準確度。

這次更新，也是OpenAI首度向免費用戶開放推理模型。加上API價格亦有顯著調降，可見得運行推理模型的成本降低，以及OpenAI透過此舉鞏固市場、擴大實際應用的策略意味。

比起GPT-5，2024年發布的推理強化模型o1可能是更大的技術突破。GPT-5在AGI基準測試ARC-AGI-2上，也輸給近期亦開放免費使用的Grok 4。GPT-5在整體綜合表現及使用者體驗上有所提升，但難以匹配近期持續炒作的變革性熱度。

推理能力尚待完善，學習、創新力亦是AGI指標

奧特曼表示，公司依然持續前進AGI，即使他「有點討厭AGI這個詞，因為每個人現在都用以指涉不太一樣的事物。」他承認，目前GPT-5還無法從發現的新事物中學習，「對我來說，這是AGI應該具有的能力。」

七月底時，主導OpenAI研究的研究總監陳信翰（Mark Chen）與推理模型的主要推手、首席科學家帕喬基（Jakub Pachocki）接受《MIT科技評論》（MIT Technology Review）專訪，也分享了他們對AGI的想法。

主導OpenAI研究的研究總監陳信翰。遠見資料庫，張智傑攝

帕喬基特別關注自動化研究、協助科學家開發新技術的前景。陳信翰則指出，模型可以自主工作的時間是一大指標；這指的是模型可以自行推進任務進展，而不會陷入死路的時間長度。

目前構成前沿模型的一大基石是所謂的「推理」能力。這讓模型能夠將困難、複雜的問題拆解成較可應付的小步驟，但這依然不是一般人類具備的推理能力。例如，模型依然無法將自己擁有的龐大知識體，做出有效率的連結。

帕喬基認為，「我們可能還處在推理典範的初步階段。」OpenAI正在研究如何讓模型可以進行長期學習、探索，並產生新的想法。陳信翰並直言，「我們絕對還沒有解決推理問題。」

開發GPT-5的坎坷歷程及延宕，顯示基礎模型能力的下一次大躍進可能得來不易。靠著拉升訓練數據與算力來提升模型表現的「擴展定律」（scaling laws）依然重要，但不是唯一或最關鍵的考量因素。

前進先進人工智慧的下一段路程，可能會看見更多在價格、效能、產品體驗等面向的綜合性改善。這不如AGI論述來得刺激有趣，但可能對深化現實應用更有幫助。

艾倫人工智慧研究所（AI2）AI科學家蘭伯特（Nathan Lambert）預期，模型在基準測試上的能力進展會稍微放緩，但在效能表現上還沒有出現明顯的瓶頸。較容易催生能力跳躍的低垂果實已摘完，但也有新工具可以協助持續推進前沿研發。

如OpenAI營運長萊特卡普（Brad Lightcap）表示，AGI應具備推理、思考、解決問題與使用工具等能力，且能學習新事物、提出新想法，因而現在的系統還稱不上是AGI。但他也認為，即使OpenAI現在停止研發，以現有的模型能力等級，也還有大量新產品、新的應用方式等著被開發利用。