GPT-4.5高貴但好用？優缺點實測揭曉

郭宇璇

郭宇璇

2025-03-06

瀏覽數

OpenAI上週發布最新模型GPT-4.5，回答幻覺更少、更有人味。遠見編輯部製作，來源：X@OpenAI

00:00

OpenAI上週發布最新模型GPT-4.5，號稱是目前OpenAI最大、最好的模型。GPT-4.5的回答幻覺更少、更有人味，但代價是API費用相當驚人。究竟外界對其評價如何？不少人實測後，指它的優點與缺點都挺明顯。

GPT-4.5是OpenAI 2月27日發布的最新模型，是目前OpenAI推出的最大模型，其所掌握的知識更多、更能理解使用者的需求，答案出現幻覺的情況也較其他模型少。此外，OpenAI也表示，GPT-4.5在美學與創意方面表現出色，擅長與寫作和設計有關的任務。

OpenAI最初發布GPT-4.5時，僅開放訂閱Pro方案的會員率先體驗，6日起陸續擴大至其他方案的會員。此外，GPT-4.5的API現已開放，價錢為每輸入一百萬個tokens 75美元、每輸出一百萬個tokens 150美元，比4o的2.5美元和10美元貴了數十倍以上。

GPT-4.5優點：情商高，回答更有人味

比起先前OpenAI發布推理模型o1、o3-mini時，總會強調模型對數學、程式等複雜問題的優秀表現，此次GPT-4.5的亮點則在於其更有「人味」，能細膩地解讀使用者訊息中的隱含線索，在回答中展現高情商。

OpenAI執行長奧特曼（Sam Altman）在X上表示，GPT-4.5是第一個讓他感覺像「在與一個有深思熟慮的人交談」的模型，並且數次驚訝於AI竟然能提供真正有價值的建議。

GPT-4.5 is ready!

good news: it is the first model that feels like talking to a thoughtful person to me. i have had several moments where i've sat back in my chair and been astonished at getting actually good advice from an AI.

bad news: it is a giant, expensive model. we…
— Sam Altman (@sama) February 27, 2025

OpenAI的官網上分享了一個實測，使用者告訴GPT-4.5和4o「考試失敗後，我經歷了一段艱難的時期。」並比較兩者回應。結果發現，4.5先表達同理、鼓勵使用者，接著進一步詢問使用者是否想討論更多細節，或者只是想轉換心情；相較之下，4o直接列點給出六項建議，而沒有進一步關心使用者。

GPT-4.5相較於其他模型，回答更有人味。截自OpenAI官網

有網友實測GPT-4.5，請它畫一台車的SVG向量圖。GPT-4.5除了畫出一台藍色的車之外，也附加了一句幽默的話：「這輛SVG車不會啟動，除非你找到SVG汽油。」貼文作者認為，它的幽默很自然，感覺不做作也不敷衍。

gpt4.5 is naturally funny, it doesn't feel forced or slop. pic.twitter.com/QalyV5D4Js
— adi (@adonis_singh) February 28, 2025

GPT-4.5缺點：速度慢、價錢貴

知名科技部落客威利森（Simon Willison）也實測了請GPT-4.5畫向量圖，結果它花了112秒，才完成一張「鵜鶘騎腳踏車」的圖片，顯示「速度慢」是目前大模型無可避免的缺點。

另一位部落客古普塔（Mehul Gupta）則在其文章中表示GPT-4.5「很糟糕」，不值得為其付錢。他整理了國外論壇Reddit網友對GPT-4.5的評價，有人形容其是「在同一輛舊車上刷了一層閃亮的新油漆」，雖然模型的規模變大、API價錢貴了數十倍，但使用者的體驗沒有明顯改變。

這或許是因為，GPT-4.5並非OpenAI嘗試尖端技術的模型。根據外媒《The Verge》報導，OpneAI最初在其介紹文件中表示「GPT-4.5不是一個前沿模型（frontier model）」，其並未引進最新的技術，在多項測試中的表現也不比已推出的推理模型o1、o3-mini優秀。而後OpenAI在更新的文件中刪除了這段文字。

在OpenAI目前的GPT-4.5介紹文件中，則強調了GPT-4.5與o1等推理模型定位不同。其說明了AI發展的兩個軸線：非監督式學習（unsupervised learning）和推理（reasoning），GPT-4.5作為前者的代表，與推理模型互補，以全面提升AI的能力。