OpenAI上週發布最新模型GPT-4.5,號稱是目前OpenAI最大、最好的模型。GPT-4.5的回答幻覺更少、更有人味,但代價是API費用相當驚人。究竟外界對其評價如何?不少人實測後,指它的優點與缺點都挺明顯。
GPT-4.5是OpenAI 2月27日發布的最新模型,是目前OpenAI推出的最大模型,其所掌握的知識更多、更能理解使用者的需求,答案出現幻覺的情況也較其他模型少。此外,OpenAI也表示,GPT-4.5在美學與創意方面表現出色,擅長與寫作和設計有關的任務。
OpenAI最初發布GPT-4.5時,僅開放訂閱Pro方案的會員率先體驗,6日起陸續擴大至其他方案的會員。此外,GPT-4.5的API現已開放,價錢為每輸入一百萬個tokens 75美元、每輸出一百萬個tokens 150美元,比4o的2.5美元和10美元貴了數十倍以上。
GPT-4.5優點:情商高,回答更有人味
比起先前OpenAI發布推理模型o1、o3-mini時,總會強調模型對數學、程式等複雜問題的優秀表現,此次GPT-4.5的亮點則在於其更有「人味」,能細膩地解讀使用者訊息中的隱含線索,在回答中展現高情商。
OpenAI執行長奧特曼(Sam Altman)在X上表示,GPT-4.5是第一個讓他感覺像「在與一個有深思熟慮的人交談」的模型,並且數次驚訝於AI竟然能提供真正有價值的建議。
GPT-4.5 is ready!
— Sam Altman (@sama) February 27, 2025
good news: it is the first model that feels like talking to a thoughtful person to me. i have had several moments where i've sat back in my chair and been astonished at getting actually good advice from an AI.
bad news: it is a giant, expensive model. we…
OpenAI的官網上分享了一個實測,使用者告訴GPT-4.5和4o「考試失敗後,我經歷了一段艱難的時期。」並比較兩者回應。結果發現,4.5先表達同理、鼓勵使用者,接著進一步詢問使用者是否想討論更多細節,或者只是想轉換心情;相較之下,4o直接列點給出六項建議,而沒有進一步關心使用者。
有網友實測GPT-4.5,請它畫一台車的SVG向量圖。GPT-4.5除了畫出一台藍色的車之外,也附加了一句幽默的話:「這輛SVG車不會啟動,除非你找到SVG汽油。」貼文作者認為,它的幽默很自然,感覺不做作也不敷衍。
gpt4.5 is naturally funny, it doesn't feel forced or slop. pic.twitter.com/QalyV5D4Js
— adi (@adonis_singh) February 28, 2025
GPT-4.5缺點:速度慢、價錢貴
知名科技部落客威利森(Simon Willison)也實測了請GPT-4.5畫向量圖,結果它花了112秒,才完成一張「鵜鶘騎腳踏車」的圖片,顯示「速度慢」是目前大模型無可避免的缺點。
另一位部落客古普塔(Mehul Gupta)則在其文章中表示GPT-4.5「很糟糕」,不值得為其付錢。他整理了國外論壇Reddit網友對GPT-4.5的評價,有人形容其是「在同一輛舊車上刷了一層閃亮的新油漆」,雖然模型的規模變大、API價錢貴了數十倍,但使用者的體驗沒有明顯改變。
這或許是因為,GPT-4.5並非OpenAI嘗試尖端技術的模型。根據外媒《The Verge》報導,OpneAI最初在其介紹文件中表示「GPT-4.5不是一個前沿模型(frontier model)」,其並未引進最新的技術,在多項測試中的表現也不比已推出的推理模型o1、o3-mini優秀。而後OpenAI在更新的文件中刪除了這段文字。
在OpenAI目前的GPT-4.5介紹文件中,則強調了GPT-4.5與o1等推理模型定位不同。其說明了AI發展的兩個軸線:非監督式學習(unsupervised learning)和推理(reasoning),GPT-4.5作為前者的代表,與推理模型互補,以全面提升AI的能力。