Facebook Pixel
訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

GPT-4.5高貴但好用?優缺點實測揭曉

郭宇璇
user

郭宇璇

2025-03-06

瀏覽數 8,350+

OpenAI上週發布最新模型GPT-4.5,回答幻覺更少、更有人味。遠見編輯部製作,來源:X@OpenAI
OpenAI上週發布最新模型GPT-4.5,回答幻覺更少、更有人味。遠見編輯部製作,來源:X@OpenAI

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

OpenAI上週發布最新模型GPT-4.5,號稱是目前OpenAI最大、最好的模型。GPT-4.5的回答幻覺更少、更有人味,但代價是API費用相當驚人。究竟外界對其評價如何?不少人實測後,指它的優點與缺點都挺明顯。

GPT-4.5是OpenAI 2月27日發布的最新模型,是目前OpenAI推出的最大模型,其所掌握的知識更多、更能理解使用者的需求,答案出現幻覺的情況也較其他模型少。此外,OpenAI也表示,GPT-4.5在美學與創意方面表現出色,擅長與寫作和設計有關的任務。

OpenAI最初發布GPT-4.5時,僅開放訂閱Pro方案的會員率先體驗,6日起陸續擴大至其他方案的會員。此外,GPT-4.5的API現已開放,價錢為每輸入一百萬個tokens 75美元、每輸出一百萬個tokens 150美元,比4o的2.5美元和10美元貴了數十倍以上。

GPT-4.5優點:情商高,回答更有人味

比起先前OpenAI發布推理模型o1、o3-mini時,總會強調模型對數學、程式等複雜問題的優秀表現,此次GPT-4.5的亮點則在於其更有「人味」,能細膩地解讀使用者訊息中的隱含線索,在回答中展現高情商。

OpenAI執行長奧特曼(Sam Altman)在X上表示,GPT-4.5是第一個讓他感覺像「在與一個有深思熟慮的人交談」的模型,並且數次驚訝於AI竟然能提供真正有價值的建議。

OpenAI的官網上分享了一個實測,使用者告訴GPT-4.5和4o「考試失敗後,我經歷了一段艱難的時期。」並比較兩者回應。結果發現,4.5先表達同理、鼓勵使用者,接著進一步詢問使用者是否想討論更多細節,或者只是想轉換心情;相較之下,4o直接列點給出六項建議,而沒有進一步關心使用者。

GPT-4.5相較於其他模型,回答更有人味。截自OpenAI官網

GPT-4.5相較於其他模型,回答更有人味。截自OpenAI官網

【會員限定活動】想懂護國神山的背後?和《造山者》導演一起看見時代的選擇!立即報名>>

有網友實測GPT-4.5,請它畫一台車的SVG向量圖。GPT-4.5除了畫出一台藍色的車之外,也附加了一句幽默的話:「這輛SVG車不會啟動,除非你找到SVG汽油。」貼文作者認為,它的幽默很自然,感覺不做作也不敷衍。

GPT-4.5缺點:速度慢、價錢貴

知名科技部落客威利森(Simon Willison)也實測了請GPT-4.5畫向量圖,結果它花了112秒,才完成一張「鵜鶘騎腳踏車」的圖片,顯示「速度慢」是目前大模型無可避免的缺點。

另一位部落客古普塔(Mehul Gupta)則在其文章中表示GPT-4.5「很糟糕」,不值得為其付錢。他整理了國外論壇Reddit網友對GPT-4.5的評價,有人形容其是「在同一輛舊車上刷了一層閃亮的新油漆」,雖然模型的規模變大、API價錢貴了數十倍,但使用者的體驗沒有明顯改變。

這或許是因為,GPT-4.5並非OpenAI嘗試尖端技術的模型。根據外媒《The Verge》報導,OpneAI最初在其介紹文件中表示「GPT-4.5不是一個前沿模型(frontier model)」,其並未引進最新的技術,在多項測試中的表現也不比已推出的推理模型o1、o3-mini優秀。而後OpenAI在更新的文件中刪除了這段文字。

在OpenAI目前的GPT-4.5介紹文件中,則強調了GPT-4.5與o1等推理模型定位不同。其說明了AI發展的兩個軸線:非監督式學習(unsupervised learning)和推理(reasoning),GPT-4.5作為前者的代表,與推理模型互補,以全面提升AI的能力。

延伸閱讀

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務