OpenAI最新模型GPT-4.5是目前OpenAI號稱最大、最好的模型,擅長美學與創意,日前已開放給Plus、Pro等訂閱會員使用。究竟GPT-4.5實測成果如何?與GPT-4o相比有哪些優缺點?
GPT-4.5是什麼?怎麼用?
GPT-4.5是OpenAI在2月底發布的最新模型,擁有更廣泛的知識、更精確的理解能力,且幻覺產生機率更低,特別擅長寫作與設計等創意領域。相較於過去強調數學與程式能力的模型,GPT-4.5號稱更具「人味」,能細膩解讀使用者需求,在回應中展現高情商。
目前訂閱Pro和Plus方案的會員皆能使用GPT-4.5,只要在模型選單中選擇GPT-4.5即可。對於其額度限制,官方並未在文件中說明,但經網友實測,Plus用戶一週約有50次的使用額度。
實測1:設計創意海報
實測讓GPT-4.5和4o設計創意海報,輸入指令為:「請發揮創意,設計一張融合兩個不相關的概念的海報,例如刺激和安穩、晴天和雨天等,要讓人從衝突的畫面中感受到和諧。」
GPT-4.5先詳細描述了海報主題、畫面構成、色彩風格,甚至還有文案標語和設計理念解說,展現了其寫作長才,但並未提供其設計的圖片。在再次要求後,其生成了一張畫面被左右分割,馬匹在草地和水窪上奔馳的圖片。
但仔細對照其先前提供的敘述後,發現圖片並未完全符合描述內容。例如描述中提及畫面要切分成上、下半部,上方是藍天和草原、下方是平靜的湖泊倒影,但圖片實際上卻是左右分割,兩個部分的色彩皆相當鮮艷,看不出「奔放」和「沉靜」的明顯差異。
用一樣的指令詢問GPT-4o,其直接生成一張圖像,並附上簡短的說明。畫面左側是「霓虹都市」、右邊則是「禪意庭園」,符合指令中結合兩個衝突概念的要求。在畫面中間還有一個打坐的人,連結兩個場景,讓畫面變得較為和諧。
實測2:提供寫作建議
實測請GPT-4.5和4o評論文章,並提供寫作建議。以記者曾寫過的科技新聞進行實測,指令如下:
*指令由Gemini生成
比較兩者的評分和建議,發現其評分和建議非常相像,差異較大的地方僅有「客觀性與平衡性」這項指標。雖然兩者給的分數相同,但GPT-4.5建議除了面臨的負面挑戰,也可以納入正面評價;GPT-4o則是建議可以納入輿論、外部專家等,不同來源的意見。
完整對話內容可見此連結。
此外,可發現GPT-4o有使用水平線排版,分隔不同指標間的內容,以及用星星符號評分,在視覺呈現上較GPT-4.5更為清楚。
完整對話內容可見此連結。
實測3:分享煩惱
如今有不少人將AI當成傾訴煩惱的對象,OpenAI在GPT-4.5的介紹文章中,也強調GPT-4.5比4o更有同理心,會知道何時要對使用者表達關心、何時需要給出建議。
實測告訴GPT-4.5和4o:「我最近在寫碩士論文,壓力很大」並比較兩者的回應。結果顯示,GPT-4.5先詢問使用者「覺得壓力大的是哪個部分?」接著說可以跟它聊聊緩解壓力;GPT-4o則是鼓勵使用者適時休息,並表示它能幫忙資料整理、寫作潤色等工作。
從這項實測結果發現,GPT-4.5的回覆似乎更傾向幫助使用者放鬆心情,而GPT-4o則是從實際幫使用者分擔工作的角度出發。
GPT-4.5 VS 4o 優缺點比較
在部分實測結果中,GPT-4.5確實有展現其擅長寫作、有同理心的特點,但整體而言與4o差異不大。在OpenAI的開發者論壇上,也有網友提及,GPT-4.5不比其他模型聰明多少,但卻要付費訂閱且有次數限制。
若想要更多GPT-4.5的使用額度,只能訂閱每個月花費高達200美元的Pro方案,與Plus方案的20美元相差十倍,許多人認為性價比太低。不過,OpenAI執行長奧特曼(Sam Altman)日前在X上表示,考慮將目前的月費制改為積分制,若超過使用額度,可購買積分以繼續使用服務。
以下整理GPT-4.5和4o的優缺點比較表格:
使用資格 | 海報設計 | 寫作建議 | 分享煩惱 | |
---|---|---|---|---|
GPT-4.5 | Pro、Plus訂閱會員 | 提供詳細說明,但生成圖像並未完全符合其描述 | 評分與建議合理 | 較有同理心,會反問使用者 |
GPT-4o | 免費會員也可使用 | 生成圖像有符合指令要求,並附上簡短說明 | 評分與建議合理,善用emoji,視覺呈現較清楚 | 表示可幫使用者分擔工作 |
請注意:此表格僅供參考,AI回應內容與品質可能因指令不同而有差異。 |