ChatGPT推Operator、Tasks！付費方案比較終極指南

ChatGPT繼更新排程任務Tasks功能，又推出Operator，讓ChatGPT從助理向AI Agent再進一步。回顧ChatGPT更新，付費從ChatGPT Plus進展到Pro，雖然月費變成10倍，但使用者可以無限制調用o1模型，付不起那麼貴訂閱費的人，使用o1、o1-mini有多少額度？免費使用ChatGPT的人又能用哪些模型？包含網頁版、手機和桌面版的ChatGPT分別有何特點？ChatGPT有多懂中文？o1正式版哪裡特別？《遠見》一文更新，並比較ChatGPT各版本沒登入、有登入、有付費與免費權益。

ChatGPT基礎入門 - 2025最新

ChatGPT官網如何登入？

怎麼使用ChatGPT？只需要造訪ChatGPT的官方網站，就能立即開始互動。無論是否擁有帳號，皆可直接與ChatGPT進行對話。

若希望解鎖更多功能，建議進行註冊。點擊「登入」即可登入現有帳號，尚未註冊的用戶也能選擇「註冊」，透過電子郵件或使用Gmail、Microsoft、Apple ID等第三方帳號快速建立新帳戶。

取自ChatGPT對話。開啟無痕視窗測試，不用登入就能使用ChatGPT。取自ChatGPT對話頁面。

自2024年4月以來，為實現推廣人工智慧的目標，OpenAI宣布未登入帳號的用戶也能免費使用ChatGPT，目前並未有計畫更改這項政策。

不過，註冊並登入帳號的用戶可以享有額外的功能，例如保存對話記錄、查看歷史訊息，甚至設定個人化選項，並可試用更多進階功能。

另外，付費方案用戶能夠使用更高效的模型，例如2024年12月5日，OpenAI執行長奧特曼（Sam Altman）正式宣布將o1模型開放給ChatGPT付費使用者，還沒有付費的用戶，要等上一段時間才能體驗先進的o1模型。

we just launched two things:

o1, the smartest model in the world. smarter, faster, and more features (eg multimodality) than o1-preview. live in chatgpt now, coming to api soon.

chatgpt pro. 0/month. unlimited usage and even-smarter mode for using o1. more benefits to come!
— Sam Altman (@sama) December 5, 2024

在使用ChatGPT的過程中遇到任何疑問，OpenAI也提供ChatGPT的常見問題解答頁面，內容涵蓋「ChatGPT的功能與用途」、「怎麼分享ChatGPT對話連結」、「如何搜尋與ChatGPT對話資訊」以及「是否可完全信任AI提供的資訊」等議題，幫助用戶快速解惑。

ChatGPT有中文版？

若從台灣登入，系統預設語言為繁體中文，使用者可自由切換至繁體或簡體中文進行交流，ChatGPT都能理解並回應。

如果在對話框裡面輸入英文、日文或者其他語言，ChatGPT也都能自由對答，若對話中ChatGPT忽然切換至其他語言，也是正常情況。雖然ChatGPT在中文回應的速度與內容的精準度上相較英文稍遜一籌，但依然能滿足大部分使用者的需求。

值得一提的是，ChatGPT在簡體中文方面的表現優於繁體中文，這與模型訓練的資料來源有關。

前Google台灣董事總經理簡立峰曾比喻，若以GPT-3模型為例，其訓練資料的原始規模達到45TB，經過篩選後也有570GB。若按照每本書十萬字概算，40TB大約可以等同兩億本書。

然而，訓練資料集以英文資料為主，僅有約莫2%的中文資料，又以簡體中文為主，導致繁體中文的回答精準度略遜一籌，「我一直在糾結這件事情，」簡立峰說道。

有鑑於此，台灣部分企業與公部門已開始思考發展在地化語言模型的可能性，期望在文化傳承與商業應用間找到平衡，並探索「台版GPT」的潛在價值。

ChatGPT具備什麼能力？

最開始時，ChatGPT主要有兩種能力：生成文字內容，以及對話，因此ChatGPT有能力處理涉及語言和文字的相關任務，例如翻譯、修改文章等。

再往下發展，OpenAI針對程式碼、圖像、聲音等不同類型的原始資料改進模型，往多模態（multimodal）方向前進，不管是上傳圖片後以文字回覆，還是用講話的方式下指令，再產出圖片，都難不倒ChatGPT。

再往下走，ChatGPT比照Perplexity，在對話上額外加入搜尋功能。從此之後，ChatGPT回覆時，就不會再受模型的訓練資料截止日期（cutoff date）限制，有辦法取得最即時的資料。

此外，ChatGPT還有比照App Store的GPT Store，讓人們可以建造專屬的個人助理，同時開放給其他人使用；再加上2025年1月釋出的任務（tasks）功能，從此之後就能排程執行工作，讓ChatGPT從熟悉工作流程的個人助理，再進一步到自主發動、執行任務。

從文字生成與自然語言處理能力開始，ChatGPT將觸角延伸至多模態、網頁搜尋和個人助理，未來加上更多能力，例如調用更多工具、更好地理解環境、有辦法執行更多任務，有望從助理（assistant）走向代理（agent），也就是已經熱烈討論超過一年的AI Agent，如此一來，AI將會更深入融入至我們的生活中。

延伸閱讀：AI Agent系列題組
AI Agent現身〉AI代理應用與優缺點解析
AI Agent現身〉AI代理介紹、趨勢全解讀
AI Agent現身〉從數位到物理世界，AI代理來了！
AI Agent現身〉數位篇：AI同事扛再多也不累，將從職場協作角色變主導？
AI Agent現身〉物理篇：黃仁勳力推！AI落地物理世界，人形機器人商機再現

ChatGPT能替人類做哪些事？

在打開ChatGPT頁面時，OpenAI已預先列出幾種常見功能，例如撰寫程式碼、構思創意、文字摘要、制定計畫、提供建議以及協助寫作等。

若進一步探討更具體的應用，OpenAI官網詳細列舉了ChatGPT的多種使用場景，包括：

・寫作與創意發想：支援文章撰寫、提供靈感、編輯內容，或幫助激盪想法。
・會議整理與效率提升：協助整理會議記錄、萃取重點資訊，提升工作效能。
・程式碼處理：生成、偵測程式碼錯誤，簡化重複性任務。
・資料分析與圖表生成：快速分析資料並製作圖表，有助提升分析效率。
・圖像互動：讓用戶拍照或上傳圖片，向ChatGPT進行提問或要求分析。
・自訂工作流程：運用GPT的能力，量身打造解決方案，滿足個人或工作需求。

舉例來說，使用者可以向ChatGPT下這樣的指令：
・「請幫助我學習並記住學測常見的單字，增強我的詞彙能力。」
・「請出題測試我對會計學基礎知識的掌握程度。」
・「幫我寫一封簡訊，主題是怎麼和暗戀多年的朋友告白。」
・「分享一個關於明末清初的小故事，希望跟滿漢風俗差異有關。」
・「請以死刑存廢為題，協助整理雙方論點。」

ChatGPT有App版？iOS、Android、電腦能用？如何下載安裝？

2023年5月，OpenAI宣布推出ChatGPT的手機應用程式，民眾因此能夠在手機上也能使用ChatGPT的APP；2024年6月，則進一步開放macOS使用者也能下載電腦版的應用程式，不再需要特別造訪ChatGPT網站；11月時則讓Windows所有用戶都能下載使用。

Google Play上可以下載ChatGPT，已經突破1億次下載。取自Google Play。

OpenAI發表手機版本ChatGPT的文章中，提到幾個要點。

ChatGPT應用程式具備跨裝置同步功能，能將桌面與行動裝置的對話紀錄相互整合，用戶切換設備時無需重新開始，極大提升便利性。此外，應用程式內建了OpenAI開發的語音辨識技術Whisper，能將語音指令轉換為文字（speech-to-text），再傳送至ChatGPT進行處理。

App Storeg上的ChatGPT，在「生產力工具」類中排名首位。取自App Store。

若用戶選擇每月付費20美元，則可在手機版中享有與桌面版相同的權益，包括使用進階模型、獲得更快的回應速度，以及率先體驗全新功能。此外，應用程式提供個人化推薦服務，能根據使用者需求，協助規劃旅遊行程或提供餐點建議。

對於Android用戶，OpenAI也提供同步裝置記錄的功能，確保資料不會遺漏或出錯。然而，由於ChatGPT的高人氣，用戶在搜尋相關應用程式時，經常會發現大量名稱中含有Chat、GPT或AI聊天的軟體，這些未必是由OpenAI發行的官方版本。

這個情況和網頁版相似，當使用者搜尋「ChatGPT」時，有其他廠商購買關鍵字廣告，讓自己的網站優先呈現，名字也以假亂真，點入後其實不是真正由OpenAI開發出的ChatGPT。

因此，若要開啟網頁版，就要認明網址是否為：chatgpt.com；若要下載ChatGPT的官方應用程式，用戶需確認是否由OpenAI推出，以避免誤安裝仿冒品。

即使對是否為官方版本不在意，也應注意應用程式的收費情況、開發者背景及其他用戶評價，以免遭遇問題。尤其在AI技術廣泛應用的時代，有些開發者可能試圖蒐集用戶對話紀錄，或誘導付費卻無法提供應有服務，選擇時更需謹慎小心。

即便搜尋ChatGPT，App Store中出現的搜尋結果有很多都不是真正的ChatGPT。取自App Store。

Mac用戶若想使用ChatGPT桌面應用程式，只需前往OpenAI官網下載，但需確保作業系統版本為macOS 14.0或以上，否則無法正常運行。

針對電腦使用情境，OpenAI提出多種應用方式，例如透過快速鍵啟動ChatGPT後，可直接使用電腦鏡頭拍照並上傳，或擷取其他應用程式的畫面進行分析。此外，用戶也能透過語音進行互動，進一步提升操作效率。
按下快速鍵後，能在對話框內直接拍照後上傳到ChatGPT當中。取自OpenAI官網。

按下快速鍵後，能在對話框內直接拍照後上傳到ChatGPT當中。取自OpenAI官網。

2024年8月，OpenAI更新桌面版本的ChatGPT，新增伴隨主程式的視窗（companion window）、增強資料分析能力、改進快速鍵（keyboard shortcuts）例如提供客製化選項等。

ChatGPT付費版PLUS，企業版Team與免費版差異？

對白領族群而言，付費後的實際價值始終是最受關注的核心議題。

如果付費服務能提供更高效的先進模型，例如顯著提升回應準確性、縮短回應時間，甚至有效減少幻覺現象的發生，那麼用戶便更可能願意為此埋單，因為這些改進直接影響到工作效率與結果的品質。

ChatGPT沒登入、有登入、有付費與免費權益比較
	沒登入	有登入，沒付費	有登入，付費20美元	有登入，付費200美元
模型選項	GPT-4o mini	GPT-4o、GPT-4o mini	GPT-4、GPT-4o、GPT-4o mini、o1、o1-mini	GPT-4、GPT-4o、GPT-4o mini、o1、o1-mini
模型額度	GPT-4o mini無限額	GPT-4o有限額，用罄後切換回GPT-4o mini	GPT-4o、o1、o1-mini皆有限額，其中GPT-4o額度是免費版五倍（ChatGPT Plus）或者更多（ChatGPT Team）	皆無限額，主要差異在於不受限制使用GPT-4o和o1
處理資料模態	僅文字和語音	包含圖像在內的多模態；能夠生成圖像；有進階語音功能	包含圖像在內的多模態；能夠生成圖像；有進階語音功能但有限額	皆無限額
進階功能	無	有資料分析、上傳檔案、瀏覽網路等進階功能，有限制	有資料分析、上傳檔案、瀏覽網路等進階功能，無限額	有資料分析、上傳檔案、瀏覽網路等進階功能，無限額
GPTs	無法用	可以用	可以用，還可以自行建立GPTs	可以用，還可以自行建立GPTs
資料來源：OpenAI；資料整理：曾子軒，最後更新日期：2025/01/21

ChatGPT提供多種模型，有登入、有付費的權益高於沒有的使用者。取自ChatGPT對話頁面

與個人付費用戶相比，OpenAI指出，ChatGPT Team提供更多功能，除了包含ChatGPT Plus的所有內容外，還針對進階需求加強了功能。Team用戶在使用GPT-4的進階功能例如資料分析、網頁搜尋和與生成圖像方面擁有更多額度，並可以在專屬的團隊工作空間內建立和分享自訂GPT。此外，Team版還提供團隊專屬的管理員控制台，並承諾團隊數據不會用於模型訓練，保障資料隱私。

若說ChatGPT Team適合專注於團隊協作與小型組織的需求，ChatGPT Enterprise則進一步為企業客戶量身打造。根據OpenAI文件顯示，無論是免費版、個人付費版、Team版或企業版，用戶都能與ChatGPT互動、保存對話記錄，並在網頁與應用程式間無縫存取。而隨著模型的進步，這些版本的回應品質和速度也會隨之提升，提供更全面的使用體驗。

那麼，ChatGPT不同版本之間的差異究竟在哪裡？核心主要反映在模型性能與功能提供上。

ChatGPT不同方案能夠調用模型差異比較
功能／方案	Free	Plus	Pro	Team	Enterprise
收費	0美元	20美元/月	200美元/月	每人30美元/月；每人25美元/年	聯繫業務
o1	無法使用	標準	無限制	標準	標準
o1-mini	食法使用	標準	無限制	標準	標準
GPT-4o mini	無限制	無限制	無限制	無限制	無限制
GPT-4o	有限制	免費版五倍	無限制	比付費個人版多	擴展
GPT-4	受限，視使用情況	標準	無限制	擴展	擴展
回應速度	有限，視使用情況	快速	快速	快速	最快
上下文窗口	8K	32K	128K	32K	128K
資料來源：OpenAI；資料整理：曾子軒，最後更新日期：2025/01/21

ChatGPT不同方案功能比較
功能／方案	Free	Plus	Pro	Team	Enterprise
語音輸入	✓	✓	✓	✓	✓
記憶功能	-	✓	✓	✓	✓
瀏覽功能	限制	✓	✓	✓	✓
資料分析	限制	✓	✓	✓	✓
圖像辨識	限制	✓	✓	✓	✓
檔案上傳	限制	✓	✓	✓	✓
探索和使用 GPTs	限制	✓	✓	✓	✓
創建與分享 GPTs	-	✓	✓	✓	✓
與團隊分享 GPTs	-	-	-	✓	✓
提前存取新功能	-	✓	✓	✓	✓
圖片生成	限制	✓	✓	✓	✓
互動表格與圖表	-	✓	✓	✓	✓
Sora（生成影音）	-	✓	✓	✓	-
資料來源：OpenAI；資料整理：曾子軒，最後更新日期：2025/01/21

ChatGPT不同方案隱私與資料保存比較
隱私選項	Free	Plus	Pro	Team	Enterprise
資料是否用於訓練模型	是，可退出	是，可退出	是，可退出	否	否
自訂資料保存期限	-	-	-	-	✓
資料來源：OpenAI；資料整理：曾子軒，最後更新日期：2025/01/21

2023年，OpenAI透過官方X帳號（前稱推特）及官網宣佈推出ChatGPT企業版，並詳細列出其主要特色：

・無限制使用GPT-4：企業用戶可不限次數使用GPT-4模型，其回應速度更是一般網頁版的兩倍以上。
・更大的上下文處理能力：ChatGPT可讀取更長的上下文範圍，適合用於複雜任務或處理長篇文檔。
・自定義對話模板：提供可客製化的對話模板，幫助企業根據需求優化內部流程。
・免費AP額度：企業版用戶可獲得免費的API使用額度，提升應用靈活性並降低成本。
・資料處理：內建包括Code Interpreter在內的分析工具，支援精準的資料處理及多樣化的客製化功能。
・資安承諾：OpenAI明確表示不會將企業資料用於模型訓練，確保資料隱私和安全。
・SOC 2認證：企業版通過SOC 2認證，進一步加強其安全性、隱私性及資料保密性。
團隊管理工具：支援網域驗證及單一登入功能，並提供控制台讓企業管理團隊成員，便於大規模使用。

OpenAI指出，自ChatGPT推出9個月以來，已有超過80%的財經五百大企業員工使用過這項服務。企業版發佈前，OpenAI邀請了多家知名企業進行試用，包括支付公司Block、設計平台Canva、美妝集團雅詩蘭黛以及會計師事務所資誠。

OpenAI認為，企業版的推出是讓企業和個人用戶充分挖掘人工智慧潛力的重要一步。雖然企業版未包含令人耳目一新的功能，但OpenAI的重點在於建立穩固的基礎。透過這一版本，OpenAI希望進一步吸引企業客戶的訂閱，並透過多元用戶群提升營收，這也成為其未來發展的關鍵策略之一。

然而，OpenAI在這條道路上仍面臨強大的市場競爭。Google、蘋果等科技巨頭擁有完整的生態系統；微軟的Copilot、Google的Gemini（前身為Duet AI for Business）以及AWS的Amazon Q，都是直接的對手。此外，OpenAI的競爭者Anthropic也推出了專為團隊設計的企業版服務Claude Team，令市場競爭更加激烈。

這些對手各有強項：微軟擁有深耕多年的Microsoft 365，Google以Google Workspace穩固市場地位，AWS則整合其開發者生態與雲端資源，進一步鞏固競爭力。在如此激烈的市場格局下，ChatGPT企業版能否脫穎而出，成為OpenAI必須面對的重大挑戰。

ChatGPT功能與版本解說

ChatGPT Tasks功能可以做什麼？

ChatGPT新推出的測試版功能「任務（Tasks）」，旨在讓使用者能夠設定未來的任務和提醒。若是熟悉排程任務的工作者們，Tasks功能和排程工作（Cron Job）的功能類似，只是在ChatGPT的伺服器上運行。

就跟Cron Job一樣，使用者可以用Tasks功能排定一次性任務，或者重複性任務，前者像是設定今天晚上10:00通知自己記得打電話給朋友，後者像是每天十點總結三篇與AI有關的最新新聞。ChatGPT會以發送通知（notifications）或者寄信的方式提醒使用者時間到了、該做事了。

要啟用此功能，訂閱用戶需在 ChatGPT 的模型選擇器中選擇「含計畫任務的GPT-4o（GPT-4o with scheduled tasks）」，並輸入希望ChatGPT執行的任務內容與時間。

付費用戶在選擇模型處，就能找到包含計畫任務的選項。取自ChatGPT對話。

目前，Tasks功能還在測試中正在逐步向 Plus、Team 和 Pro 訂閱用戶開放，初期僅限於網頁版，每位用戶最多可同時設定10項任務。

ChatGPT的Operator是什麼？

在1月23日，OpenAI 官方宣布推出了名為Operator的新AI代理工具，根據外媒揭露，它能夠自動執行如購買雜貨和提交報銷等任務。Operator目前只對美國地區200美元月費的ChatGPT Pro用戶開放，主要是幫用戶解放雙手，執行網頁上各種行為，例如預訂餐廳和歸檔公司報表等操作。

Operator幫用戶解放雙手，執行網頁上各種行為。取自OpenAI

以文生成影片的Sora誰能用？

早在2024年2月，OpenAI宣布推出名為Sora的文字生成影像模型與工具，進一步擴展了從文字與圖像生成到影片創作的技術可能性，但直到2024年年底，才正式開放使用。「Sora」源自日文，意為「天空」，象徵著OpenAI希望透過這項技術，實現人人都能自由創作的願景。

究其本質，Sora是一種多模態生成工具，能根據文字指令、圖片或影片生成短片，並支援最高1080p的解析度，滿足多樣化的創作需求。

Sora的運作方式相當簡單，用戶只需輸入文字或上傳圖片，即可生成長度最長達20秒的影片，解析度最高為1080p，並能選擇多種長寬比與版本供比較。這種設計理念與Midjourney以文字生成四張圖片的模式類似，但應用範疇擴展至動態影像，為創作者提供更多靈感與可能性。

訂閱ChatGPT Plus或者ChatGPT Pro方案的使用者都能使用Sora。利用下指令生成影片能用嗎？請見實測結果。

ChatGPT Pro 200美元有哪些好處？

2024年美國時間12月5日，OpenAI正式推出每月200美元的ChatGPT Pro服務，相較於每月20美元的ChatGPT Plus，在定位上明顯拉開了層級差距。

【遠見 x 未來親子】全家一起讀，孩子成長看得見：週年慶限定組再送這些>>

參與當日直播的OpenAI研究員史瓦瑟表示，ChatGPT Pro用戶可以存取OpenAI目前最先進的模型，包括當天由OpenAI執行長奧特曼宣布開放的全新 o1 模型，以及額外推出的「o1 pro」模式。

史瓦瑟進一步解釋，「o1 pro」模式使用更多的運算資源進行推理，能回答極具挑戰性的問題，並提供更優質的答案。未來，OpenAI還計畫在ChatGPT Pro方案中加入更多專為高度運算需求而設的生產力功能。

ChatGPT Pro用戶除了能無限制地調用o1模型，還可自由使用o1-mini、GPT-4o等模型，以及ChatGPT Plus付費者享有的進階語音功能，功能選擇更為全面。

奧特曼表示，推出ChatGPT Pro的原因，是觀察到有許多ChatGPT的重度使用者，他們的運算需求遠超過每月20美元方案的範圍。這項高階方案旨在滿足這些深度用戶的需求，透過「世界上最聰明的模型」o1，協助解決最棘手的問題。

此外，史瓦瑟在直播中提到，OpenAI正為o1模型開發更多工具，例如瀏覽網頁、上傳檔案，以及調用API等功能，並進一步強化結構化輸出、函數調用與圖像理解能力。這些改進將使ChatGPT Pro朝向代理式應用（agentic application）的全新領域邁進，為用戶提供更全面的人工智慧體驗。

o1正式版跟預覽版差在哪裡？

2024年9月，OpenAI推出重新命名的新一代模型 o1預覽版（o1-preview）。這款模型以其卓越的推理能力為賣點，強調能透過「思維鏈」（chain-of-thought）的方式分步拆解任務，特別擅長處理複雜且高難度的問題。

雖然期待已久的 GPT-5 尚未問世，OpenAI搶先推出了 o1正式版，取代原先的預覽版，讓用戶率先體驗這款領先技術的強大性能。

ChatGPT Plus對話用戶已經可以選擇o1模型。取自OpenAI對話頁面

與預覽版相比，o1正式版不僅回應速度顯著加快，答案也更加智慧，右具備同時處理圖像與文字的能力。由於o1系列模型著重於運用推理能力解決複雜問題，史瓦瑟分享了一些用戶回饋。

有用戶曾表示，o1-preview的回應速度過於緩慢，例如當用戶簡單打出「嗨」，模型卻要花上10秒思考如何回應，令人忍俊不禁。史瓦瑟笑說：「我們修復了這個問題，現在的o1能更快速且智慧地回應。」

在比較正式版與預覽版時，史瓦瑟指出，o1正式版犯下重大錯誤的頻率比預覽版低了 30%，而回應速度則提高了 50%，性能大幅優化。此外，經過強化的推理能力和多模態功能，顯著提升了使用者體驗。

進一步分析，o1正式版的安全性更高，防範越獄（jailbreak）的能力顯著增強，內容偏見減少，產生幻覺（hallucination）的比例降低；其推理能力更為強大，更為擅長處理程式、數理等複雜問題，並能進行更深入的思考。它也具備多模態能力，增強圖像與文字的處理能力，適用範圍更廣。

透過這些改進，o1正式版在速度、準確性和安全性方面均有提升。不過，包含Google、Claude在內，也都在往更強大的推理能力邁進；且也有其他挑戰者例如DeepSeek，昨天（2025/01/20）發表DeepSeek-R1模型，同樣強調推理能力，系列模型號稱對標o1與o1-mini，只能說競爭仍舊激烈。

新模型o1和GPT-4o怎麼用？

目前，用戶只需登入ChatGPT，即可預設使用 OpenAI 最新推出的 GPT-4o 與 GPT-4o mini 模型。無論是否付費，用戶登入後皆能體驗這些模型。不過，免費用戶的使用有額度限制，當額度耗盡時，系統會自動從 GPT-4o 切換至 GPT-4o mini，以繼續提供服務。

付費用戶則擁有更大的靈活性，已可自由選擇是否使用 o1 模型。在實際對話中，用戶甚至能察覺到模型在產出回應前陷入短暫思考，這種深入分析過後的回應，內容品質更高，體驗也更佳。

回顧模型進展，OpenAI在2024年12月推出o1正式版，取代9月推出的o1-preview模型。而在此之前，OpenAI已發布了GPT-4o，作為GPT系列的最新成員。相較於GPT-4 turbo、GPT-4 和 GPT-3.5，GPT-4o 帶來了多項改進，例如支援多模態輸入，能同時處理圖像與文字的複雜任務；大幅提升回應速度，改善用戶的使用體驗；也在特定應用場景中展現了顯著優勢。

o1模型產出的內容非常完善。取自OpenAI對話頁面

當初GPT-4發布時，OpenAI將重點放在提升模型的智慧與回應品質，而GPT-4o則更側重於實現商業價值與增強人機互動的自然性，展現了其在各類應用場景中的廣泛潛力。

從輸入模態的進步來看，早期的GPT-4與GPT-3.5已支援語音互動，但GPT-4o更進一步，能同時處理文字、聲音、圖像及影像，提升模型適應性與靈活性。然而，OpenAI的競爭對手也迅速推出具備原生多模態處理能力的模型，使競爭更加激烈。

在回應速度方面，早期模型通常需要3至5秒延遲。為了解決這一問題，OpenAI改良語音處理與文字生成流程進行，GPT-4o採用端到端（end-to-end）處理方式，無需經過聲音轉文字的中間步驟，讓模型在處理語調、背景聲和多人對話等細節時更為自然，互動體驗大幅提升。

OpenAI表示，GPT-4o的文字生成、推理與程式撰寫能力已達到與GPT-4 Turbo相當的水準，同時在多語言應用及聲音與視覺功能上樹立了新標準。然而，隨著市場競爭升溫，包括Google Gemini、Claude，以及阿里巴巴、零一萬物和馬斯克的Grok在內，各大企業紛紛加入這場AI模型混戰。

在GPT-4o推出後僅兩個月，2024年7月，OpenAI又發佈了GPT-4o mini，並且將其定位為「小模型」，明顯遠低於百億級參數的旗艦模型。推出小模型的目的是在能力無明顯下降的前提下，以更經濟且快速的方式完成任務。

根據OpenAI在API文件中的說明，GPT-4o mini被形容為「可負擔且智慧的小型模型」，特別適合用於輕量級任務。相比兩年前的text-davinci-003這類舊型模型，GPT-4o mini不僅大幅提升了性能，每次對話的符元（token）成本也降低了 99%，展現其經濟性與高效性。

市場中，Meta和微軟等科技巨頭同樣推出了小模型以應對需求競爭。而正如李開復所預測的，「未來兩年將見證（LLM應用）激烈的競爭，至少還會迎來兩代重大模型的升級。」每次技術突破都將推動新應用的出現，並進一步壓低推論成本。在這場競賽中，OpenAI憑藉 GPT-4o mini 的推出，搶先展現其降低成本的能力與市場競爭優勢。

｜延伸閱讀：獨家專訪》李開復解讀大模型之戰！AI 2.0時代如何拚「三位一體」戰略？

Canvas功能成為寫程式和寫文章新利器？

2024年10月，OpenAI宣布在ChatGPT的既有對話模式上新增了一項基於 GPT-4o 的協作功能—Canvas。用戶在選擇模型時，會發現多了一個Canvas模式的選項。

在這種模式下，ChatGPT的輸出內容會被獨立呈現，與用戶的指令並排顯示。此設計讓用戶能更輕鬆地進行多次互動，在反覆修改與對照中快速調整內容，提升了協作效率與便利性。

點擊對話上方模型選項，就能看到其中一個選項為ChatGPT 4o with canvas。取自與ChatGPT對話頁面。

OpenAI表示，Canvas特別適合用於程式編寫和文章撰寫等情境。這項功能讓使用者能更直觀地處理需調整的段落或內容風格。

使用者可以靈活微調內容的長度與難度、測試程式碼、加入表情符號，並享有便利的複製與貼上功能。在程式開發方面，Canvas還支援一鍵轉換程式語言及錯誤檢測，進一步提高效率。

值得一提的是，即使用戶未主動啟用Canvas功能，若ChatGPT判斷互動內容適合採用此模式，也會自動切換至Canvas，協助用戶完成文章創作或程式開發。

根據OpenAI的測試結果，通過Canvas完成的任務在輸出品質與執行效率方面，均明顯優於單純使用 GPT-4o 模型進行的操作，展現出其在多樣化應用中的實用性。

提供記者個人作品頁面作為範例的網頁截圖，ChatGPT便能依樣畫葫蘆產出程式碼。取自與ChatGPT對話頁面。

熟悉生成式AI工具的用戶可能會注意到，ChatGPT的 Canvas 與Claude的 Artifacts 在功能設計上有不少相似之處。

兩者皆採用左右對照的呈現方式，將生成的文章或程式碼與用戶的對話指令分開顯示，方便用戶檢視與修改。不過，Claude的一項顯著優勢在於，可以直接預覽程式碼的執行結果，而ChatGPT目前則需要先下載程式碼才能進行檢視，這點仍有改進空間。

OpenAI表示，Canvas是ChatGPT自推出以來首次針對視覺互動界面進行的大幅度改進，凸顯了其對這項功能的高度重視。

事實上，生成式AI對話工具的問世，如ChatGPT、Claude和Gemini，已經徹底改變了傳統的資訊查詢方式。過去，用戶需要通過反白、拖拉、複製與貼上的繁瑣操作來尋找答案，而現在，只需進行簡單的問答即可獲得所需資訊。

特別是在文章撰寫與程式碼生成的應用中，這類創作過程往往需要多次迭代與修正。傳統對話界面的拉長，容易降低用戶觀察與編輯的效率，而左右並置的結構設計，則有效解決了這一問題。對於日常依賴生成式AI工具的職場用戶而言，這種設計不僅提升了生產力，也讓操作體驗更加直觀與便利。

ChatGPT的Canvas功能能夠依照使用者指令反覆修改，右方的獨立介面會由上至下改動程式碼或者產出文章。取自與ChatGPT對話頁面。

《遠見》記者曾向Anthropic產品長、Instagram共同創辦人克里格（Mike Kreiger）提問，儘管Claude率先推出了Artifacts功能，但OpenAI隨後快速跟進；而10月Anthropic宣布的「電腦使用（Computer use）」AI Agent功能，預期OpenAI與Google也將很快追隨。面對這種競爭態勢，Claude該如何取勝？

克里格坦言：「我常告訴我的團隊，AI領域沒有任何所謂『 5年獨特競爭優勢』，因為這個領域的變化如此迅速，產品本身也在飛速進步。」

他回憶起Claude推出Artifacts功能時，團隊的喜悅之情溢於言表，但在Instagram多年的經歷，讓他見過太多好功能被業界借鑑的案例。因此，他告訴同事：「如果這個主意真的很好，它就會在整個業界傳播開來。」

在克里格眼中，Anthropic的未來發展方向，是將Claude從一個強大的AI模型，進一步轉型為服務於企業與訂閱用戶的智慧引擎，專注於解決真實場景中的問題。這種務實的定位，將是Claude在激烈競爭中的重要策略。

語音對話功能到哪開啟？有何用途？

2024年5月，OpenAI在發佈會上展示了一項語音互動功能，模擬出電影《雲端情人》中AI伴侶的情境，令人印象深刻。然而，由於被指控涉嫌盜用知名演員史嘉蕾·喬韓森（Scarlett Johansson）的聲音設計，雖然OpenAI隨後澄清並無此事，但這場爭議導致該功能延遲至9月才得以大規模推出。

根據OpenAI公布的資訊，目前語音功能分為兩種模式：一是付費用戶專享的進階語音模式（Advanced Voice Mode），僅限Pro、Plus和Team方案的付費用戶使用，提供更自然、即時的語音對話體驗，能識別說話者的非語言線索（non-verbal cue），例如語速與背景音，並在回應中融入情緒，打造更具情感的互動。

另一種，則是只要登入便可以是只要登入就能免費使用的標準語音模式（Standard Voice Mode），支援基本的語音轉文字功能，讓用戶能輕鬆進行語音對話。

在行動裝置上使用語音功能非常簡單，用戶只需開啟ChatGPT應用程式，點擊對話按鈕並授權麥克風使用權限，即可選擇偏好的語音設定。為方便用戶選擇，ChatGPT會提供每種語音的特質描述，例如語調、情感表達程度等。選定後，用戶便能立即與ChatGPT進行語音交流。

語音功能進一步拓展了AI互動的可能性，無論是在對話自然度還是用戶體驗細膩度上，都帶來了顯著的提升。

點擊右下角裡面有音訊示意的圓圈，就能從打字轉成以語音開啟對話。取自與ChatGPT對話頁面。

使用手機應用程式，開啟對話頁面後，要先授權讓ChatGPT使用聲音。取自與ChatGPT對話頁面。

ChatGPT提供有著不同特質的聲音。取自與ChatGPT對話頁面。

結束對話後，ChatGPT會提供完整對話逐字稿。取自與ChatGPT對話頁面。

在台灣，ChatGPT預設以中文與用戶對話，但用戶可隨時切換至其他語言。而當ChatGPT發出語音時，用戶也能立即打斷並更改指令。

若對話被終止，ChatGPT會將內容轉為文字並提供完整逐字稿，這讓許多使用者將其作為語言學習的輔助工具。不論是做家事、讀論文，還是照顧家人時，閒暇之餘都可以呼喚ChatGPT進行對話，提升語言能力。

然而，一些專業語言學習應用程式對此提出不同看法。

獲得OpenAI投資的美國語言學習新創Speak，其共同創辦人徐安廬（Andrew Hsu）向《遠見》記者表示，語言學習不能僅依靠對話本身，而需要透過對話中的改進與錯誤修正來深化學習。同時，結合常用句型、道地用法等系統化的內容，才能幫助學習者全面掌握外語。

他認為雖然ChatGPT為語言學習帶來了便利與創新，但在學習深度與專業性方面，專門設計的語言學習應用程式仍然具備優勢，能提供更結構化且針對性的學習體驗。

ChatGPT指令寫法與應用

ChatGPT入門指令教學：如何請它翻譯，生成圖片？

在開啟ChatGPT介面後，最基本的互動方式就像日常對話一樣，提出簡單而清楚的問題。例如，你可以問：「應該更專注於工作還是生活更重要？」或是探討：「如何在工作與生活之間找到平衡？」

同樣地，ChatGPT也能協助回答更多貼近個人需求的問題，例如：「找工作時，應該優先考慮高薪，還是看重累積經驗的機會？」或者：「尋找人生伴侶時，應該注重哪些特質？」

為了獲得更精準且實用的建議，採取結構化的方式與ChatGPT互動會更有效。以下是幾項提升回答品質的指導原則：

・背景：向ChatGPT描述任務的背景資訊，甚至可以直接為ChatGPT設定角色。例如：「假設你是一位財經媒體的專業文稿編輯，精通中英文寫作，現在需要審核記者提交的稿件，檢查是否存在問題。」

・任務：清楚說明希望ChatGPT協助完成的具體工作，讓目標更明確。例如：「請審核以下討論『ChatGPT的應用與影響』的文章，檢查是否有錯別字或語句不順的地方。」

・脈絡：提供相關的背景資訊，幫助ChatGPT更準確地理解你的需求。例如：「這篇文章的目標讀者是從未接觸過ChatGPT的人，請檢查是否有過多專有名詞或內容晦澀之處。同時，確保文章正反觀點平衡，範例貼切，並確認其是否達到教學目的。」

・限制與要求：若有特定需求，提前告知，讓生成內容符合你的預期。例如：「檢查後，請以列表形式列出待改進的地方和建議，避免直接提供修改後的全文。」

除了這些指令上的注意事項，還有幾種實用技巧可改善與ChatGPT的互動體驗。例如，激發ChatGPT的情感，嘗試以人性化的語氣與ChatGPT互動，增加回答的細膩度；打開多個視窗交叉檢查，藉此比對生成內容的品質；若對回覆不滿意，可以進一步追問，讓答案內容變得更好。

如果想要獲得更有用、更精確的回答，可以採用更加結構化的方法。Photo by Emiliano Vittoriosi on Unsplash

ChatGPT指令進階：拆解任務更精準？

Anthropic針對Claude推出了官方指南，旨在幫助開發者與使用者更高效地運用Claude。雖然部分內容專為開發者在調用Claude的應用程式介面時設計，但其中一些建議對使用網頁版的用戶同樣具有參考價值。此外，這些提示也適用於ChatGPT或Claude的使用者，具有普遍性。

以下是官方指令撰寫指南中的幾個重點建議：

1. 指令要直接、清晰且詳細，將ChatGPT視為一名能力出色但剛入職的新員工，只有提供清楚明確的指示，才能讓它準確理解並達成使用者的需求。

・設定清楚的角色：在指令中為ChatGPT分配角色，例如「資深資料科學家」、「財務經理」或「企業法律專家」，以引導其運用專業知識，針對需求提供精準回應。

・提供足夠的背景資訊：說明任務的目的、目標受眾、相關流程，以及成功完成任務的標準，幫助ChatGPT更好地理解工作要求。

・使用簡單易懂的語言：避免使用過於專業的術語或模糊不清的表達，確保指令內容清晰明了。

・循序漸進說明：採用編號或項目符號逐步拆解任務，幫助ChatGPT按步驟完成所要求的內容。

2. 運用思維鏈技巧，幫助ChatGPT將複雜任務拆解為子任務

・思維鏈（Chain of Thought）：在指令中明確要求ChatGPT逐步推理，例如加入「逐步思考」（Think step-by-step）的提示，讓其自動分解任務。同時，可進一步要求其列出執行步驟及需要考慮的關鍵面向，為後續處理提供參考依據。

・提示鏈（Prompt Chaining）：當任務的複雜度超出單純的思維鏈能解決時，可以採用提示鏈的方法，也就是把整體任務，再進一步拆解為幾個單一目標明確的子任務，確保每個子任務都清晰可行。另外，Anthropic也提醒，要注意任務之間的資訊傳遞，確保ChatGPT的輸出能連貫地用於下一步操作，逐步完成高度複雜的目標。

3. 運用範例與結構化元素提升ChatGPT的表現

・提供多個範例（Multi-shot Examples）：在指令中加入多個精心設計的範例，讓ChatGPT更清楚需要生成的內容形式與風格，預期結果應該跟範例有著相同長相，並具備足夠的多樣性（diversity），還要包括邊緣案例（borderline examples），這樣ChatGPT才能應對更廣泛的情境。

・使用XML標籤：在指令中活用XML標籤標記不同段落，清楚區分上下文、指令和範例等元素。舉例來說，可以用標籤標明哪部分是文件的開頭或結尾，幫助ChatGPT更準確地解析和執行指令。

4. 其他重要技巧：

・善用長上下文提示：針對需要處理大量前置資料的任務，透過XML標籤標記指令中不同段落的意義，並將長篇內容置於指令的上方，而執行任務的指令、目標與範例則放在下方。

・要求引用：當處理長篇文件時，要求ChatGPT在回覆中標明引用的資訊來源，能降低生成錯誤資訊的可能性，並提高結果的可靠度。

・測試與迭代：指令無法一次達到完美，需透過反覆練習和調整來優化。可以參考高品質指令的撰寫方式，並觀察ChatGPT或Claude的回應，逐步改進指令內容，達到理想效果。