OpenA推官方AI Agent了!近期發表在ChatGPT可使用的代理程式模式(Agent Mode),到底這是什麼?怎麼用?需要付費還是免費?應用場景包括哪些?能幫忙買票或餐廳訂位?本文實測了4種生活中常見的任務,並比較其成果與優缺點。
ChatGPT AI Agent 是什麼?怎麼用?付費或免費?
OpenAI 17日推出ChatGPT的代理程式模式(Agent Mode),正式將今年各家AI公司都積極發展的「AI代理」(AI Agent)整合進ChatGPT介面中。今年1月時,OpenAI推出首個AI代理Operator,當時只有訂閱Pro方案的會員,可在獨立的網站中搶先試用Operator。如今訂閱ChatGPT Pro、Plus和Team方案的會員,都可直接在ChatGPT中使用AI代理。然而免費方案截自2025年8月1日仍無法使用。
在工具選單中選擇「代理程式模式」後,會出現ChatGPT推薦可應用的任務類型,例如整理深入研究報告、執行特定動作、製作試算表或簡報等。
雖然深入研究是原先ChatGPT就有的功能,但OpenAI表示,過去深入研究功能無法透過操作電腦畫面得到更好的結果,也無法存取需要使用者驗證或登入的網站。如今將深入研究與AI代理結合,便能收集到更精準完整的內容。
ChatGPT Agent會在虛擬電腦中執行任務,並將執行過程保留下來。OpenAI指出,ChatGPT Agent適合用於需要反覆調整和協作的工作流程。在AI執行任務的過程中,使用者隨時可以打斷它,提出修改要求、或引導它的執行方向;而若是AI遇到問題,或是網站需要登入等,AI也會主動停下來詢問使用者。
ChatGPT AI Agent 應用實測1:餐廳訂位
實測輸入指令「請幫我訂今天晚上8點之後的新竹藏壽司兩位,在要訂位前停下來讓我確認」,請ChatGPT AI Agent幫忙預訂餐廳。
首先,AI花了7分鐘找到餐廳的訂位網站,並進到新竹店的訂位頁面。接著AI停下來,要求使用者登入會員,以繼續完成訂位流程。在使用者接管畫面時,下方會提示ChatGPT不會查看或儲存使用者的任何動作。
登入會員之後,AI花了9分鐘選好訂位日期、時間和人數。AI在要點開下拉式選單選擇訂位人數時遇到問題,重試了幾次,才成功將訂位人數設為2人。
接著AI又停下來詢問使用者,是否要點擊確認按鈕完成預約。OpenAI在其官網介紹中也有提及,在AI要做這類會影響到使用者現實行為的決策之前,必須要明確取得使用者許可,以及若是傳送電子郵件這類的重要任務,也會要求使用者主動監督;對於轉帳這類更高風險的任務,AI則會拒絕執行。
完整對話與AI Agent執行過程可見此連結。
ChatGPT AI Agent 應用實測2:買電影票
再測試另一個類似的任務,輸入指令「購買兩張本週日晚間場次、在台北的《F1》電影票,最好是靠近電影院後排的座位。在結帳時暫停讓我確認。」,要求AI幫忙購買電影票。
買電影票和餐廳訂位的主要差異,是買電影票多了選座位的步驟。觀察AI執行過程,發現其在進入選位頁面後,沒有注意到購票網站已經自動選好兩個相鄰的位置,因此AI嘗試想自行選擇座位,但可能因為游標位置不準確,其花了約5分鐘、重試很多次之後,才成功選好位置,進到登入畫面讓使用者接管。
- 完整對話與AI Agent執行過程可見此連結。
ChatGPT AI Agent 應用實測3:近期重要新聞整理
接下來實測AI Agent結合深入研究的應用,輸入指令「請幫我整理最近一週《遠見雜誌》網站上最重要的5則科技新聞,並整理在試算表中,要有標題、發佈時間、原文連結」。
結果AI花了6分鐘,就做出符合要求的成果。先是在對話中列出其找到的新聞摘要,而後按照指令將對應欄位的內容製作試算表。
完整對話與AI Agent執行過程可見此連結。
ChatGPT AI Agent 應用實測4:製作簡報
除了上網搜尋資訊之外,ChatGPT AI Agent還能串接其他程式,使用者將該程式設為資料來源後,AI就會從中抓取資料。
實測連結Canva之後,輸入指令「請幫我在Canva製作ChatGPT、Gemini、Claude等知名AI模型的分析簡報,包括模型參數、表現、特色、價格等面向比較」,要求其製作Canva簡報。
雖然已經有事先登入好Canva帳號,但AI在嘗試進入Canva網站時遇到驗證問題,重試多次後仍無法解決,最終它表示「Cloudflare 驗證讓機器人望門興嘆」,並改採用其他方式製作簡報。
對於其簡報製作成果,整體而言有依照指令中提及的面向撰寫,但初步閱讀資料後,發現仍有一些錯誤或不明確之處。例如Gemini其實有Google AI Pro和Google AI Ultra的訂閱方案,但簡報中卻寫無訂閱方案;以及在比較API價格時,ChatGPT的價格並未註明是哪個模型等。
- 完整對話與AI Agent執行過程可見此連結。
各項實測優缺點比較
以下表格整理了本次實測的結果與優缺點比較,可見目前ChatGPT Agent在達成日常任務方面有一定能力,但需要花費較長的時間試錯,以及牽涉到需要登入其他網站的步驟時,可能因為權限驗證問題出錯。
因此,推薦想入門ChatGPT Agent的使用者,可以先從無需複雜授權、步驟明確的任務開始測試。同時也需留意提供給ChatGPT的權限,做好資安管理。
任務 | 花費時間 | 做得好的地方 | 遇到的困難 |
---|---|---|---|
餐廳訂位 | 7分鐘(進入訂位頁面)+ 9分鐘(完成訂位步驟) | 順利完成時間、地點、人數皆正確的訂位 | 點選訂位人數的下拉式選單時重試多次 |
買電影票 | 17分鐘(進入訂位頁面)
| 選擇相鄰座位時重試多次 | |
整理新聞 | 6分鐘 | 先輸出新聞摘要後,再製作符合指令欄位的試算表 | 無 |
製作簡報 | 19分鐘 | 簡報架構完整,分頁符合指令要求 | 無法通過Canva驗證 |