早在2024年初,人工智慧權威吳恩達(Andrew Ng)就將AI代理(AI Agent)列為最值得關注的AI趨勢之一。兩年過去,AI Agent已從紙上理論與行銷熱詞,走向OpenClaw、Claude Code、Claude Cowork等真正開始做事的產品。究竟AI Agent是什麼,為何備受討論?所謂「AI代理工作流程」(AI agentic workflow)又指的是什麼?如今AI Agent上線後,又碰上哪些挑戰?《遠見》一文帶你看。
*本文初版完成於2024/06/30,最後更新日期:2026/05/22
AI Agent是什麼?
OpenAI產品長威爾高聲呼喊,2025年就是AI Agent元年;Google執行長皮蔡(Pichai)也表示,我們已經進入Agent時代(agentic era)。
進入2026年,伴隨OpenClaw熱潮,AI Agent已經進入企業工作現場與日常應用場景。
所謂AI Agent,是指具備自主運作(autonomous)能力、無需人類介入的AI系統。
使用者只需下達指令,AI Agent便能感知環境、解讀意圖;面對高複雜度任務時,它會自行拆解步驟、制定計劃並執行。任務完成後,更具備分析資訊、自我進化的能力。
台灣習慣將AI Agent翻譯為「AI代理」與「AI代理人」,對岸則以「AI智能體」稱之,翻譯的核心皆在於結合「智慧」(intelligence)與「代行」(agent)特質。
無論是將產品與服務賣給消費者(2C),還是專注於企業(2B),有許多企業開始高喊導入AI Agent,或者販售AI Agent服務。開始出現不少高喊AI Agent應用的公司。
究竟,AI Agent的發展進度如何?
AI Agent應該具備哪些能力?
儘管市場對AI Agent的定義眾說紛紜,但若撥開行銷迷霧、回歸技術核心,前OpenAI應用研究主管、Thinking Machines共同創辦人Lilian Weng在2023年發表的論述,至今仍然值得參考。
她深入剖析了由大型語言模型(LLM)驅動的自主代理系統(Autonomous Agents)架構;這篇文章因其嚴謹的邏輯與實務指導價值,也成為許多企業與個人在開發AI Agent時,重要的參考座標。
就像人類一樣制訂計畫,還能利用工具做事
Lilian Weng主張,AI Agent是以LLM為核心大腦,並具有規劃(planning skills)、記憶(memory)與工具調用(tool use)能力的系統,讓AI從原本只能執行特定任務的工具,進化為能處理通用型問題(general problem)的自主個體。
以規劃能力來說,Agent能運用「思維鏈」(Chain of Thoughts)或「思維樹」(Tree of Thoughts),將複雜指令拆為一系列子目標(Subgoals),實現對進度的精準控管。
任務告一段落後,它還能透過ReAct、Reflexion及「事後反思鏈」(Chain of Hindsight)自我評估。這種具備「反思能力」的機制,讓Agent能從經驗中迭代學習,在避免重蹈覆轍的同時,持續改進行動品質。
AI Agent具備規劃能力、擁有記憶力、可以使用工具,因此能夠展開行動。取自Lillian Weng部落格

鏈奇國際創辦人何建幟補充,一個成熟的AI Agent應具備感知(perception)、思考(thinking)與行動(action)三大核心能力。
自主運作的基石源於「感知」,系統需即時掌握外部環境變化,並釐清自身所處的情境座標。隨後的「思考」階段,則是將環境資訊轉化為縝密的執行計畫,確保決策的精準與有效。
最終,AI Agent必須跨越邏輯分析,將計畫具現化為具體的「行動」。
唯有具備將思維轉譯為實作的執行力,AI才能真正跨出螢幕、代人代勞。這三大能力交織而成的運作框架,正是讓AI任務從虛構構思走向現實落地的關鍵。
AI Agent展現出哪些特性?
除了從「能力」角度定義AI Agent,也可以透過「特性」這個視角,進一步理解AI Agent的本質與價值。
曾於2024年參與開發生成式AI平台「達哥」(DaVinci)的聯發科技人工智慧暨數據工程處副處長楊建洲,當時接受《遠見》採訪時,提出AI Agent應涵蓋五大核心特性:個人化(personalization)、主動性(pro-active)、互動適應性(adaptive interaction)、自主學習(learning),以及任務管理(task management)。
若對照ChatGPT,差異相當鮮明。
AI Agent不是被動等待指令,而是會主動出擊,自行發起對話、向使用者提問。更關鍵的是,它能在持續互動中累積對使用者偏好與習慣的理解,讓每一次的決策都更貼近個人需求,而非千篇一律的通用回應。
面對突發或未知狀況,AI Agent同樣不需要人類介入引導,它有能力自動規劃應對方案並付諸執行。楊建洲認為,真正到位的AI Agent,應能完整走完「接受任務、調整任務、執行任務、回報任務」整段流程。
他進一步以「Fire and Forget」這個概念點出AI Agent的終極價值:使用者只需下達指令、完成任務分配,接下來便可去做其他的事,甚至直接去睡覺。不必再把時間和注意力耗費在來回對話上,認知資源得以真正解放,工作也能安心地交托給AI全權處理。

2026年5月Google開發者大會上,Google展示的AI Agent應用,很適合說明AI Agent的理想特性。
以Gemini Spark為例,它的定位是能夠24小時在背景運作的個人AI Agent,使用者即便關閉電腦,它也能替你執行任務。
例如,使用者可以指派Gemini Spark定期解析每月信用卡帳單,主動標出新出現或可疑的訂閱費用;也可以請它持續追蹤某類資訊,像是自動檢查孩子學校寄來的Email,抓出重要截止日期,再整理成一份每日摘要寄給家長。更進一步,它還能把分散在郵件與聊天紀錄中的會議筆記整合起來,整理成正式文件,甚至順手起草專案啟動信。
包含Gemini Spark在內的AI Agent,都不僅止於提供答案,還能跨工具、跨時間地主動追蹤資訊、整理脈絡,並完成一整段工作流程,真正朝「Fire and Forget」的使用體驗靠近。
AI Agent與常見工具有何不同?
AI Agent與ChatGPT有何不同?
OpenAI曾在其開發者大會上,提到AI正從「有問必答」進化到「有求必應」,這也正是AI Agent與ChatGPT的本質差異,ChatGPT只能對話,而AI Agent能夠行動。
對比兩者,ChatGPT可以說是博學多聞、善於聊天的數位助手,AI Agent則是具備執行力的數位員工。它不只停留在內容生成,更整合了記憶、規劃與工具運用,將核心重心從「產出答案」轉向「達成任務」,能夠超出網頁上的對話框,替人類完成任務。
AI Agent與AI模型有何不同?
自從ChatGPT震撼問世以來,人們便將目光放在幾間先進AI實驗室的新模型,比較Anthropic最先進的Claude Opus 4.7、Google最新的Gemini 3.1 Pro,還有OpenAI的GPT-5.5,究竟誰是當今地表最強大的模型。
不過,AI模型不能直接和AI Agent畫上等號。
Google Cloud執行長科里安(Thomas Kurian)在2026年4月自家的年會中就提到,「企業要發揮AI實力,光靠模型是不夠的。」
如果說模型是負責理解與生成的引擎,Agent就是以引擎為核心驅動、長出手腳的系統,串聯了記憶、規劃與工具調用能力,將純粹的運算力轉化為可落地的執行力。
單靠模型時,AI多半仍停留在回應使用者請求而已,主要用途是問答、摘要、翻譯、撰文或生成程式碼;Agent則能根據目標拆解步驟、跨系統調用資料,甚至在取得授權後,於現實環境中直接採取行動。
| AI Model與AI Agent對比 | ||
|---|---|---|
| 項目 | 模型 | Agent |
| 知識 | 知識有截止日期(cutoff date),僅具備訓練資料中的知識。 | 可以利用外部搜尋工具,擴展知識的範圍。 |
| 脈絡 | 以單次查詢回應為主,除非在指令中特別提醒,否則無法「想起」先前對話內容。 | 能夠記錄並管理多輪對話的歷史,因此對話時較能掌握脈絡。 |
| 工具 | 無法調用工具。 | 能夠調用工具。 |
| 推理 | 使用者僅能盡量利用提示工程(prompt engineering)技巧引導。 | 可以調用ReAct等推理框架。 |
| 資料來源:受訪者、Google 2025年AI Agent白皮書。整理:曾子軒。2025/01更新。 | ||
AI Agent與RPA有何不同?
在大型語言模型(LLM)席捲全球前,企業談及自動化,多半指的是RPA(機器人流程自動化)。作為技術先行者,RPA擅長在固定規則下精準執勤,是追求效率的穩定推手;然而,一旦任務進入需要隨機應變的灰色地帶,AI Agent具備的決策特質,便成為兩者的關鍵分水嶺。
楊建洲認為,AI Agent並非漫無目的地自由發揮,而是在預設地圖中保有彈性。以規畫日本旅遊為例,她表示,訂票與租車是標準化的RPA流程,但Agent能根據使用者的預算,在特定節點上自主判斷並調整選項。
簡而言之,RPA照表操課,AI Agent則擅長處理具不確定性的判斷任務。這種在預設(Pre-defined)框架內代人行動的能力,讓AI從被動接受指令,轉為主動代替人類工作。
AI Agent為何興起?
2023年底,比爾蓋茲便預言,AI Agent能夠幫助使用者完成「所有活動」。
他認為,AI Agent不僅能理解日常語言,更能深入掌握每位使用者的個別需求,進而提供量身打造的服務。在他看來,AI Agent的崛起不單是人機互動方式的演進,更將從根本上重塑整個軟體產業的版圖。
有趣的是,蓋茲坦承,AI Agent的概念其實並不新鮮。早在1995年的著作《擁抱未來》中,他便已埋下這顆種子。只是彼時缺乏技術土壤,這個想法始終停留在紙面。直到近年AI研究突飛猛進,AI Agent才真正從願景走向現實。
這場蛻變的關鍵,在於大語言模型(LLM)開始有能力充當「大腦」,同時在物理與數位兩個世界施展影響力。
過去的LLM生成內容游刃有餘,付諸行動卻力不從心,堪稱「思想的巨人、行動的侏儒」。即便2023年出現了BabyAGI、AutoGPT等項目,史丹佛大學與Google研究人員也曾聯手打造AI虛擬小鎮,AI Agent依然像一個觸手可及卻始終未竟的夢。

DeepLearning.AI工程經理陳奎翰認為,記憶力的躍升,是LLM從對話工具進化為行動主體的核心驅動力之一。
GPT-3.5時代,模型能消化的上下文長度(context window)僅停留在數千字的量級;GPT-4將上限推升至數萬;將時間快轉至2026 年,三大主流模型均能夠容納的上下文已突破百萬符元(token)大關。
以上下文長度來說,Anthropic的Claude Opus 4.6與Sonnet 4.6支援最高100萬token,Google的Gemini 3.1 Pro同樣提供100萬token,OpenAI的GPT-5.5則配備超過105萬token。
曾經令人驚豔的百萬token,如今已成為頂級模型競爭的新基準線。
因為能夠容納的上下文提升,陳奎翰建議使用對話式AI服務時,可以先列出幾個範例,「告訴它(LLM)你的任務如果是這樣,可以把它拆解。」
他的說法,與提示工程(prompt engineering)中的少樣本範例(few-shot example)概念一脈相承。
量變帶來質變,隨著LLM的記憶容量愈來愈大,開發者便能提供更豐富、更細緻的參考範例。有了充足的前例作為對照,面對陌生任務時,模型自然能夠舉一反三、將指令拆解執行,這也是AI Agent規劃能力持續精進的重要原因。

除了記憶力,AI Agent同樣具備反思機制,能夠在行動中不斷修正自我。常見的做法,是在原有的執行角色之外,額外引入一個負責旁觀與回饋的LLM,它可以直接評估前者的行為,也可以調取外部資訊加以比對,從而推動整體表現的迭代提升。
陳奎翰進一步指出,自我評估之外,人類同樣可以隨時介入這個迴路。舉例來說,當LLM在網路搜尋後列出A、B、C、D四個連結,人類若判斷D不適合,直接告知模型排除即可,模型會據此調整後續行為,這正是「人類在迴路中」(human-in-the-loop)機制的體現。
當以上種種能力匯聚一身,LLM便完成了從純粹產出文字的思考者,到能夠採取實際行動的執行者這一身份轉換。這正是AI Agent時代開幕的起點。
AI Agent調用工具有哪些用途?
| AI Agent的工具使用功能可以做哪些事? | |||
|---|---|---|---|
| 項目 | 調用API | 函數 | 資料 |
| 目的 | 使用他人已經開發好的第三方服務或者取用資料。 | 處理開發者自訂的複雜計算,或者企業內部業務邏輯。 | 檢索(模型)外部資料,藉此得到更精準與即時的資訊。 |
| 注意事項 | 確保API訪問權限與速率限制。若AI Agent調用太多API,可能因為回應延遲影響使用者體驗,甚至因為過度依賴外部API增加風險。 | 考慮函數執行的效率、順序與容錯能力,確保每個函數的輸出可正確被後續步驟使用,並妥善處理異常情況。 | 資料需經預先處理與索引,確保結構化數據的準確性;對非結構化資料需增加解析效率並保障隱私。 |
| 實例 | - 調用地圖API獲取位置 - 調用翻譯API進行語言轉換 - 調用支付API完成交易 | - 驗證用戶輸入後進行條件計算 - 在一個函數中轉換資料格式後傳遞給下個函數處理 - 人工審查後大量生成報表 | - 從PDF中抽取簽約者的個人資料 - 從關聯資料庫中檢索銷售情況 - 抓取HTML文件中特定標籤的內容 |
| 資料來源:受訪者。整理:曾子軒。2025/01更新。 | |||
AI Agent擅長解決什麼問題?
自LLM崛起以來,「RPA是否會被AI Agent取代」的討論便從未停歇。
對此,橡子園太平洋基金合夥人吳德威以「哲學上的矛盾」點出核心張力:無論是辦公室還是工廠的自動化需求,本質上都是為了排除人力、讓機器依循固定規則運作。然而,生成式AI帶來的恰恰是創造力與不可預測性,這對那些因重視可控性而採購RPA的企業客戶而言,反而是難以接受的變數。
AI Agent的獨特之處,在於它擅長應對非結構化問題(unstructured problem)。吳德威指出,進入AI時代後,當AI助理回應使用者提問時,不再需要預先建立題庫,便能給出準確答案,甚至可以自然地與使用者對話,或直接執行播放音樂等具體動作。「它不能太限制於structured problem,因為處理(結構化問題)說真的,就不需要AI。」
也正因如此,他認為訂票這類高度結構化的任務,根本輪不到AI Agent出手。
「那是把選擇題複雜化」,無非是把原本應用程式裡的選項框,換成用語音來操作。在他看來,AI Agent真正能發揮價值的場景,應從旅宿產業開始切入。旅客入住後若遇到問題,過去習慣撥電話向櫃檯求助,如今換成向AI Agent提問;這類問題既非標準化的結構化問題,又不至於漫無邊際,恰好落在AI Agent能夠靈活處理的甜蜜點。
不過,一旦任務複雜度持續攀升,AI Agent的局限便開始浮現。吳德威表示,決策難點愈多,所需的配置(configuration)就愈繁瑣,系統也愈難以駕馭。

他以AI秘書類產品為例,以自身兼具創投、顧問等多重身份的現實來說,AI秘書根本無法有效協調他錯綜複雜的行程安排。訂餐也是同樣的道理,現有成熟工具的設計邏輯,是把複雜決策化繁為簡、提供明確選項讓人挑選;若改用AI Agent重新處理,等同於把選擇題硬生生變回問答題,未必能夠帶來進步。
另一方面,旗下已有面向企業的AI Agent產品的何建幟,對於Agent適合介入哪類任務則有更直接的體悟。他的判斷標準清晰:當企業或個人已清楚知道自己需要什麼,Agent自然無用武之地;但一旦需求本身還模糊,或任務本身充滿不確定性,Agent的價值才真正得以體現。
正是憑藉推理能力、動態規劃與工具調用這三項核心優勢,何建幟強調,AI Agent不只能處理非結構化的資料,更能進一步應對非結構化的問題本身,這才是它與傳統自動化工具之間,最根本的差距。
AI Agentic Workflow是什麼?
吳恩達在2024年6月撰文指出,若說向LLM下達單次指令、等待回覆的one-shot互動,明顯稱不上Agent;而能夠自主規劃、調用工具並反覆迭代改進的系統,則明顯就是Agent。只是,兩者之間,存在一片廣闊的灰色地帶。
因此,比起非此即彼地劃定「Agent」或「不是Agent」的邊界,他更偏好以「Agentic」這個形容詞,來衡量一個AI系統在多大程度上接近Agent的本質。他也補充觀察:使用「Agentic」這個詞的,通常是技術背景的人,因此每當他看到文章標題出現這個詞,點開的意願反而更高,「因為它比較不會是行銷噱頭,而是懂得技術的人所寫。」
無論是「Agent」還是「Agentic」,本質上都是在描述同一件事的不同側面。談論AI Agent時,人們慣常從它「應該具備哪些能力」切入定義;但其實,同樣可以從「完成任務的流程」這個角度來認識它。
前幾個段落提及的種種能力,如拆解指令、動態規劃、工具調用,並非孤立的特性清單,而是AI Agent在接受人類委派後,從理解任務到付諸行動的完整過程。也正因如此,那些專注於如何設計與構建AI Agent的工程師和從業者,更習慣以「AI代理工作流程」(AI Agentic Workflow)這個詞來討論整個系統的運作邏輯。

AI Agent有哪些應用?
當AI Agent真正落地應用時,大致可分為面向企業(B2B)與面向消費者(B2C)兩條路徑。但若從實際場景來看,它的應用邊界其實相當寬廣,難以一概而論。
陳奎翰以撰寫研究報告為例,可以設計出「資料搜集者」、「資料整理者」與「報告撰寫者」三種專職角色,各司其職。資料搜集者負責網路爬梳;資料整理者懂得以學術指標篩選論文品質;報告撰寫者則熟悉使用者偏好的寫作體例。
三者分工合作、截長補短,最終產出的報告品質,遠非單一模型單打獨鬥所能比擬,也具體說明AI Agent如何透過分工協作發揮效能。
撰寫研究報告只是一例。往外延伸,AI Agent既能在職場上為白領員工分擔繁瑣事務,例如協助財務團隊處理帳務核對,或代替採購人員向供應商詢價比價,也能走入日常生活,從旅遊行程的規劃,到餐廳預訂、機票購買,一手包辦。
企業端的AI Agent應用
在企業端(B2B)的應用場景中,客服是目前最普及、也最為成熟的AI Agent落地領域。
不過,企業實際在客服端運用AI Agent的具體涉入程度不同,有些是單純讓AI Agent輔助人工客服,藉此提升客服品質;有的則直接讓AI Agent站上第一線,獨立回應客戶問題,全程無需人工介入。
以輔助型AI Agent的應用來說,和泰汽車數位應用部部長謝琴韻受訪時曾分享了兩個案例。
第一種是讓AI接手客服流程中的後台整理工作。
謝琴韻表示,過去客服人員接電話時,必須一邊回應客戶、一邊手動記錄重點摘要,還得趕在下一通電話進來前完成案件分類;導入AI後,系統會在背景自動生成逐字稿、主旨摘要與分類建議,讓客服人員能把更多注意力放回顧客本身。根據謝琴韻說法,這套做法已讓案件分類正確率從60%提升到80%,也明顯減輕第一線人員的多工負擔。

第二種則是協助第一線人員更快找到專業知識。
謝琴韻指出,過去技師遇到複雜、難修的車輛問題時,常得在分散的技術文件與過往案例之間反覆翻找;如今團隊嘗試把技術文件整合進系統,讓AI成為可交叉查詢的技術知識庫,在第一線遇到問題時先整理出較完整的參考結果,協助技師更快掌握可能的問題成因與處理方向。
延伸閱讀:和泰汽車的AI轉型課:為何選擇Gemini?又如何打通資料孤島?
如果說和泰的做法,是讓AI先成為第一線人員背後的知識助手;那麼再往前一步,有些企業則放手讓AI接手第一線的大量標準化需求。
以美國外送企業DoorDash為例,它曾與AWS合作,建立生成式AI自助聯絡中心,直接處理外送員常見的app故障排除、註冊與付款等問題,處理最常見、最大量的來電,把更複雜的問題留給真人處理,藉此減少每日數千次升級轉接真人客服的案件。
YouTube TV客服團隊推出的語音代理,同樣也是讓AI Agent站上第一線面對消費者。Google Cloud資深產品經理馬洛(Patrick Marlow)分享,這款語音代理可以直接處理NFL週日門票與YouTube TV方案的訂閱事宜,這套系統除了基本的「是否有體育方案」等問題以外,還能即時比較方案價格、說明頻道內容,甚至在對話中切換語言、延續銷售流程。
延伸閱讀:AI Agent仍不夠好用?Google專家:答案在情境切換成本
消費者端的AI Agent應用
在個人端(B2C)的應用場景中,最直覺、也最好想像的AI Agent原型,莫過於《鋼鐵人》的AI管家Jarvis。這類貼身AI助理,是目前效益最為顯著的生活化應用,現實中的近似案例包括Apple Intelligence與Google的Gemini Intelligence。
要讓個人AI Agent真正發揮價值,關鍵充分理解使用者,以及能夠採取有意義的行動。隨著AI模型能力持續躍進,這兩個面向都已出現顯著突破。
就「理解使用者」而言,早期的智慧助理如Amazon Alexa、Apple Siri,只能接收明確且格式固定的指令,語句稍有模糊或複雜,系統便容易失準。生成式AI崛起後,局面為之一變,在的AI助理能夠解讀人類開放式的自然語言,將模糊的表達轉譯為具體可執行的需求。
就「採取行動」而言,過去的智慧助理即使聽懂了指令,能做的事仍相當有限,大多侷限在單一裝置或應用程式內執行簡單操作,如開燈、查天氣、設定鬧鐘等。
如今的AI Agent則具備跨應用、跨平台的任務執行能力,能將使用者交付的目標自動拆解為具體步驟。以出差需求為例,AI可以同步整理航班與住宿選項、比對行事曆空檔、草擬請假或報備信件、建立待辦清單,甚至在取得授權後直接完成預訂與付款。

蘋果在2024年預告Apple Intelligence時,核心願景便是讓生成式AI深度融入使用者的個人情境,提供真正切身的智慧服務,而非泛用的通用回應。
2026年Google推出的Gemini Intelligence,同樣以「行動力」作為核心亮點。使用者指派任務後,系統會運用推理能力制定執行計畫,再串接外部服務完成整個流程。舉例來說,當使用者想訂餐、叫車或規劃旅程,Gemini不只停留在給建議的層次,而是進一步連接DoorDash下單、透過Uber派車,或直接在Expedia上安排行程,從意圖到落地,一氣呵成。
延伸閱讀:Gemini正顛覆iPhone,以後還需要買手機嗎?
AI Agent有哪些挑戰?
LLM擅長生成內容的核心能力,在AI Agent的實際落地過程中,卻意外成為阻礙前行的根源。
理想狀態下的AI Agent,面對任何未知問題都應能從容拆解,根據現有資訊勾勒出完整的行動藍圖。但這份本該是優勢的推理能力,卻在講求穩定與可控的企業環境中,演變成導入AI Agent時揮之不去的痛點。
《經濟學人》在2024年底預測2025年AI走向時便已點出,AI Agent的發展至少面臨三道關卡。
其一,推理過程本身會推升運算成本;其二,Agent在現實世界產生的後果牽涉到信任問題,企業難以放心交棒;其三,用於訓練任務執行的資料量,遠遠少於對話類資料,使得模型在「做事」上的能力比「說話」更難養成。
AI Agent挑戰 - 不可預測性
專攻金融法遵的新創Parcha,曾以「Agents aren’t all you need」為題,直指AI Agent在實務應用中的核心缺陷。其中有段數字令人警醒:若一個AI Agent自主執行由10個子任務串聯而成的工作流程,而每個子任務的錯誤率為10%,累積下來,整個流程的複合錯誤率將高達65%。
這不過是伯努利分布與冪次運算,卻因為有具體數字支撐,讓問題的嚴重性一目了然。
Parcha進一步解釋,AI Agent每次處理問題時,都會以靈活且富有創意的方式重新擬定計畫,聽起來是優點,實則帶來四個連鎖隱患:行為難以預測、各步驟之間高度相互依賴、潛在的效能瓶頸,以及成果難以客觀評估與持續改善。
楊建洲所說的AutoGen,由微軟、賓州大學和華盛頓大學攜手開發出,是一種讓多位Agent彼此交流,以此解決任務的框架,開發者能夠利用AutoGen打造大語言模型應用。市場上熱門的LLM應用開發框架LangChain、LlamaIndex,也陸續推出支援使用者打造Agent的功能和語法。
AI Agent挑戰 - 出錯與信任
除了推理與規劃能力尚未臻熟、難以真正做到從零到一地解決問題之外,AI Agent對外運作時一旦出錯,帶來的後果往往遠比想像中嚴重。
舉例來說,先前Google推出以生成式AI驅動的搜尋摘要功能「AI概覽」,便接連鬧出內容失真的笑話:建議使用者用膠水讓起司黏住披薩,或引述地質學家的話聲稱人們每天可以吃一塊石頭。
「Google可以受這樣的傷害,但是品牌沒辦法受這樣的傷害。」吳德威語氣篤定。在他看來,任何認真經營品牌的企業,面對這類風險只會選擇保守應對。
因此,即便AI Agent已具備流暢對話的能力,在直接面向客戶的場景中,很多時候企業還是會加入人工審查的緩衝機制。他舉例,若電信商應用程式內建的客服Agent,因為知識庫的侷限而不慎向用戶推薦了競品,哪怕只是一次失誤,累積多年的品牌信任便可能就此動搖。
陳卓翰的憂慮與吳德威如出一轍。他以電商購物為例:當AI Agent依照使用者需求前往電商平台下單,走到即將刷卡的最後一步時,使用者內心難免浮現疑問「還是要人去決定,這會有信任問題。」一旦信任的橋梁尚未搭穩,AI Agent的自主行動能力,反而可能成為用戶裹足不前的理由。

AI Agent挑戰 - 行動上的障礙
AI Agent在數位世界行動時,可行作法包含直接走官方通道,也就是接上其他服務的API;或者模擬人類作法,撰寫腳本完成任務。前者的挑戰在於可能撞上企業生態系的壁壘,例如電商平台不願開放API給購物Agent,後者的限制則在於費時。
舉例來說,購物Agent能夠自行到電商平台上比價,並根據使用者預算挑出合適品項。楊建洲表示,可以預想電商可能不願意開放API給使用者的Agent,因為只有真人消費者會有衝動購物、被折扣誘惑的行為。
不過,他並不擔心這個問題,因為他預期未來使用者與服務之間,都會使用AI Agent互動。目前,「達哥」團隊已在著手進行Agent與真人的互動,例如讓Agent打電話訂餐,接下來則會出現Agent之間自行溝通。
「秘書最痛苦的就是協調多個主管的會議時間,但秘書可以請代理人,也就是達哥,去跟每一個主管的代理人直接溝通,討論會議時間後約會議室、寄出邀請和開會議程,中間都沒有人介入。」

AI Agent挑戰 - 上線後的治理問題
OpenClaw的爆紅,讓市場具體見識到AI Agent的能力;而它隨後的退燒,則讓人們意識到,光是能夠採取行動還不夠,穩定性與可控性,才是AI Agent真正落地的關鍵。
和聊天機器人不同,Agent要能夠超出對話框,在使用者的手機或電腦內採取行動,就必須碰觸本地(local)檔案、郵件,甚至取得企業內部系統的權限。
一旦AI Agent遭到滲透或攻擊,可能誤刪資料、發錯訊息、下錯指令,直接衝擊公司內部營運,這也是企業在導入AI Agent時最難以迴避的顧慮。
奧義智慧共同創辦人暨技術長邱銘彰形容,AI能夠在幾分鐘內替人類快速完成工作,「但它也可能在幾秒鐘內摧毀你的系統。」速度愈快、自主性愈高,出包時造成的損害也愈難即時補救。

更棘手的是,若企業事前未留下完整紀錄,事後可能連Agent究竟讀取了哪些資料、調用了哪些API、在哪個環節開始偏離目標,都無從查起。
邱銘彰直言,缺乏追蹤與控管機制的AI Agent,形同「完全不受控的黑盒子」,一旦出事,責任歸屬便無從釐清。
也因此,不管是企業或個人,都開始將更多注意力放在如何治理AI Agent,包含如何劃定任務邊界、如何在出錯時啟動應變機制,以及事先明確責任歸屬。
從權限管理、運算成本,到錯誤發生後的究責方式,這些現實條件,將共同決定AI Agent能否在企業裡走多遠。
AI Agent的未來?是泡沫嗎?
若要討論AI Agent的未來,NVIDIA執行長黃仁勳在資訊服務軟體商ServiceNow年會中,曾談到AI Agent的演進軌跡,或許也值得參考。
他描繪出清晰的發展脈絡:「現今大多數的AI都是一次性的(one-shot)。你給它一個提示,它會立即生成建議。」而下一階段的AI,將走向多次互動(multi-shot),成為以推理為基礎的系統。
「就像我們人類在複雜情境下制定計畫一樣,它將自行規劃……擁有多步推理的人工智慧即將到來,這些AI將愈來愈多地用於代理應用(agentic use)。」
黃仁勳也指出,能夠調用工具、存取個人化資訊的AI已初見雛形,且能力仍在持續躍升。他以員工作比喻:「AI像我們公司的員工一樣在其中一起工作……我們將擁有顧問人工智慧、專業人工智慧,和通才人工智慧。」
從one-shot到multi-shot,從單一回覆到自主規劃,從工具到夥伴,AI Agent與人類協作、彼此之間相互串連的那個未來,正在來臨。