遠見x科學人 遠見x科學人 想一次掌握全球趨勢與科學新知?訂遠見+科學人一年享專屬優惠

破除自動化AI代理效率迷思!工作流程再思考

陳向豪 Vincent
user

陳向豪 Vincent

2025-12-26

瀏覽數 50+

根據史丹佛研究,任務若完全交由AI代理執行,整體效率反而下降。僅為情境配圖,pexels-ron-lach
根據史丹佛研究,任務若完全交由AI代理執行,整體效率反而下降。僅為情境配圖,pexels-ron-lach

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

編按:當AI代理走進企業流程,自動化往往被直接等同於效率提升,但實際情況可能更複雜。根據史丹佛研究,任務若完全交由AI代理執行,整體效率反而下降;唯有人類保留關鍵判斷、AI負責可標準化環節,效率才能真正被放大。

過去一年,只要打開科技新聞、看產業報告,或是聽公司主管談策略,AI Agent(AI代理)幾乎無所不在。我們的數創實驗室社群也是,在2025年舉辦的活動中,超過一半的主題都和AI Agent有關。

這股熱潮,悄悄把大眾對AI Agent的直覺想像,簡化成一個漂亮的公式:只要把流程交給Agent自動跑,工作效率就會上升。在這個公式的想像下,許多企業相信自己可以靠AI Agent,一邊省下人力成本,一邊做完同樣多、甚至更多事。

然而,根據史丹佛與卡內基美隆大學的一項最新聯合研究:How Do AI Agents Do Human Work? Comparing AI and Human Workflows Across Diverse Occupations(AI代理如何執行人類工作?跨不同職業比較AI與人類工作流),卻對這個看來完美的公式潑了冷水。

研究團隊在Upwork上,招募48位具有實務經驗的專業工作者,同時使用四種常見的AI Agents(OpenHands-GPT、OpenHands-Claude、ChatGPT Agent、Manus Agent),一起執行16組真實任務。這些任務涵蓋五大通用技能(數據分析、計算/表格處理、軟體工程、寫作、設計),用來比較在「全自動」和「人機協作(或AI增強)」兩種模式下,工作者與Agent的工作表現差異。

結果顯示,當任務交給Agent全自動處理時,整體工作效率反而下降17.7%;但在人機協作的模式下,效率則提升24.3%。

讀到這裡,相信有些人會對這組「打破直覺的數字」感到訝異。因此,接下來,我們先退一步,看看這項研究的設計、以及到底在觀察什麼。

當任務交給Agent全自動處理時,整體工作效率反而下降17.7%。僅為情境配圖,取自Unsplash

當任務交給Agent全自動處理時,整體工作效率反而下降17.7%。僅為情境配圖,取自Unsplash

快又便宜,但為何無法省事?

這項研究可靠嗎?應該還算可靠。

研究團隊先從O*NET中取出五大通用技能,這五類技能合計涵蓋71.9%白領工作者每天在電腦前做的事情;再從900多種職業、上萬個工作任務中,實際挑出16組具體任務作為代表。這些任務,包括你我都很熟悉的整理員工聚餐收據、依照財報做數據分析等。

接著,研究團隊將這16組任務,同時分配給人類專業工作者與AI Agent。

當這16組任務的數據被攤開來,第一眼看到的,是一個非常符合直覺的結論:在效率與成本上,AI Agent的確遠勝人類。

舉例來說,在所有人類與Agent都成功完成的任務中,Agent的平均完成時間,比人類快了將近九成,電腦上的實際操作動作也少了超過九成。從成本角度來看,Upwork平均一個案子大約是25美元;把同樣的任務交給Agent來跑,大約只落在1~2.4美元之間。對習慣算ROI的管理者來說,這是一個巨大的成本差距。

$3,980全球議題、科學新知一次掌握!訂遠見掌握全球領先議題+科普雜誌第一品牌科學人,陪你從趨勢走向洞察>>

然而,如果我們從任務成功率與品質的角度來看,Agent明顯輸給人類。

研究結果顯示,AI Agent的任務成功率,比人類低了大約32.5~49.5%。舉例來說,一旦任務牽涉到視覺理解(像是從收據影像裡讀金額),或是需要在UI上進行點擊、拖拉等非結構化操作時,差距會變得更明顯。

更麻煩的是,這些不是一眼就看得出來的錯誤。當Agent無法順利從圖像中讀出數字,它有時會直接編造一組看起來合理的數字填進表格;讀不懂使用者上傳的PDF財報,會改用網路搜尋其他文件來補資料。從模型角度看,它只是想辦法完成任務;但從企業角度看,這是難以察覺的數據與合規風險。當這種看起來沒問題、實際有風險的輸出堆疊起來,人類就需要花更多時間檢查、重做與收拾爛尾。

全自動vs.人機協作,哪個更有效率? 

研究團隊接者把視角拉回整體工作流程,以人類自己做當作基準線,比較兩種方式:

.全自動模式(Automation):工作者把任務整包交給Agent,自動跑完整個流程,最後才接手檢查、修正結果。

.人機協作模式(Augmentation):工作者維持原本的工作流程,只在中間幾個可被標準化的步驟交給Agent處理,開頭的資料準備與最後的檢查,仍由人類負責。

得到的結果,如同前述所提。讀至此,或許我們可以猜到原因:因為當任務交給Agent全自動處理時,省下的僅是表面操作時間,增加的卻是後續追錯、驗證與重工的時間;而在人機協作模式下,Agent承接中段重複又可程式化的步驟,人類則專注在定義問題與把關結果,重工成本大幅下降。

Agent當渦輪,Human-in-the-loop才是最佳解

這項研究,反轉我們對AI Agent的直覺想像:把整個工作流交給它,自動跑完,效率就會自然提升。如果企業只把AI Agent視為一條「能省錢省事的捷徑」,最後可能得到一個更複雜、更脆弱,又無法讓人放心的系統。

或許,接下來真正該思考的是,我們要如何善用AI Agent這顆引擎上的渦輪,讓我們跑得更快;但路要怎麼選、什麼時候該減速、哪些路段要親自掌舵,仍需要人來決定。只有在這樣的前提下,人類與Agent才有機會都待在對的位置上,各自發揮長處。

你可能也喜歡

AI治理有方 新北市打造智慧城市資安新典範
數位專題

AI治理有方 新北市打造智慧城市資安新典範

洞察趨勢的新北市政府,以超前部署、積極布局的策略,致力打造宜居、創新的智慧城市,聚焦「基礎建設」、「關鍵技術」、「智慧應用」三大面向,新北市已同步展現具體成果,體現地方政府的前瞻思維與執行力。

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務