你的職場同事,不再僅限於真實的血肉之軀,會有許多外型與人類無異,卻能24小時不休息的機器人;與你線上對話、協作的伙伴,也有可能不是真人。
當機器真正擁有智慧,會是什麼景象?它不再笨拙地只能吐出連串詞語,而是聰慧如《鋼鐵人》的管家Jarvis,理解複雜指令,拆解成不同步驟後執行,更從此不再遺忘對話脈絡。它不再受限於封閉式的環境,將日常如《機械公敵》裡的設定,機器人大軍以人類外形走進你我生活。
在科技大廠銳意經營之下,有能力自主推理並完成決策的AI,不再是小說裡的綺麗幻想,而是轉瞬間就要落地的現實。
AI代理(AI agent)來了!
系列題組
AI Agent現身〉從數位到物理世界,AI代理來了!
AI Agent現身〉數位篇:AI同事扛再多也不累,將從職場協作角色變主導?
AI Agent現身〉物理篇:黃仁勳力推!AI落地物理世界,人形機器人商機再現
眾星雲集,都在談AI代理
自2024年第二季開始,科技大廠的腳步就沒停過。OpenAI、Google和微軟,連番發布新模型和服務,COMPUTEX更是眾星雲集,讓人瞥見生成式AI狂潮的影響力。
令人意想不到的是,軟體巨頭、晶片軍火商和筆電品牌大廠之間的最大交集,既不是AI PC,也不是AI手機,更不是萬眾矚目的GPU,而是由大型語言模型(Large Language Model, LLM)驅動的AI代理。
輝達描繪出布滿機器人的AI工廠近景,也預言機器裝進LLM的「數位人類」終將降臨;華碩則稱筆電和手機準備注入AI,裝置就要迎來智慧。
Google的「Project Astra」要讓AI助理滲透至民眾生活,微軟則頗有將Copilot從副駕駛升級成主駕的野心;OpenAI的新模型GPT-4o,更宛若雲端情人現身,讓機器的地位更上一層。
從熱烈揮舞雙手的黃仁勳,到大喊口號的施崇棠,再到軟體公司舵手們,如皮蔡(Sundar Pichai)、納德拉(Satya Nadella)和穆拉提(Mira Murati),即便站在不同位置,他們同樣讓世人看見,機器安上AI大腦之後,準備顛覆物理和數位世界。
所謂「AI大腦」,就是指大型語言模型能力漸次提升,不再只是生成內容,能做的事情變得更多。
解釋何謂AI代理時,人工智慧巨擘李開復分享,先前妻子生日時想送禮物,他找上AI尋求建議,結果得到令人滿意的解答。既然AI有能力,「為什麼只是回答,而不乾脆把事情做了?」
從對話升級到概念上更進階的AI代理,大型語言模型不再只是玩文字接龍,關鍵進化就是李開復點出的「行動」。
延伸他所說,人們生活中稀鬆平常的活動如訂票、購物,甚至是洗碗、泡咖啡,AI都應當能完成;甚至,AI可以進入職場,在工廠產線上、在辦公室裡,接下人類的工作。
全球缺工,AI代理是解方
事實上,台灣社會急需AI真能「動起來」。無論是出於少子化,還是高科技產業的人才磁吸效應,感嘆員工難尋的企業主只增不減。「最近若是入住台灣觀光飯店,觀察早上換床單、收盤子的人,可能都是移工。」橡子園太平洋基金合伙人吳德威分享他的觀察。
吳德威認為,AI代理可望解決餐旅招待產業(hospitality industry)的需求,「不管是飯店打電話問事情沒人接,還是醫院護理師巡房人手不夠,中間都涉及到直接的勞動力節省。」
缺工問題不僅發生在線下,線上的人力挑戰同樣嚴峻。
根據IBM和SAP共同發表的研究報告,此刻,數位員工和數位助理構成的「深度自動化」,在職場占比僅有5%,但到了2025年,這個數字將暴衝至50%。
「以前操作ERP的都是人,以後很多操作ERP的可能是數位員工。」台灣IBM諮詢總經理林翰拋出對比,解釋職場變化。
不僅是台灣,世界上各個地方,都在面臨勞動力人口占比下滑的趨勢。「那問題就來了,我們有經濟成長的需要、有生產的需要,但又沒有這麼多人口來應付我們生產所需。」林翰表達老闆們普遍的憂慮。
因此,見到雲端大廠紛紛端出AI代理服務做為解方,也就不讓人意外。
以Google Cloud推出的「虛擬服務專員」(AI Agent)為例,旅遊新創KKday就將其部署在面對客人的對話機器人後頭,以虛擬客服之姿,解答使用者的疑難雜症。
為何讓AI直接對到用戶?很多時候,是不得不然。KKday數據部技術主管陳柏翰將話說得直白,「沒辦法這麼多(真人)客服,24小時都在服務。」導入以大型語言模型為基底的虛擬專員後,不用人類介入,仰賴AI便解決問題的「攔截率」持續上升。
雖然對話機器人技術發展多時,但得到大型語言模型加持,不再只能靠關鍵字猜測使用者意圖,透過強化後的自然語言理解能力,再加上客製化訊息,以及封裝進模型的業務知識,虛擬客服變得更為聰明。
除了客服以外,這些AI專員還能運用在提供員工內訓、打造個人家教,以及生成網站等多樣用途,甚至,他們彼此也能夠互動。Google Cloud北亞區董事總經理李孔源解釋,虛擬專員之間也能交叉互動(crossover),例如增進產能的員工專員技能提升時,也能帶動增進客服專員的能力,「這些都會結合在一起。」
不過,AI解決方案已有多年歷史,數位世界有虛擬人、物理世界有機械手臂,由AI驅動的自動化(automation),更是兩個世界的共同語言。關鍵差別在於,生成式AI的發展,讓AI代理相關技術走入全新階段。
過往,想讓人工智慧「知行合一」並非易事。
Meta首席科學家、圖靈獎得主楊立昆多次公開表示,AI現有能力還無法企及狗、貓或者幼童,遑論與成年人類比肩。貓擁有記憶、理解物理世界,能規劃複雜行動,甚至有一定程度的推理能力,即便是最新一代的大型語言模型,也不能和貓相提並論。
推理和學習以外,AI的感知與活動能力,也長期落後於人。早在1988年,機器人學者莫拉維克(Hans Moravec)便提出一個弔詭現象:電腦在做智力測驗、下棋時,能輕易展現出與人類同等的運算能力,卻無法像一歲嬰兒那樣活動或者感知環境。
這,便是著名的「莫拉維克悖論」(Moravec's paradox )。
幸好,每個技術齒輪的微小轉動,都不是白費力氣。接收不同類型資訊的多模態能力、將行動拆解的思考鏈,甚至是行動後接受回饋的反思迴圈,大型語言模型的進展,讓卡榫全都接上。
對環境有感知、能根據外在資訊和條件制定計畫,最後採取行動讓計畫落地,「所有的AI agent基本上會有這三個模塊。」打造出數位AI代理服務HelperAI的鏈奇國際創辦人何建幟,分析AI代理應當擁有的能力。
他進一步解釋,AI接收指令後,能夠動態產出計畫,再調取不同工具完成任務。例如,機器人伸出手臂拿取重物,也例如,雲端上運行的模型瀏覽網路資料,或者接上使用者的日曆修改行程。
AI代理進行式,準備好了?
檢視既有AI自動化方案,例如產線上的工業機器人、辦公室裡的機器人流程自動化(RPA),都是解決固定場景中的結構化問題。
對照之下,吳德威強調,AI大腦「一定是處理非結構化、不確定命題的問題。」包含AI代理和人形機器人,特色就是臨機應變,因此能夠在不確定性更高的環境裡派上用場。
舉例來說,人形機器人能夠走出工廠,跨入廚房、救災現場,甚至是尋常百姓家;AI代理在工作中能自主、一條龍完成任務,也可以走進生活。
而且,這已是現在進行式。
在COMPUTEX期間,聯發科展示了多種智慧助理(agent)服務。除了人們熟知的語音導覽和智慧管家以外,使用者可以在聯發科的生成式AI平台「達哥」上,輸入行程需求和個人資訊,便能完成訂票。
聯發科技人工智慧暨數據工程處副處長楊建洲解釋,以AI訂票為例,乍看之下僅是將行動從應用程式搬到生成式AI平台,但背後的想像空間很大。
例如,通勤方式可能同時牽涉高鐵、機票和台鐵,又會有想靠窗、中途要在特定景點停留的個人化需求。只要簡單打字,或者出聲對話,智慧助理的AI大腦就會運作,並展開行動,「這不只是單純的訂票,實際上是旅遊規劃的過程。」
再往下延伸,根據預算、時機和送禮對象,AI助理能自行到電商網站瀏覽商品,根據購買者意圖比價、挑品,即便缺貨也能靈活應對。工作場景中,高階主管的AI祕書能彼此協調時間,不用再消磨於無止盡的確認日曆。
當人類指派AI代理任務後,可以倒頭就睡,或者專心於原先工作上。楊建洲因此用「fire and forget」,凸顯AI代理的效益。
閉上雙眼,試著在腦中想像,職場上的同事,不再是真人,而是24小時運作的數位專員,還有永不疲憊的人形機器人。
這樣的景象讓人興奮,也讓人擔心。然而,這不再是即將到來的以後,而是眼前的真實。
迎接AI代理到來的美麗新世界,你準備好了嗎?