繼DeepSeek以具有推理能力的低成本模型震撼市場以後,另一間中國新創Monica推出的AI Agent(AI代理)「Manus」再度掀起波瀾。ChatGPT和Claude的Agent還在測試階段,垂直領域的Agent才初見成效,為何Monica有勇氣聲稱Manus是通用AI Agent?Manus在網上聲量兩極,有試用者讚嘆,也有人說沒多厲害。到底強在哪?《遠見》取得邀請碼,實測揭開真相。
Manus是什麼?
Manus是2025年3月中國AI新創Monica所釋出的AI工具,就像ChatGPT一樣,使用者可以造訪Manus網頁,以對話的方式請Manus完成任務。
Manus與ChatGPT的不同之處在於能夠省去大量來回對話的時間,只要描述需求以後,Manus就能夠自己制定完整計劃,並按照計劃再提出細部任務,最後按表操課完成,且提供的結果品質頗高,實現AI Agent的願景。
Monica首席科學家季逸超強調,Manus的突出之處在於能夠採取行動,並實際交付成果,例如篩選履歷、研究房地產、分析資料,在不同任務中展現其自主性和解決問題的能力。
此外,Manus具備知識和記憶能力,能夠從過往經驗中學習並改進後續任務的執行,且可以調用API、瀏覽網站,能夠和外部世界建立聯繫。
在季逸超的展示中,Manus有辦法在接受命令以後,一條龍地完成任務。以評價履歷為例,他上傳壓縮了好幾份履歷的.zip檔,並以文字提出請Manus評價履歷的需求,接著Manus便開始行動。
Manus在實際「看」履歷以前,就像人類那樣,先制定出評價履歷的標準,接著在實際檢查履歷的時候,根據標準,從投遞履歷者的經歷中抽出相關敘述,並依照內容評分。
從他的展示中,已經能夠看到Manus實現AI Agent自己制定計劃並採取行動,雖然速度還有改進空間,但Manus的產出品質已經足夠令人興奮。季逸超曾在公開發言中表示,他相信AI能力將會不斷進步,讓人期待Manus的未來。
Manus誰可以用?要怎麼註冊?
目前Manus仍在測試階段,要有邀請註冊碼,才能夠使用。
如果手上拿到邀請碼,便可以到Manus的官網點擊開始使用,接著會轉移至填寫邀請碼的頁面,輸入邀請碼後就能透過Google帳號註冊並登入。
登入後,就能進入Manus的畫面開始使用了。不過,目前Manus有使用限制,一天只能開啟三個對話,若超過後就要出現以下訊息:「您已達到測試階段每日使用的最大限制。請明天再試,或聯繫我們以增加您的配額。」
以下為《遠見》取得邀請碼後的實測結果。
Manus實測:評價文章
對媒體來說,評價稿件並修改是非常常見的任務,但過往運用ChatGPT修改時,大多只是用來改錯字、調整標準字、修正不通順之處等,即便請ChatGPT分析文章,常常需要來來回回要求它按照標準行動,並不是非常好用。
因此,本次實測中《遠見》便想請Manus評價文章,看它能夠分擔多少任務。
測試時向Manus下的指令:
接收指令後,Manus把評價文章拆分成不同步驟:抽取文章內容、建立評估標準、制定評分細節、按照標準評估文章並評分、撰寫綜合評估報導,並在過程中,活用Python的不同套件(library),把測試上傳的PDF檔案轉成純文字檔,再接續分析。
雖然測試的指令中提供Manus評估文章的標準,但Manus為了詳細評分,進一步提出給予分數的規則,以報導主題重要性為例,Manus列出以下劃分方式:
- 10-9分:主題具有重大社會影響力,涉及產業革命性變化或重大趨勢,對大眾有高度關聯性
- 8-7分:主題具有明顯社會意義,涉及產業重要發展或新興趨勢,對特定群體有高度關聯性
- 6-5分:主題具有一定社會意義,涉及產業變化或趨勢,對特定群體有一定關聯性
- 4-3分:主題社會意義有限,涉及小範圍產業變化或趨勢,關聯性較低
- 2-1分:主題社會意義不明顯,涉及非常小眾的產業變化或趨勢,關聯性極低
實際評價測試文章《博恩夜夜秀》幕後功臣:薩泰爾團隊AI神用法,如何讓全員升級?時,Manus在每個面向裡,皆詳細列出評分與評分理由,例如本文在報導主題重要性拿到8分,理由是「文章探討AI在企業團隊中的實際應用與挑戰,這是當前數位轉型浪潮中的重要議題。薩泰爾娛樂作為案例,展示了AI如何從個人工具擴展為團隊協作的基礎,對企業管理者和知識工作者有高度參考價值。」
另外,Manus還提到,文章不僅關注技術本身,更探討了組織變革的必要性,這對於正在思考如何整合AI的企業具有重要啟示。因此最後給予8分。
再以寫作文筆為例,Manus指出「文章開頭引用OpenAI共同創辦人的觀點,中間穿插具體案例,最後以哲學思考收尾,結構完整,⋯⋯文章善用比喻和引用,如將AI比作『槓桿』和『魔法』,使抽象概念具體化,增強了可讀性。」
當然,Manus也會指出文章的不足之處,在其他編譯類型的文章中,Manus便點出過度仰賴二手資料,缺乏一手採訪的問題,建議有機會可以補足。
Manus評價文章的歷程:點此看
Manus實測:研究議題
前項實測中,事前就制定出評價文章的標準,若減少提示詞的內容,Manus會怎麼發揮?
《遠見》以研究DeepSeek為例,請Manus執行。以下是測試時使用的指令:
此時Manus則要求使用者補足更多資訊,提出以下問題:
- 這時補上以下回應:
得到回覆後,Manus繼續推進:
在研究開始,Manus規劃了一份收集資料的待辦清單,把DeepSeek相關資料拆解成公司、團隊成員、公開發言、專家評論等,並且在每個項目中都列出具體要搜集到的內容。以下是Manus整理出的研究任務:
Manus利用搜尋功能,查找不同文章與報導,再從中抽取出需要的內容,甚至也知道要查找Linkedin,藉此搜集創辦團隊的背景資訊。使用者也能從歷程中看到Manus造訪網頁的過程,例如閱讀一篇《BBC》的報導。
因為原先提出的需求是想要採訪DeepSeek團隊但碰壁,因此Manus也整理出「為用戶提供替代約訪DeepSeek團隊的方案建議」,包含整合現有訪談內容、建議採取時間線分析法、比較分析法,還有尋找間接信息來源、訪問專家觀點和行業分析等作法。
最後,Manus整理出一份包含以下檔案的完整資料,提供給使用者參考:
1. deepseek_company_info.md - DeepSeek公司詳細資訊
2. deepseek_founder_info.md - 創始人梁文鋒詳細資料
3. team_members/core_team_info.md - 核心團隊成員資訊
4. public_statements/founder_interviews.md - 創始人訪談內容摘要
5. public_statements/early_interviews.md - 早期訪談內容摘要
6. expert_opinions/expert_analysis.md - 專家評論與分析
7. deepseek_comprehensive_report.md - DeepSeek綜合研究報告
8. alternative_approaches.md - 替代約訪DeepSeek團隊的方案建議
Manus研究議題的的歷程:點此看
與一般記者在事前針對一間公司該做的背景研究功夫相較,Manus的表現堪稱優異。
Manus還能做些什麼?
作為通用的AI Agent,Manus能做的事情非常多。除了官方影片中介紹的分析資料、研究房地產、替履歷評分以外,Manus也另外舉出自己能做到的事情:深度分析特斯拉股票、設計互動課程、比較分析保險政策、研究適合供應商和線上商城營運分析等。
其實,有許多任務並不是由Manus首創,也不是第一個測試相關任務的Agent,例如「規劃行程」就是常見的消費者Agent案例,但以規劃日本七天行程為例,Manus制定計劃格外完整。
它知道要先建立起旅遊專案的架構,接著調查交通方式、查詢天氣預報、確認簽證要求、研究匯率與預算,並檢查航班和探索景點,並且在使用者提供的限制之下,例如確保行程符合預算範圍,達到「制定每日行程與時間安排,同時平衡城市探索與文化體驗」的目標。
Manus有何特色?為何引發關注?
「Manus不僅僅是另一個由聊天機器人構成的工作流程,而是一個真正自主的Agent。其他 AI 僅止步於生成想法,但Manus能夠彌合構思與執行之間的鴻溝。」在介紹Manus影片中,Monica首席科學家季逸超堅定地說道。
Manus之所以能夠再度掀起旋風,關鍵在於過往AI Agent還不夠成熟,但Manus彷彿讓人瞥見突破的曙光。
所謂AI Agent,指的是能夠自主(autonomously)決策並執行行動的人工智慧系統,過程中不需要人類介入。
接收人類所下達的複雜指令後,AI Agent 能夠結合環境中感知到的資訊與指令內容,自行規劃行動計畫,將任務拆解成多個步驟並依序執行;完成任務後,它還會根據所獲得的回饋,改善未來的行為。(延伸閱讀:AI Agent來了,但它是什麼?AI代理介紹、趨勢全解讀)
雖然AI Agent已經成為科技論壇中人人都能說上一句的趨勢,但距離真正落地仍有距離,例如前Google台灣董事總經理簡立峰今年(2025)1月便提到,AI Agent的挑戰主要出現在規劃與推理能力上,若沒有顯著提升,則全面爆發便還需要時間。
就執行任務來說,AI Agent真正能夠執行的任務還不夠多,且執行過程中也仰賴人類介入,尚且無法獨當一面,這便是為何Manus問世後,就得到大量關注。
人們使用ChatGPT時,多半是在一來一回的對話之間,完成使用者指派的任務。若是相對簡單的任務,例如翻譯、摘要,ChatGPT不太需要額外指令,可以直接完成任務。過往使用GPT-3.5、GPT-4驅動的ChatGPT時,人們還要在指令中提供一個或者數個範例(one-shot/few-shot examples),但隨著模型進展,進步到GPT-4o、OpenAI o1時,已經可以不用提供範例(zero-shot),甚至不用在指令中自己拆解任務。
不過,隨著任務的複雜性提高,例如分析資料時,ChatGPT提供的分析結果也常常有不完整之處。再以撰寫程式碼為例,只是執行簡單的自然語言處理任務時,例如分析情緒,它可以一鍵完成。
但如果請ChatGPT撰寫能夠替照片加上浮水印功能的應用程式,即便使用具備推理能力的模型,雖然有機會一次過關,但有很多時候還是得來回修改,例如浮水印位置不只能夠依照pixel調整,還要提供百分比功能,又或者要讓使用者可以預設浮水印的路徑,需要在後續交談中補上。
因此,能夠把「看履歷」、「評價文章」分成不同步驟,發展出自己的給分框架,再從內容中抽取對應到的內容,並計算出完整分數的Manus,充分展現出其自主性,才會讓人興奮無比。
從《遠見》實測也能看出,Manus在研究議題時,也能恰到好處地尋找優質的資料來源,有許多步驟和方法和真實的人類研究員非常相似,有辦法獨立完成使用者指派的任務。
Manus名字來自於拉丁文「Mens et Manus」,意思為智力與技巧(Mind and Hand),體現出Monica想把知識應用於現實世界產生影響的信念。現在的Manus已經展現出一定能力,若未來能夠串接更多API、讀懂更多資訊,距離機器像人類一樣理解世界的那天就不遠了。