鴻海科技日上,人工智慧帶動下一波商機的動能鮮明。但除了硬體設備,鴻海在軟體模型的布局也不可輕視。身為全球製造業龍頭的鴻海,為什麼要自己做模型?鴻海研究院人工智慧研究所所長栗永徽點出了 OpenAI、Google、Anthropic等巨頭的「致命傷」,也正是發展利基。究竟身為少數持續推進基礎模型研發的本地團隊,「FoxBrain」的下一步前景為何?如何成為支持鴻海整體戰略的重要力量?
從「AI工廠」到「實體AI」,新一代AI硬體是2025年鴻海科技日的一大亮點。論及驅動下一代AI應用的智慧能力,鴻海研究院人工智慧研究所亦親身耕耘基礎模型,至今是台灣少數繼續推進基礎模型研發的本地團隊。
鴻海科技集團董事長劉揚偉在開場中特別指出,自家研發的大模型「FoxBrain」能理解儒家思想。言下之意,中華文化價值可以是FoxBrain在模型市場中的差異化元素,也昭示FoxBrain不自限於製造業應用的未來。

FoxBrain不追求全面通才,做深研「垂直領域」的專家
鴻海於2025年正式開源第一個繁體中文、專攻製造業的大語言模型(LLM)FoxBrain,不過,鴻海的大業當然不僅止於此。鴻海研究院人工智慧研究所所長栗永徽解釋,「我們希望這個模型除了可以接收 vision(影像)、或者是 language(文字) 之外,它還能夠output一些token,可以控制實體的機器人。」
栗永徽解釋,目前FoxBrain的藍圖劃分為四個階段:從1.0的文字處理,到2.0加入視覺能力的 VLM(Vision Language Model),3.0再強化具備物理常識與專業知識的「世界模型」(World Models),最終邁向4.0的 VLA(Vision─Language─Action),最終目標是達到能夠由模型完成端到端的機器人動作控制。
身為全球製造業龍頭的鴻海,為什麼要自己做模型?栗永徽點出了 OpenAI、Google、Anthropic等巨頭的「致命傷」,也就是缺乏場域內的私有數據(Domain Knowledge)。
「前幾大AI公司可以抓下所有網路資料,但許多場域內的專家資料,網路上找不到。」栗永徽解釋。而鴻海坐擁全球最大的電子製造產線,也正積極布局的智慧電動車,以及透過合作醫院取得的智慧醫療的相關資料。這些被鎖在工廠與醫院深處的「垂直領域數據」,正是訓練AI成為場域內專家的燃料,也是鴻海突圍的關鍵。
「比方說產線轉換,」栗永徽解釋,「不需再找很多專家設計、修改,而是用這個(VLA)模型,快速調整配置,機器手臂馬上轉換。」這種在特定產業中高度專業化、垂直領域靈活泛化的能力,正是鴻海眼中未來五至十年製造業機器人的樣貌。

動作數據難取得,機器人還是四、五歲小孩
目前,FoxBrain還處於大語言模型階段。在企業內部的應用多以文字為基礎,例如寫程式支援工具、論文分析,以及設備維修指示等。例如,若產線上有設備故障,員工可以透過FoxBrain獲得檢查步驟的解釋,自行執行簡單的檢測。
但研究所預期能在2026年發布下一階段模型,融入視覺能力,朝向「實體AI」(physical AI)應用更近一步。也就是當AI模型在讀取完數位世界中所有資料後,下一步便是了解實體世界的物理定律,包括重力、摩擦力、光學等,如此一來,模型生成的預測才會符合真實世界運作的模樣,機器人也才可以自己規劃做出人類想像中的行為路徑。
只不過,在進入垂直領域、商用營運前,機器人基礎模型還需更加「聰明」。「以前ChatGPT或許還像高中生,那現在的ChatGPTo1、o3,然後到 GPT─5,可能已經變成博士生的能力。」栗永徽直言,相較之下,當前機器人領域仍在初期發展階段,例如,將一堆物品根據相對應的顏色分類,或摺衣服,「如果你把它比喻人的話,可能就是四、五歲的小孩子。」
ChatGPT橫空出世,其背後正是大語言模型藉著持續訓練大量資料,迎來「頓悟」時刻。鴻海研究院人工智慧研究所博士級實習生劉尚青指出,當前AI與機器人研究學者也紛紛希望仿照LLM模式,持續疊加算力,讓模型能力隨著規模擴大能夠呈現指數級的增長。
只不過,當前仍受限於動作數據難以取得。「目前在網路上的公開的robotic data大概是 million等級,」劉尚青直言,「現在的gap就是,我們要怎麼從million等級的token,到15 trillion等級的token。」
也就是說,即便透過輝達的Cosmos平台,讓模型在虛擬世界進行千百萬次的模擬與強化學習,數據仍存在百萬量級的差距。不過,劉尚青對此抱持樂觀,他認為當前各大機器人公司正積極提高算力,也透過不同的模擬方式,多管齊下,試圖補足資料鴻溝。

鴻海機器人大業的三大策略
這一切技術與資本的投入,其實也代表著新一波的商機,可回溯至鴻海的三大核心商業戰略。
首先,便是「伙伴共榮」。栗永徽笑說,正如大眾所知,輝達是鴻海非常緊密的伙伴。當前訓練機器人基礎模型訓練仰賴大量算力,有助輝達推動其GPU的生意。 尤其,輝達許多伺服器機櫃由鴻海負責生產、組裝、封裝等,「根據劉董事長在很多公開場合所說的,鴻海在AI Data Center機櫃的市占率超過 40%。如果我們伙伴賺錢的話,那我們自己一定也會賺錢。」
第二大策略則是透過自動化,優化鴻海自身產線,「提升良率、降低成本,然後提升效能,就是我們常說的『提質增效、降本減存』。」不僅可減少人為介入干擾,未來若導入具備泛化能力的VLA模型後,機器手臂將具備靈活使用工具的能力,便可依照產品自動換成對應的夾爪、靈巧手、工具等,達到最終目標100%關燈工廠。
至於第三大策略,則是「事業群賦能」。栗永徽指出,鴻海目前布局的三大平台與智慧醫療,這四個領域若加入AI機器人,皆可產生巨大助益。他預期,隨著FoxBrain的基礎能力強化,專業領域的應用範圍也逐漸明晰。可能會發展出針對製造業場景、智慧醫療場景,以及電動車等場景的不同版本,趨向專才型的模型。
也就是說,無論是工廠裡的機械手臂、路上的電動車、智慧城市的基礎建設,還是醫院裡的影像判讀,若能以同一套AI大腦,加上各領域的專業知識,可說是同時打通了鴻海各事業群的任督二脈。
另外,進入實體AI階段後,機器人與人類的互動也需要引入安全性與倫理的關注。這也是為何FoxBrain有其世界觀、文化價值觀的面向。這呼應科技日不斷出現的「主權AI」概念,足見鴻海在人工智慧上涵括硬體、模型到應用賦能的布局,以及領導本地生態系的野心。