近期SpaceX創辦人馬斯克大談太空資料中心將崛起,更希望人類有一天成「多行星物種」,或許人類火星移民已不是遙遠夢想。身處人工智慧發展的核心地帶,在機器人研究上擁有長久背景的史丹佛大學,可謂是新一波智慧機器熱潮的完美交會點。電腦科學系教授劉正芸如何看待AI機器人的前行之路?她為何指出自己的實驗室花6千美元打造人形機器人,只是體現「太空人思維」,為登上火星做準備?輝達在此又提供了什麼關鍵資源?
從無到有地打造出一隻屬於自己的機器狗需要多長時間?
在美國史丹佛大學的熱門課程「打造人工智慧機器人實作入門」上,答案是大約四週。即使先前完全沒有機器人實作經驗,只要是對程式語言Python、梯度概念有基礎理解的學生,也大多能在一個月內做出一台四足機器人「Pupper」。

這佐證了開設這門課的電腦科學系教授劉正芸(C. Karen Liu)對近期這波機器人熱潮的觀察:前所未見的民主、草根化。過往,只有掌握核心技術、充沛資金的團隊能打造出可用的機器人,如今一般學生、業餘愛好者,也有機會做出屬於自己的機器人。這吸引更多參與者投入,生態系更加多元、熱鬧,機器人熱度也水漲船高。
劉正芸在課程描述中表示,她希望這門課能引導學生持續探索,「在機器人領域有著許多再進一步的機會,這只是開端。」
模擬訓練推進機器人實務落地,受惠者不僅機器人學家
來自台灣的劉正芸早期研究聚焦在圖學與電腦動畫。在《遠見》專訪中,她透露過去其實「不是很喜歡機器人」,認為它們又笨重、又占空間。但在2012年前後,隨著深度學習加速發展,她專精的技術在機器人領域的應用日趨明顯。
核心就在她研發的「模擬」技術具有兩大特質:既關注數位人物與世界的互動關係,也重視行動的物理合理性。這讓劉正芸研發的模擬技術不僅限於電影、遊戲等娛樂應用,也成為訓練現實可用的機器人的理想環境。
長期以來,訓練機器人有著雞生蛋、蛋生雞的難題。研發者需要大量數據來訓練出實用的機器人,但在機器人足夠有用前,也蒐集不到足量的現實部署數據。
模擬技術成為擊破這個難題的關鍵武器。在符合現實物理定律的模擬世界中,機器人可以進行大量且低成本的訓練,學習如何控制身體、完成研究人員指定的任務。可以說,劉正芸過往所研發物理模擬器的方法論,與機器人研發只差了「sim to real」從虛擬世界遷移到現實世界的最後一步。
然而,現實世界是開放、複雜的,為了提升機器人在現實世界執行任務的穩定性,需要用多種模擬情境進行訓練。而這件事很適合用善於平行運算的GPU進行。
這解釋了許多本業不是機器人的科技公司,也積極為機器人研發添柴加火。因為機器人是他們產品的理想載體,若AI機器人成功起飛,也能拉抬公司業績。其中,輝達在推廣「實體AI」上,更是不遺餘力。
劉正芸肯定,輝達在Isaac平台推出的一系列模擬工具對機器人產業發展的幫助很大。因為絕大部分的機器人開發者不會自己動手開發模擬器。而這些工具也與輝達自家GPU無縫結合,讓輝達有掌握全套技術堆疊的機會。

眾多支持技術到位,機器人從未如此親民
近期這波機器人熱潮的一大亮點是人形機器人,而人形機器人熱潮很大程度上是受到ChatGPT這類的大語言模型啟發。在自然語言溝通上的流暢度,以及文本範圍的通用性,都令大眾對通用人型機器人充滿想像。
但劉正芸指出,除了人工智慧模型突破,還有許多乍看下沒有直接相關的技術、工具與硬體效能到位,才促成機器人生態系蓬勃發展。這包括電池、馬達與邊緣算力等硬體功效提升,足夠便宜的3D列印,免費可用的線上設計工具,以及可客製化的PCB等。
「十年前,可能只有Boston Dynamics有能力自己打造一個新的機器人。」劉正芸表示,如今很多不同的支持技術,形塑出一個非常友善的環境,「很多人都可以自己設計、打造機器人。」
事實上,即使在兩、三年前,系上學生想自己做機器人,劉正芸還覺得不可能。「我們是電腦科學家,可能連螺絲起子都不太會用。」她說,「我們怎麼可能自己做機器人?」
但現在使用便宜的3D列印技術,加上市面上既有的馬達,一般大學生也能做出機器人。例如,在劉正芸與Google DeepMind、蘋果等科技巨頭的業師共同開課的「打造人工智慧機器人實作入門」上,就強調學生從做中學的進路。
長約十週的課程涵蓋運動學、強化學習、大語言模型等主題。大部分的學生可在前半學期完成機器狗,最後幾週則開放學生研發個別技能。有學生在機器狗背上加裝一隻手臂,可以執行取物任務。也有學生加裝水槍,希望也能協助滅火。
由於教材硬體有限,這門課只開放二十餘名學生選修。但時常是兩、三百個人爭搶,劉正芸表示,線上表單開啟後,「十秒內就沒了。」
6000美元從零打造人形機器人,體現「太空人思維」
劉正芸也參與研發開源的迷你人形機器人「ToddlerBot」,作為蒐集現實世界訓練數據的低成本人形平台。ToddlerBot身高只有56公分,運作起來較為安全。但只要配合尺寸相襯的物件,在ToddlerBot上訓練的操作能力,應也可以遷移到大型的人形機器人上。
團隊估計,打造ToddlerBot的總成本大約只要6千美元。完全使用3D列印與市面上就有的馬達,其中九成成本是用在購買馬達與電腦算力上。
「我很喜歡ToddlerBot!」劉正芸笑說,隨著如ToddlerBot般,兼具輕量化與實用性的機器人普及,也轉變她過往並沒有那麼喜歡機器人的想法。背後原因不只是ToddlerBot小巧精悍,而是體現了劉正芸極力推崇的「太空人思維」(Astronaut Mentality)。
「我常跟學生說,我的實驗室是在訓練太空人。如果你在火星上需要某種工具,但手邊沒有,這不能成為藉口,你要自己發明出來。」劉正芸指出,ToddlerBot計畫正是這種哲學的體現。受惠於硬體技術的「草根化」,研究團隊不再受限於廠商販售的規格產品,而是能針對需求、自主從零打造工具。如此一來,團隊也能精確控制研發目標,使機器人技術持續進步,展現更強大的功能性。

資金、人才大量湧入,掌握移動操控能力的人形機器人不是幻想
比起四足機器人,ToddlerBot計畫更著重在「Loco-Manipulation(移動操作)」的能力上。也就是在開放的非結構環境中,邊移動邊操控物體的能力。例如搬起重物移動,邊前進邊開、關門等,在執行這類任務時,機器人需要協調不同肢體的相互運動,涉及所謂的「全身體控制」(whole body control)。
這回歸到劉正芸學研的核心議題:人體運動。因此,劉正芸既做人形機器人,也做靈巧手;就像她研究電腦動畫,也研究機器人。即便在傳統上,它們是相對獨立的領域。
劉正芸的一大目標,是做出結合靈巧手的人形機器人,達到更接近人類水平的移動操控能力。也就是既要能夠平衡步態,也要能夠靈巧地操控物體。「雖然硬體還不夠成熟,但很多AI方面的研發已經可以開始了。」她表示。
她認為,下身為輪型、雙手為夾爪的人形機器人都是過渡性產物,擁有靈巧手的雙足人形機器人會是最終目標,也是最可能長久存續的形態。
部分看法主張輪型、夾爪即可提供實用價值,不一定需要作出雙足與靈巧手。但劉正芸認為,若能做出既可靠、靈巧又安全的雙足靈巧人形機器人,沒有人會抗拒使用它。
許多質疑雙足、靈巧手必要性的看法,背後的原因是認為這太難做出來。「但我可以告訴你,我們做得到。」劉正芸表示,「三個月前我可能還不是那麼確定,今天我很確定。為什麼?它發展太快了,每天多少資金、人才投資在這個領域。一定做得到。」
(延伸閱讀:獨家直擊史丹佛實驗室!「電子皮膚之母」鮑哲南,讓智慧機器有了觸覺)
市場前景仍具不確定性,正是決策關鍵時刻
也因此,在產業正在快速前進可能長久主導市場的人形機器人平台時,台灣尤其不能缺席這場智慧機器的革命。
十月回台參訪的劉正芸,在與產、官、學界交流中,也注意到台灣對人形機器人充滿興趣。但基於市場的不確定性,許多企業不確定如何做出最理想的投資決策。例如,該在既有強項上專研特定零件,或是邁向整機販售、拓展垂直技術堆疊。
但現在是必須作出重要決策的時刻。隨著智慧機器席捲實體世界的前景步步逼近,問題已不在於是否參與,而是如何參與,形塑台灣在這條產業鏈的關鍵角色。‘