近兩年,文字、圖像與聲音等基礎模型興起,不僅在數位世界掀起劇變,也翻轉了機器人領域。雖然通用類型的機器人還很遠,但生成式AI已為機器人注入強勁的成長動能。
ChatGPT、iPhone、網際網路⋯⋯,這些改變世界的新興科技產品,就像枝繁葉茂的大樹,人們很容易感受到他們的存在。對比之下,產品背後的技術,像是深埋於土壤的龐大根系,難以察覺,卻扮演穩固整個生態系的關鍵角色。
吳恩達用電力比喻的人工智慧,或者更精確來說的生成式AI,在機器人領域裡,也屬於不外顯、隱藏在各類應用幕後的技術邏輯。
「其實機器人是古老的題目,但有了生成式AI,這題目有了不一樣的解法!」工研院AI策略長余孝先舉例,現在ChatGPT不只能以文字溝通,還能夠讀懂圖像、聽懂聲音,這種多模態能力(multimodality)之於機器人,就是增進聽力與視力,使其在應用上更靈敏、更能與人類自然互動。