OpenAI被揭露要開發硬體,微軟則要自行研發自己版本的LLM(large language model,LLM),免得過度依賴OpenAI;臉書除了開源可商用的Llama 2外,更推出能嵌合於自家通訊軟體Messenger、WhatsAPP、IG的Meta AI。Google除了持續更新Google Bard以外,還有什麼招數?為何身為Google中引領人工智慧發展的關鍵人士,DeepMind執行長指出,未來的AI應用,不必再讓我們學著下指令,用日常對話就能輕鬆上工?
雖然被OpenAI和微軟合作的ChatGPT突襲失掉先機,但Google數次更新Google Bard以後,整合旗下生產力軟體,以及包含YouTube、地圖、航班等服務,已經讓世人窺見Google深厚實力。
所有科技巨頭都在戮力開發自家版本的大語言模型,其他大型企業則忙碌於訓練大語言模型成為自家服務,中小型企業試圖調用API軟體接合介面,把對話與生成內容,融入現有服務中,上班族個人則是用LLM改善效率,活用指令(prompt)解決日常需求。
在這個LLM百花齊放的當下,未來會有什麼超出ChatGPT一類的應用?AI如何落地、幫助人類?Google DeepMind執行長哈薩比斯(Demis Hassabis)接受《The Verge》訪問時,提出新方向。
他先釐清人工智慧真有實用性,而非一戳急破的泡沫,接著揭示ChatGPT引發熱潮的關鍵在於語言能力,最後分享Google內部應用AI方向,以及他見到的未來應用。
從玩樂到解決真實問題,AI不只很會下棋
作為DeepMind的共同創辦人,哈薩比斯首先拿主攻圍棋的AlphaGo,和能夠預測蛋白質結構的AlphaFold作為AI技術變化的例證。
他解釋,研發AI應用時,遊戲(games)是很好的試驗場,因為在設定演算法的目標函數時,拿到最多分數或者贏得比賽,都是很清晰的目標,因此DeepMind就曾經在拓展強化學習(reinforcement learning)領域技術時,先把遊戲當做試驗場,從乒乓球開始,再一直到雅達利(Atari)遊戲,再接著進入有明確規則,而且可以從每次對弈中獲得經驗、知道報酬(reward)的棋盤,也就是打敗人類旗手李世乭的AlphaGo。
若說AlphaGo還只是人類探索興趣的遊玩之作,那AlphaFold就絕對是對世界帶來實質幫助的應用。哈薩比斯指出,從科學家與研究人員發表的論文來看,AlphaFold對生物學家尋找蛋白質結構是真的有用。從下棋到幫上生物學家,哈薩比斯想強調的是,AI早就可以派上用場,只是一般民眾沒有實感。
等到ChatGPT推出後,之所以引發巨量關注,「因為語言是人類智能和每日生活的核心,」此外,一般民眾都能夠理解ChatGPT是什麼、跟它互動。對話式生成內容的服務,已經從實驗室中走出,真正跨入常民生活,而這也能成為日後AI應用的發軔。
未來的AI應用,就是說自然語言不必下指令
哈薩比斯想像中的未來AI應用,將會是全方位的人工智慧助理。我們已經熟悉的ChatGPT,或者Google Bard、Claude等對話式服務,這種擅長生成內容的大語言模型,會扮演與人互動的介面(interface),以自然語言跟人類對話,不用再去鍛鍊提示工程(prompt engineering)也能聽懂指令,就像智慧管家一樣。
與人類對話,機器接收到任務,接著人工智慧助理則會調用不同專精的模型。推薦書籍與活動、安排行程甚至直接下訂單、幫助日常工作等,都是哈薩比斯想到的場景。每一種任務都由細分的專家模型負責,處理完畢後再回傳到互動介面,接著與人類溝通。
事實上,人們現在看到Google Bard的種種實驗功能,背後流程可說是哈薩比斯願景的簡化版。例如向Google Bard詢問航班,他同樣是理解人類任務後,調用Google Flights的API,取得資料後再整理轉化為人類易讀的表格。可以預期的是,未來執行任務的模型不單只是調用API而已,它可能真正做到規劃(plan)、推理(reason)並且維持記憶(memory),這3項能力,也是哈薩比斯預期接下來數年,研發AI者全力以赴投入的項目。
他更大膽預言,「也許幾年後,今日所見的聊天機器人,將會顯得微不足道。」
除了勾勒AI應用的藍圖以外,哈薩比斯也分享,Google內部也有把DeepMind的研發成果,應用於改善產品與使用體驗;同時,還有改善企業經營效率,例如DeepMind便利用AlphaZero,提升資料中心的能源利用率。
從哈薩比斯的話語中,我們得以一瞥頂尖AI科學家如何想像AI應用。當AI學會規劃與推理時,世界恐怕又會再被顛覆一次。但是如此未來人工智慧如此強大,人類還能繼續保住工作嗎?仍是值得深思的議題。