Facebook Pixel
訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

ChatGPT與Bard愛「亂講話」,谷歌團隊找到解方超越它?

曾子軒
user

曾子軒

2023-08-17

瀏覽數 13,150+

Google科學家紀懷新指出,大語言模型使用上限制仍多,目前Google希望利用搜尋引擎提升其回答品質。Google提供
Google科學家紀懷新指出,大語言模型使用上限制仍多,目前Google希望利用搜尋引擎提升其回答品質。Google提供
00:00
00:00

無論是Google Bard或者ChatGPT,都有為人詬病的「無中生有」問題,甚至有科學家悲觀認為,因為模型開發機制,讓這個問題根本沒有解方,網路服務龍頭企業Google團隊,目前已積極思考解決方法治好AI「亂說話」毛病,可能就此讓Bard超越ChatGPT?

OpenAI推出ChatGPT後,掀起全球生成式AI和大語言模型熱潮,Google後來也推出Google Bard回擊,除卻提升語言切換能力、加強程式撰寫功能,Google也在多模態(multi-modal)上加緊腳步,以「圖片回應」方式與使用者文字溝通,上個月Google更宣布開放繁體中文版本。

不過,ChatGPT每月造訪流量上已經滑落,人們已經清楚認知到大語言模型的諸多限制。作為較晚推出對話式應用的後進者,Google怎麼看待大語言模型的不足之處?Google又會如何彌補?就Google Bard來說,還有哪些應用可能性?

Google Bard團隊指:GPT、PalM、LLaMA等大語言模型都有類似挑戰

任職Google超過12年、目前在Google DeepMind(DeepMind和Google Brain已合併)帶領機器學習研究團隊,並負責包含大語言模型和神經網絡推薦系統等研究、領導Google Bard開發團隊,出身台灣的紀懷新(Ed H. Chi)指出,Google開發對話式語言模型LaMDA,便是想利用大語言模型(large language model,簡稱為LLM)幫助人類,並透過自然語言的對話形式,讓民眾都能使用。

紀懷新表示,在大語言模型出現以前,因應不同任務需要獨立不同的模型,例如翻譯需要一個模型、摘要也需要一個模型,但現今趨勢則是讓單一模型完成多個任務,例如LaMDA就能做到這點,也為Google Bard奠定基礎。

Google開發對話式語言模型LaMDA,便是想利用大語言模型幫助人類,並透過自然語言的對話形式,讓民眾都能使用。取自Google Bard

Google開發對話式語言模型LaMDA,便是想利用大語言模型幫助人類,並透過自然語言的對話形式,讓民眾都能使用。取自Google Bard

紀懷新回憶,在LLM技術出現之前的對話式模型,互動不夠連貫,「很像去7-11跟店員進行交易式(transactional)對話,」他意指交談內容目的單純,且不帶感情,因此技術人員希望能夠讓互動變得更自然、更加人性化,因此要讓電腦程式增加主動性(proactive),而且不只是系統發起對話(system initiative),更希望做到人類和機器同樣能發起互動(mixed initiative)。

目前大語言模型無論是GPT(OpenAI)、LaMDA(Google)、PaLM(Google)或者LLaMA(臉書),都會運用預訓練、微調、提示這三個步驟讓模型表現變好,不過,即使這幾間企業均深耕人工智慧多時,仍遇到相似挑戰。

Google用「搜尋引擎」加持,突圍ChatGPT幻覺問題

紀懷新指出,大語言模型發展仍在早期階段,不可避免地仍會遇到問題。

其中「幻覺」是最常被提及的問題,LLM產生內容的隨機性,容易生成過度解讀、無中生有的內容,因此在事實準確性上遭遇挑戰,此外,受到訓練資料影響,內容可能承載類似偏見、惡意暗示等。

知識與美味同行,遠見請客西堤

對於這些問題,紀懷新勾勒出一個可能解方:檢索增強(retrieval augmentation)。遇到問題時,人們時常到搜尋引擎尋求解答,那麼,大語言模型是不是也能做類似的事?紀懷新表示,他們正在想辦法「教導」LLM不只從預訓練中語料找答案,更要利用搜尋引擎外部知識回答問題。

不過,他也強調,對於判斷何謂「正確」,從不只是單純技術問題,更牽涉到價值判斷。他用絕對(absolute)和相對(relative)事實兩個詞彙,指稱人類平常能讀到的內容,以目前Google努力的方向來說,會將重點置於「利用搜尋結果輔助內容生成以便讓讀者確認」,也就是提供可參照的相對事實,至於絕對事實如何定義?那是更深刻的哲學問題。

紀懷新也分享,Google未來除了繼續發展文字與圖片對話、提高品質,也會在多模態(multimodal)上繼續努力,讓Google Bard「讀懂」並輸出不同型態資料,例如增加更多聲音互動的可能性。

「幻覺」是大語言模型發展最常被提及的問題,LLM產生內容的隨機性,容易生成過度解讀、無中生有的內容。取自Unsplash

「幻覺」是大語言模型發展最常被提及的問題,LLM產生內容的隨機性,容易生成過度解讀、無中生有的內容。取自Unsplash

Google「祖產」多,多元應用場景讓人期待

至於外界總是拿微軟與ChatGPT相比,Google Bard要如何競爭?紀懷新的回答較為隱晦,他強調Google能夠將LLM應用在旗下多元的產品之中。

剖析他的言外之意,因Google和微軟同樣擁有生產力工具,因此至少可以對標微軟以人類副駕命名的Copilot;然而,Google旗下同時還有地圖、YouTube、支付以及市佔率高出許多的搜尋引擎,諸多與人類實體經濟更緊密相連的服務,因此能夠做得更多。

若搜尋景點時,不只是導引,更有了解意圖後的主動介紹;觀賞影片時,除了既有機制以外,更利用大語言模型產出更多推薦;還有搜尋商品時Google已經介紹過的生成式搜尋體驗等,Google現有服務的多元場景,讓LLM有更多派上用場的可能性。

如同紀懷新所說,Google希望讓大語言模型學習人類利用搜尋的行為,以搜尋引擎提升生成內容品質。如果說,人類智慧已經透過搜尋引擎得到提升,那麼,擁有更聰明、回答品質更有保障的LLM,人類智慧又會上升到什麼高度呢?

延伸閱讀

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務