近年極力發展人工智慧的百度於今日(3/16)下午2點召開新聞發布會,介紹自家的ChatGPT「文心一言」。發布會上,百度創辦人暨董事長兼執行長李彥宏介紹了文心一言的應用場景,並實際展示模型能生成的各式內容,當場亮點不少。但為何投資人硬是不捧場,讓股價一直跌?
號稱要和美國競爭人工智慧的中國大陸,自產的AI聊天機器人在哪?3月16日,百度版ChatGPT「文心一言」現身!發表會上,只看百度執行長李彥宏面帶笑容,語氣堅定地向來賓們介紹這個預訓練大模型,種種不輸人的能耐,期盼著贏得頭彩。
只是,與李彥宏的自信從容恰好相反,發布會開始不過20分鐘,百度股價竟一度下跌10%,等於馬上賞了百度團隊耳光。雖然後續有逐漸拉回,但在下午4點鐘左右,百度股價仍舊呈現6%至7%的下跌。投資人為什麼不滿意?真有那麼差?請見以下一文深度開箱,這個百度雄心壯志推出的生成式AI應用。
發布會竟是影片預錄、是信心不夠?
首先,發布的展示手法,就讓人深覺得團隊信心不夠,反遭致股東質疑。或許是看到谷歌在發表聊天機器人Bard時,因為直播無法造假,結果讓Bard當場出糗,回答錯誤,一時的行差踏錯淪為笑柄。這次百度發布會上,為了確保展示效果,對話功能竟是採用預錄影片進行,此環節也沒有開放台下觀眾提問互動,但外界,反而根本無法確認文心一言的功力到底如何。
此外,李彥宏表示,文心一言的訓練資料集以中文居多,也最擅長中文。雖然也有以包含英文在內的其他語言資料訓練,因此能處理英文對話,但他坦承,文心一言對英文理解和處理能力沒有中文那麼好,因為英文數據還沒有那麼多。
至於未來,百度會逐步訓練模型理解外語,並加強跨語言的翻譯與推理能力。
然而,在OpenAI釋出的研究結果中,無論是過往的模型版本還有甫發布的GPT4,不僅能夠處理不同語言,更能夠靈活地跨語言溝通,同時掌握各個語言的脈絡,以及彼此之間關係的轉化,這都讓文心一言相形見絀。
另外,文心一言和ChatGPT相同,都有用上人類回饋的強化學習,對此百度首席技術官王海峰更直接表示,「基於人類反饋的學習在應用中至關重要,⋯⋯我得承認,我們訓練得很不充分,真正訓練要在實際使用中用戶反饋回來。」
從他的回答可得知,文心一言尚未經歷OpenAI釋出ChatGPT供人們使用、得到回饋訊號進而修正回答的過程,因此還有待改進。
不過,目前百度僅開放「邀測」,只有特定個人用戶和百度智能雲客戶能夠測試文心一言,並沒有開放給一般大眾,因此,這個中國版AI,比全球數億人日操夜也操的正宗ChatGPT,學習速度將會因此慢上一截。
搜尋引擎基底外加生成式AI,多模態輸出功能是亮點
不過,若文心一言真的如同李彥宏展示的那樣,具備良好的生成能力,則百度的未來,仍舊值得期待。
李彥宏一共介紹了5個文心一言的使用場景:文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成,其中,以中文理解和多模態生成最為突出。
包含文學創作等前3個功能,對於熟悉使用ChatGPT的用戶來說,無法讓人眼睛為之一亮。不過,中文理解部分,既展現出百度利用中文語料訓練模型的特色,也讓人得以一窺百度多年經營搜尋引擎為基底的技術涵養。
展示時,李彥宏以「洛陽紙貴」為題,先是請文心一言解釋意思,接著要求它回答「當時洛陽的紙實際上有多貴」,以及這個成語能夠對應到的經濟學理論。李彥宏強調,訓練模型時,百度活用培養甚久的知識圖譜,當中包含5500億項知識,再加上特別挑選適合學習中文的樣本,因此能夠回答泛用類的問題(解釋洛陽紙貴),也能回答冷知識的問題(到底有多貴)。
不只能生成文字、圖像、聲音與影片都行
多模態產出則是另一大亮點。目前GPT-4支援輸入文字和輸入圖像,但僅支援輸出文字,文心一言雖然暫時有文字輸入,但輸出型態包含文字、圖像、聲音、影片一共4種。
雖然市場上早有文字生成圖像、聲音、影片等產品,但若文心一言的功能真的如同展示一般,那麼文心一言是第一個集大成者。李彥宏以百度的內容創作平台「百家號」為例,未來創作者只要寫稿,就能自動生成配圖、音檔,甚至轉化成影片,可以直接發布於平台上變現。
對標微軟,還是走自己的路?
從布局來看,百度的發展方向很清楚。
先借鏡微軟和谷歌的路線,微軟和OpenAI合作,可謂相輔相成。就看中國用戶挺不挺國產品了。