百度開箱自家ChatGPT「文心一言」，仍救不了股價？

近年極力發展人工智慧的百度於今日（3/16）下午2點召開新聞發布會，介紹自家的ChatGPT「文心一言」。發布會上，百度創辦人暨董事長兼執行長李彥宏介紹了文心一言的應用場景，並實際展示模型能生成的各式內容，當場亮點不少。但為何投資人硬是不捧場，讓股價一直跌？

號稱要和美國競爭人工智慧的中國大陸，自產的AI聊天機器人在哪？3月16日，百度版ChatGPT「文心一言」現身！發表會上，只看百度執行長李彥宏面帶笑容，語氣堅定地向來賓們介紹這個預訓練大模型，種種不輸人的能耐，期盼著贏得頭彩。

只是，與李彥宏的自信從容恰好相反，發布會開始不過20分鐘，百度股價竟一度下跌10%，等於馬上賞了百度團隊耳光。雖然後續有逐漸拉回，但在下午4點鐘左右，百度股價仍舊呈現6%至7%的下跌。投資人為什麼不滿意？真有那麼差？請見以下一文深度開箱，這個百度雄心壯志推出的生成式AI應用。

李彥宏展示文心一言。取自百度發布會

發布會竟是影片預錄、是信心不夠？

首先，發布的展示手法，就讓人深覺得團隊信心不夠，反遭致股東質疑。或許是看到谷歌在發表聊天機器人Bard時，因為直播無法造假，結果讓Bard當場出糗，回答錯誤，一時的行差踏錯淪為笑柄。這次百度發布會上，為了確保展示效果，對話功能竟是採用預錄影片進行，此環節也沒有開放台下觀眾提問互動，但外界，反而根本無法確認文心一言的功力到底如何。

此外，李彥宏表示，文心一言的訓練資料集以中文居多，也最擅長中文。雖然也有以包含英文在內的其他語言資料訓練，因此能處理英文對話，但他坦承，文心一言對英文理解和處理能力沒有中文那麼好，因為英文數據還沒有那麼多。

至於未來，百度會逐步訓練模型理解外語，並加強跨語言的翻譯與推理能力。

然而，在OpenAI釋出的研究結果中，無論是過往的模型版本還有甫發布的GPT4，不僅能夠處理不同語言，更能夠靈活地跨語言溝通，同時掌握各個語言的脈絡，以及彼此之間關係的轉化，這都讓文心一言相形見絀。

另外，文心一言和ChatGPT相同，都有用上人類回饋的強化學習，對此百度首席技術官王海峰更直接表示，「基於人類反饋的學習在應用中至關重要，⋯⋯我得承認，我們訓練得很不充分，真正訓練要在實際使用中用戶反饋回來。」

從他的回答可得知，文心一言尚未經歷OpenAI釋出ChatGPT供人們使用、得到回饋訊號進而修正回答的過程，因此還有待改進。

不過，目前百度僅開放「邀測」，只有特定個人用戶和百度智能雲客戶能夠測試文心一言，並沒有開放給一般大眾，因此，這個中國版AI，比全球數億人日操夜也操的正宗ChatGPT，學習速度將會因此慢上一截。

搜尋引擎基底外加生成式AI，多模態輸出功能是亮點

不過，若文心一言真的如同李彥宏展示的那樣，具備良好的生成能力，則百度的未來，仍舊值得期待。

李彥宏一共介紹了5個文心一言的使用場景：文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成，其中，以中文理解和多模態生成最為突出。

文心一言5個應用場景。取自百度發布會

包含文學創作等前3個功能，對於熟悉使用ChatGPT的用戶來說，無法讓人眼睛為之一亮。不過，中文理解部分，既展現出百度利用中文語料訓練模型的特色，也讓人得以一窺百度多年經營搜尋引擎為基底的技術涵養。

展示時，李彥宏以「洛陽紙貴」為題，先是請文心一言解釋意思，接著要求它回答「當時洛陽的紙實際上有多貴」，以及這個成語能夠對應到的經濟學理論。李彥宏強調，訓練模型時，百度活用培養甚久的知識圖譜，當中包含5500億項知識，再加上特別挑選適合學習中文的樣本，因此能夠回答泛用類的問題（解釋洛陽紙貴），也能回答冷知識的問題（到底有多貴）。