據Google官方指出,5月19日NotebookLM App已正式上線兩大平台。即便市場上有ChatGPT、Claude與Perplexity等多樣AI服務,但仍有後輩不時竄出,NotebookLM便是異軍突起的其中之一。這款主打忠於事實的筆記工具,究竟有哪些功能,為何是學生與研究人員的利器,甚至連NVIDIA創辦人黃仁勳都很常用?行動版App的功能?它背後的運作原理又是什麼?正式開放中文輸出podcast錄音檔要怎麼用?《遠見》一文整理帶你看。
NotebookLM是什麼?
2023年7月,由Google旗下Google實驗室推出的NotebookLM,是一款主打AI功能的筆記軟體,它由Google旗艦基礎模型Gemini驅動,設計宗旨是幫助使用者閱讀並理解資訊。
Google實驗室編輯總監(Editorial Director)、從專案開始處便參與的史提芬.強生(Steven Johnson)接受《遠見》專訪時指出,若使用者上傳特定領域資料到NotebookLM上,它就是一位領域專家;如若提供的是自己的私人日記,它便會對你的私人生活瞭若指掌。
換句話說,NotebookLM扮演的角色是一位個人專屬助理,透過問答與生成內容幫助使用者快速掌握資訊。
打開NotebookLM以後,使用者可以提供不同來源的資訊(sources of information),例如YouTube對談的連結,或者寫滿筆記的Google文件,又或者手動貼上內容。消化這些資訊後,NotebookLM會草擬與文件有關的問題,幫助使用者透過提問理解這份檔案。
與其他常見對話式AI(conversation AI)服務如ChatGPT、Claude相比,NotebookLM的最大差異之處在於,它尤其重視與現實連結(grounding,或稱接地),嚴格限制對話內容的產出,一定要遵循使用者提供的資訊,不僅避免幻覺出現,也讓人更能專注在想要掌握的資料。
強生用兩句話總結設計NotebookLM的核心想法:「創建一個簡單易用的介面,讓人可以上傳和整理不同任務的文件,」接著便能開始與資料互動,從過程中理解內容。
NotebookLM有哪些功能?
NotebookLM最主要的功能,就是讓使用者可以用問答方式理解資料。
為了增進理解,NotebookLM透過不同預設功能輔助使用者。舉例來說,除了與NotebookLM閒聊資料內容以外,NotebookLMM還提供如生成簡介文件(breifing doc)、常見問答(FAQ)等選項,讓需求各異的用戶更好理解並運用經過消化的資料。
強森透露,NotebookLM提供的預設功能,各自都對應到使用者研究的不同發現,以及適合的場景,例如簡介功能很適合開會前,先上傳先前的會議結論;時間軸(timeline)則適合媒體工作,可以上傳新聞事件的相關文字,讓NotebookLM整理事件始末。
2024年9月,Google宣布增加語音摘要(Audio Overview)功能,NotebookLM讀進知識後,變成生成雙人對談的音訊檔案,就像一檔專屬於使用者、以上傳資料為主題的podcast,以不同媒介獲取知識。
會發展音訊功能,也是注意到獲取資訊的媒介不只有文字,有人對聲音的反應更好。光是從改變形式出發,就能帶來更多不同的可能性。
努力研發出不同的資訊形式以外,強森表示,NotebookLM也打算加緊開發傳統筆記該有的功能,尤其是增進文字編輯區塊,希望讓使用者不要只是在NotebookLM上問答,還能夠停駐此地,直接在平台上寫文章、後製對話產出的內容。
2025年4月,Google宣布語音摘要功能支援包含中文在內的50種語言,方便使用者可以利用慣用語言,從上傳的文件中學習。
在NotebookLM右上角的設定選單中,能夠自訂語音摘要的輸出語言,無論原始內容語言為何,生成的語音與聊天回應都會依照設定語言呈現。在課堂上或者辦公室裡,無論原始資料的語言為何,不同國籍的學生和員工都能用各自嫻熟的語言理解內容。
Google舉例,若有教師在課堂上討論亞馬遜雨林,可以整合葡萄牙文的紀錄片、西班牙文的研究論文和英文的學習資料,學生即便無法掌握這些語言,還是可以在NotebookLM中,以自己偏好的語言生成語音總結,突破語言隔閡,提升學習成效。
Google表示,這項功能仍處於初期階段,未來將根據用戶回饋持續改善,拓展AI語音學習工具的可能性。
NotebookLM App是什麼?
據Google官方部落格資訊,5/19已正式推出 NotebookLM 的手機 App !Android 和 iOS 雙平台都有,讓你隨時隨地都能輕鬆搞懂複雜資訊。主要收錄在行動版App的功能包括:
- 1. 離線收聽語音摘要: 不管是在捷運還是網路訊號差的地方,都能下載語音摘要,隨時隨地邊聽邊學,實測可一鍵完成,還能聽中文等多元語言語音摘要。
- 2. 與 AI 主持人互動: 有問題想問?想引導討論方向?直接點擊加入,想問什麼就問什麼,互動性十足。
- 3. 隨處分享內容到 NotebookLM: 在瀏覽網頁、PDF 或 YouTube 影片時,點擊分享按鈕,就能直接把內容加入 NotebookLM。
下載條件為:App Store所需的軟體版本為 iOS 17+ ;Google Play Store 則是Android 10+。這兩個平台搭載的手機與平板皆可。
Google的NotebookLM已推出App,在iOS平台上可下載。圖片來源:iOS市集截圖
NotebookLM運作原理為何?
強生向《遠見》解釋,待使用者上傳後資料後,NotebookLM會將其放入模型的上下文視窗(context window)當中,這可以用短期記憶來理解。對比之下,訓練資料則更接近長期記憶的範疇。
如果資料規模沒有超過模型能夠記下的容量,NotebookLM就會將上傳內容完整吸收;若超過上下文視窗容納長度,NotebookLM會從中選取最重要的段落,再將其加入到短期記憶裡。
接著,NotebookLM會按照「利用這些資訊回答問題、生成FAQ」等預先寫好的劇本運作。強森補充,NotebookLM背後也有預設指令,要求它完全依照來源資料回答問題。
強森舉例,若有使用者上傳美國最高法院的判決文件,但使用者卻提問藝人泰勒絲(Taylor Swift)的相關問題,NotebookLM會判斷出兩者並不相關,並回覆使用者,「無法回答此問題,」實現不知為不知的境界。
當然,NotebookLM背後的模型,也具備一定的常識,才有辦法回答問題。NotebookLM團隊也有透過指令,讓輸出維持穩定風格。
強森認為,經過團隊的努力,NotebookLM已經擅長處理基本的事實性問題,下一個開發重點在於品質。「當我們談論回應的品質時,品質到底是指什麼?準確性當然很重要,我們希望模型能根據來源文件給出事實性回應。但是,有品質的回應,是否應該是那種很有趣、親切、讓人感覺像在與真人互動的回應?還是,品質指的應該是冷靜陳述事實、不假裝是朋友,只是單純列出資訊?」
他將上述決策用「與編輯相關」(editorial)形容,因為在忠於事實以外,上升到回應長度與聲音音調,重點就不只有回應是否貼近原始資料,而是轉移到開發產品時,究竟要滿足使用者何種需求的價值判斷了。
NotebookLM PLUS跟NotebookLM差在哪?誰能用?
NotebookLM與NotebookLM PLUS使用量與功能比較 | ||
---|---|---|
方案 | NotebookLM | NotebookLM PLUS |
面向受眾 | 個人帳號 | 企業或者學校的帳號 |
費用 | 免費 | 購買Gemini for Workspace的Google Workspace(for Education)才能使用,亦可藉由Google Cloud存取 |
使用量 |
|
|
功能比較 | 包含以下基礎功能
| 除了基礎功能以外,另外多出以下付費功能
|
資料來源:採訪、公開資訊。曾子軒整理,2025/01更新。 |
NotebookLM實測起來如何?跟ChatGPT對比?
NotebookLM擅長化繁為簡,從不同來源資料中梳理出重點,例如把英文論文變成Podcast、詢問AI文章細節、新增筆記並讓AI評論以及匯入YouTube影片等,究竟使用上表現如何?請見NotebookLM實測結果。
NotebookLM在執行任務,例如在特定範圍中學習知識、將AI回答存為記事等,與ChatGPT對比效果如何?誰更厲害?請見NotebookLM比較ChatGPT實測結果。