訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

遠見39週年 遠見39週年 訂兩年送一年、訂一年送半年 再送暢銷好書

NotebookLM有暢銷書作家參與孵化?他征戰AI靠編輯力

曾子軒
user

曾子軒

2024-11-18

瀏覽數 5,750+

NotebookLM左扛Notion、右抗ChatGPT,儘管後發,卻能在利基應用場景中先至。強生就是幕後推手之一。Google提供
NotebookLM左扛Notion、右抗ChatGPT,儘管後發,卻能在利基應用場景中先至。強生就是幕後推手之一。Google提供

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

將筆電螢幕從桌上掀起,打開瀏覽器視窗,數十個分頁堆積如山,擺放許久懸而未決。試著從散亂的來源中尋覓資訊,努力將其組織拼湊,重新架構出一份結果。如果這是你的生活寫照,那麼,「不管你的職業是什麼,NotebookLM對你來說會是一個很棒的工具。」接受《遠見》專訪,Google實驗室編輯總監(Editorial Director)史提芬.強生(Steven Johnson)肯定地說道。但強生的背景相當特別,他是寫過多本暢銷書的作家,還曾獲得艾美獎。他如何靠文字編輯力在AI領域發光?

「如果你最近有留意,Google丟了一個叫做NotebookLM的黑科技。你可以把所有讀過的文章,甚至是影片都丟給它,它可以馬上翻成文字之後摘要。」偌大的演講台上,Google台灣前董事總經理簡立峰如此簡介NotebookLM的用途。

他口中的NotebookLM,是Google實驗室內部孵化的新銳產品,也像組織內的微型創業。

這款主打AI輔助的筆記軟體,由Google的基礎模型Gemini驅動,設計宗旨是幫助使用者閱讀並理解資訊。向NotebookLM提供不同來源資訊,例如YouTube演講和Google文件以後,它會細嚼慢嚥後重組,應使用者要求,生成簡報文件(briefing docs)、常見問答(FAQ)等內容,試圖替知識工作者消除面對未知時的知識門檻。

簡立峰曾多次表示,AI工具和應用出現影響的不只是企業,個人的學習甚至是教育都遭受衝擊。曾子軒攝

簡立峰曾多次表示,AI工具和應用出現影響的不只是企業,個人的學習甚至是教育都遭受衝擊。曾子軒攝

去年(2023)5月Google I/O大會上,Google實驗室推出帶有以「助力」為命名寓意的人工智慧筆記服務「Project Tailwind」,它能夠整合雲端硬碟中的課本與講義,產出延伸的小測驗、學習指南或者課堂摘要,幫助學生學習,這便是NotebookLM的前身。

開發NotebookLM的小團隊初期只有3人,去年7月正式問世之際,除了強生之外,就只有3位工程師、一位設計師和一位產品經理。

今年9月,NotebookLM推出音訊概覽(audio overview)功能,只要上傳內容,NotebookLM便可以生成雙人對談的音訊,就此引爆寫作者和podcast製作人社群。

強生稱這款實驗之作的用途為「理解事物」。聽來詞不達意,甚至可說空泛,然而,對愛好者來說卻無比真實。

NotebookLM用途》能當領域專家,也是最懂你的人 

學生放上教材,能夠得到精美的學習指南;高階主管趕在開會前提供會議資料,就能收穫一份會前簡報文件。就像大廚烹煮食材,NotebookLM處理使用者上傳的文件後,衍生出的諸多功能,是其產品核心。

宜蘭縣中山國小教師林穎俊將NotebookLM描述為「刺針」。他認為上傳資料、與AI工具對話,能夠協助自己「窺探」內容是否足夠切身;交談之中,可以向下深挖,也能橫向尋找脈絡,有機會探索出更多可能。

強生解釋,若是提供特定領域素材,NotebookLM便能成為領域專家;倘若交出自己的日記,NotebookLM就可以掌握你過去5年間思考的事情。

在他眼中,使用ChatGPTClaude等對話式AI服務,與大模型來一場開放問答,絕對能夠收穫滿滿,「但更令人驚艷的是,那些能夠依據提供資料進行參考的語言模型,」當手上握有大量文件,想要理解特定領域的專業知識時,著重現實連結(grounding,或稱接地),藉此避免幻覺的NotebookLM,有著更好的發揮。

「其他許多產品只是聊天界面,後來才是使用者『上傳文件』,但我們打從開始,就圍繞文件設計這個平台。」例如,NotebookLM提供嵌入式的引用,這項強生稱為「對話式超文本」(conversational hypertext)的功能,讓使用者能夠在需要時回溯資料來源,又不會中斷自己的思路。

NotebookLM的產品核心,就是限制生成內容以上傳內容為基底,避免幻覺出現。曾子軒攝

NotebookLM的產品核心,就是限制生成內容以上傳內容為基底,避免幻覺出現。曾子軒攝

對非虛構類型的創作者來說,確保內容並非憑空捏造非常重要,「讀者不會願意付費看有很多錯誤的東西。」科技電子報《VK科技閱讀時間》作者VK(何晨瑋)表示,每期電子報內有超過20處需要事實查核(fact check),對話基於事實、能夠追本溯源的工具便帶來許多助益。

避免出錯以外,透過對話增進理解也是重點。何晨瑋習慣在寫作前會先精讀10至15篇訪談素材,過程中初步架構會自然浮現,寫作時再依照大綱填補血肉。不過,從概念落地成為文字,思緒可能仍有晦澀不明之處。因為NotebookLM已經掌握資訊,與其交談和提問,能夠幫助自己釐清絞纏的線頭。

人們在NotebookLM上閱讀、寫作、儲存和處理文件,聽起來,筆記軟體老將Evernote、新星Notion也在做類似的事,都替人們整理、組織並且彙整資訊。NotebookLM哪裡不同?

「很多知識管理工具都提供大量的組織功能,你可以上傳資料、標記它們,還能在文件之間建立連結⋯⋯,但在有AI模型的時代,你不需要花太多時間在這些組織上。」自己使用筆記軟體超過20年,強生認為,人們已經可以省下整理筆記的時間,將所有內容丟給AI。因為自然語言處理的進展,讓資訊產品從搜尋轉進到問答時代,想要建立起筆記軟體愛好者理想中的第二大腦,變得更加容易。

事實上,強生曾多次建議,人們不妨開闢一本記錄所有事物的筆記(everything notebook),將平常愛看的書籍、工作會用到的重要文件、頓悟時刻記下的潦草隨筆,全都上傳到NotebookLM,便能夠擁有一位專屬的個人幫手。

NotebookLM願景》混搭重塑資訊,讓使用者自由 

雖然定位清晰、功能不俗,但去年發表以來,NotebookLM還像是文青愛不釋手的小眾讀物,頗受好評之餘,未能在市場上掀起大浪,直到今年年中,才開始出現水花。

就在5月的Google I/O大會上,Google實驗室副總伍德沃德(Josh Woodward)在眾人面前打開NotebookLM,他已預先上傳幾份物理學課程講義,因此NotebookLM已經做好準備好,提供測驗、問答等輔助教材,幫助他的兒子吉米學習。

伍德沃德說,這些內容很有效,「但吉米用聽的方式學習,效果會更好。」話剛說完,消化完講義的NotebookLM,產出一份以力學為主題的對談音訊。伍德沃德描述,當吉米見證這個功能的時候,眼睛睜得很大、很大。

這個9月問世的功能叫做音訊概覽,上市後大獲好評。除了輔助學習以外,使用者找到更多應用場景,不擅言詞的文字創作者找到內容的新出口,聲音經濟的創作者們,也找到新方法改變工作流程。

「你可以把所有東西都變成podcast,」OpenAI共同創辦人卡帕席(Andrej Karpathy)如此評論。他的說法毫不誇張,因為卡帕席就以GPT-2模型的原始程式碼為素材,利用音訊概覽功能,得到一段討論GPT-2架構的生動對談。

從文字轉戰聲音,看似偏離專注解析文件的發展路線,但是在NotebookLM團隊眼中,其實不脫輔助用戶理解事物的初衷。Google實驗室負責NotebookLM的的產品經理馬丁(Raiza Martin)就說,研發這款產品的願景始終是透過AI介面,以多樣化的格式,讓使用者能夠自由混搭、重塑任何形式的資訊。音訊,也是其中之一。

【遠見 x 未來親子】全家一起讀,孩子成長看得見:週年慶限定組再送這些>>

強生透露,希望提供不同聲音和不同語言讓使用者自由選擇,但每種語言各自表達方式的獨特性是挑戰。取自Google

強生透露,希望提供不同聲音和不同語言讓使用者自由選擇,但每種語言各自表達方式的獨特性是挑戰。取自Google

有趣的是,為了讓生成的聲音更加自然,NotebookLM會刻意加入停頓、重複和「嗯」與「啊」,藉此貼近真人說話的習慣。強生表示,音訊開發團隊在初期便意識到,應該在聲音中加入雜訊,因為人們渴求的,絕不是語法完美的機器人。「這些細微的不完美,反而成為至關重要的一部分,讓對話聽起來更加真實且自然。」

對照之下,NotebookLM的文字風格顯得更為正式,消去了交談時留下的冗贅痕跡。強生分享,未來的開發重點將是帶給使用者更多客製化,例如在音訊和文字中,提供風格選項任君挑選。

NotebookLM團隊》筆記加寫作,產品需要編輯 

攤開過往經歷,他被《紐約時報》稱為「卓越的故事講述者與深刻思想家」,主持電視節目拿下艾美獎、負責的Podcast也攻占過排行榜首位;他還是14本書籍的作者,平時定期為媒體撰稿。

在AI產品的小組織裡,既不是設計師、也不用寫程式的強生,掛著編輯總監頭銜,和產品經理馬丁緊密合作。

馬丁除了與強生討論產品發展方向以外,也把強生當成產品本身就近觀察。她會睜大雙眼,檢視這位擅長文字的創作者,怎麼在日常中消化海量資訊,再把觀察到的工作流程和心法,轉化爲產品功能。

當然,強生本人也時常貢獻編輯角度出發(editorial)的想法,例如NotebookLM時常以列點方式總結內容,並且替關鍵句加上粗體以便閱讀,這便是編輯常見的考量。

強生表示,模型已經擅長處理事實性問題,但是從新聞角度來看,會更為關注回覆品質,「準確性很重要,⋯⋯但說到有品質的回覆,應該是很有趣、親切、讓人感覺像在跟真人互動?還是體現在冷靜陳述事實,不會假裝是你的朋友?」

回覆時應該採取的語氣、生成內容的理想長度,其實是價值判斷,而非對或錯的事實性問題。思考這些大哉問,便是強生的職責所在。

回顧互動式AI產品的崛起,ChatGPT以對話為介面,改變人機互動的標準,掀起滔天關注;NotebookLM則致力於將先進的AI能力,轉化為能夠為人所用的功能,讓大語言模型不只是通過律師考試、奧林匹亞競賽,但總有些距離的資優生。

為了貼近使用者需求,NotebookLM團隊也在Google內部做了許多研究。

上傳文件後顯示的預設選項,例如簡報文件、常見問題、時間軸等,被團隊稱為指南(guides),大部分出自使用者研究的回饋。強生表示,Google本身聚集出色的知識工作者,是測試產品的好地方。

他透露,簡報文件其實是Google高階主管許願後設計的功能,「(主管們)上傳會議相關資料後生成簡報文件,他們希望幫助自己了解,開會前需要先知道什麼。」

強生曾仿照脫口秀常見的吐槽風格,讓NotebookLM批評自己的文章,結果音訊便出現「他(強生)有在寫文章前做過任何研究嗎?真是個笨蛋」這樣的句子。Google提供

強生曾仿照脫口秀常見的吐槽風格,讓NotebookLM批評自己的文章,結果音訊便出現「他(強生)有在寫文章前做過任何研究嗎?真是個笨蛋」這樣的句子。Google提供

另外,廣受好評的「建議問題」,也就是對話框上方浮現出的提問,想法來自學生,原先並沒有這個功能,因為設想有需求的人發想問題,自行提問,直到去年夏天,邀來學生測試,收到「我不知道要問什麼」的回饋,讓強生大感慚愧,因為對記者出身的他來說,提問是最基本的技能。

現在,NotebookLM固定在使用者上傳資料後,生成三個相關問題。隨著對話演進,也會根據使用者發問補充相應的後續建議提問,「他們能夠從一開始,就透過點擊建議問題進行探索,體驗如何提問等互動。」強生解釋。

提問、生成小考、轉成聲音,NotebookLM多樣化的媒介與方式,讓簡立峰感歎它將改變人們的學習方式,「問出好問題」也變得至關重要。「那我們的教育是什麼?問大家『有沒有問題』,大家接著回答『沒有問題』,這樣就有大問題了!根本的教育需要跟著改變。」

NotebookLM展望》團隊速度快,不害怕競爭 

對開發團隊來說,根據提供內容產生回覆的grounding,是產品不可撼動的根基。不過,從使用端來看,總是追求更多彈性。

當被問到要如何控制回覆基於事實,又要保持內容的自由時,強生表示,團隊傾注大量心力取得平衡,「這是一種精妙的技藝,需要在遵循依據的同時留下創意空間。」

就未來發展方向來說,重點將會放在帶給人們更多形式上和使用上的自由,例如開放更多音訊和文字上的回覆風格、擴張到更多語言,並且讓使用者自行定義預設對話與提問。讓NotebookLM更接近傳統筆記軟體,改進寫作視窗、方便編輯,也是確定會看到的升級。

雖然NotebookLM的知名度漸增,但後進者從不會停下腳步。除了其他AI工具在產品中補上grounding功能以外,Meta更直接推出開源的NotebookLlama,完全複製NotebookLM的音訊概覽功能。

Meta團隊毫不避諱地指出,NotebookLlama專案就是NotebookLM的開源版本。取自Meta官方GitHub。

Meta團隊毫不避諱地指出,NotebookLlama專案就是NotebookLM的開源版本。取自Meta官方GitHub。

不過,強生笑著說,儘管自家孩子每天都在使用Claude,但他個人幾乎從不使用主流的AI對話服務,因為開發路線圖上的新功能堆積如山,他也想把時間花在理解人們怎麼使用自家產品,無暇關注競爭對手的動向。

對強生來說,NotebookLM就像在Google實驗室內部創業,小團隊緊密溝通,以飛速實驗、迭代產品;今年第四季更往商業化道路邁開大步,全球已經有8萬間組織使用NotebookLM,走進企業工作場景。但他也坦然表示,若真的在Google以外創業,「我可能會更加擔心競爭。」

能夠存放50則文件、2500萬字,提出問題後收到精準回答,甚至在資料源頭和摘要之間穿梭,將時間倒退回20年、10年,恐怕難以想像這個畫面。「我常常開玩笑說,自己已經夢想這樣的軟體30年了。」能夠親眼見證幻想成真,甚至參與其中,強生的眼裡有說不出的滿足。

標榜AI支持的產品和服務如過江之鯽,但消逝的產品不知凡幾。

如同愛因斯坦所說,「任何人都能知道,但重點在於理解,」成長於Google土壤的NotebookLM,打從設計之初便有著鮮明邏輯。接下來,且看它能否持續從創作者視角出發,帶給使用者正中紅心的獨特價值。

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務