訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

AI應用實測》ChatGPT + Whisper怎麼用來打造文章?

林士蕙
user

林士蕙

2023-03-09

瀏覽數 29,500+

藉由OpenAI團隊開發的語音轉文字模型Whisper,以及聊天機器人ChatGPT或許有機會從零打造文章。Photo by Levart_Photographer on Unsplash
藉由OpenAI團隊開發的語音轉文字模型Whisper,以及聊天機器人ChatGPT或許有機會從零打造文章。Photo by Levart_Photographer on Unsplash

AI人工智慧的創新,已在顛覆職場。最近國內不少上班族,已經善用各類超夯AI應用,趁下班時間在社群上發文,斜槓作網紅。如果你偶然錄下一段訪談錄音,可以減少人力,光靠ChatGPT、Whisper等AI工具,從零打造文章嗎?最後和專業寫作程度多接近?又怎麼下指令?以下全面實測工具的優劣點帶你看懂。

人工智慧AI讓許多上班族,更有能力斜槓找新方向。像是網上經營個人品牌寫部落格文章,現在有AI幫助更有效率。

而當你手機錄了一段訪談語音,有可能完全只用AI工具,就能快速從語音變成可用的文章嗎?依照記者使用經驗,只要結合OpenAI團隊開發出的語音轉文字模型Whisper,或者建基於Whisper模型的類似AI應用Good Tape,再結合聊天機器人ChatGPT,確實能打造出草稿。雖然和專業寫作者的水準仍有一段距離,已提高不少效率。

至於使用上就是簡單兩大步驟,首先將音檔輸入語音辨識模型應用,讓它轉出逐字稿文檔,其次就將檔案中文字貼上ChatGPT,請它潤飾即可。

但是,到底實際使用上,效果多好?指令怎麼下?這些AI應用的優缺點以及使用友善性在哪?以下是完整介紹與實測,可以讓你避免卡關踩地雷。

生成式AI應用ChatGPT是什麼?為何它引爆全球使用熱潮?

雖然ChatGPT已是今年全球與台灣最熱門的技術趨勢議題,可能還是有人,從未全面了解它的發展歷程與爆紅成功原因。想看最完整解讀,請見此文。

ChatGPT已被微軟融入自家搜尋引擎Bing,在手機上也可用?

ChatGPT出App版了嗎?為何好多人天天手機上使用?原來是今年2月,微軟已將ChatGPT融入搜尋引擎Bing ,就此讓「Bing」行動版App如虎添翼,可使用Bing AI加上搜尋服務,其實也就是ChatGPT在背後發威。到底這次升級有哪些驚喜?另外,又如何運用含上千種指令的萬能工具箱外掛,幫你工作?可見此文攻略。

語音轉文字的AI工具1〉Whisper是什麼?講中文也能通?

Whisper的說明文件,來源Github截圖

Whisper的說明文件,來源Github截圖

打造出聊天機器人ChatGPT的OpenAI團隊,也早就推出了語音轉文字模型Whisper,相當適合用來將你的錄音轉成文字。

但是,它能否正確辨識中文的逐字稿,應該是國內民眾最關心的。根據OpenAI在Github上釋出的說明文件,Whisper是一個通用的語音識別模型,目前已可辨識全球約50多種語言的語音,並轉成文字。不過辨識準確度則差異頗大,目前準確度最高的前3名為西班牙文、義大利文與英文。中文的辨識準確度,在這50多種語言中僅列第30名。不過,就許多人的使用經驗,Whisper的中文辨識已稱得上堪用等級。

語音轉文字的AI工具2〉Good Tape是什麼?和Whisper關係在哪?

Good Tape官網截圖

Good Tape官網截圖

另外,還有來自丹麥的數位媒體Zetland,善用Whisper模型,進而建置了更專業的語音轉文字應用Good Tape。根據Good Tape官網資訊,它也一樣能將中文等數十種語言的語音轉成文字稿。同時,由於Zetland團隊本身是媒體業出身,因此是依照記者採訪平日錄製訪談語音的要求,來打造這個AI應用,號稱更能符合專業報導用途。

AI比一比:Whisper vs. Good Tape誰使用上較友善?費用問題?

OpenAI去年9月一開始推出Whisper,是在Github上釋出程式碼;今年3月則開放付費的Whisper API串接服務。不論你使用哪一種方式來安裝使用,都會需要一點程式相關知識,建議要有工程師背景的人較適合。另外,若使用Whisper API串接服務,目前每分鐘0.006美元計價,相當平價,但並非免費。

至於Good Tape,則相當簡單,只要進入官網,直接上傳語音檔,選定要整理逐字稿的語言,並輸入你的信箱。它會在完成後,自動寄出辨識完成的文字檔連結到你信箱。且目前仍是免費試用階段。

8/17賴佩霞新書分享會 | 在基隆塔來一場心靈對話,立即報名!

想使用,相關網址如下:

▌有興趣瀏覽或使用Github上OpenAI釋出的Whisper程式碼,可從Github此網址進入。https://github.com/openai/whisper

▌有興趣瀏覽或使用Good Tape,可從此網址進入:https://www.mygoodtape.com/ 

音檔實測:Whisper vs. Good Tape,哪個辨識中文語音,準確度較高? 

到底這兩個AI應用,哪個中文逐字稿辨識得更準?以《遠見》記者2月7日採訪國內知名教育家、「公益平台基金會」董事長嚴長壽,追憶星雲大師的採訪音頻轉文字為例,以下是實測對照。

◎Good Tape實測結果

所以大師跟我其實是有幾段的因緣 他跟我父親的淵源跟我對談的因緣。當然中間也有一些階段,不同的因素。父親的淵源,我父親比清明大師大概大將近30歲

◎Whisper實測結果

所以大師跟我其實是有幾段的因緣,他跟我父親的人員,跟我對談的因緣,當中也有一些階段不同的接觸,父親的原因是我父親比新年大師大概大將近30歲

Whisper將這段嚴長壽談及他父親與星雲大師淵源的內容,大致上能辨識出來,不過,Good Tape可以辨識出正確的「淵源」一詞,Whisper則辨識成錯誤的「人員」。但是在「不同的接觸」這一句,Whisper辨識正確,Good Tape則錯誤整理為「不同的因素」,可以說辨識語音各有擅長之處,準確度差異不大。

至於上述這兩個應用,都無法正確辨識人名如「星雲大師」。

文稿潤飾實測:如何將語音轉出的文字檔,交由ChatGPT潤稿?

接著,語音轉成的文字訪談,可以請聊天機器人ChatGPT稍微潤飾成專業一點,接近媒體報導的草稿嗎?以下是兩種實測示範。

◎請ChatGPT以專業報導的風格,來潤飾以下這段訪談逐字稿。指令是:「可否請你用專業報導的寫作風格,來潤飾下面這段文字」

以下是將所提供的文字進行潤飾後的範例:

有人可能會好奇我父親的淵源是什麼。事實上,我父親比清明大師大約28歲,如果他還在世的話,現在應該已經121歲了。他在20多歲時來到台灣,並住在台南的水交社。我們一家人來自杭州,當時我父親與一些空軍朋友相識,其中有些朋友已經在台灣定居。於是他們建議我父親來台灣看看,於是他便來了。這是在1948年。在來到台灣之後,我父親覺得這裡還不錯,於是把我媽媽和我們小孩接過來了。

◎請ChatGPT以感性的人物報導的風格,來潤飾這段訪談逐字稿。指令是: 「可否請你用人物報導的寫作風格,來潤飾下面這段文字」 

以下是我以人物報導的文筆風格,為您潤飾的文字:

他深情地向我們道來,這位大師和他父親的淵源,以及他和這位大師對談的點滴。他告訴我們,這位大師比他的父親大近30歲,如今如果他的父親還在世,已經是121歲高齡。而這位大師的到來,是因為他們都來自於杭州,而他的父親當時是和這位大師一些空軍的朋友相識。這些朋友建議他們一起前往台南基地,並向他的父親提出要不要到台灣來看看。於是,他的父親帶著家人來到了台灣。

◎原來逐字稿段落

所以大師跟我其實是有幾段的因緣,他跟我父親的淵源跟我對談的因緣,當然中間也有一些階段不同的因素,父親的淵源我父親比清明大師大概大將近30歲 20幾歲,今天父親要在的話應該是121歲了。所以他呢,當時我父親是當時來到台灣,是住在台南的水交社 所以他當時就來到台灣,是因為我們是杭州人。爸爸在那個時候跟杭州的一些空軍,比如當時的一些朋友,所以當時他們就建議他們就接受了台南基地就要求我爸爸,你乾脆要不要到台灣來看看,我父親就來了 他是1948年 他來了以後覺得還不錯,就把我媽媽跟我們小孩接過來了。

至於兩種風格的潤飾稿件,和上面原來文本的逐段落,對照看來。第一個專業報導風格,ChatGPT確實將口語的贅字精簡,或用比較專業的說法來取代,看來是有掌握專業報導的一些常見作法。第二個人物報導風格,ChatGPT則添加了不少感性辭彙,只是竟也跟著添加一些錯誤的資訊,例如星雲大師是江蘇江都人,並非與嚴長壽一家人都同樣是杭州人,另外訪談中所指的「空軍朋友」,應是嚴長壽父親的朋友,與星雲大師無關。嚴長壽父親也並非是和星雲大師的朋友一起從中國大陸到台南。

◎記者實測心得

不過,就實測心得來說,好處是Whisper只需一分鐘就可生成逐字稿,比起人工整理高效不少,同時AI製作的逐字稿中除了人名,一些事實大致正確,還可以協助確認年歲差距等數據。至於ChatGPT潤飾文字時,也確實會調整成相對正式用詞,但是要千萬小心AI無意中添加的假資訊,絕對需要重新確認過。

結論是作為草稿尚可,但記者真實完成的報導,還是遠遠花了更多功夫調整語彙,並且得查證訪談內容相關的事實數據,仍不至於靠AI「秒生成」一篇報導。有興趣看最終報導內容,可參考此網址:嚴長壽追憶星雲:大師風範傳世,遺囑一句話就破除迷思

更多精采報導,歡迎加入《遠見》 Line官方帳號
AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務