AI人工智慧的創新,已在顛覆職場。最近國內不少上班族,已經善用各類超夯AI應用,趁下班時間在社群上發文,斜槓作網紅。如果你偶然錄下一段訪談錄音,可以減少人力,光靠ChatGPT、Whisper等AI工具,從零打造文章嗎?最後和專業寫作程度多接近?又怎麼下指令?以下全面實測工具的優劣點帶你看懂。
人工智慧AI讓許多上班族,更有能力斜槓找新方向。像是網上經營個人品牌寫部落格文章,現在有AI幫助更有效率。
而當你手機錄了一段訪談語音,有可能完全只用AI工具,就能快速從語音變成可用的文章嗎?依照記者使用經驗,只要結合OpenAI團隊開發出的語音轉文字模型Whisper,或者建基於Whisper模型的類似AI應用Good Tape,再結合聊天機器人ChatGPT,確實能打造出草稿。雖然和專業寫作者的水準仍有一段距離,已提高不少效率。
至於使用上就是簡單兩大步驟,首先將音檔輸入語音辨識模型應用,讓它轉出逐字稿文檔,其次就將檔案中文字貼上ChatGPT,請它潤飾即可。
但是,到底實際使用上,效果多好?指令怎麼下?這些AI應用的優缺點以及使用友善性在哪?以下是完整介紹與實測,可以讓你避免卡關踩地雷。
生成式AI應用ChatGPT是什麼?為何它引爆全球使用熱潮?
雖然ChatGPT已是今年全球與台灣最熱門的技術趨勢議題,可能還是有人,從未全面了解它的發展歷程與爆紅成功原因。想看最完整解讀,請見此文。
ChatGPT已被微軟融入自家搜尋引擎Bing,在手機上也可用?
ChatGPT出App版了嗎?為何好多人天天手機上使用?原來是今年2月,微軟已將ChatGPT融入搜尋引擎Bing ,就此讓「Bing」行動版App如虎添翼,可使用Bing AI加上搜尋服務,其實也就是ChatGPT在背後發威。到底這次升級有哪些驚喜?另外,又如何運用含上千種指令的萬能工具箱外掛,幫你工作?可見此文攻略。
語音轉文字的AI工具1〉Whisper是什麼?講中文也能通?
打造出聊天機器人ChatGPT的OpenAI團隊,也早就推出了語音轉文字模型Whisper,相當適合用來將你的錄音轉成文字。
但是,它能否正確辨識中文的逐字稿,應該是國內民眾最關心的。根據OpenAI在Github上釋出的說明文件,Whisper是一個通用的語音識別模型,目前已可辨識全球約50多種語言的語音,並轉成文字。不過辨識準確度則差異頗大,目前準確度最高的前3名為西班牙文、義大利文與英文。中文的辨識準確度,在這50多種語言中僅列第30名。不過,就許多人的使用經驗,Whisper的中文辨識已稱得上堪用等級。
語音轉文字的AI工具2〉Good Tape是什麼?和Whisper關係在哪?
另外,還有來自丹麥的數位媒體Zetland,善用Whisper模型,進而建置了更專業的語音轉文字應用Good Tape。根據Good Tape官網資訊,它也一樣能將中文等數十種語言的語音轉成文字稿。同時,由於Zetland團隊本身是媒體業出身,因此是依照記者採訪平日錄製訪談語音的要求,來打造這個AI應用,號稱更能符合專業報導用途。
AI比一比:Whisper vs. Good Tape誰使用上較友善?費用問題?
OpenAI去年9月一開始推出Whisper,是在Github上釋出程式碼;今年3月則開放付費的Whisper API串接服務。不論你使用哪一種方式來安裝使用,都會需要一點程式相關知識,建議要有工程師背景的人較適合。另外,若使用Whisper API串接服務,目前每分鐘0.006美元計價,相當平價,但並非免費。
至於Good Tape,則相當簡單,只要進入官網,直接上傳語音檔,選定要整理逐字稿的語言,並輸入你的信箱。它會在完成後,自動寄出辨識完成的文字檔連結到你信箱。且目前仍是免費試用階段。
想使用,相關網址如下:
音檔實測:Whisper vs. Good Tape,哪個辨識中文語音,準確度較高?
到底這兩個AI應用,哪個中文逐字稿辨識得更準?以《遠見》記者2月7日採訪國內知名教育家、「公益平台基金會」董事長嚴長壽,追憶星雲大師的採訪音頻轉文字為例,以下是實測對照。
◎Good Tape實測結果
◎Whisper實測結果
Whisper將這段嚴長壽談及他父親與星雲大師淵源的內容,大致上能辨識出來,不過,Good Tape可以辨識出正確的「淵源」一詞,Whisper則辨識成錯誤的「人員」。但是在「不同的接觸」這一句,Whisper辨識正確,Good Tape則錯誤整理為「不同的因素」,可以說辨識語音各有擅長之處,準確度差異不大。
至於上述這兩個應用,都無法正確辨識人名如「星雲大師」。
文稿潤飾實測:如何將語音轉出的文字檔,交由ChatGPT潤稿?
接著,語音轉成的文字訪談,可以請聊天機器人ChatGPT稍微潤飾成專業一點,接近媒體報導的草稿嗎?以下是兩種實測示範。
◎請ChatGPT以專業報導的風格,來潤飾以下這段訪談逐字稿。指令是:「可否請你用專業報導的寫作風格,來潤飾下面這段文字」
以下是將所提供的文字進行潤飾後的範例:
◎請ChatGPT以感性的人物報導的風格,來潤飾這段訪談逐字稿。指令是: 「可否請你用人物報導的寫作風格,來潤飾下面這段文字」
以下是我以人物報導的文筆風格,為您潤飾的文字:
◎原來逐字稿段落
至於兩種風格的潤飾稿件,和上面原來文本的逐段落,對照看來。第一個專業報導風格,ChatGPT確實將口語的贅字精簡,或用比較專業的說法來取代,看來是有掌握專業報導的一些常見作法。第二個人物報導風格,ChatGPT則添加了不少感性辭彙,只是竟也跟著添加一些錯誤的資訊,例如星雲大師是江蘇江都人,並非與嚴長壽一家人都同樣是杭州人,另外訪談中所指的「空軍朋友」,應是嚴長壽父親的朋友,與星雲大師無關。嚴長壽父親也並非是和星雲大師的朋友一起從中國大陸到台南。
◎記者實測心得
不過,就實測心得來說,好處是Whisper只需一分鐘就可生成逐字稿,比起人工整理高效不少,同時AI製作的逐字稿中除了人名,一些事實大致正確,還可以協助確認年歲差距等數據。至於ChatGPT潤飾文字時,也確實會調整成相對正式用詞,但是要千萬小心AI無意中添加的假資訊,絕對需要重新確認過。
結論是作為草稿尚可,但記者真實完成的報導,還是遠遠花了更多功夫調整語彙,並且得查證訪談內容相關的事實數據,仍不至於靠AI「秒生成」一篇報導。有興趣看最終報導內容,可參考此網址:嚴長壽追憶星雲:大師風範傳世,遺囑一句話就破除迷思。