不只台灣,歐美醫生在疫情後常傳出過勞,不少人下班還得忙著回訊病人累翻。該如何解決?醫療管理平台MyChart在美國推出AI功能,可自動撰寫給病患的回覆訊息,減少醫生工作負擔。醫療作為專業性高且攸關生命的產業,適合讓AI介入其中嗎?目前盲測發現真人醫生與ChatGPT回答的優缺點各在哪?又面臨哪些挑戰?
發現身體有小問題,但又覺得不需要馬上去看醫生時,許多人會先輸入症狀上網搜尋,也有些人會在醫療網站上留言詢問醫生。不過,現在人們在網站上收到的醫療建議,可能未必全然來自醫生本人——當中可能也有一部分是AI的主意。
因應醫生過勞頻傳,MyChart推新功能
《紐約時報》日前刊登一篇報導,討論醫療管理平台MyChart的AI功能如何應用在醫生與病患的互動中帶來了潛在的問題。
MyChart是什麼?這是科技公司Epic開發的醫療管理平台,病患可以在上面查看醫療紀錄、預約門診或詢問醫生問題。據Epic指出,目前在MyChart平台上包括醫療人員與病人在內的活躍用戶約1.85億,頗有成效。
為何醫生愈來愈需要科技幫忙?起始於新冠肺炎疫情期間,實體的醫療量能有限,許多人轉向在MyChart上與醫生溝通,這導致醫生在下班時間仍需回覆大量的病患問題,壓縮了本來就少的休息時間。即使目前疫情已趨緩,在線上尋求醫療建議的民眾仍未減少。現在MyChart平台上每天病患傳給醫生的訊息竟高達數十萬件,已讓醫生陷入回訊過勞。
AI根據病患訊息與病歷生成回覆,還能模仿醫生語氣
因此,2023年,MyChart推出基於GPT-4模型的AI功能In Basket Art,便是希望能減少醫生的這份負擔。
In Basket Art能根據病患的問題和病歷草擬回覆訊息,讓醫生不必從頭開始撰寫回覆,而是稍微修改AI生成的內容後送出即可。目前,有超過150個醫療系統、大約15000名醫生和助理,正在使用In Basket Art。
醫學網站AAMC上的一篇文章指出,這個AI工具與一般生成式AI的訓練方式不同,其有針對醫療和健康資料庫特別接受過培訓,使其不會僅根據網路上的內容提供可能錯誤的答案。此外,其也能查閱病患病歷的某些部分,以針對不同病患給出客製化建議。
甚至,Epic正在嘗試讓此工具可以閱讀過去醫生撰寫的訊息,以模仿該醫生的寫作風格。根據《紐約時報》,北卡羅來納大學健康系統的首席資訊長拉姆(Brent Lamm)表示,這解決了醫生常有的疑慮,例如:「使用AI的話,我的個人風格無法體現」,或是「我已經認識這位病患七年了,他們一定會知道這不是我寫的。」等。
是否要在訊息中加註「AI生成」有爭議
過去醫療領域多半將AI用於處理行政工作,而如今,AI正滲透進醫病關係當中。要不要在給病患的訊息中加註「AI自動生成」是一項重要問題,目前美國還沒有明確的法律規範,因此仍有爭議。
根據《紐約時報》,加州大學聖地牙哥健康系統的首席臨床和創新長朗赫斯特(Christopher Longhurst)表示,將資訊透明化沒有缺點,並且病患也普遍能夠接受這項新功能。
然而,紐約大學朗格尼健康系統的首席醫療資訊長泰斯塔(Paul Testa)則指出,如果病患得知醫生回覆的訊息中含有AI內容,可能會讓他們認為其提供的建議不夠專業。也有一些管理者擔心,若在訊息中加註AI生成,有可能會讓醫生在沒有仔細審核AI內容就傳送出去,以至於病患收到錯誤建議時當作藉口。
盲測:他們喜歡ChatGPT的回覆更勝醫生
究竟AI生成的醫療建議是否可靠?AAMC引述了去年發表的一篇論文,其研究AI聊天機器人撰寫的醫療問題回覆,是否能和醫生寫得一樣好。該研究從論壇Reddit上隨機抽取了195個已有醫生回覆的問題,並要求ChatGPT生成這些問題的回覆。
接著,讓醫療專業人員針對醫生和GPT的答案進行盲測評估。結果發現,評估人員更喜歡的回覆,有78.6%是來自ChatGPT,而非真人醫生。並且,整體而言,評估人員認為ChatGPT在回覆品質和同理心方面,都顯著優於醫生。不過,仍有一些AI的答案文不對題,或者包含錯誤資訊。
這項研究看似展現了AI的優異表現,但「幻覺」(hallucination)仍是AI無法百分之百避免的問題。《紐約時報》文中引述的一篇論文發現,在116個AI生成的訊息中,有7則訊息含有虛構資訊,也就是出現幻覺。
北卡羅來納大學健康系統的家庭醫學醫生雷迪(Vinay Reddy)也分享了親身經歷。當時一位病患傳訊息詢問其是否需要接種B型肝炎疫苗,AI告訴病患她已經接種過該疫苗,甚至提供了具體的日期;但這並非事實,並且AI也沒有權限得知病患的疫苗接種紀錄。
AI幻覺嚴重讓人有疑慮
在醫療領域中,每項建議都攸關生命,因此需要更謹慎看待AI的幻覺問題。或許,讓AI生成的內容品質維持「適中」是最實際的解方。杜克大學健康系統的首席健康資訊長潘(Eric Poon)便認為,表現普通的AI模型讓他感到安心,因為這會讓醫生保持懷疑,不會過度相信AI生成的內容,又能在一定程度上幫醫生減輕工作負擔。