徐來 陳樹越 林勤
【摘要】? ? 互聯(lián)網(wǎng)醫(yī)院的遠(yuǎn)程醫(yī)療使越來越多患者得到了醫(yī)療服務(wù),同時也方便了醫(yī)務(wù)專業(yè)技術(shù)人員。近年來,隨著相關(guān)技術(shù)及基礎(chǔ)設(shè)施的涌現(xiàn),遠(yuǎn)程醫(yī)療服務(wù)已經(jīng)逐漸成為趨勢。自新冠肺炎爆發(fā)以來,人們不太愿意冒著新冠的風(fēng)險親自去看醫(yī)生,所以遠(yuǎn)程醫(yī)療的優(yōu)勢也越發(fā)明顯。本文主要關(guān)注了醫(yī)生和患者之間遠(yuǎn)程問診的用戶體驗。隨著遠(yuǎn)程醫(yī)療服務(wù)需求的增加,遠(yuǎn)程問診質(zhì)量和效率顯得至關(guān)重要。因此,本文設(shè)計一種智能自動回復(fù)機(jī)制,以幫助醫(yī)生有效地響應(yīng)咨詢請求。首先通過聚類算法來識別醫(yī)生使用頻率較高的回復(fù),然后手動標(biāo)記相應(yīng)數(shù)據(jù),最后通過機(jī)器學(xué)習(xí)算法來生成預(yù)處理的數(shù)據(jù)并給予患者回復(fù)。
【關(guān)鍵詞】? ? 遠(yuǎn)程醫(yī)療? ? 人工智能? ? 深度學(xué)習(xí)
Abstract: The telemedicine of Internet hospital makes more and more patients get medical services, and it also facilitates medical professionals. In recent years, with the emergence of related technologies and infrastructure, these services have gradually become a trend. Since the outbreak of novel coronavirus pneumonia, people are not willing to take risks to see a doctor in person, so the advantages of telemedicine are becoming more apparent. This paper focuses on the user experience of remote consultation between doctors and patients. With the increasing demand for tele health services, the quality and efficiency of tele consultation are very important. Therefore, this paper designs an intelligent automatic response generation mechanism to help doctors respond to consultation requests effectively. Firstly, the most frequent replies of doctors are identified by clustering algorithm, and then the corresponding data are manually marked. Finally, the preprocessed data is generated by machine learning algorithm and the patients are given replies. In recent years, with the emergence of related technologies and infrastructure, these services have gradually become a trend. Since the outbreak of the new crown pneumonia, people are reluctant to take the risk to see a doctor in person, so the advantages of telemedicine have become more obvious. This article focuses on the user experience of remote consultations between doctors and patients. With the increase in demand for remote health services, the quality and efficiency of remote consultations are critical. Therefore, this paper designs an intelligent automatic response generation mechanism to help doctors effectively respond to consultation requests. First, the clustering algorithm is used to identify the doctors most frequent replies, and then the corresponding data is manually labeled, and finally the machine learning algorithm is used to generate preprocessed data and give the patient a reply.
Key words:Telemedicine? Artificial intelligence? Deep learning
一、背景
在線咨詢服務(wù)廣泛應(yīng)用于各行各業(yè),其主要包括客戶服務(wù)、技術(shù)支持、咨詢、銷售支持和遠(yuǎn)程教育等。在線咨詢服務(wù)相對于面談和電話交談,能支持高并發(fā)咨詢服務(wù)同時也避免了實時咨詢的尷尬[1]。隨著智能手機(jī)和智能手表的普及,在線咨詢服務(wù)已經(jīng)由最初的電商客服逐漸成為各行各業(yè)不可或缺的一部分。互聯(lián)網(wǎng)醫(yī)院作為新興產(chǎn)物,在線咨詢是其的主要運(yùn)營模式。
互聯(lián)網(wǎng)醫(yī)院最早是在民營單位推廣。2018年國家衛(wèi)生健康委、國家中醫(yī)藥管理局出臺《互聯(lián)網(wǎng)醫(yī)院管理辦法(試行)》,將“互 聯(lián)網(wǎng)醫(yī)院”發(fā)展模式界定為兩種:一種是實體醫(yī)院自己搭建互聯(lián)網(wǎng)醫(yī)院平臺并申請互聯(lián)網(wǎng)醫(yī)院作為第二名稱,其主要執(zhí)業(yè)醫(yī)生主要為本院醫(yī)生及其集團(tuán)單位醫(yī)生;另一種是第三方機(jī)構(gòu)申請舉辦互聯(lián)網(wǎng)醫(yī)院,以實體醫(yī)院為依托,由企業(yè)提供資金和技術(shù),搭建互聯(lián)網(wǎng)診療平臺。新冠疫情后,國家衛(wèi)健委開始大力推進(jìn)以公立醫(yī)院為基礎(chǔ)的互聯(lián)網(wǎng)醫(yī)院模式,因此線上接診的在線咨詢量也越來越大,互聯(lián)網(wǎng)醫(yī)院的運(yùn)營面臨著挑戰(zhàn)。當(dāng)產(chǎn)生高并發(fā)的患者咨詢數(shù)時,人工的回復(fù)往往不夠及時,所以對于高并發(fā)的患者咨詢,自適應(yīng)人工智能回復(fù)功能的開發(fā)迫在眉睫[1]。在線上接診時采用智能回復(fù)能夠緩解目前的高并發(fā)咨詢回復(fù)不及時的問題。
二、線上診療智能回復(fù)系統(tǒng)的概述
2.1 線上診療智能回復(fù)系統(tǒng)的意義
隨著國家的戰(zhàn)略部署,互聯(lián)網(wǎng)醫(yī)院的發(fā)展進(jìn)入快車道,高并發(fā)的患者咨詢壓力是目前互聯(lián)網(wǎng)醫(yī)院發(fā)展的瓶頸。由于醫(yī)生資源的緊缺,線上人工診療回復(fù)往往不夠及時,而智能回復(fù)系統(tǒng)恰好能夠保證快速準(zhǔn)確的響應(yīng),提高了線上接診的效率,也減少了患者等待時間,提升了患者的服務(wù)滿意度。同時線上診療智能回復(fù)系統(tǒng)能夠同時處理多個患者的在線接診咨詢框,也節(jié)省了額外的人力成本。
2.2 線上診療智能回復(fù)系統(tǒng)的結(jié)構(gòu)設(shè)計
線上診療智能回復(fù)系統(tǒng)與普通的聊天機(jī)器人不同之處在于,智能回復(fù)系統(tǒng)并不是每條咨詢都自動生成回復(fù)。因此,需要首先對患者咨詢的消息進(jìn)行預(yù)處理,再定義一個觸發(fā)回復(fù)的模型,然后由該模型確定是否觸發(fā)自動回復(fù)功能[2]。在建立觸發(fā)模型時,首先需要調(diào)研現(xiàn)有的的數(shù)據(jù)庫并從中抽取約3000條咨詢模塊的消息,通過對這些數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn),醫(yī)生和患者的咨詢交流有兩個顯著特點即咨詢消息的數(shù)量和輪次(醫(yī)患間來回發(fā)送消息的次數(shù))。通過對這些數(shù)據(jù)的調(diào)研可以發(fā)現(xiàn),每個醫(yī)患之間的平均咨詢回合數(shù)約為15.5輪,每次咨詢約含23.8條消息。下一步對這些醫(yī)患咨詢消息進(jìn)行配對,即患者回復(fù),醫(yī)生回答為一組,然后手動進(jìn)行標(biāo)記,即確定配對的消息是否觸發(fā)智能回復(fù)。
至于是否觸發(fā)智能回復(fù)的條件可以設(shè)定為以下幾點。第一點是過濾掉超過100個字的患者咨詢回復(fù)。因為長回復(fù)通常包含的內(nèi)容較多,也是患者對病情的詳細(xì)描述,通常需要人工回復(fù)才能給予患者滿意的答復(fù),所以人工智能回復(fù)系統(tǒng)直接過濾掉這種長咨詢。第二點是過于詳細(xì)或過于籠統(tǒng)的咨詢,過于復(fù)雜或冗長的咨詢,這些咨詢觸發(fā)模型也可以直接忽略。詳細(xì)的咨詢首先要參考自設(shè)的常見病情咨詢的專業(yè)術(shù)語及關(guān)鍵字[3],若掃描到這些術(shù)語或關(guān)鍵字,則系統(tǒng)自認(rèn)定為詳細(xì)咨詢,因為這類咨詢通常包含這類咨詢通常涉及患者病情的重要信息并且不適應(yīng)于其他患者,所以選擇人工回復(fù)。而太過籠統(tǒng)的咨詢可能并不涉及病情問題,所以也選擇過濾。
在患者咨詢自動識別回復(fù)時,即預(yù)處理的步驟中,要刪除多余的空格,標(biāo)點符號和URL等。遇到習(xí)語、簡寫和一些錯別字的情況下,我們設(shè)計的智能回復(fù)系統(tǒng)需要先建立一個詞典(Python中的詞匯檢查包),把常見的習(xí)語,簡寫錄入,對此進(jìn)行識別回復(fù)。而對于一些常見的習(xí)慣性錯誤詞匯,例如“可以”打成了“闊以”,“好的”打成了“好得”需要予以識別并回復(fù)。
患者的咨詢消息觸發(fā)了智能響應(yīng)系統(tǒng)后,接下來它將進(jìn)入自動響應(yīng)模型。本文所采用深度學(xué)習(xí)的算法,需要先手動進(jìn)行標(biāo)記。由于自動響應(yīng)生成智能回復(fù)的調(diào)研數(shù)據(jù)量較大,手動標(biāo)記的話工作量也較大,所以本次調(diào)研時,抽取了一些特征比較明顯的對話段。首先在醫(yī)生端,對醫(yī)生常見的回復(fù)進(jìn)行聚類,得出醫(yī)生常見回復(fù)的數(shù)據(jù)集群。接著在患者端,對醫(yī)生回復(fù)后,患者接下來的回復(fù)進(jìn)行聚類,得出患者常見回復(fù)的數(shù)據(jù)集群。然后對這些數(shù)據(jù)進(jìn)行整理后,可以得出醫(yī)生接下來最常見應(yīng)答的數(shù)據(jù)集群,最后從醫(yī)生和患者的數(shù)據(jù)集群中,加權(quán)計算并抽取配對響應(yīng)頻率較高的語句,將之組建成一個回復(fù)響應(yīng)數(shù)據(jù)包,將計算出的最常用加權(quán)平均詞作為發(fā)送給患者的回復(fù)[4]。而這一模型實現(xiàn)的過程則由編碼器,解碼器來完成。編碼器將患者的消息編碼為上下文加權(quán)語境向量[5],然后將其傳遞給解碼器生成醫(yī)生回復(fù)的輸出序列。
對于線上診療自動生成智能回復(fù)的精度問題,使用深度學(xué)習(xí)算法能夠逐漸解決這個系統(tǒng)問題[6]。醫(yī)生可以針對人工智能回復(fù)選擇是否撤回信息。通過對醫(yī)生撤回頻率的計算,當(dāng)相關(guān)醫(yī)患配對回復(fù)的準(zhǔn)確率大于80%時,智能回復(fù)系統(tǒng)所生成的該條回復(fù)消息才會作為優(yōu)先使用的回復(fù)消息推送給病人。
三、線上診療智能回復(fù)系統(tǒng)的應(yīng)用
目前互聯(lián)網(wǎng)醫(yī)院的的線上咨詢模塊和線上復(fù)診模塊是病患和醫(yī)生進(jìn)行溝通的兩大主要模塊。圖1顯示了某醫(yī)院咨詢模塊的智能回復(fù)模式。
通過對患者問題的預(yù)處理掃描到關(guān)鍵字,接著可以生成問候類的結(jié)束語,或者提出檢查檢驗及查看報告單的需求,針對性地對病患問題給與回復(fù)。其他如患者提出皮膚瘙癢等問題,智能回復(fù)系統(tǒng)會要求提供患處圖片。經(jīng)過模塊測試,回復(fù)效果較為準(zhǔn)確。
四、結(jié)束語
隨著醫(yī)院信息化的不斷發(fā)展,互聯(lián)網(wǎng)醫(yī)院成了解決實體醫(yī)院線下醫(yī)療資源緊張的一個突破口。但是隨著在線問診人數(shù)的極速增長問題,人工回復(fù)已經(jīng)不能滿足咨詢量的暴漲。當(dāng)然,醫(yī)院可以通過增加在線醫(yī)生的人數(shù)來解決這一問題。但是增加醫(yī)生所帶來的高昂成本,使得線上問診這種主要收入為收取掛號費(fèi)的盈利模式遠(yuǎn)遠(yuǎn)不夠承擔(dān)醫(yī)生的薪水。相對于昂貴的用人成本,開發(fā)線上智能回復(fù)系統(tǒng)的花費(fèi)幾乎可以忽略不計了。同時智能回復(fù)系統(tǒng)還大大減輕了醫(yī)生的工作負(fù)擔(dān),節(jié)省了醫(yī)生的寶貴時間。雖然線上智能回復(fù)系統(tǒng)解決了很多人力問題,但是其完善扔需要一定的時間,未來隨著大數(shù)據(jù)的引入,該系統(tǒng)的發(fā)展更值得期待。
參? 考? 文? 獻(xiàn)
[1] T. Nadarzynski, O. Miles, A. Cowie, D. Ridge, Acceptability of artificial intelligence (ai)-led chatbot services in healthcare: A mixed-methods study, Digital health 5 (2019)
[2]李國壘,陳先來,夏冬,等.中文病歷文本分詞方法研究[J].中國生物醫(yī)學(xué)工程學(xué)報,2016,35(4):477-481
[3]張素榮.? 智能客服問答系統(tǒng)關(guān)鍵算法研究及應(yīng)用[D].南京:南京郵電大學(xué),2018.
[4]馬遠(yuǎn)浩,曾衛(wèi)明,石玉虎,等? 基于加權(quán)向量和LSTM-CNN的微博文本分類研究[J].現(xiàn)代計算機(jī),2018(25):18-22.
[5]吳龍峰,于?,王峰.? 向量空間模型的文本分類研究與應(yīng)用[J].宿州學(xué)院學(xué)報,2019,34(12)69-72.
[6]A. Kumar, S. Vembu, A. K. Menon, C. Elkan, Beam search algorithms for multilabel learning, Machine learning 92 (2013) 65–89.