口腔專科醫(yī)院科室分工精細且部分科室之間存在專業(yè)交叉,同時多數口腔疾病需要經歷跨專業(yè)、跨科室的診治過程,導致多數初診患者就診前難以準確選擇就診科室。例如,牙周專業(yè)患者易誤掛黏膜專業(yè),智齒冠周炎患者易誤掛頜面外科專業(yè)。由于缺乏及時有效的指導,患者掛錯號、退換號行為以及相關糾紛屢見不鮮,造成號源利用率降低、診療效率降低、患者滿意度下降、醫(yī)院運營成本增加等不良影響。
醫(yī)院開通互聯網預約掛號服務后,傳統的線下導診方式難以滿足線上掛號的咨詢需求,線上簡單的科室和專業(yè)說明也無法有針對性地解決患者對就診科室的疑慮,加之號源有限患者搶號時間緊張,錯掛號情況更加頻繁。為此,項目團隊基于人工神經網絡和自然語言處理技術開發(fā)智能分診系統,在系統同患者對話后即時反饋患者相對準確的答案,以節(jié)約患者咨詢時間,為患者提供自動化、準確化、高效化的就診指導。
智能分診系統需具備與患者對話聊天、基于深度學習的診斷功能,同時通過安全權限控制,保證患者信息安全傳輸,并對日志數據進行埋點收集,對患者的訪問進行有效記錄。該系統分為口腔知識圖譜構建和口腔診療智能分診兩個子系統。口腔知識圖譜構建子系統利用醫(yī)療過程中生成的真實口腔臨床數據,通過分析存儲口腔臨床病歷數據的數據庫表,設計出關鍵概念模式并構建知識圖譜??谇辉\療智能分診子系統以該口腔知識圖譜為基礎,匹配查詢模板在知識圖譜內進行查詢,生成分診結果并通過前端頁面展示給患者[1]。系統架構見圖1。
圖1 系統架構
1.口腔知識圖譜構建子系統
1.1 實體抽取。醫(yī)院口腔??齐娮硬v基準數據模型根據口腔疾病的臨床診療特點設計,以診斷名稱(diagnosis)、治療方案(plan)、治療步驟(step)、醫(yī)囑(order)、收費項目(item)為路徑,梳理2015年至2019年口腔??圃\療過程中的非結構化數據、半結構化數據與結構化數據,數據清單見表1。通過自然語言處理和上下文語義識別,并利用數據模型進行數據抽取,生成文本數據集[2](見圖2)。結合傳統教科書與指南對文本數據集進行清洗,得到口腔領域的臨床術語及關鍵詞。據此定義口腔知識圖譜中的實體,包括患者癥狀實體、就診科室實體、診斷實體、用藥實體、檢查實體、檢查指標實體等。
圖2 診療數據抽取示例
表1 數據梳理清單
1.2 語義類設計。語義類設計作為實體層面上的規(guī)整和抽象,包含了兩層概念:第一層概念對應口腔臨床數據表,第二層概念對應口腔臨床數據表中字段名[3]。歸納提取概念之間的關系以及概念的屬性,形成有向的、包含關系的語義類。
表2 概念間的關系
1.3 知識圖譜構建。將實體集中的實體與語義類中的概念一一對應,將同類實體映射到同一個概念上,建立實體與語義類的映射表。通過BFS(廣度優(yōu)先遍歷)算法將映射表中的數據實例存入其映射的概念結點的子節(jié)點中,建立三元組口腔知識圖譜[4]。
以繼發(fā)齲節(jié)點為例。與繼發(fā)齲存在診斷關系的癥狀節(jié)點包括:(食物嵌塞,診斷,繼發(fā)齲),(咬合不適,診斷,繼發(fā)齲),(牙齒有洞,診斷,繼發(fā)齲),(冷熱酸甜敏感,診斷,繼發(fā)齲),(冷熱刺激痛,診斷,繼發(fā)齲)與(充填物脫落,診斷,繼發(fā)齲)。與繼發(fā)齲存在就診關系的就診科室節(jié)點包括:(繼發(fā)齲,就診,牙體牙髓科),(繼發(fā)齲,就診,特診科牙體牙髓科),(繼發(fā)齲,就診,口腔預防保健科牙體牙髓科),(繼發(fā)齲,就診,綜合科牙體牙髓科)。因此,當患者輸入上述癥狀時,系統可通過知識圖譜對應相關就診科室,輔助智能分診。
2.口腔診療智能分診子系統
2.1 對話聊天模塊。對話聊天模塊是基于AIML架構和以圖結構的問答模塊,內置的問題生成器通過人機交互引導患者回答問題,收集患者基本信息、癥狀等數據。當收集到足夠的信息后,利用實體識別模型對患者提供的數據進行清洗和轉換,獲取關聯模型可識別的字段[5]。
2.2 關聯模型與服務。從歷史病歷信息中抽取有效特征,結合知識圖譜內容,建立就診科室與患者主訴的關聯模型,通過restful接口對外提供服務,用于分析病人主訴和病史等信息,給出就診科室的推薦。關聯模型的輸入為所有訓練集的病例特征信息,采用加法模型將各個弱分類器進行線性組合得到預測結果,輸出為建議就診科室。對于預測錯誤的弱分類器增加該分類器的權重值,對于預測正確的弱分類器則降低該分類器的權重值,進行迭代訓練,直到關聯模型具有較低的殘差和較高的預測準確性,應用用于對新病例的預測。
智能分診系統可針對北大口腔醫(yī)院所有專業(yè)和15個科室常見的100多個癥狀、100多種疾病提供就診建議,應用于北大口腔醫(yī)院微信公眾號。系統可為以下情景下的患者推薦就診科室:(1)僅知道癥狀,如牙疼、潰瘍;(2)僅知道診斷,如牙體缺損、牙髓炎;(3)僅知道治療方式,如整牙、拔牙。
截止2020年底,智能分診系統服務人次達3.7萬,近1萬人次對系統服務進行了評價,好評率達98%。系統在運行過程中積攢了大量真實患者數據,對患者畫像、癥狀疾病、就診科室等數據進行分析,可了解患者行為偏好、口腔常見病等情況。圖3列出了患者咨詢數量最多的5種癥狀。
圖3 癥狀分析
智能分診系統從口腔專科電子病歷入手,利用自然語言處理技術和知識圖譜技術,建立起計算機可閱讀、可理解的知識體系。通過搭建的人機智能對話系統,收集患者的口腔疾病信息,綜合運用中文分詞技術、近義詞處理技術、不確定推理技術以及文本相似度技術,合理推斷患者可以前往就診的科室信息。該口腔??浦悄芊衷\系統支持部署于APP、公眾號、小程序,基本覆蓋了口腔專業(yè)的疾病與治療方式,隨時隨地為患者提供快捷的就診指導,降低了患者誤掛科室的可能性,可為其他醫(yī)療機構開展口腔??浦悄芊衷\提供借鑒。
智能分診系統通過日志監(jiān)控系統記錄系統的使用狀況,可對各服務節(jié)點的穩(wěn)定性與服務效率進行可視化監(jiān)控,有利于及時發(fā)現系統的效率瓶頸與錯誤信息。另外,通過日志系統可有效收集患者訪問記錄,對患者使用數據進行合理分析,可作為系統優(yōu)化、資源分配的依據。
智能分診系統具備兩個特點:第一,知識圖譜的構建以口腔??齐娮硬v中的大量專家模板與真實診療數據為基礎,相較于常規(guī)的基于百科類站點、垂直站點爬取,知識圖譜的完整性與推斷的準確率更高;第二,不同于開放的自由文本人機對話,本系統的人機對話是在預定義的規(guī)則下進行的,更符合真實的診療場景。在時間有限的線下面對面問診過程中,醫(yī)生會對患者提出引導性的問題,從而獲得關鍵信息做出診斷。如果允許完全自由的文本人機對話,患者可能會輸入與診療目的無關的過于離散的信息,導致機器學習的成本大大提高,推理結果的準確性反而降低。因此,經真實測試與實踐表明,基于真實診療數據的、預定義人機對話場景的智能分診系統可用性與可信性更高。