王維笑 賈露榮 陶 焜 李 艷 閭海榮*
流行病學(xué)調(diào)查作為新型冠狀病毒肺炎(COVID-19)疫情防控的重要手段,對于鎖定感染者、搜索密切接觸者以及梳理傳播鏈條發(fā)揮著不可替代的作用[1-5]。疫情期間全國多個(gè)地區(qū)先后啟動重大突發(fā)公共衛(wèi)生事件一級響應(yīng)機(jī)制時(shí),各地疾病預(yù)防控制機(jī)構(gòu)派出流行病學(xué)專業(yè)人員,深入現(xiàn)場展開調(diào)查和疫情分析,與患者面對面交流,詢問患者發(fā)病前后的暴露情況、接觸情況、活動軌跡以及就醫(yī)情況,尋找與傳染源以及傳播途徑有關(guān)的蛛絲馬跡,為判定密切接觸者并采取隔離措施、劃定消毒范圍提供依據(jù)[6-7]。然而,隨著確診病例不斷增多,疫情進(jìn)入暴發(fā)期后,持續(xù)及多點(diǎn)位的流行病學(xué)調(diào)查工作使得流行病學(xué)調(diào)查人員的工作量極大增加[8]。傳統(tǒng)的人工問卷調(diào)查方式暴露出效率低、準(zhǔn)確性差、數(shù)據(jù)傳輸不及時(shí)和利用率低等諸多問題。此外,COVID-19以呼吸道飛沫傳播和密切接觸傳播[9]為主要傳播途徑,傳統(tǒng)的信息采集方式無法避免與被調(diào)查者的大量交流與接觸,增加了現(xiàn)場流行病學(xué)調(diào)查人員交叉感染的風(fēng)險(xiǎn)。因此,開發(fā)一種針對COVID-19的流行病學(xué)智能采集系統(tǒng),將現(xiàn)場流行病學(xué)調(diào)查工作中的信息收集流程智能化、標(biāo)準(zhǔn)化,幫助流行病學(xué)調(diào)查人員及時(shí)收集完備信息的同時(shí)最大限度地減少人員之間的交流與接觸,將極大地提升流行病學(xué)調(diào)查工作效率,避免交叉感染,遏制疫情蔓延。
近年來,隨著人工智能(artificial intelligence,AI)技術(shù)的飛速發(fā)展,越來越多的醫(yī)療場景中出現(xiàn)了智能化應(yīng)用。人機(jī)對話系統(tǒng)作為AI領(lǐng)域的核心技術(shù)之一,也被廣泛地應(yīng)用在居家自診、分診導(dǎo)診及病史采集等醫(yī)療場景中。人機(jī)對話系統(tǒng)通過自然語言處理相關(guān)技術(shù)來模仿學(xué)習(xí)人與人之間對話的方式和內(nèi)容,讓機(jī)器通過自然語言與人進(jìn)行信息交互[10]。語音識別、自然語言理解、對話狀態(tài)跟蹤及策略優(yōu)化、自然語言生成以及語音合成是人機(jī)自然語言交互的關(guān)鍵組成部分[11]。本研究針對此次疫情傳播速度快、傳播途徑多及傳播范圍廣等特點(diǎn),利用多模態(tài)的移動端智能人機(jī)交互技術(shù),構(gòu)建智能信息采集系統(tǒng),輔助現(xiàn)場流行病學(xué)調(diào)查人員進(jìn)行便捷高效的信息采集,將有效降低交叉感染風(fēng)險(xiǎn),緩解調(diào)查人員工作壓力,提升數(shù)據(jù)質(zhì)量與安全性,并為后續(xù)的數(shù)據(jù)挖掘與共享提供基礎(chǔ)。
COVID-19流行病學(xué)智能采集系統(tǒng)利用智能人機(jī)交互技術(shù),根據(jù)《新型冠狀病毒感染的肺炎防控方案》《中華人民共和國傳染病防治法》以及《突發(fā)公共衛(wèi)生應(yīng)急條例》等文件要求,并結(jié)合現(xiàn)場實(shí)踐建立標(biāo)準(zhǔn)化的流行病學(xué)信息收集模板,構(gòu)建文字與圖片智能識別平臺,并實(shí)現(xiàn)結(jié)構(gòu)化信息與預(yù)設(shè)模板的自動映射與分析,為流行病學(xué)現(xiàn)場調(diào)查提供更加智能高效的信息采集模式。
智能人機(jī)交互系統(tǒng)的核心是人機(jī)對話服務(wù)引擎,其主要由對話管理系統(tǒng)、知識庫管理系統(tǒng)及AI技術(shù)管理系統(tǒng)三部分組成。前端可根據(jù)現(xiàn)場需要采用智能手機(jī)APP、智能平板APP等為載體。系統(tǒng)技術(shù)架構(gòu)見圖1;手機(jī)APP應(yīng)用界面見圖2。
圖1 流行病學(xué)智能采集系統(tǒng)技術(shù)架構(gòu)
圖2 流行病學(xué)智能采集系統(tǒng)手機(jī)APP應(yīng)用界面
對話邏輯模塊負(fù)責(zé)生成問題,通過與后臺知識庫管理系統(tǒng)交互獲得新的問題。對話交互模塊負(fù)責(zé)展示問題并回收答案,同時(shí)負(fù)責(zé)與AI技術(shù)管理系統(tǒng)進(jìn)行交互,調(diào)用對應(yīng)的接口獲得識別結(jié)果。健康報(bào)告模塊負(fù)責(zé)將所有對話內(nèi)容轉(zhuǎn)換為符合相關(guān)文件規(guī)范的調(diào)查報(bào)告或表單。
知識庫管理系統(tǒng)以服務(wù)器的形式供前端訪問。知識庫維護(hù)系統(tǒng)負(fù)責(zé)流行病學(xué)知識庫的創(chuàng)建、讀取、更新和刪除操作。知識庫推理引擎負(fù)責(zé)返回問題結(jié)構(gòu)體,供移動端對話邏輯模塊調(diào)用。知識庫模型訓(xùn)練系統(tǒng)利用機(jī)器學(xué)習(xí)算法,基于知識庫結(jié)構(gòu),訓(xùn)練高效的推理算法,以最簡潔的問題得到最完善的調(diào)查信息,該過程在服務(wù)器端自行完成訓(xùn)練。
圖像識別、語音識別與合成調(diào)用相應(yīng)的語音和(或)圖像服務(wù)應(yīng)用程序編程接口(application programming interface,API)完成。語義抽取接口負(fù)責(zé)識別患者表述中的癥狀、體征、暴露史等相關(guān)內(nèi)容,轉(zhuǎn)換為語義結(jié)構(gòu)體。
COVID-19流行病學(xué)智能采集系統(tǒng)集流行病學(xué)信息采集、化驗(yàn)單拍照識別、調(diào)查報(bào)告和(或)表單自動生成以及疫情資料智能歸檔等功能于一體,支持語音輸入、點(diǎn)選、普通輸入法輸入及手寫識別等多模態(tài)交互方式。
系統(tǒng)模仿流行病學(xué)調(diào)查人員以自然對話的形式進(jìn)行多輪友好的引導(dǎo)式問答,根據(jù)每個(gè)問題的性質(zhì)(單選題、多選題及開放式等)提供相對應(yīng)的最便捷的交互方式(點(diǎn)選、語音輸入等),快速和全面收集患者發(fā)病與就診情況、暴露史、危險(xiǎn)因素以及密切接觸者等重要信息,并進(jìn)行結(jié)構(gòu)化存儲,為尋找傳染源、梳理傳播鏈條、鎖定密切接觸者、控制疫情傳播范圍等工作提供有力的數(shù)據(jù)支持。智能人機(jī)交互模式不僅可以最大限度地減少流行病學(xué)調(diào)查人員與被調(diào)查者不必要的接觸,降低交叉感染風(fēng)險(xiǎn),還可以提高數(shù)據(jù)準(zhǔn)確性與規(guī)范性,提高個(gè)案調(diào)查質(zhì)量。
對于已完成的實(shí)驗(yàn)室檢測,被調(diào)查者可以通過拍照上傳檢測結(jié)果。系統(tǒng)利用圖像處理和文字識別技術(shù),對用戶上傳的化驗(yàn)單進(jìn)行自動識別和結(jié)構(gòu)化轉(zhuǎn)換,通過圖像增強(qiáng)和自動校準(zhǔn)技術(shù),對用戶拍攝的照片清晰度和幾何畸變進(jìn)行智能優(yōu)化。通過光學(xué)字符識別(optical character recognition,OCR)技術(shù)和版式智能分析技術(shù)自動分析化驗(yàn)單表格相關(guān)字段,并將識別結(jié)果映射到結(jié)構(gòu)化表格中進(jìn)行保存。
根據(jù)所采集的患者基本信息、發(fā)病與就診以及危險(xiǎn)因素與暴露史等內(nèi)容,自動進(jìn)行結(jié)構(gòu)化映射,生成規(guī)范的COVID-19病例個(gè)案調(diào)查表或流行病學(xué)調(diào)查報(bào)告。采集的所有數(shù)據(jù)可與調(diào)查信息系統(tǒng)對接,并同步至電腦端,流行病學(xué)調(diào)查人員可以在電腦端進(jìn)行調(diào)閱、審核與修訂,無需重復(fù)錄入,優(yōu)化采集流程,提高工作效率。
按相關(guān)要求對所采集數(shù)據(jù)進(jìn)行自動化歸檔,實(shí)現(xiàn)對海量數(shù)據(jù)的存儲管理。疫情資料具備重要的醫(yī)學(xué)研究價(jià)值,通過對疫情資料的分析、查證,有助于探究突發(fā)公共衛(wèi)生事件的發(fā)生預(yù)兆和成因,規(guī)范突發(fā)公共衛(wèi)生事件的處置方法,為科學(xué)防范和控制突發(fā)公共衛(wèi)生事件提供科學(xué)依據(jù)[12]。
COVID-19流行病學(xué)智能采集系統(tǒng)打破傳統(tǒng)的單一信息采集模式,將多模態(tài)的移動端智能人機(jī)交互方式應(yīng)用到現(xiàn)場流行病學(xué)調(diào)查的實(shí)際場景中,解決當(dāng)前流行病學(xué)調(diào)查工作中信息采集效率低、準(zhǔn)確性差、數(shù)據(jù)利用率與安全性不足以及交叉感染風(fēng)險(xiǎn)高等問題,讓戰(zhàn)“疫”時(shí)期的信息采集變得更加智能、高效、安全且便捷。系統(tǒng)所開發(fā)的人機(jī)對話與信息結(jié)構(gòu)化算法引擎,可以準(zhǔn)確理解患者描述的病情信息,引導(dǎo)患者以自然對話的形式完成信息采集,并進(jìn)行結(jié)構(gòu)化映射,不僅可以在疫情期間的流行病學(xué)調(diào)查工作中發(fā)揮重要作用,在日常的導(dǎo)診、預(yù)問診、隨訪及滿意度調(diào)查等諸多醫(yī)療場景中也可發(fā)揮重要的應(yīng)用價(jià)值。