袁駿毅 潘常青 沈曉冬 岑星星 宓林暉
醫(yī)技檢查是循證醫(yī)學(xué)的重要組成部分,檢查報(bào)告的及時(shí)性對(duì)于臨床后續(xù)治療有重要影響[1]。出于科學(xué)嚴(yán)謹(jǐn)?shù)尼t(yī)療質(zhì)量要求,報(bào)告完成前需經(jīng)過(guò)從提交到審核等多道環(huán)節(jié),以盡量保證報(bào)告的詳盡和準(zhǔn)確。隨著人民健康水平的提高,醫(yī)院檢查業(yè)務(wù)量逐年增加,醫(yī)技部門往往人手緊張,工作負(fù)荷壓力較大。為避免檢查環(huán)節(jié)成為醫(yī)療流程中的瓶頸,利用智能技術(shù)提高報(bào)告出具的速度,成為現(xiàn)代醫(yī)院管理重點(diǎn)關(guān)注的內(nèi)容[2]。有學(xué)者在針對(duì)臨床調(diào)研的報(bào)告中指出,當(dāng)醫(yī)生建立電子健康檔案時(shí),應(yīng)用語(yǔ)音識(shí)別可起到較好的輔助作用[3]。本研究在醫(yī)院放射科、病理科的報(bào)告軟件中嵌入智能語(yǔ)音平臺(tái),觀察醫(yī)生使用的工作情況和書(shū)寫報(bào)告的數(shù)量,分析語(yǔ)音識(shí)別技術(shù)帶來(lái)的效果。為醫(yī)生提供便捷的書(shū)寫檢查報(bào)告的輔助功能,同時(shí)為其他醫(yī)療機(jī)構(gòu)利用語(yǔ)音識(shí)別技術(shù)優(yōu)化臨床工作模式提供借鑒參考。
據(jù)相關(guān)統(tǒng)計(jì),在放射科或病理科等醫(yī)技科室的檢查報(bào)告中,約60%~70%的文字屬于專業(yè)醫(yī)學(xué)術(shù)語(yǔ)[4]。醫(yī)生通常在醫(yī)技工作站上事前定制部分病種模板文字,針對(duì)患者個(gè)體情況加以修改,重復(fù)率較高且輸入量大。隨著信息技術(shù)在醫(yī)療領(lǐng)域的發(fā)展,語(yǔ)音識(shí)別技術(shù)成為非接觸式智能交互的研究熱點(diǎn)[5]。
語(yǔ)音識(shí)別研究起源于1950年,Davis在貝爾實(shí)驗(yàn)室構(gòu)建了首個(gè)可識(shí)別10個(gè)英語(yǔ)單字節(jié)字母發(fā)音的系統(tǒng)[6]。美國(guó)和日本出于軍事用途,1990年研發(fā)了口語(yǔ)理解系統(tǒng)[7]??缛?0世紀(jì)后,美國(guó)的Nuance、Google和Microsoft等公司的語(yǔ)音識(shí)別軟件準(zhǔn)確率已達(dá)到較高水平,我國(guó)也出現(xiàn)了如科大訊飛、云知聲等基于深度學(xué)習(xí)網(wǎng)絡(luò)的語(yǔ)音識(shí)別軟件公司,日常對(duì)話識(shí)別率已達(dá)97%[8]。醫(yī)院也開(kāi)始嘗試將語(yǔ)音應(yīng)用在醫(yī)療工作中。2017年,安徽省立醫(yī)院將語(yǔ)音對(duì)話機(jī)器人用于門診導(dǎo)診服務(wù)。2019年,西安交通大學(xué)第二附屬醫(yī)院上線了面向社區(qū)居民的語(yǔ)音移動(dòng)隨訪系統(tǒng)[9]。但國(guó)內(nèi)醫(yī)療行業(yè)中將語(yǔ)音識(shí)別深度應(yīng)用在臨床醫(yī)生的案例不多,且尚無(wú)統(tǒng)一建設(shè)技術(shù)規(guī)范[10]。
上海市胸科醫(yī)院是一家以心胸手術(shù)為主的三甲專科醫(yī)院,2019年全年手術(shù)人次2.8萬(wàn),患者均需要進(jìn)行術(shù)前和術(shù)后多次檢查。為加快床位周轉(zhuǎn)率及降低術(shù)前等候時(shí)間,醫(yī)院對(duì)檢查報(bào)告的出具時(shí)間限定十分嚴(yán)格。因此,本研究對(duì)醫(yī)院實(shí)施基于智能語(yǔ)音識(shí)別平臺(tái)的報(bào)告軟件改造,以期提高醫(yī)生書(shū)寫效率,降低臨床等候報(bào)告時(shí)間。
智能語(yǔ)音識(shí)別平臺(tái)主要由語(yǔ)音識(shí)別組件、知識(shí)管理中心和場(chǎng)景適配器3部分組成。
語(yǔ)音識(shí)別組件屬于底端輸入層,包括耳麥、話筒和語(yǔ)音識(shí)別包,使音頻轉(zhuǎn)換成文字。語(yǔ)音識(shí)別包采用市場(chǎng)上的成熟產(chǎn)品云知聲,語(yǔ)音輸入平均響應(yīng)時(shí)間<500 ms,通過(guò)云知聲提供的Win32bit及64bit的軟件開(kāi)發(fā)工具(software development kit,SDK),技術(shù)人員無(wú)需了解語(yǔ)音技術(shù)的具體實(shí)現(xiàn),使用簡(jiǎn)單的Windows應(yīng)用程序接口(application programming interface,API),實(shí)現(xiàn)在病理和影像等報(bào)告軟件的無(wú)縫嵌入[11]。
知識(shí)管理中心是平臺(tái)的內(nèi)核,采用SQL Server 2015數(shù)據(jù)庫(kù),存放醫(yī)學(xué)術(shù)語(yǔ)集和語(yǔ)義控制集數(shù)據(jù)。考慮到保存安全因素,數(shù)據(jù)庫(kù)放置于醫(yī)院內(nèi)部的局域網(wǎng)。通過(guò)精準(zhǔn)技術(shù)建立特征匹配模型,調(diào)整文字或操作的識(shí)別度,具有自定義和日志分析功能。
場(chǎng)景適配器負(fù)責(zé)甄別轉(zhuǎn)換后的文字,結(jié)合場(chǎng)景進(jìn)行關(guān)鍵詞判斷,判斷為報(bào)告錄入模式則輸出文字,若遇到換行或保存等命令則轉(zhuǎn)換為操作指令,替代常規(guī)的鍵盤和鼠標(biāo)操作。智能語(yǔ)音識(shí)別平臺(tái)總體架構(gòu)見(jiàn)圖1。
圖1 智能語(yǔ)音識(shí)別平臺(tái)總體架構(gòu)
語(yǔ)音識(shí)別引擎主要針對(duì)音譜進(jìn)行時(shí)頻分析,受具體醫(yī)療環(huán)境和醫(yī)生口音影響。此外,檢查報(bào)告中存在大量專業(yè)詞匯,需匹配適用的醫(yī)療術(shù)語(yǔ)集,以便增進(jìn)口語(yǔ)理解識(shí)別度(spoken language understand degree,SLUD),進(jìn)而達(dá)到準(zhǔn)確率要求[12]。
為此,需要建立實(shí)際醫(yī)療環(huán)境下醫(yī)學(xué)術(shù)語(yǔ)自適應(yīng)的最優(yōu)工作流程。事前調(diào)研醫(yī)技科室的真實(shí)環(huán)境,包含工作時(shí)的背景聲音、醫(yī)療儀器噪聲及特殊醫(yī)生方言等,判斷究竟選擇話筒還是耳麥的方式,對(duì)聲學(xué)模型進(jìn)行預(yù)適應(yīng)并局部增強(qiáng),以達(dá)到輸入清晰的效果。在常規(guī)語(yǔ)料庫(kù)基礎(chǔ)上,前期導(dǎo)入80余萬(wàn)條基本醫(yī)學(xué)詞匯。并針對(duì)醫(yī)院??铺厣?,按醫(yī)技科室的檢查類型,分門歸納整理現(xiàn)有的海量報(bào)告文本,使用數(shù)據(jù)抽取工具(extract-transform-load,ETL),從中提取近2萬(wàn)條高頻使用詞匯,納入附加醫(yī)學(xué)術(shù)語(yǔ)集[13]。針對(duì)使用過(guò)程中醫(yī)生反饋錯(cuò)誤的單詞,建立日志跟蹤隊(duì)列,通過(guò)自定義方式納入特定詞組,確定糾正搜索算法的輸出,達(dá)到更準(zhǔn)確的識(shí)別效果,通過(guò)一系列的工作舉措,最終將文字正確識(shí)別率提高到96%左右。自適應(yīng)設(shè)定工作流程見(jiàn)圖2。
圖2 醫(yī)學(xué)環(huán)境及術(shù)語(yǔ)自適應(yīng)設(shè)定流程
醫(yī)生書(shū)寫報(bào)告過(guò)程中,平臺(tái)需通過(guò)不同場(chǎng)景下語(yǔ)義的智能分析,理解并模擬部分功能性動(dòng)作,替代手動(dòng)的鍵鼠操作。關(guān)鍵詞分析(keyword analysis,KWA)是場(chǎng)景識(shí)配器的核心模塊,基于語(yǔ)義控制規(guī)則集來(lái)區(qū)分不同界面時(shí)醫(yī)生的語(yǔ)音意圖,語(yǔ)義控制規(guī)則集見(jiàn)表1[14]。
隨著信息互聯(lián)互通的日趨完善,現(xiàn)有醫(yī)技工作站整合了多項(xiàng)功能,包括報(bào)告書(shū)寫、模板調(diào)用及查看其他輔助信息等,工作中操作步驟較多。尤其是病理取材環(huán)節(jié),醫(yī)生需同時(shí)兼顧查看切片和輸入報(bào)告,同時(shí)連續(xù)性地點(diǎn)選患者,進(jìn)行大量重復(fù)性動(dòng)作。因此,設(shè)計(jì)時(shí)采取了分層細(xì)化方法,在接收到語(yǔ)音轉(zhuǎn)換的文本后,通過(guò)光標(biāo)具體位置判斷是否處于編輯狀態(tài),確定目的是文本還是控制命令輸出,以便精確執(zhí)行醫(yī)生的語(yǔ)音目標(biāo)[15]。不同醫(yī)技科室操作順序各異,語(yǔ)義理解的規(guī)則需結(jié)合醫(yī)技工作站的操作方法及醫(yī)生個(gè)人習(xí)慣,通過(guò)覆蓋應(yīng)用場(chǎng)景的訓(xùn)練,才能達(dá)到深度優(yōu)化的使用效果。
表1 語(yǔ)義控制規(guī)則集
表2 語(yǔ)音識(shí)別技術(shù)試用情況反饋匯總
經(jīng)過(guò)前期現(xiàn)場(chǎng)調(diào)研和技術(shù)對(duì)接,智能語(yǔ)音平臺(tái)與報(bào)告軟件完成嵌入整合,于2019年12月投入試點(diǎn)使用。放射科和病理科的報(bào)告室各部署3套,均為話筒輸入;病理科的切片室部署2套,由于取材工作特點(diǎn)選擇耳麥輸入。選取2020年1月間部署了智能語(yǔ)音識(shí)別平臺(tái)的醫(yī)技工作站上醫(yī)生的工作情況作為觀察組,選取2019年1月同批醫(yī)生采用常規(guī)方式的工作情況作為對(duì)照組。采集兩組醫(yī)生的完成報(bào)告情況,通過(guò)比較數(shù)量的差異性,分析語(yǔ)音識(shí)別技術(shù)產(chǎn)生的影響作用。
采用SPSS25.0軟件對(duì)數(shù)據(jù)匯總分析。通過(guò)兩組樣本的比較,分析存在的差異。計(jì)量資料以均值±標(biāo)準(zhǔn)差()表示,進(jìn)行t檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
4.3.1 試用情況反饋
試用初期暴露了兩方面問(wèn)題:①由于傳統(tǒng)工作習(xí)慣的改變,醫(yī)生需要適應(yīng)過(guò)程;②未能有效識(shí)別。經(jīng)過(guò)4周的磨合,隨著使用深入和不斷糾錯(cuò),醫(yī)生的使用熟練度不斷提升,每分鐘可輸入100~200字,92%的醫(yī)生表示較為滿意,形成語(yǔ)音轉(zhuǎn)化的報(bào)告文字>12萬(wàn),累計(jì)錄音時(shí)長(zhǎng)達(dá)到1 021 min。語(yǔ)音識(shí)別技術(shù)試用情況反饋見(jiàn)表2。
智能語(yǔ)音平臺(tái)成效如下:①利用信息技術(shù)提升醫(yī)療服務(wù)能級(jí),提高醫(yī)生書(shū)寫效率,加快了出具報(bào)告的速度;②基于整合理念內(nèi)嵌檢查報(bào)告軟件,按功能特點(diǎn)將部分語(yǔ)音轉(zhuǎn)化為操作行為,實(shí)現(xiàn)了高可用性。③設(shè)定了靈活通用的規(guī)則知識(shí)庫(kù),對(duì)異常及失效情況提供了及時(shí)靈活的變更手段。
4.3.2 檢查報(bào)告完成量對(duì)比
放射科和病理科的兩組樣本在報(bào)告類型、當(dāng)班時(shí)段和日排班人數(shù)等方面均無(wú)統(tǒng)計(jì)學(xué)上的差異,具有可比性??紤]到可能存在醫(yī)生主觀不使用語(yǔ)音等異常情況,排除標(biāo)準(zhǔn)為:①排除雖部署但無(wú)使用語(yǔ)音識(shí)別痕跡的報(bào)告;②排除書(shū)寫開(kāi)始至完成時(shí)間間隔>1 d的報(bào)告。放射科對(duì)比結(jié)果見(jiàn)表3,病理科對(duì)比結(jié)果見(jiàn)表4。
表3 放射科檢查報(bào)告完成量對(duì)比()
表3 放射科檢查報(bào)告完成量對(duì)比()
表4 病理科檢查報(bào)告完成量對(duì)比()
表4 病理科檢查報(bào)告完成量對(duì)比()
由表3和表4可見(jiàn),放射科和病理科的觀察組中每日檢查報(bào)告的完成數(shù)量較多(t=-3.61,t=-2.48,t=-2.61;P<0.05),表明采用智能語(yǔ)音識(shí)別平臺(tái)的模式有利于文字的快速輸入,節(jié)約了醫(yī)生操作的時(shí)間,加快了工作效率。此外,可觀察到一個(gè)現(xiàn)象,病理科冰凍報(bào)告差異不明顯(t=-0.99;P>0.05),這是由于冰凍報(bào)告已實(shí)現(xiàn)全結(jié)構(gòu)化,內(nèi)容中純文字的輸入量較少,導(dǎo)致語(yǔ)音僅主要在替代操作方面起到作用。
深入推進(jìn)智能語(yǔ)音識(shí)別在臨床信息系統(tǒng)中的應(yīng)用,可有效提高醫(yī)院人力資源的利用率,為醫(yī)生提供個(gè)性化的精準(zhǔn)信息技術(shù)服務(wù)。本研究通過(guò)上海市胸科醫(yī)院病理科和放射科醫(yī)生工作情況,實(shí)證分析將智能語(yǔ)音平臺(tái)嵌入檢查報(bào)告軟件后的實(shí)施效果。研究結(jié)果表明,通過(guò)平臺(tái)的有效整合,改進(jìn)了傳統(tǒng)工作模式,提升了醫(yī)生應(yīng)用信息系統(tǒng)的滿意度,降低了醫(yī)生操作強(qiáng)度,提高了工作效率,間接為患者提供更及時(shí)的后續(xù)治療。工作推進(jìn)過(guò)程中,發(fā)現(xiàn)一些下階段的重點(diǎn)突破方向,如全結(jié)構(gòu)化病歷的快速輔助定位及克服嘈雜使用環(huán)境等問(wèn)題。隨著大數(shù)據(jù)與人工智能技術(shù)的日趨成熟,語(yǔ)音識(shí)別技術(shù)與其他醫(yī)院信息系統(tǒng)的深度融合已是大勢(shì)所趨,為醫(yī)療機(jī)構(gòu)推廣語(yǔ)音識(shí)別在門診及住院的應(yīng)用場(chǎng)景提供有效的借鑒參考。