国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于神經(jīng)網(wǎng)絡(luò)模型的電子病歷文本提取及質(zhì)量缺陷分析

2022-04-25 05:53曹新志沈君姝袁雪王澤川胡欣馬存寧王至誠(chéng)王杰
中國(guó)醫(yī)療設(shè)備 2022年4期
關(guān)鍵詞:病案病歷檢出率

曹新志,沈君姝,袁雪,王澤川,胡欣,馬存寧,王至誠(chéng),王杰

江蘇省中西醫(yī)結(jié)合醫(yī)院 a. 信息中心;b. 設(shè)備科,江蘇 南京 210028

引言

醫(yī)院的電子病歷是醫(yī)院進(jìn)行醫(yī)療服務(wù)的憑證,全面記錄了在醫(yī)院進(jìn)行的所有醫(yī)療工作[1],反映了對(duì)患者疾病診斷、治療和轉(zhuǎn)歸的全過(guò)程,不僅充分體現(xiàn)了醫(yī)療質(zhì)量,也是保障醫(yī)療安全的重點(diǎn)[2],同時(shí)也是鑒定醫(yī)療事故和處理醫(yī)患糾紛的法律依據(jù)[3]。其在書(shū)寫中瑕疵或質(zhì)量缺陷會(huì)涉及醫(yī)患雙方權(quán)利及義務(wù)[4],而隨著人們法律意識(shí)的提升與醫(yī)療技術(shù)進(jìn)步的不平衡性,醫(yī)患矛盾發(fā)生的概率逐年增加。為避免因電子病歷質(zhì)量缺陷引發(fā)醫(yī)療糾紛,對(duì)病例的真實(shí)性和規(guī)范性要求越來(lái)越嚴(yán)格[5],各醫(yī)院也分別采取有力的規(guī)范措施提升電子病歷的書(shū)寫質(zhì)量。所以醫(yī)院強(qiáng)化電子病歷質(zhì)量管理對(duì)加強(qiáng)電子病歷質(zhì)量控制有重要意義。

隨著電子信息技術(shù)和人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)模型在醫(yī)學(xué)中的應(yīng)用越來(lái)越廣泛,用于文本分類任務(wù)的卷積神經(jīng) 網(wǎng) 絡(luò)(Text Convolutional Neural Networks,TextCNN)模型作為其中一種,可利用多個(gè)不同大小的卷積核來(lái)提取句子中關(guān)鍵信息,能更好地捕捉局部相關(guān)性。在篩查文字、圖片等信息中的問(wèn)題方面有一定優(yōu)勢(shì),現(xiàn)在多應(yīng)用在病例首頁(yè)問(wèn)題中的篩查,可識(shí)別和分類所提取的首頁(yè)問(wèn)題[6],目前較少用于篩查電子病歷所遇到的質(zhì)量問(wèn)題。為更好地預(yù)測(cè)和篩查電子病歷文本提取及質(zhì)量缺陷,本文通過(guò)建立TextCNN模型,探討和分析其預(yù)測(cè)電子病歷文本提取及質(zhì)量缺陷的情況。

1 資料與方法

1.1 資料來(lái)源

選擇并抽取我院于2020年1月1日至2021年10月31日歸檔的電子病歷9萬(wàn)份,其中門診病例7萬(wàn)份,住院病例2萬(wàn)份。

1.2 方法

1.2.1 電子分組和抽取情況分析

本次研究的樣本量共有9萬(wàn)份,按照7∶3的比例把所有電子病歷分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集有63000份電子病歷(11540份有質(zhì)量缺陷,51460無(wú)質(zhì)量缺陷),測(cè)試集有27000份電子病歷(5145份有質(zhì)量缺陷,21865例無(wú)質(zhì)量缺陷)。訓(xùn)練集采用K折交叉驗(yàn)證(K=10)。

1.2.2 運(yùn)用自然語(yǔ)言處理技術(shù)提取信息

本研究是運(yùn)用中文自然語(yǔ)言處理系統(tǒng)從電子病歷系統(tǒng)中提取出臨床有用信息。處理方法如下:① 預(yù)處理:先將系統(tǒng)內(nèi)的電子病歷轉(zhuǎn)換成TXT可編輯的文本格式,同時(shí)清除掉文中的空白行和空格;② 句子分割:全文分割應(yīng)用的是常在文檔中詞語(yǔ)或句子間斷開(kāi)的標(biāo)點(diǎn)符號(hào),包括“,”“?!薄埃 薄??”“;”等;③ 段落篩選:應(yīng)用段落篩選排除不必要的信息以便簡(jiǎn)化工作量;例如入院記錄和首程中主訴這一行,從“主訴:”后的句子內(nèi)容均是臨床上的關(guān)鍵信息,這需要設(shè)定兩個(gè)固定的邊界篩選文本內(nèi)容,而影像或病理學(xué)中的結(jié)論報(bào)告與上述問(wèn)題類似;④ 關(guān)鍵詞識(shí)別和值的提取:按照預(yù)定義的關(guān)鍵詞提取電子病歷中的關(guān)鍵詞,在匹配過(guò)程中按順序進(jìn)行逐步的運(yùn)算算法(如果遇到文本中無(wú)法識(shí)別的預(yù)定義字段,程序會(huì)跳過(guò)此段處理下一個(gè))。

1.2.3 構(gòu)建人工神經(jīng)網(wǎng)絡(luò)

采用TextCNN探索卷積神經(jīng)網(wǎng)絡(luò)深度與其性能間的關(guān)系,TexTCNN構(gòu)建了包含嵌入層、卷積、最大池化層、全連接輸出層的卷積神經(jīng)網(wǎng)絡(luò)(圖1),通過(guò)以詞為單位進(jìn)行文本表示形成詞向量,再將詞向量按照詞在句子中出現(xiàn)的順序進(jìn)行拼接,形成代表句子的矩陣,從而實(shí)現(xiàn)句子特征的自動(dòng)提取和學(xué)習(xí)。本研究使用TextCNN模型進(jìn)行遷移學(xué)習(xí),其中嵌入層為采用經(jīng)自然語(yǔ)言處理技術(shù)提取后的關(guān)鍵詞,并將之轉(zhuǎn)化為詞向量,構(gòu)成文本特征向量作為循環(huán)層的輸出(文本會(huì)轉(zhuǎn)變成一個(gè)二維矩陣,假設(shè)文本的長(zhǎng)度為|T|,詞向量的大小為|d|,則該二維矩陣的大小為|T|×|d|);卷積層則采用列數(shù)與循環(huán)層相等的卷積矩陣窗口,并將矩陣中的列矩陣塊由上到下依次進(jìn)行卷積運(yùn)算,將矩陣所有相同位置的元素相乘后再求和并提取矩陣特征;在池化層中采用最大池化的方法取每個(gè)卷積窗口卷積得到的卷積層向量中最大的元素作為特征值,通過(guò)降低特征的維度,進(jìn)一步提高分類效率;輸出層與池化層全連接,以池化層向量為輸入對(duì)向量進(jìn)行分類,并輸出最終的分類;而后將輸出結(jié)果與之前預(yù)先基于中文醫(yī)學(xué)主題詞表構(gòu)建好的醫(yī)學(xué)主題詞模型進(jìn)行比對(duì),并將所有比對(duì)完成的TextCNN模型的參數(shù)定義為集合,并采用隨機(jī)梯度下降方法訓(xùn)練,得到最終模型,最后將驗(yàn)證集輸入模型中以進(jìn)行驗(yàn)證。

圖1 TextCNN 模型結(jié)構(gòu)略圖

1.2.4 人工神經(jīng)網(wǎng)絡(luò)模型的評(píng)估

根據(jù)選出的測(cè)試集為驗(yàn)證對(duì)象,用TextCNN構(gòu)建出模型進(jìn)行驗(yàn)證,先通過(guò)疾病診斷相關(guān)分類系統(tǒng)(Diagnosis Related Groups,DRGs)對(duì)測(cè)試集內(nèi)所有電子病歷分組,將提取出問(wèn)題的電子病歷同時(shí)由一名具有中級(jí)職稱并有5年以上審核病案工作經(jīng)驗(yàn)的主治醫(yī)師和此次建立的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行核查,如果二者審查結(jié)果不一致時(shí)交由病案室內(nèi)具有副主任醫(yī)師以上職稱的專家醫(yī)師進(jìn)行復(fù)測(cè),此結(jié)論是此病歷質(zhì)量檢驗(yàn)的最終判定結(jié)果。統(tǒng)計(jì)所有神經(jīng)網(wǎng)絡(luò)模型判斷錯(cuò)誤的電子病歷數(shù)并計(jì)算出人工網(wǎng)絡(luò)模型的準(zhǔn)確率、特異度和敏感度。

1.3 統(tǒng)計(jì)學(xué)分析

實(shí)驗(yàn)數(shù)據(jù)分析采用的硬件平臺(tái)為i7-7700K+GTX1060(6G),軟件平臺(tái)為Python 3.7.10及TensorFlow-gpu 2.4.0人工神經(jīng)網(wǎng)絡(luò)庫(kù)建立TextCNN模型,從預(yù)訓(xùn)練基線卷積層中提取特征優(yōu)化的優(yōu)化策略。準(zhǔn)確率比較采用χ2檢驗(yàn),P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。

2 結(jié)果

2.1 電子病歷質(zhì)量缺陷統(tǒng)計(jì)

納入研究的9萬(wàn)份電子病歷中,通過(guò)DRGs篩查后總共有16685份電子病歷存在質(zhì)量缺陷,質(zhì)量缺陷發(fā)生率是18.54%(16685/90000),分析系統(tǒng)運(yùn)行界面如圖2所示,統(tǒng)計(jì)結(jié)果如表1所示。通過(guò)人工復(fù)檢后發(fā)現(xiàn)存在質(zhì)量缺陷病歷中的問(wèn)題主要有以下幾個(gè)方面:對(duì)病情和醫(yī)囑變化或檢查報(bào)告等病程記錄不全;部分檢查報(bào)告缺失不全;入院記錄或首程填寫不全;病程內(nèi)容書(shū)寫錯(cuò)誤或重復(fù);醫(yī)生未能在規(guī)定時(shí)間內(nèi)及時(shí)書(shū)寫病程或簽字提交;首頁(yè)填寫不全或錯(cuò)誤;部分知情同意書(shū)等內(nèi)容缺失;醫(yī)囑打印不全;出院記錄對(duì)病情記錄不全。

圖2 電子病歷質(zhì)量缺陷分析系統(tǒng)界面

表1 電子病歷質(zhì)量缺陷統(tǒng)計(jì)

2.2 預(yù)測(cè)模型的內(nèi)部驗(yàn)證和外部驗(yàn)證結(jié)果

通過(guò)收集預(yù)測(cè)模型及人工復(fù)審的預(yù)測(cè)矩陣,見(jiàn)表2。計(jì)算比較TextCNN模型與人工復(fù)審的預(yù)測(cè)指標(biāo)之間的差異結(jié)果顯示:TextCNN模型的準(zhǔn)確率、敏感度、特異度、陽(yáng)性及陰性預(yù)測(cè)值顯著高于人工復(fù)審,差異具有統(tǒng)計(jì)學(xué)意義(χ2=253.249、57.091、197.199、186.241、57.547,P值均<0.001),見(jiàn)表3。

表2 TextCNN模型和人工復(fù)審預(yù)測(cè)質(zhì)量缺陷的混淆矩陣(份)

表3 TextCNN模型和人工復(fù)審預(yù)測(cè)測(cè)試集質(zhì)量缺陷的效能對(duì)比(%)

2.3 應(yīng)用CNN模型后逐月篩選出問(wèn)題病案的情況對(duì)比

由2021年2—10月間DRGs篩選出問(wèn)題病案的數(shù)量結(jié)果顯示(圖3),自開(kāi)始采用TextCNN模型分析后,隨著模型系統(tǒng)應(yīng)用逐漸熟練,DRGs每月篩選出有質(zhì)量缺陷病的問(wèn)題病案數(shù)逐漸下降,在3月份下降最明顯,后下降趨勢(shì)逐漸減緩,系統(tǒng)應(yīng)用逐漸熟練、性能逐漸穩(wěn)定。DRGs篩選出有質(zhì)量缺陷病的問(wèn)題病案發(fā)生率顯著下降(χ2=16.830,P<0.001)。

圖3 DRGs篩選出問(wèn)題病案發(fā)生率

3 討論與總結(jié)

病歷是醫(yī)師基本醫(yī)學(xué)知識(shí)、技能與實(shí)際相結(jié)合的客觀體現(xiàn),也是處理醫(yī)患糾紛及其他涉及醫(yī)學(xué)糾紛的法律依據(jù)[7],因此病歷質(zhì)量和病歷質(zhì)量管理在醫(yī)院管理中一直占據(jù)著重要地位。而且好的病歷還是醫(yī)院進(jìn)行教學(xué)科研的重要資料,為醫(yī)師的成長(zhǎng)提供幫助[8]。而隨著社會(huì)信息化的發(fā)展,電子病歷已逐漸代替了手寫病歷,成為醫(yī)院的組成部分,而電子病歷的質(zhì)量缺陷也成為病歷質(zhì)量管理中的關(guān)鍵部分[9]。如何提高電子病歷的質(zhì)量也成為目前臨床研究的重要課題。TextCNN作為一種深度前饋人工神經(jīng)網(wǎng)絡(luò)可用于提取文本中的關(guān)鍵信息,也可以識(shí)別和處理圖像,目前逐漸應(yīng)用于處理病歷首頁(yè),對(duì)識(shí)別首頁(yè)缺陷有較好的效果,有助于提高病歷質(zhì)量[10],較少用于電子病歷的質(zhì)量管理。

在本研究結(jié)果中發(fā)現(xiàn),近兩年我院的電子病歷質(zhì)量缺陷發(fā)生率是18.54%,說(shuō)明我院在提高電子病歷質(zhì)量方面仍有較大的提升空間。而通過(guò)復(fù)檢后發(fā)現(xiàn)最重要的質(zhì)量缺陷問(wèn)題主要包括對(duì)病情和醫(yī)囑變化或檢查報(bào)告等病程記錄不全、部分檢查報(bào)告缺失不全等,一方面考慮與患者多、周轉(zhuǎn)快、醫(yī)師工作強(qiáng)度大、書(shū)寫病歷時(shí)間少有關(guān);另一方面考慮與部分醫(yī)師法律觀念薄弱、缺乏自我保護(hù)意識(shí)、對(duì)電子病歷質(zhì)量重要性的認(rèn)知程度不夠、容易出現(xiàn)錯(cuò)別字或記錄不嚴(yán)謹(jǐn)?shù)惹闆r有關(guān)[11],而且電子病歷有復(fù)制粘貼等功能,在打電子病歷時(shí)容易出現(xiàn)病程內(nèi)容書(shū)寫錯(cuò)誤或重復(fù)、與病情不符或忘記簽字等低級(jí)錯(cuò)誤。在沈占英等[12]的研究中也列舉了包括病程記錄缺陷、病案首頁(yè)缺陷、入院記錄缺陷等在內(nèi)的病歷質(zhì)量缺陷,與本文研究結(jié)果類似。也說(shuō)明了如何提高電子病歷質(zhì)量是目前大多數(shù)醫(yī)院所面對(duì)的重要問(wèn)題。

通過(guò)預(yù)測(cè)模型內(nèi)部和外部驗(yàn)證發(fā)現(xiàn)TextCNN模型準(zhǔn)確率、敏感度、特異度、陽(yáng)性及陰性預(yù)測(cè)值均高于人工復(fù)審。這說(shuō)明了TextCNN預(yù)測(cè)模型在預(yù)測(cè)電子病歷質(zhì)量缺陷中有一定優(yōu)勢(shì)。在現(xiàn)今的通用技術(shù)中,機(jī)器學(xué)習(xí)對(duì)大規(guī)模數(shù)據(jù)處理有較大的優(yōu)勢(shì),TextCNN可以通過(guò)構(gòu)建模型對(duì)提取的數(shù)據(jù)反復(fù)對(duì)比篩查,可提高缺陷的檢出率,特別是對(duì)電子病歷中的圖像、文字和表格等多個(gè)方面的識(shí)別和提取有較大的優(yōu)勢(shì)[13]。而人工檢測(cè)由于人的固有觀念及對(duì)問(wèn)題的主觀意識(shí)不同,對(duì)不同問(wèn)題的看法不一致,而且病案審查人員數(shù)量少、工作量繁重,均會(huì)導(dǎo)致人工檢測(cè)的敏感性和特異性降低[14]。在我院,通過(guò)應(yīng)用TextCNN模型分析后發(fā)現(xiàn)DRGs篩選出問(wèn)題病案發(fā)生率顯著下降。觀察我院每月有質(zhì)量缺陷的問(wèn)題病例檢出率發(fā)現(xiàn),隨著應(yīng)用TextCNN模型時(shí)間的延長(zhǎng),問(wèn)題病例檢出率逐漸降低。主要是在剛開(kāi)始使用DRGs系統(tǒng)時(shí),由于對(duì)診斷、格式、系統(tǒng)等模不熟悉,使得早期問(wèn)題病歷的檢出率相對(duì)較高,而隨著對(duì)DRGs系統(tǒng)的熟悉,缺陷病歷的檢出率明顯降低。而且網(wǎng)絡(luò)系統(tǒng)具有記憶性,能共享模型中各分層的實(shí)現(xiàn)參數(shù),并且能儲(chǔ)存各種長(zhǎng)度不等的數(shù)據(jù)片段,增加了數(shù)據(jù)片段的識(shí)別性[15],減少了由于數(shù)據(jù)長(zhǎng)度增加引起的不能識(shí)別文本的情況。TextCNN模型還能在局部感知和權(quán)值共享時(shí)通過(guò)模型進(jìn)一步減少模型內(nèi)訓(xùn)練參數(shù)的數(shù)目,提高模型效率,減少電子病歷質(zhì)量缺陷檢出率[16],對(duì)提高電子病歷質(zhì)量有良好的效果。

綜上所述,神經(jīng)網(wǎng)絡(luò)模型在電子病歷文本提取和篩查質(zhì)量缺陷病歷中的效果較好,可用于臨床推廣以提高病歷質(zhì)量。雖然系統(tǒng)使用后有質(zhì)量缺陷的電子病歷檢出率下降,但由于電子病歷的復(fù)雜性,仍有部分電子病歷質(zhì)量缺陷檢測(cè)存在誤差,需要更完善的系統(tǒng)進(jìn)一步檢測(cè),也需要進(jìn)一步完善質(zhì)量管理規(guī)定,提高電子病歷質(zhì)量。

猜你喜歡
病案病歷檢出率
QCT與DXA對(duì)絕經(jīng)后婦女骨質(zhì)疏松癥檢出率的對(duì)比
強(qiáng)迫癥病歷簿
安寧市老年人高血壓檢出率及其影響因素
長(zhǎng)程動(dòng)態(tài)心電圖對(duì)心律失常的檢出率分析
試析病案管理中預(yù)防病案錯(cuò)位發(fā)生的方法
“大數(shù)的認(rèn)識(shí)”的診斷病歷
“病例”和“病歷”
病案信息化在病案服務(wù)利用中的應(yīng)用效率分析
臨床表現(xiàn)為心悸的預(yù)激綜合征B型心電圖1例
山東產(chǎn)品抽查:文胸嬰幼兒服裝不合格率居前
龙口市| 甘孜| 宿迁市| 石狮市| 尚志市| 怀柔区| 石首市| 岱山县| 施秉县| 桐乡市| 佛冈县| 浪卡子县| 江阴市| 祁门县| 中牟县| 县级市| 广灵县| 梨树县| 浠水县| 黎川县| 北安市| 于田县| 罗甸县| 双鸭山市| 柯坪县| 新蔡县| 丰台区| 当阳市| 静宁县| 合肥市| 那曲县| 东台市| 炉霍县| 商城县| 马龙县| 山西省| 青浦区| 沾化县| 汕尾市| 枝江市| 伊川县|