国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度神經網絡的智能診斷預測模型研究*

2022-10-13 09:58:20馬良玉
醫(yī)學信息學雜志 2022年8期
關鍵詞:結構化實體預測

李 民 馬良玉 姚 智

(南通市第一人民醫(yī)院(南通大學第二附屬醫(yī)院) 南通 226001)

1 引言

1.1 研究背景

臨床決策支持系統是指運用相關、系統的臨床知識和患者基本信息及病情信息,加強醫(yī)療相關的決策和行動,提高醫(yī)療質量和服務水平的計算機應用系統。其核心任務是診斷預測,其目的是根據患者歷史醫(yī)療數據預測當前診斷[1]。為了使決策支持結論更加準確,診斷預測任務需要充分有效地利用已有醫(yī)療數據,包括患者基本信息、電子病歷、病程記錄以及醫(yī)囑、檢驗、影像、護理信息等[2-3]?,F有臨床決策支持系統大多利用機器學習分類模型對結構化數據如患者基本信息、檢查檢驗、醫(yī)囑等數據進行建模,對非結構化文本數據,主要使用基于規(guī)則的方法抽取關鍵詞進行建模,文本數據利用率偏低[4]。能夠反映患者病情的關鍵信息主要體現在電子病歷、病程記錄等文本中,有效利用此類文本數據并將其與結構化數據相結合對提高診斷預測準確率意義重大[5-7]。

1.2 研究內容

為解決上述問題,本文提出一種基于深度神經網絡語言模型的診斷預測框架,可以獲得電子病歷、病程記錄等醫(yī)學文本數據的深度語境表示,并將其與患者結構化數據相結合,輸入到卷積神經網絡分類模型中進行預測,輸出最可能的診斷[8-9]。本文提出診斷預測框架,并針對南通市第一人民醫(yī)院(以下簡稱南通一院)醫(yī)療數據構建數據集進行驗證。實驗結果表明使用深度神經網絡語言模型對醫(yī)學文本進行表示,結合結構化醫(yī)療數據進行診斷預測,較之以往方法F1值提高了13.66%,充分驗證了本文提出的診斷預測框架的有效性和先進性。

2 方法

2.1 結構化數據表示

結構化數據主要是指患者就診產生的基本信息、檢查檢驗、醫(yī)囑等數據。這部分數據存儲于關系數據庫中,結構清晰,較易從中篩選特征并抽取特征向量用于診斷分類系統[10-12]。選取多個特征作為結構化數據的分類特征,所有特征分為數值型和多項型。數值型指該維度特征值是數字,包括整形和浮點數;多項型指該維度特征值有多個可選值,見表1。

表1 結構化數據特征

2.2 非結構化數據表示

2.2.1 命名實體識別 非結構化數據主要是指患者就診產生的醫(yī)學純文本,如電子病歷、病程記錄等。高效分析該部分數據是診斷預測的關鍵。命名實體識別是一項序列標注任務,該任務在給定的文本序列上預測序列中需要標注的標簽。使用目前最成功的語言模型雙向編碼器表征(Bidirectional Encoder Representations from Transformers, BERT)來識別文本中的醫(yī)學實體。其中Classification(CLS)為句子開始標志,輸入句子為“患者服用華法林后牙齦出血”,在BERT模型中經過多層自注意力機制和殘差網絡計算,最終識別出3個實體:華法林(藥品)、牙齦(部位)、出血(癥狀),見圖1。

圖1 基于BERT的醫(yī)學命名實體識別

2.2.2 關系抽取 關系抽取使用模板匹配方法。該方法利用醫(yī)學專家根據經驗預先定義的關系模板庫,從模板庫中對輸入文本兩個給定實體進行上下文匹配,如果滿足模板則輸出模板對應關系。在一個句子中,如果有兩個實體類型匹配到關系模板的實體1和實體2,則判定其存在對應關系,見表2。

表2 實體關系模板

2.3 診斷分類

診斷分類的本質是多分類任務,采用卷積神經網絡(Convolutional Neural Networks, CNN)完成最終診斷預測,見圖2。其中x1為個人信息、醫(yī)囑、檢驗等結構化數據表示矩陣,x2為電子病歷、病程記錄、檢查報告等非結構化數據表示矩陣,X為輸入矩陣,其計算方式如下:

x=x1⊕x2

ci=f(WTxi:i+h-1+b)

c=[c1,c2,…,cn-h+1]

從隱藏層z到輸出層y,通過softmax函數計算該患者屬于每個診斷的概率,然后取概率最大的一個作為本次預測的診斷,計算方式如下:

y=softmax(W(S)z+b)

圖2 基于卷積神經網絡的診斷預測

3 實驗

3.1 數據集

實驗中使用的數據集是在南通一院4個月的就診數據基礎上生成的,通過多名醫(yī)學專家進行人工標注,包含病程記錄和檢查報告等文檔共1 800份。本文提出的方法需要識別28類實體和32類關系。28類實體分別為:治療、檢查發(fā)現、檢驗指標、屬性值、分型、屬性值單位、部位、體征指標、癥狀、誘因、程度、癥狀+、藥物、檢查指標、發(fā)生時間、性質、手術、檢查、診斷+、檢驗、持續(xù)時間、類型、頻率、檢查描述、分期、轉歸、護理和診斷。32類關系分別為:癥狀的發(fā)生時間、診斷的發(fā)生時間、癥狀的持續(xù)時間、診斷的持續(xù)時間、癥狀的部位、診斷的部位、癥狀的程度、診斷的程度、癥狀的性質、診斷的性質、癥狀的頻率、診斷的頻率、癥狀的誘因、診斷的誘因、癥狀的轉歸、診斷的轉歸、診斷的類型、診斷的分期、診斷的分型、檢查發(fā)現的部位、檢查描述的部位、檢查的結果、檢查的描述、檢查的指標、檢驗指標的值、檢查指標的值、體征指標的值、檢驗指標的單位、檢查指標的單位、體征指標的單位、藥物的劑量、藥物的劑量單位。

3.2 評價指標

為驗證本文提出框架的有效性,選擇分類模型最常用評價指標:精確率(Precision)、召回率(Recall)和二者的調和平均值F1,計算公式如下。公式中TP指被模型預測為正的正樣本、FP指被模型預測為正的負樣本、TN指被模型預測為負的負樣本、FN指被模型預測為負的正樣本。

精確率度量分類器對某一類別預測結果的準確性,對所有類別求和取均值后可以得到整體精確率。

召回率度量分類器對某一類別預測結果的覆蓋面,對所有類別求和取均值后可以得到整體覆蓋面。

調和平均值F1度量分類器對某一個類別預測結果的精確性和覆蓋面。它是精確率和召回率的調和平均值。

3.3 結果

實驗中使用兩種方法進行對比,第1種方法只用結構化數據進行診斷預測,作為本文的對比方法,記為基線方法(Baseline);第2種方法即本文提出的方法,將結構化和非結構化數據相結合進行診斷預測,記為本文提出的方法(Ours),見表3。根據實驗結果,本文提出的框架在數據集上的結果與基線方法相比,精確率、召回率和F1 3個指標均有大幅提高。其中精確率提高了14.04%,召回率提高了13.29%,F1值提高了13.66%,充分驗證本文提出診斷預測框架的有效性。

表3 實驗結果(%)

4 討論

診斷預測是臨床輔助決策系統的核心任務,該任務根據患者的結構化數據(個人信息、醫(yī)囑、檢驗等)和非結構化數據(病程記錄、檢查報告等)預測患者診斷,是醫(yī)學研究和應用領域最復雜的任務之一。然而現有診斷預測系統對非結構化文本數據的利用率偏低,導致診斷預測準確率有待提高。近年來深度學習技術受到廣泛關注。與傳統的機器學習模型需要領域專家手工完成特征工程不同,深度學習模型可從源數據中自動學習數據表示,建立與任務相關的特征?;颊唠娮硬v等數據的積累為深度學習預測患者診斷奠定了基礎。臨床診斷預測模型在醫(yī)學研究與實踐中的應用廣泛。借助臨床預測模型醫(yī)生和患者可以共同做出決策,臨床研究者可以更精準地篩選合適的研究對象,政府部門與衛(wèi)生管理者可以更好地進行醫(yī)療質量管理,合理配置醫(yī)療資源[12-13]。此外臨床預測模型的應用價值體現在疾病的三級預防體系。一是疾病的一級預防。臨床預測模型可以給患者和醫(yī)生提供基于當前健康狀態(tài)、未來患有某疾病的量化風險值(概率),為健康教育和行為干預提供更直觀、有力的科學工具。二是疾病的二級預防。臨床預測模型尤其是診斷模型,常可借助無創(chuàng)、低成本、易采集的指標給出高靈敏度和特異度的診斷方案,踐行“早發(fā)現,早診斷,早治療”的疾病預防理念,具有重要衛(wèi)生經濟學意義。三是疾病的三級預防。預后模型可對疾病的復發(fā)、死亡、傷殘以及出現并發(fā)癥的概率給出量化估算,從而指導對癥治療和康復方案的制定,防止傷殘和促進功能恢復,提高生存質量,延長壽命,降低病死率。

5 結語

診斷預測是指利用大規(guī)模的醫(yī)療數據建成診斷預測模型,根據就診數據預測患者可能發(fā)生的疾病。該任務在臨床輔助決策系統和疾病預防體系中具有廣泛應用。本文使用BERT、CNN等先進的深度學習模型構建一種診斷預測框架。該框架可以將患者的非結構化文本數據和結構化數據有機結合,對患者病情做出更準確預測。實驗結果表明,將非結構化文本數據與結構化數據相結合,能夠有效提高診斷預測的準確率,為臨床決策支持系統后續(xù)的診療推薦等任務奠定基礎。

猜你喜歡
結構化實體預測
無可預測
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
促進知識結構化的主題式復習初探
結構化面試方法在研究生復試中的應用
計算機教育(2020年5期)2020-07-24 08:53:00
前海自貿區(qū):金融服務實體
中國外匯(2019年18期)2019-11-25 01:41:54
實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
哲學評論(2017年1期)2017-07-31 18:04:00
兩會進行時:緊扣實體經濟“釘釘子”
振興實體經濟地方如何“釘釘子”
不必預測未來,只需把握現在
仁布县| 西和县| 阿瓦提县| 乌拉特前旗| 林甸县| 仁布县| 资溪县| 岫岩| 南部县| 澳门| 高青县| 石楼县| 海口市| 渭南市| 兴安盟| 江都市| 东至县| 奉贤区| 宜城市| 上高县| 唐山市| 木里| 商洛市| 太原市| 财经| 开平市| 通河县| 绵阳市| 通化市| 中宁县| 大洼县| 丹江口市| 张家口市| 定安县| 隆林| 四子王旗| 神农架林区| 和田县| 剑川县| 大理市| 大足县|