繩慧峰 劉 晴 許 蘋(píng) 陳春林*
?
人工神經(jīng)網(wǎng)絡(luò)在醫(yī)療風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用研究*
繩慧峰1劉 晴2許 蘋(píng)3陳春林1*
目的 建立基于人工神經(jīng)網(wǎng)絡(luò)的醫(yī)療風(fēng)險(xiǎn)預(yù)測(cè)模型,為有效預(yù)防醫(yī)療風(fēng)險(xiǎn)提供參考。方法 運(yùn)用SPSS 21.0統(tǒng)計(jì)軟件,以入院方式、住院天數(shù)等變量為輸入神經(jīng)元,以醫(yī)療糾紛分組為輸出神經(jīng)元,用RBF(徑向基函數(shù))建立神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)醫(yī)療風(fēng)險(xiǎn)的發(fā)生,評(píng)估各因素對(duì)醫(yī)療風(fēng)險(xiǎn)的作用。結(jié)果 訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)準(zhǔn)確率分別為83.7%和84.2%,醫(yī)療風(fēng)險(xiǎn)影響因素重要性排序前6位分別是住院費(fèi)用(100.0%)、住院天數(shù)(78.2%)、四周內(nèi)手術(shù)次數(shù)(61.4%)、感染(60.5%)、傷口愈合不良(54.0%)和手術(shù)并發(fā)癥(47.8%)等。結(jié)論 運(yùn)用RBF(徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)對(duì)醫(yī)療風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),不受樣本分布特點(diǎn)及數(shù)據(jù)類(lèi)型的影響,適用性較好。
人工神經(jīng)網(wǎng)絡(luò);徑向基函數(shù);醫(yī)療風(fēng)險(xiǎn);預(yù)測(cè);應(yīng)用
First-author's address Ministry of Medical Affairs, 105th Hospital of People 's Liberation Army, Hefei, Anhui, 230031, China
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)簡(jiǎn)稱(chēng)神經(jīng)網(wǎng)絡(luò)(Neural Network,NN),是模擬生物神經(jīng)系統(tǒng)結(jié)構(gòu),由大量處理單元組成的非線(xiàn)性自適應(yīng)動(dòng)態(tài)系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)因其強(qiáng)大性、靈活性和易用性,成為預(yù)測(cè)數(shù)據(jù)應(yīng)用程序的首選工具。徑向基函數(shù) (Radial Basis Function,RBF)是人工神經(jīng)網(wǎng)絡(luò)諸多形式中應(yīng)用較廣泛的一種,由于其具有能夠逼近任意的非線(xiàn)性函數(shù)、學(xué)習(xí)收斂速度快等優(yōu)點(diǎn),目前已經(jīng)成功應(yīng)用于非線(xiàn)性函數(shù)逼近、模式識(shí)別、信息處理等方面[2]。本研究在前期研究基礎(chǔ)上,初步嘗試采用RBF神經(jīng)網(wǎng)絡(luò)建立醫(yī)療風(fēng)險(xiǎn)預(yù)測(cè)模型,篩選醫(yī)療風(fēng)險(xiǎn)影響因素,以期為進(jìn)一步加強(qiáng)風(fēng)險(xiǎn)控制,制定管理決策提供參考。
1.1 資料來(lái)源
本研究所使用的數(shù)據(jù)資料均來(lái)源于合肥市某軍隊(duì)三甲醫(yī)院信息系統(tǒng)。針對(duì)該院2010年-2015年發(fā)生的60例手術(shù)糾紛案例和120例非糾紛案例,通過(guò)醫(yī)院信息系統(tǒng)調(diào)取各案例的16項(xiàng)醫(yī)療風(fēng)險(xiǎn)指標(biāo)。其中,60例糾紛案例為該院6年間發(fā)生的全部手術(shù)糾紛案例,反映該院實(shí)際糾紛情況;120例非糾紛案例則按照常用病例和對(duì)照1:2的標(biāo)準(zhǔn)選取。16項(xiàng)指標(biāo)均由前期通過(guò)單因素分析篩選并確定,分別是入院方式、住院天數(shù)、住院費(fèi)用、四周內(nèi)手術(shù)次數(shù)、非計(jì)劃再次手術(shù)等[3]。具體指標(biāo)及賦值情況見(jiàn)表1。
表1 醫(yī)療風(fēng)險(xiǎn)指標(biāo)變量及其賦值
變量*代碼賦值入院方式X10=門(mén)診;1=急診住院天數(shù)X20=<20天;1=≥20天住院費(fèi)用X30=<5萬(wàn);1=≥5萬(wàn)四周內(nèi)手術(shù)次數(shù)X40=<2次;1=≥2次非計(jì)劃再次手術(shù)X50=無(wú);1=有輸血總量X60=<1600ml;1=≥1600ml非正常進(jìn)入ICU天數(shù)X70=<3天;1=≥3天病情危重X80=無(wú);1=有病情突變X90=無(wú);1=有搶救次數(shù)X101=0次;2=1次;3=≥2次手術(shù)并發(fā)癥X110=無(wú);1=有傷口愈合不良X120=無(wú);1=有感染X130=無(wú);1=有休克X140=無(wú);1=有出院病情X150=治愈或好轉(zhuǎn);1=死亡出院方式X160=醫(yī)囑出院;1=家屬要求分組Y0=非糾紛組;1=糾紛組
注:*16項(xiàng)風(fēng)險(xiǎn)指標(biāo)是從22個(gè)變量中篩選出來(lái)的。這些變量是前期經(jīng)過(guò)專(zhuān)家咨詢(xún)篩選的相對(duì)重要的指標(biāo),但不包括所有可能與糾紛事件相關(guān)的變量。
1.2 研究方法
所有數(shù)據(jù)采用Excel 2007整理和匯總,采用SPSS 21.0統(tǒng)計(jì)軟件中的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行分析。神經(jīng)網(wǎng)絡(luò)模型包含輸入層、隱藏層和輸出層3層結(jié)構(gòu),將16項(xiàng)醫(yī)療風(fēng)險(xiǎn)指標(biāo)作為輸入神經(jīng)元,醫(yī)療糾紛分組作為輸出神經(jīng)元。
1.3 操作步驟
神經(jīng)網(wǎng)絡(luò)建模按照以下步驟進(jìn)行:(1)打開(kāi)SPSS軟件,導(dǎo)入Excel數(shù)據(jù)。(2)生成隨機(jī)數(shù)。選擇菜單欄里的“轉(zhuǎn)換-隨機(jī)數(shù)字生成器”,勾選設(shè)置起點(diǎn)中的固定值,并輸入數(shù)字“9191972”。(3)建立神經(jīng)網(wǎng)絡(luò)模型。選擇菜單欄里的“分析-神經(jīng)網(wǎng)絡(luò)-徑向基函數(shù)”,將醫(yī)療糾紛分組作為因變量,入院方式、住院天數(shù)等16項(xiàng)指標(biāo)變量作為因子。在輸出選項(xiàng)中勾選“描述→圖表→模型匯總→分類(lèi)結(jié)果→ROC曲線(xiàn)→累積增益圖→增益圖→觀(guān)察預(yù)測(cè)圖→個(gè)案處理摘要→自變量重要性分析”。其他選項(xiàng)均采用系統(tǒng)默認(rèn),點(diǎn)擊確定進(jìn)行分析。
2.1 模型預(yù)測(cè)結(jié)果
共有180個(gè)有效樣本,按照神經(jīng)網(wǎng)絡(luò)常用7:3比例,123個(gè)案例(68.3%)被分配到訓(xùn)練樣本,57個(gè)案例(31.7%)被分配到測(cè)試樣本,沒(méi)有個(gè)案被排除。表2為模型分類(lèi)結(jié)果。訓(xùn)練樣本中,83個(gè)非醫(yī)療糾紛樣本有80個(gè)(96.4%)被正確分到了非醫(yī)療糾紛組,40個(gè)醫(yī)療糾紛樣本有23個(gè)(57.5%)被正確分到了醫(yī)療糾紛組,預(yù)測(cè)正確總百分比為83.7%;測(cè)試樣本中,37個(gè)非醫(yī)療糾紛樣本有35個(gè)(94.6%)被正確地分到了非醫(yī)療糾紛組,20個(gè)醫(yī)療糾紛樣本有13個(gè)(65.0%)被正確地分到了醫(yī)療糾紛組,預(yù)測(cè)正確總百分比為84.2%。表3模型匯總中,訓(xùn)練樣本百分比錯(cuò)誤預(yù)測(cè)16.3%和測(cè)試樣本百分比錯(cuò)誤預(yù)測(cè)15.8%相對(duì)應(yīng)。圖1為觀(guān)察預(yù)測(cè)圖,顯示組合的培訓(xùn)和測(cè)試樣本的預(yù)測(cè)擬概率。最左側(cè)箱圖顯示,對(duì)于觀(guān)察類(lèi)別no(非醫(yī)療糾紛組)的個(gè)案,類(lèi)別no的預(yù)測(cè)擬概率。在y軸0.5標(biāo)記之上的箱圖部分代表分類(lèi)表中顯示的正確預(yù)測(cè)值,0.5標(biāo)記以下部分代表不正確的預(yù)測(cè)值;最右側(cè)箱圖顯示,對(duì)于觀(guān)察類(lèi)別yes(醫(yī)療糾紛組)的個(gè)案,類(lèi)別yes的預(yù)測(cè)擬概率。在y軸0.5標(biāo)記之上的部分代表分類(lèi)表中顯示的正確預(yù)測(cè)值,0.5標(biāo)記以下部分代表不正確的預(yù)測(cè)值。
表3 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型結(jié)果匯總
訓(xùn)練平方和錯(cuò)誤16.031百分比錯(cuò)誤預(yù)測(cè)(%)16.3培訓(xùn)時(shí)間0:00:00.31測(cè)試平方和錯(cuò)誤8.316a百分比錯(cuò)誤預(yù)測(cè)(%)15.8
注:a隱藏單位的數(shù)量由檢驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)確定,隱藏單位的“最佳”數(shù)量為檢驗(yàn)數(shù)據(jù)中產(chǎn)生最小錯(cuò)誤的單位。
圖1 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)擬概率
注:0表示非醫(yī)療糾紛組,1表示醫(yī)療糾紛組。
2.2 ROC曲線(xiàn)擬合結(jié)果
圖2為ROC曲線(xiàn)擬合結(jié)果,顯示了單個(gè)圖中所有界限的敏感度和特異性。ROC曲線(xiàn)下面積為0.821,表明了診斷試驗(yàn)準(zhǔn)確度的大小[4],說(shuō)明對(duì)于每一個(gè)類(lèi)別,該類(lèi)別中一個(gè)隨機(jī)選擇的個(gè)案高于非該類(lèi)別中一個(gè)隨機(jī)選擇的個(gè)案的概率。例如,對(duì)于隨機(jī)選擇的醫(yī)療糾紛者與隨機(jī)選擇的非醫(yī)療糾紛者,就缺省模型預(yù)測(cè)擬概率而言,前者高于后者的概率為0.821。
圖2 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的ROC曲線(xiàn)
表2 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型分類(lèi)結(jié)果
樣本已觀(guān)測(cè)已預(yù)測(cè)01正確百分比(%)訓(xùn)練080396.41172357.5總計(jì)百分比(%)78.921.183.7測(cè)試035294.6171365.0總計(jì)百分比(%)73.726.384.2
2.3 重要性分析結(jié)果
表4為自變量的重要性及標(biāo)準(zhǔn)化的重要性。結(jié)果顯示,醫(yī)療風(fēng)險(xiǎn)影響因素重要性排序前6位的自變量及其標(biāo)準(zhǔn)化重要性分別為:住院費(fèi)用(100.0%)、住院天數(shù)(78.2%)、四周內(nèi)手術(shù)次數(shù)(61.4%)、感染(60.5%)、傷口愈合不良(54.0%)和手術(shù)并發(fā)癥(47.8%)。對(duì)醫(yī)療風(fēng)險(xiǎn)的影響作用最小的自變量是入院方式(17.8%)。
表4 醫(yī)療風(fēng)險(xiǎn)指標(biāo)的重要性
指標(biāo)重要性標(biāo)準(zhǔn)化的重要性(%)入院方式0.02317.8住院天數(shù)0.09978.2住院費(fèi)用0.127100.0四周內(nèi)手術(shù)次數(shù)0.07861.4非計(jì)劃再次手術(shù)0.05543.7輸血總量0.04838.0非正常進(jìn)入ICU天數(shù)0.04535.5病情危重0.04736.8病情突變0.05846.0搶救次數(shù)0.05946.3手術(shù)并發(fā)癥0.06147.8傷口愈合不良0.06854.0感染0.07760.5休克0.04837.6出院病情0.05140.6出院方式0.05845.4
3.1 神經(jīng)網(wǎng)絡(luò)模型效果分析
醫(yī)療風(fēng)險(xiǎn)成因復(fù)雜,受患者因素、疾病因素、醫(yī)院管理因素、醫(yī)務(wù)人員因素、社會(huì)因素等的影響[5]。本研究?jī)H納入了醫(yī)療風(fēng)險(xiǎn)的部分影響因素,所選16項(xiàng)指標(biāo)均是從醫(yī)院HIS系統(tǒng)調(diào)取的定量指標(biāo),不包含醫(yī)務(wù)人員技術(shù)水平、醫(yī)患溝通、患者期望值等定性指標(biāo)。所建立的神經(jīng)網(wǎng)絡(luò)模型對(duì)醫(yī)療風(fēng)險(xiǎn)總的預(yù)測(cè)正確率達(dá)80%以上,具有較強(qiáng)的預(yù)測(cè)效能,可以為醫(yī)療風(fēng)險(xiǎn)識(shí)別提供客觀(guān)依據(jù)。同時(shí),與多元線(xiàn)性回歸等模型相比,神經(jīng)網(wǎng)絡(luò)模型給出了所有自變量的敏感度,有利于綜合判斷各自變量對(duì)醫(yī)療風(fēng)險(xiǎn)的重要性。
3.2 建立醫(yī)療風(fēng)險(xiǎn)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的意義
醫(yī)療風(fēng)險(xiǎn)管理是醫(yī)療質(zhì)量管理的重要組成部分,醫(yī)療風(fēng)險(xiǎn)將直接影響醫(yī)療質(zhì)量。如何控制醫(yī)療風(fēng)險(xiǎn),降低風(fēng)險(xiǎn)發(fā)生率,是醫(yī)院管理者持續(xù)探索和關(guān)注的話(huà)題[6-7]。本研究所建立的醫(yī)療風(fēng)險(xiǎn)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,風(fēng)險(xiǎn)識(shí)別率高,對(duì)實(shí)時(shí)監(jiān)測(cè)、篩選醫(yī)療風(fēng)險(xiǎn),從而及時(shí)預(yù)防醫(yī)療風(fēng)險(xiǎn)發(fā)生有一定參考價(jià)值。同時(shí),為醫(yī)院風(fēng)險(xiǎn)管理提供了新的方法和思路,有利于進(jìn)一步深入挖掘風(fēng)險(xiǎn)成因,建立預(yù)警機(jī)制,總結(jié)歸納經(jīng)驗(yàn),改進(jìn)管理辦法,從源頭上遏止醫(yī)療風(fēng)險(xiǎn)的發(fā)生。
3.3 本研究的創(chuàng)新性和局限性
人工神經(jīng)網(wǎng)絡(luò)對(duì)資料的分布特征無(wú)特殊要求,能夠較好地解決非線(xiàn)性問(wèn)題等優(yōu)點(diǎn),在其他領(lǐng)域得到了廣泛應(yīng)用[8-9],并取得了良好效果,但在醫(yī)療風(fēng)險(xiǎn)預(yù)測(cè)方面的應(yīng)用較少。本研究嘗試將神經(jīng)網(wǎng)絡(luò)用于醫(yī)療風(fēng)險(xiǎn)預(yù)測(cè),并運(yùn)用SPSS軟件建立神經(jīng)網(wǎng)絡(luò)模型,與MATLAB等軟件相比,省去了復(fù)雜的編程麻煩,簡(jiǎn)單易操作。同時(shí),建立的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型效果較好,對(duì)醫(yī)院管理部門(mén)進(jìn)行醫(yī)療風(fēng)險(xiǎn)管理提供了參考。
但是,本研究?jī)H是基于RBF神經(jīng)網(wǎng)絡(luò)對(duì)醫(yī)療風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)的初步嘗試,結(jié)果仍然存在一定局限性。由于僅以合肥市某三甲醫(yī)院為例進(jìn)行分析,所用的數(shù)據(jù)資料均來(lái)自該院實(shí)際發(fā)生的案例,針對(duì)性較強(qiáng),研究結(jié)果是否具有良好推廣性還有待進(jìn)一步驗(yàn)證。
[1] 方鵬騫,謝金亮.人工神經(jīng)網(wǎng)絡(luò)在公立醫(yī)院監(jiān)管指標(biāo)體系中的應(yīng)用[J].中國(guó)醫(yī)院,2012,16(9):23-25.
[2] 鄒慧琴,李 碩,陶 歐,等. RBF神經(jīng)網(wǎng)絡(luò)在中醫(yī)藥領(lǐng)域中的應(yīng)用及其在SPSS 17.0 軟件中的實(shí)現(xiàn)[J].中華中醫(yī)藥學(xué)刊,2015,33(2):336-338.
[3] 劉 晴,許 蘋(píng),繩慧峰,等.醫(yī)院醫(yī)療風(fēng)險(xiǎn)預(yù)警預(yù)控指標(biāo)研究[J].中國(guó)醫(yī)院管理,2016,36(7):43-45.
[4] 賀 佳,尹 平.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2015.
[5] 劉 晴,許 蘋(píng),繩慧峰,等.軍隊(duì)某三甲醫(yī)院醫(yī)療糾紛發(fā)生特點(diǎn)及對(duì)策[J].解放軍醫(yī)院管理雜志,2016,23(5):415-417.
[6] 連 斌,秦 婷,吳 瓊,等.醫(yī)療風(fēng)險(xiǎn)防范調(diào)控體系研究[J].中國(guó)衛(wèi)生質(zhì)量管理,2006,13(1):1-4.
[7] 杜淑英,曹紅英,顧躍靜,等.醫(yī)療風(fēng)險(xiǎn)管理的實(shí)踐及體會(huì)[J].中國(guó)衛(wèi)生質(zhì)量管理,2013,20(2):43-44.
[8] 江 弋,林永鵬.RBF神經(jīng)網(wǎng)絡(luò)在股價(jià)預(yù)測(cè)中的應(yīng)用[J].心智與計(jì)算,2007,1(4):413-419.
[9] 王 敏,張開(kāi)金,姜 麗,等. BP神經(jīng)網(wǎng)絡(luò)技術(shù)在慢性病患者住院費(fèi)用研究中的應(yīng)用[J].中國(guó)衛(wèi)生經(jīng)濟(jì),2010,29(11):86-88.
修回日期:2016-12-16
責(zé)任編輯:吳小紅
Application of Artificial Neural Network in Medical Risk Prediction/
SHENG Huifeng,LIU Qing,XU Ping,et al.//
Objective To establish prediction model of medical risks based on artificial neural network, provide reference for effective prevention of medical risks. Methods With the admission form, length of stay and other variables as the input neurons, medical disputes group as the output neuron, using radial basis function (RBF) to establish neural network model, the occurrence of medical risk was predicted, and the factors on the role of health risk was evaluated. Results The prediction accuracies of the training sample and test sample were 83.7% and 84.2%, respectively. The top six importance of medical risk factors were hospitalization expenses (100.0%), length of stay (78.2%), four weeks’ operation times (61.4%), infection (60.5%), poor wound healing (54.0%) and complications (47.8%). Conclusion It is not affected by sample distribution features and data types to use RBF neural network to forecast the medical risks and has a good applicability.
Artificial Neural Network;Radial Basis Function;Medical Risk;Prediction; Application
10.13912/j.cnki.chqm.2017.24.4.07
國(guó)家社會(huì)科學(xué)基金資助項(xiàng)目(14AGL020)
陳春林 1 中國(guó)人民解放軍第105醫(yī)院 安徽 合肥 230031
2016-10-12
Chinese Health Quality Management,2017,24(4):15-17
繩慧峰1劉 晴2許 蘋(píng)3陳春林1*
2 安徽醫(yī)科大學(xué)解放軍臨床學(xué)院 安徽 合肥 230031 3 第二軍醫(yī)大學(xué)衛(wèi)勤系衛(wèi)生事業(yè)管理教研室 上海 200433
陳春林:解放軍105醫(yī)院院長(zhǎng)
E-mail:shenghuifeng8@163.com
中國(guó)衛(wèi)生質(zhì)量管理2017年4期