張駿,姬慧(.杭州市第三人民醫(yī)院,浙江 杭州;.杭州市中醫(yī)院,浙江 杭州)
邏輯回歸模型在醫(yī)療設(shè)備報(bào)廢評(píng)估輔助決策系統(tǒng)中的應(yīng)用
張駿1,姬慧2
(1.杭州市第三人民醫(yī)院,浙江杭州;2.杭州市中醫(yī)院,浙江杭州)
本文針對(duì)目前醫(yī)療設(shè)備報(bào)廢主要依據(jù)使用年限和臨床主觀意見的現(xiàn)狀,提出結(jié)合目前醫(yī)療設(shè)備信息化管理系統(tǒng),基于多參數(shù)的報(bào)廢評(píng)估輔助決策方法。利用邏輯回歸模型,對(duì)有內(nèi)在關(guān)聯(lián)的多個(gè)因素(包括:設(shè)備采購(gòu)價(jià)格、使用年限、維修次數(shù)、維修費(fèi)用、售后服務(wù)情況、安全記錄等)共同作用下做出的評(píng)估。并且將該評(píng)估方法應(yīng)用于醫(yī)療設(shè)備的報(bào)廢評(píng)估子系統(tǒng)中。
邏輯回歸模型;醫(yī)療設(shè)備;報(bào)廢評(píng)估;輔助決策
醫(yī)療器械報(bào)廢環(huán)節(jié)是醫(yī)院醫(yī)療器械管理中重要的環(huán)節(jié),目前醫(yī)院設(shè)備報(bào)廢除滿足規(guī)定使用年限外,主要靠使用科室申請(qǐng)和醫(yī)工部門的審核,存在較多的主觀因素,缺乏科學(xué)合理的評(píng)價(jià)依據(jù)。隨著醫(yī)療設(shè)備信息化管理的廣泛應(yīng)用,很多醫(yī)院都積累了大量的醫(yī)療設(shè)備相關(guān)數(shù)據(jù)。雖然人們可以在這些數(shù)據(jù)之上進(jìn)行分析和研究工作,但是進(jìn)行更高層次的處理時(shí),例如從中發(fā)現(xiàn)規(guī)律和模式,對(duì)如此龐大的數(shù)據(jù)進(jìn)行人工處理是非常困難。同時(shí),隨著數(shù)據(jù)在日常決策中的重要性越來(lái)越顯著,人們對(duì)數(shù)據(jù)處理技術(shù)的要求也不斷提高,例如得到數(shù)據(jù)的總體特征以及預(yù)測(cè)發(fā)展趨勢(shì)等,而這些功能對(duì)傳統(tǒng)的管理系統(tǒng)來(lái)說(shuō)是無(wú)法做到的。于是,人們希望有一種方法可以幫助處理這些十分繁雜的數(shù)據(jù),從中發(fā)現(xiàn)有價(jià)值的信息或知識(shí)為決策服務(wù),同時(shí)減輕工作負(fù)擔(dān)。[1]
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。[2]是一種利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過(guò)程,這些模型和關(guān)系可以用來(lái)做出預(yù)測(cè)。
醫(yī)療設(shè)備使用的安全性與有效性跟使用年限、工作環(huán)境、使用習(xí)慣、維護(hù)保養(yǎng)水平等眾多因素均有關(guān)聯(lián),而醫(yī)療設(shè)備的報(bào)廢除考慮設(shè)備安全性和有效性外,還需要考慮設(shè)備使用的經(jīng)濟(jì)效益。這些因素共同作用,決定醫(yī)療設(shè)備是否繼續(xù)使用。鑒于以上原因,本文提出利用邏輯回歸模型尋找其中的關(guān)系。
邏輯回歸(logistic Regression, LR)屬于概率型非線性回歸,它是研究二分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多元統(tǒng)計(jì)方法[3],是回歸方法的一種。回歸是通過(guò)具有已知值的變量來(lái)預(yù)測(cè)其它變量的值。在最簡(jiǎn)單的情況下,回歸采用最簡(jiǎn)單的線性回歸這樣的標(biāo)準(zhǔn)統(tǒng)計(jì)技術(shù)。但是很多問(wèn)題不是簡(jiǎn)單的線性回歸所能預(yù)測(cè)的,如在用醫(yī)療設(shè)備什么時(shí)候報(bào)廢更合理等很難用簡(jiǎn)單的線性模型來(lái)有效預(yù)測(cè)。因?yàn)槊枋鲞@類事件的變化所需的變量太多,如產(chǎn)品本身設(shè)計(jì)制造因素,環(huán)境因素,使用因素,后期維修狀況,經(jīng)濟(jì)效益等,且這些變量本身往往是非線性的,故要使用非線性的回歸方法,比如邏輯回歸,決策樹,神經(jīng)網(wǎng)絡(luò)等。在研究過(guò)程中,本文通過(guò)比較,提出利用邏輯回歸模型作為醫(yī)療設(shè)備報(bào)廢評(píng)估模型的設(shè)想。
圖1 醫(yī)療設(shè)備報(bào)廢評(píng)估系統(tǒng)總體結(jié)構(gòu)圖
3.1數(shù)據(jù)準(zhǔn)備
因醫(yī)療設(shè)備的報(bào)廢與眾多因素有關(guān),本文利用HIS系統(tǒng)中的記錄,調(diào)取:醫(yī)療設(shè)備裝機(jī)信息(包含設(shè)備類別、采購(gòu)價(jià)格、使用年限等信息)、維修次數(shù)、年因故障停機(jī)時(shí)間、累計(jì)維修金額、單次最大維修金額、工資費(fèi)用、修理用備件、常用消耗材料等信息[4],還需結(jié)合該設(shè)備是否還有零配件供應(yīng)、安全事故記錄、售后維修響應(yīng)情況等。
3.2數(shù)據(jù)清理與集成
數(shù)據(jù)清理主要解決樣本的不完整、噪聲和不一致的問(wèn)題,以優(yōu)化樣本,提高其后的挖掘過(guò)程的精度和性能。由于HIS中的維修記錄并不是根據(jù)數(shù)據(jù)挖掘的要求而記錄的,可能會(huì)存在某些數(shù)據(jù)的缺失,對(duì)于這類缺失的記錄,可以根據(jù)數(shù)據(jù)特性可以選用以下方法進(jìn)行填補(bǔ):
(1)常量填補(bǔ);
(2)用所有樣本的均值或同類樣本的均值填補(bǔ);
(3)根據(jù)工作經(jīng)驗(yàn)手工填補(bǔ)。[5]
而數(shù)據(jù)的集成,合并來(lái)自多個(gè)數(shù)據(jù)存儲(chǔ)的數(shù)據(jù),主要是為來(lái)自不同醫(yī)院、不同HIS系統(tǒng)的異構(gòu)數(shù)據(jù)進(jìn)行合并處理。使數(shù)據(jù)集達(dá)到有足夠多的樣本分布,同時(shí)又有助于減少結(jié)果數(shù)據(jù)集的冗余和不一致,有助于提高其后挖掘過(guò)程的準(zhǔn)確性和速度。[6]
3.3數(shù)據(jù)轉(zhuǎn)換與約簡(jiǎn)
在收集到足夠多的可利用的樣本數(shù)據(jù)后,還需要將這些數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘的形式,并將這些數(shù)據(jù)約簡(jiǎn)成一個(gè)精簡(jiǎn)的數(shù)據(jù)集合。數(shù)據(jù)約簡(jiǎn)策略包括:維歸約(減少所考慮的隨機(jī)變量或?qū)傩缘膫€(gè)數(shù))、數(shù)量歸約(用替代的、較小的數(shù)據(jù)表示形式替換原數(shù)據(jù))、數(shù)據(jù)壓縮(使用變換,以便得到原數(shù)據(jù)的歸約或壓縮表示)。
邏輯回歸模型的數(shù)學(xué)表達(dá)式為:
注:k-維自變量yi-實(shí)際觀察到的響應(yīng)變量;yi=1-事件發(fā)生;yi=0-事件未發(fā)生;Pi-第 i 個(gè)事件發(fā)生的概率(取值;在 0 到 1 之間);α-回歸截距;β1,…,βk-回歸系數(shù)。[7,8]
隨著多參數(shù)變量不斷增大,響應(yīng)變量Pi也不斷增大,如果選取恰當(dāng)?shù)亩鄠€(gè)因素作為自變量,令每一組自變量對(duì)應(yīng)的輸出概率為響應(yīng)變量,利用歷史數(shù)據(jù)或者預(yù)先定義的數(shù)據(jù)訓(xùn)練模型,就可以得到邏輯回歸模型的參數(shù)。
醫(yī)療設(shè)備報(bào)廢評(píng)估輔助決策具有二值性,即建議正常使用和建議報(bào)廢。決定設(shè)備是否報(bào)廢的因素用:使用年限、風(fēng)險(xiǎn)等級(jí)、故障頻率、維修費(fèi)用、維修響應(yīng)時(shí)間、新設(shè)備的價(jià)格等因素。因此,本文通過(guò)建立模型訓(xùn)練樣本,利用訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練,得到邏輯回歸模型參數(shù),然后利用該參數(shù)值來(lái)獲取決策信息。
4.1邏輯回歸模型訓(xùn)練與評(píng)估
本文利用已報(bào)廢設(shè)備的歷史數(shù)據(jù),經(jīng)過(guò)降噪、濾波等預(yù)處理后,進(jìn)行特征提取,得到訓(xùn)練用的初始特征集。然后設(shè)計(jì)一種搜索策略,來(lái)尋找最佳邏輯回歸模型??紤]到醫(yī)療設(shè)備的相關(guān)數(shù)據(jù)是屬于數(shù)據(jù)量相對(duì)較少,并且具有一定的先驗(yàn)知識(shí),因此可以選用貝葉斯統(tǒng)計(jì)方法評(píng)估模型。首先基于先驗(yàn)知識(shí),給定待估參數(shù)一個(gè)先驗(yàn)統(tǒng)計(jì)分布,然后根據(jù)貝葉斯公式,推算出參數(shù)的后驗(yàn)分布,最后最大化這個(gè)后驗(yàn)概率,獲得對(duì)應(yīng)的參數(shù)值。
4.2獲取報(bào)廢評(píng)估值
在HRP系統(tǒng)或HIS系統(tǒng)中,根據(jù)系統(tǒng)中設(shè)備的相關(guān)參數(shù),預(yù)處理后再乘以各自的權(quán)重,輸入到訓(xùn)練好的模型中即可作出是否報(bào)廢的建議。
在現(xiàn)有醫(yī)療設(shè)備信息化管理的條件下,通過(guò)利用醫(yī)療設(shè)備全壽命周期數(shù)據(jù)進(jìn)行決策支持,實(shí)現(xiàn)醫(yī)療設(shè)備報(bào)廢前進(jìn)行較為科學(xué)、準(zhǔn)確的評(píng)估,從而解決醫(yī)療設(shè)備績(jī)效、代價(jià)、風(fēng)險(xiǎn)等互相制約的難題。對(duì)于充分發(fā)揮信息化管理的優(yōu)勢(shì),提高醫(yī)工的勞動(dòng)價(jià)值和地位有著積極的作用。但在實(shí)施過(guò)程中可能也會(huì)面臨:數(shù)據(jù)收集問(wèn)題、樣本選取問(wèn)題、數(shù)據(jù)預(yù)處理問(wèn)題、與其它系統(tǒng)集成問(wèn)題等,需要在接下來(lái)的工作中逐步解決。
在大數(shù)據(jù)未出現(xiàn)之前,醫(yī)院通過(guò)對(duì)內(nèi)部HRP、HIS等信息系統(tǒng)的建設(shè),建立了高效的內(nèi)部統(tǒng)計(jì)報(bào)表,對(duì)醫(yī)院業(yè)務(wù)發(fā)展決策起到重要作用。但是,這些數(shù)據(jù)分析只是反映了冰山一角,是不全面的,更多潛在的有價(jià)值信息往往被忽略。在大數(shù)據(jù)時(shí)代,業(yè)務(wù)部門需要以更新的視角來(lái)面對(duì)大數(shù)據(jù),接受和利用好大數(shù)據(jù),以創(chuàng)造出更大的價(jià)值。[9]以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ)決策支持系統(tǒng)的研究,將大幅提高醫(yī)院的管理水平。[10]
[1]曾小麗,王中生.決策樹算法在評(píng)估中的應(yīng)用研究[J].電腦知識(shí)與技術(shù),2009,5(25):7314-7317.
[2]韓家煒,坎伯.數(shù)據(jù)挖掘:概念與設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2007.
[3]王濟(jì)川,郭志剛.logistic 回歸模型--方法與應(yīng)用[M].北京:高等教育出版社,2001.
[4]周明山,袁林.醫(yī)療設(shè)備運(yùn)行中的統(tǒng)計(jì)與核算[J].中國(guó)醫(yī)學(xué)裝備,2010,7(8):29-31.
[5]楊杰,姚莉秀.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[M].上海:上海交通大學(xué)出版社,2011.
[6]Jiawei Han, Micheline Kamber, Jian Pei.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012:61-62.
[7]羅富榮,劉文彬.基于邏輯回歸模型的地鐵工程建設(shè)多參數(shù)安全評(píng)估方法研究[C].Proceedings of 2010 International Conference on Management Science and Engineering (MSE 2010) (Volume 4).
[8]鐘金,劉文彬,楊劍鋒.基于邏輯回歸的滾動(dòng)軸承性能退化評(píng)估[J].科技信息,2010,16:504-505.
[9]深圳國(guó)泰安教育技術(shù)股份有限公司大數(shù)據(jù)事業(yè)部群.大數(shù)據(jù)導(dǎo)論――關(guān)鍵技術(shù)與行業(yè)應(yīng)用最佳實(shí)踐[M].北京:清華大學(xué)出版社,2015:8.
[10]莊軍,袁梅,劉侃,等.基于HIS下的決策支持系統(tǒng)的開發(fā)設(shè)想[J].醫(yī)學(xué)信息,2005,18(3):177-181.
Application of logistic regression model in the assistant decision system of medical equipment
ZHANG Jun1, JI Hui2
(1.Hangzhou Third Hospital, Zhejiang Hangzhou; 2.Hangzhou Hospital of Traditional Chinese Medicine,Zhejiang Hangzhou)
Aiming at the current situation of the medical equipment abandoned mainly according to the service life and the clinical subjective opinion, this paper puts forward the combination of the current medical equipment information management system, based on the multiple parameters of the decision making method. Using the logic regression model, the intrinsic connection of a number of factors (including: the purchase price of the equipment, the use of period, the number of maintenance, maintenance costs, after-sales service, safety record , etc.) together to make the evaluation. And the evaluation method is applied to the evaluation subsystem of medical equipment.
Logistic regression models; Medical equipment; Scrap evaluation; Assistant decision
浙江省醫(yī)院協(xié)會(huì)浙江省康恩貝醫(yī)院管理軟科學(xué)研究項(xiàng)目
項(xiàng)目名稱: 基于數(shù)據(jù)挖掘的醫(yī)療設(shè)備報(bào)廢評(píng)估研究
項(xiàng)目編號(hào): 2015ZHA-KEB322