摘 要:基于現(xiàn)行三級公立中醫(yī)醫(yī)院績效考核辦法,使用數(shù)據(jù)挖掘技術(shù)對中醫(yī)特色治療相關(guān)指標(biāo)進行深入分析。采用無監(jiān)督學(xué)習(xí)算法,將中醫(yī)特色治療項目數(shù)據(jù)進行分類,實現(xiàn)對科室績效考核目標(biāo)的多維度評價。該研究通過構(gòu)建CK-means聚類模型,使用三種特征工程方法對中醫(yī)特色治療相關(guān)指標(biāo)進行預(yù)處理,然后使用優(yōu)化后的CK-means模型進行無監(jiān)督的聚類訓(xùn)練。改變傳統(tǒng)科室考核劃分模式,將全院科室分為5類。根據(jù)分類結(jié)果,制定并優(yōu)化更具有中醫(yī)特色的科室考核方法,為三級中醫(yī)醫(yī)院的良好發(fā)展提供支持與保障。
關(guān)鍵詞:精細化運營;中醫(yī)特色;聚類算法;績效考核
中圖分類號:TP391.1 文獻標(biāo)識碼:A 文章編號:2096-4706(2024)16-0118-05
Research on Performance Appraisal Indicators of Traditional Chinese Medicine Characteristic Treatment Based on Data Mining
Abstract: Based on the current performance appraisal method for tertiary public Traditional Chinese Medicine hospitals,this paper uses data mining technology to analyze the related indicators of TCM characteristic treatment. In order to achieve multi-dimensional evaluation of department performance appraisal goals, the Unsupervised Learning algorithm is used to classify data on the TCM characteristic treatment projects. The research uses three feature engineering methods to preprocess TCM characteristic treatment related indicators through constructing CK-means clustering model, then uses the improved CK-means model for unsupervised clustering training. It changes the traditional division mode of department assessment and divides the entire departments of the hospital into 5 clusters. Based on the classification results, department assessment methods with more TCM characteristics can be developed and optimized to provide support and guarantee for the good development of tertiary TCM hospitals.
Keywords: refine operation; Traditional Chinese Medicine characteristic treatment; clustering algorithm; performance appraisal
0 引 言
隨著我國醫(yī)療改革的不斷推進,優(yōu)化和完善醫(yī)院的績效考核成為醫(yī)院管理者著重面對和跟進的工作之一[1]。2019年,國家衛(wèi)健委組織開展首次全國三級公立醫(yī)院績效考核工作,以達到提升三級公立醫(yī)院總體管理水平和服務(wù)質(zhì)量的目的,進而為人民群眾提供更加高效、優(yōu)質(zhì)的醫(yī)療衛(wèi)生服務(wù)[2]。隨后,國家中醫(yī)藥管理局根據(jù)《國務(wù)院辦公廳印發(fā)關(guān)于加快中醫(yī)藥特色發(fā)展若干政策措施的通知》《國務(wù)院辦公廳關(guān)于推動公立醫(yī)院高質(zhì)量發(fā)展的意見》等政策文件印發(fā)《國家三級公立中醫(yī)醫(yī)院績效考核操作手冊》[3],旨在通過績效考核的引導(dǎo),促進三級公立中醫(yī)醫(yī)院臨床診療和服務(wù)能力全面提升,在一定程度上轉(zhuǎn)變?nèi)壒⒅嗅t(yī)醫(yī)院在醫(yī)院資源配置、優(yōu)勢學(xué)科發(fā)展和人才培養(yǎng)等方面的模式,積極為廣大人民群眾提供優(yōu)質(zhì)高效的醫(yī)療服務(wù)[4]。
目前我國從三級公立中醫(yī)醫(yī)院績效評價66項指標(biāo)中選取34項監(jiān)測指標(biāo)進行分析評價,由醫(yī)療質(zhì)量、運營效率、持續(xù)發(fā)展、滿意度評價4個方面的指標(biāo)構(gòu)成[5]。其中包括門診中藥處方比例、門診散裝中藥飲片和小包裝中藥飲片處方比例、門診患者中藥飲片使用率、出院患者中藥飲片使用率、門診患者使用中醫(yī)非藥物療法比例等獨具中醫(yī)特色的績效考核指標(biāo)。本研究使用數(shù)據(jù)挖掘技術(shù)將中醫(yī)特色治療考核指標(biāo)作為變量進行無監(jiān)督學(xué)習(xí)訓(xùn)練,得到以中醫(yī)特色治療指標(biāo)為基礎(chǔ)的科室劃分結(jié)果,為醫(yī)院管理者在科室目標(biāo)管理決策和績效考核方面提供參考,制定并優(yōu)化更具有中醫(yī)特色的科室考核方法,為三級中醫(yī)醫(yī)院的良好發(fā)展提供支持與保障。
1 研究方法
隨著我國醫(yī)療改革的深入推進和醫(yī)療信息化建設(shè)的快速發(fā)展,公立醫(yī)院的運營壓力不斷增大,機器學(xué)習(xí)等人工智能技術(shù)被逐漸運用到醫(yī)院管理決策工作中。
1.1 研究思路框架
本文首先從HIS抽取中醫(yī)特色治療相關(guān)數(shù)據(jù),然后使用區(qū)間縮放、歸一化和單變元函數(shù)變換三種特征工程方法進行特征處理,最后進行CK-means模型的構(gòu)建與訓(xùn)練,最終得到最優(yōu)的科室聚類結(jié)果。研究思路框架如圖1所示。
1.2 特征工程
特征工程具體包括:數(shù)據(jù)清洗、特征選擇、特征構(gòu)造、特征預(yù)處理等[6]。由于本文所用到的數(shù)據(jù)特征已經(jīng)根據(jù)《國家三級公立中醫(yī)醫(yī)院績效考核操作手冊》中的中醫(yī)特色治療類指標(biāo)進行選取,同時從HIS中抽取的數(shù)據(jù)無缺失值,因此本文的特征工程主要研究工作落在特征的無量綱化處理[7],即使用區(qū)間縮放[8]、歸一化[9]和自定義變換函數(shù)進行預(yù)處理,計算公式如式(1)至式(3)所示:
其中,Xi為數(shù)據(jù)特征項,Xmin為該列特征項中的最小值,Xmax為該列最大值。
本文的源數(shù)據(jù)是依據(jù)門診科室就診情況進行統(tǒng)計的,每項特征都與科室掛號總量息息相關(guān),因此本文擬在特征工程階段將源數(shù)據(jù)進行比重轉(zhuǎn)換。
1.3 模型選擇
聚類算法是一種無監(jiān)督學(xué)習(xí)的方法,其目的是將數(shù)據(jù)劃分成有意義或有用的簇。它是一種迭代求解的聚類分析算法,與監(jiān)督學(xué)習(xí)最大的區(qū)別是不需要預(yù)先標(biāo)注好的訓(xùn)練集,通過不斷地更新數(shù)據(jù)到簇中心的距離,得到簇內(nèi)相似性最大和簇間差異性最大的聚類結(jié)果,常見的距離計算方法包括曼哈頓距離[10]、余弦相似性距離[11]、歐氏距離[12]等。K均值(K-means)是聚類算法中最流行的算法模型之一[13],它將數(shù)據(jù)劃分為K簇,直觀上看,簇是一組一組聚集在一起測數(shù)據(jù),而簇中所有數(shù)據(jù)的均值被稱為該簇的質(zhì)心。在K-means算法中,核心任務(wù)就是根據(jù)設(shè)定好的簇心k,找出最優(yōu)的質(zhì)心,并將離這些質(zhì)心最近的數(shù)據(jù)分配到該質(zhì)心所代表的簇,本文提出的CK-means模型能自動選擇最優(yōu)的超參數(shù),使聚類結(jié)果最優(yōu)。
1.4 模型評估
選取輪廓系數(shù)[14]、CH分數(shù)[15]和戴維森堡丁指數(shù)[16]三項聚類算法常用的模型評估指標(biāo)對本文CK-means聚類模型進行評估。計算公式如式(4)至式(6)所示:
其中,a(i)計算簇內(nèi)不相似度,為每個樣本到同簇內(nèi)其他樣本點的平均距離,體現(xiàn)凝聚度,b(i)計算簇間不相似度,為每個樣本到其他簇平均距離的最小值,體現(xiàn)分離度。
其中,Bk為簇間協(xié)方差矩陣,Wk為簇內(nèi)協(xié)方差,tr為矩陣的跡,k為質(zhì)心個數(shù),n為樣本數(shù)量。
其中,k為簇的個數(shù),ci為第i個簇的質(zhì)心,σi為簇i中所有樣本到質(zhì)心的平均距離,cj為第j個簇的質(zhì)心,σj為簇j中所有樣本到質(zhì)心的平均距離,d(ci,cj)為質(zhì)心ci和cj質(zhì)心之間的距離。
2 實驗過程分析
2.1 數(shù)據(jù)描述
本文使用甘肅省某三級甲等中醫(yī)院2023年1月,95個門診科室的中醫(yī)特色治療數(shù)據(jù)作為源數(shù)據(jù)集,使用3種方法對數(shù)據(jù)進行特征工程處理和模型的訓(xùn)練。源數(shù)據(jù)包括6個特征,具體特征描述如表1所示。
2.2 特征處理
本文在訓(xùn)練模型之前,希望通過特征工程技術(shù),將源數(shù)據(jù)進行處理,使得處理后的數(shù)據(jù)集在輸入到模型后,使得模型能得到更好的聚類效果。因此使用了1.2小節(jié)提出的3種特征工程方法對數(shù)據(jù)進行預(yù)處理,最終得到處理后的部分數(shù)據(jù)樣例如表2至表4所示。
2.3 模型訓(xùn)練及優(yōu)化
為使本研究基礎(chǔ)模型K-means盡可能達到相對理想的訓(xùn)練結(jié)果,本文使用優(yōu)化函數(shù)C同步進行模型的訓(xùn)練及優(yōu)化,使模型能自動得到不同質(zhì)心下的模型聚類結(jié)果,進而得到最優(yōu)的中醫(yī)特色治療科室聚類結(jié)果。模型關(guān)鍵步驟如算法1。
算法1:CK-means算法
本文使用CK-means算法模型對區(qū)間縮放法得到的特征集(Feature1)、歸一化得到特征集(Feature2)和自定義函數(shù)變換得到的特征集(Feature3)進行訓(xùn)練。訓(xùn)練結(jié)果發(fā)現(xiàn)特征集(Feature2)在質(zhì)心k=4時,CK-means模型的輪廓系數(shù)和CH分數(shù)最大,而在k=9時,戴維森堡丁指數(shù)最小。特征集(Feature3)在質(zhì)心k=4時,CK- means模型的輪廓系數(shù)和CH分數(shù)最大,而在k=6時,戴維森堡丁指數(shù)最小。特征集(Feature1)在質(zhì)心k=5時,區(qū)間縮放法得到的CK-means模型的輪廓系數(shù)和CH分數(shù)最大,同時戴維森堡丁指數(shù)最小,故模型得到最優(yōu)的聚類結(jié)果,最優(yōu)模型訓(xùn)練結(jié)果如圖2所示。
由模型優(yōu)化訓(xùn)練結(jié)果可知,在質(zhì)心k=4時,歸一化得到CK-means模型的輪廓系數(shù)和CH分數(shù)最大,而在k=9時,戴維森堡丁指數(shù)最小,因此先保留質(zhì)心k=4和k=9時構(gòu)建的模型;在質(zhì)心k=4時,自定義函數(shù)變換得到CK-means模型的輪廓系數(shù)和CH分數(shù)最大,而在k=6時,戴維森堡丁指數(shù)最小,因此先保留質(zhì)心k=4和k=6時構(gòu)建的模型進行進一步實驗。
3 實驗結(jié)果
實驗一:針對三種特征工程方法,當(dāng)選取不同的質(zhì)心時,對模型評價指標(biāo)進行對比。
實驗二:對比三種特征工程方法下CK-means模型的聚類結(jié)果,選取每個特征工程方法下的最優(yōu)質(zhì)心和最佳的CK-means模型。
3.1 實驗一模型對比
使用三種特征工程方法,依次記錄CK-means模型中質(zhì)心取值在k∈[4,10]時,模型的評價指標(biāo),詳細內(nèi)容如表5、表6、表7所示。
由表5可知,當(dāng)k=5時,CK-means模型輪廓系數(shù)為0.618,有較好的聚類結(jié)果。由表6知,當(dāng)k=4時,CK-means模型輪廓系數(shù)為0.413,CH分數(shù)最大至63.943,有較好的聚類效果。戴維森堡丁指數(shù)是在k=9時達到最小值0.909。由表7可知,當(dāng)k=4時,CK-means模型輪廓系數(shù)為0.311,CH分數(shù)最大至57.403,戴維森堡丁指數(shù)在k=6時呈現(xiàn)最小值1.122。
3.2 實驗二模型對比
在將區(qū)間縮放法得到的數(shù)據(jù)作為特征集進行模型優(yōu)化訓(xùn)練時,選取質(zhì)心k=5時,CK-means優(yōu)化模型的聚類效果最優(yōu),模型聚類結(jié)果如圖3所以。
在將歸一化方法得到的數(shù)據(jù)作為特征集進行模型優(yōu)化訓(xùn)練時,根據(jù)2.2小節(jié)優(yōu)化結(jié)果,分別將k=4和k=9作為質(zhì)心進行模型聚類訓(xùn)練,發(fā)現(xiàn)當(dāng)k=4和k=9時模型的聚類結(jié)果在散點圖中的分布效果均不理想。在將自定義函數(shù)方法得到的數(shù)據(jù)作為特征集進行模型優(yōu)化訓(xùn)練時,根據(jù)2.2小節(jié)優(yōu)化結(jié)果,分別將k=4和k=6作為質(zhì)心進行聚類,結(jié)果發(fā)現(xiàn)質(zhì)心k=4時CK-means模型的聚類效果比k=6時的聚類效果好。效果圖如圖4、圖5所示。
綜合對比三種方法及不同質(zhì)心下的模型聚類結(jié)果發(fā)現(xiàn),使用區(qū)間縮放法作為特征集進行CK-means聚類模型訓(xùn)練時,模型得到的聚類效果是最優(yōu)。本文研究得到的科室劃分結(jié)果示例如表8所示。
4 結(jié) 論
在本研究中,使用CK-means聚類模型得到最優(yōu)的科室聚類結(jié)果,在醫(yī)院原有4類科室分類:內(nèi)科、外科、骨科和其他科室的體系模式下,提出基于中醫(yī)特色治療角度的科室劃分,將95個科室劃分為5類,在醫(yī)院現(xiàn)行考核管理制度下,給醫(yī)院管理決策者提供多維度且適用于中醫(yī)醫(yī)院的科室分類考核辦法,客觀的評價科室目標(biāo),促進三級公立中醫(yī)醫(yī)院績效考核工作的規(guī)范化、標(biāo)準化和同質(zhì)化。
數(shù)據(jù)挖掘技術(shù)在中醫(yī)醫(yī)院績效考核方面的應(yīng)用可以帶來廣泛的影響和改變,數(shù)據(jù)挖掘在這一領(lǐng)域的潛在貢獻主要包括:
1)定量化和客觀化指標(biāo):數(shù)據(jù)挖掘可用于發(fā)現(xiàn)和驗證客觀的績效考核指標(biāo),減少人為因素影響,提高考核的公平性和準確性。
2)預(yù)測分析:利用歷史數(shù)據(jù),數(shù)據(jù)挖掘可以預(yù)測未來的績效趨勢,幫助醫(yī)院及時調(diào)整管理策略,改善服務(wù)質(zhì)量和運營效率。
3)揭示隱性知識:通過分析大量復(fù)雜的醫(yī)療數(shù)據(jù),可以揭示醫(yī)療服務(wù)、運營管理等方面的深層次規(guī)律和關(guān)聯(lián)性,為決策提供科學(xué)依據(jù)。
4)個性化評估:數(shù)據(jù)挖掘可以幫助制定更加個性化的績效考核指標(biāo),根據(jù)不同科室特點、醫(yī)生專長等因素調(diào)整評估標(biāo)準。
5)優(yōu)化資源配置:數(shù)據(jù)挖掘可用于分析醫(yī)院資源利用情況,幫助醫(yī)院更有效地分配人力、物資和財力資源,提高資源使用效率。
6)支持政策制定:數(shù)據(jù)挖掘分析結(jié)果可以用于支持中醫(yī)醫(yī)院的政策制定,包括人才培養(yǎng)、科研方向選擇、服務(wù)項目開發(fā)等。
總體而言,數(shù)據(jù)挖掘的應(yīng)用能夠使中醫(yī)醫(yī)院在績效考核方面實現(xiàn)更加精細化的管理,實現(xiàn)數(shù)據(jù)驅(qū)動的決策支持,為提升整體醫(yī)療服務(wù)和管理水平提供強有力的支撐。
參考文獻:
[1] 段志祥.淺析國家三級公立中醫(yī)醫(yī)院的績效考核 [J].新疆中醫(yī)藥,2022,40(3):91-93.
[2] 國務(wù)院辦公廳關(guān)于加強三級公立醫(yī)院績效考核工作的意見 [J].中華人民共和國國務(wù)院公報,2019(5):22-30.
[3] 國家中醫(yī)藥管理局.國家中醫(yī)藥管理局綜合司關(guān)于印發(fā)國家三級公立中醫(yī)醫(yī)院績效考核操作手冊(2023版)的通知 [EB/OL].[2024-01-08].https://www.huangshan.gov.cn/zwgk/public/6615714/11508466.html.
[4] 吳凌放.改革中的我國醫(yī)院績效管理:現(xiàn)況、困境與出路 [J].同濟大學(xué)學(xué)報:社會科學(xué)版,2018,29(2):118-124.
[5] 朱靜.三級公立中醫(yī)醫(yī)院績效考核背景下病案首頁質(zhì)量控制系統(tǒng)研究與實現(xiàn) [D].長沙:湖南中醫(yī)藥大學(xué),2022.
[6] 毛德磊.基于特征工程的協(xié)同過濾算法研究 [D].重慶:西南大學(xué),2019.
[7] 李興奇,高曉紅.無量綱化方法的有效性評價 [J].統(tǒng)計與決策,2021,37(15):24-28.
[8] 石逸.區(qū)間型數(shù)據(jù)多維標(biāo)度分析方法研究及應(yīng)用 [D].廈門:廈門大學(xué),2021.
[9] YU L J,GAO X S. Improve Robustness and Accuracy of Deep Neural Network with L2, Normalization [J].Journal of Systems Science &Complexity,2023,36(1):3-28.
[10] 陶維青,李雪婷,華玉婷,等.基于曼哈頓平均距離和余弦相似度的配網(wǎng)單相接地故障定位 [J].電力工程技術(shù),2023,42(2):130-138.
[11] 郝少璞,劉全,徐平安,等.基于余弦相似度的多模態(tài)模仿學(xué)習(xí)方法 [J].計算機研究與發(fā)展,2023,60(6):1358-1372.
[12] 陳奕延,李曄,李存金.一種基于密度峰值的針對模糊混合數(shù)據(jù)的聚類算法 [J].計算機工程與科學(xué), 2020,42(2):317-324.
[13] 張繼孔,劉艷.基于數(shù)據(jù)挖掘中聚類算法研究與應(yīng)用 [J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2023(12):39-41.
[14] KHALEDIAN E,PANDEY S,KUNDU P,et al. Real-Time Synchrophasor Data Anomaly Detection and Classification Using Isolation Forest, KMeans,and LoOP [J].IEEE Transactions on Smart Grid,2021,12(3):2378-2388.
[15] 鄒臣嵩,段桂芹.基于改進K-medoids的聚類質(zhì)量評價指標(biāo)研究 [J].計算機系統(tǒng)應(yīng)用,2019,28(6):235-242.
[16] 黃曉輝,王成,熊李艷,等.一種集成簇內(nèi)和簇間距離的加權(quán)k-means聚類方法 [J].計算機學(xué)報,2019,42(12):2836-2848.