王 瑜 鮑 鯤 黃婷婷 邵 新*
隨著醫(yī)學(xué)技術(shù)的發(fā)展,醫(yī)療設(shè)備在醫(yī)療診療活動(dòng)中的地位逐漸提高,逐步成為衡量醫(yī)療機(jī)構(gòu)規(guī)模、技術(shù)水平和現(xiàn)代化程度的重要標(biāo)志[1]。醫(yī)療設(shè)備的可靠性及運(yùn)行效能直接影響醫(yī)療技術(shù)水平,建立科學(xué)規(guī)范的醫(yī)療設(shè)備管理系統(tǒng)是確保醫(yī)療質(zhì)量的重要保障。其中,醫(yī)療儀器設(shè)備檔案的采集、查閱、分析和展示是應(yīng)用的重點(diǎn)。
在醫(yī)療設(shè)備信息化建設(shè)的發(fā)展中,不同業(yè)務(wù)領(lǐng)域分別構(gòu)建了對(duì)應(yīng)的信息系統(tǒng),快速積累了大量的設(shè)備信息數(shù)據(jù),在規(guī)模、結(jié)構(gòu)和使用等方面逐步形成了大數(shù)據(jù)環(huán)境,給數(shù)據(jù)管理及應(yīng)用帶來(lái)了挑戰(zhàn)?,F(xiàn)有醫(yī)療設(shè)備檔案相關(guān)業(yè)務(wù)系統(tǒng)在功能上雖提供了檢索、分析及展示功能,但無(wú)法滿足系統(tǒng)應(yīng)用的整體要求[2]。如何將不同業(yè)務(wù)系統(tǒng)間的數(shù)據(jù)集整合并運(yùn)用信息化手段和科學(xué)的分類、匯總和統(tǒng)計(jì)分析方法,將現(xiàn)有各業(yè)務(wù)模塊和查詢數(shù)據(jù)報(bào)表統(tǒng)一展現(xiàn),本研究基于Power BI工具的大數(shù)據(jù)分析,以醫(yī)療設(shè)備檔案科學(xué)管理為背景,建立多維數(shù)據(jù)檢索系統(tǒng),為不同應(yīng)用場(chǎng)景提供數(shù)據(jù)分析,為決策提供依據(jù)[3]。
醫(yī)療設(shè)備檔案管理中,設(shè)備檔案相關(guān)業(yè)務(wù)系統(tǒng)往往針對(duì)具體業(yè)務(wù)構(gòu)建,在應(yīng)用中缺乏整合和關(guān)聯(lián),尤其是數(shù)據(jù)查詢,往往需要跨庫(kù)查詢,應(yīng)用難度大,執(zhí)行效率低;檔案查詢及分析過程停留在靜態(tài)狀態(tài),依賴系統(tǒng)構(gòu)建時(shí)的功能設(shè)計(jì),無(wú)法滿足不斷更新的業(yè)務(wù)需求;檔案查詢通常采用數(shù)據(jù)報(bào)表和數(shù)據(jù)表的形式展現(xiàn)結(jié)果,缺乏靈活快捷的可視化展示工具。因此,醫(yī)療設(shè)備的檔案管理尚需實(shí)現(xiàn)下述功能。
醫(yī)療設(shè)備管理內(nèi)容的更新缺乏時(shí)效性和完整性,缺乏能全面覆蓋醫(yī)療設(shè)備管理內(nèi)容的應(yīng)用體系。因此,在分析業(yè)務(wù)需求的基礎(chǔ)上,各業(yè)務(wù)系統(tǒng)應(yīng)建立統(tǒng)一的標(biāo)準(zhǔn)化接口,使業(yè)務(wù)數(shù)據(jù)間的數(shù)據(jù)可按照標(biāo)準(zhǔn)設(shè)計(jì)自動(dòng)更新,并可通過數(shù)據(jù)結(jié)構(gòu)構(gòu)建、校準(zhǔn)和轉(zhuǎn)換,完成數(shù)據(jù)采集及質(zhì)量控制,提高數(shù)據(jù)的完整性、穩(wěn)定性和時(shí)效性。
大數(shù)據(jù)時(shí)代下,現(xiàn)有的醫(yī)療設(shè)備管理系統(tǒng)無(wú)法實(shí)現(xiàn)復(fù)雜結(jié)構(gòu)數(shù)字檔案的靈活快速管理需求。需要一種面對(duì)不同業(yè)務(wù)場(chǎng)景下的應(yīng)用需求,實(shí)現(xiàn)快速檢索和過濾多維度檢索條件,并對(duì)檢索結(jié)果進(jìn)行統(tǒng)計(jì)、排序和運(yùn)算,最終以各種統(tǒng)計(jì)圖的方式提供給決策者,輔助決策。
能夠根據(jù)數(shù)據(jù)模型實(shí)現(xiàn)數(shù)據(jù)的采集、整合、查閱、分析和展示等功能,提高系統(tǒng)應(yīng)用效率和靈活性。
目前,數(shù)據(jù)分析領(lǐng)域廣泛應(yīng)用的商業(yè)智能(business intelligence,BI),可基于數(shù)據(jù)倉(cāng)庫(kù)(data warehouse,DW)技術(shù)從海量數(shù)據(jù)中鉆取信息并挖掘知識(shí)[4-5]。BI技術(shù)層次及業(yè)務(wù)流程上包含提取轉(zhuǎn)換加載(extraction transformation loading,ETL)、DW、聯(lián)機(jī)分析處理(on-line analytical processing,OLAP)和數(shù)據(jù)挖據(jù)(data mining,DM)等多環(huán)節(jié),可為醫(yī)療設(shè)備管理提供技術(shù)支持,從而滿足醫(yī)療設(shè)備科學(xué)管理的現(xiàn)實(shí)需求[6-7]。因此,構(gòu)建支持異構(gòu)業(yè)務(wù)系統(tǒng)來(lái)源的混合架構(gòu)BI分析系統(tǒng)的多維數(shù)據(jù)檢索系統(tǒng),是解決當(dāng)前業(yè)務(wù)需求的有效方式。
多維數(shù)據(jù)檢索系統(tǒng)分為數(shù)據(jù)層、ETL及數(shù)據(jù)模型層、數(shù)據(jù)分析層和數(shù)據(jù)展示層。ETL及數(shù)據(jù)模型層可定期從業(yè)務(wù)系統(tǒng)中抽取數(shù)據(jù)到數(shù)據(jù)倉(cāng)庫(kù)。以醫(yī)療設(shè)備為主題構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù),在功能上可實(shí)現(xiàn)數(shù)據(jù)展示和查詢統(tǒng)計(jì)應(yīng)用,用戶可通過Web應(yīng)用、移動(dòng)端及Restful等方式提供數(shù)據(jù)訪問和統(tǒng)計(jì)分析服務(wù)。多維數(shù)據(jù)檢索系統(tǒng)結(jié)構(gòu)見圖1。
圖1 多維數(shù)據(jù)檢索系統(tǒng)結(jié)構(gòu)
Power BI是微軟公司出品的商業(yè)智能工具,具有經(jīng)濟(jì)、迭代更新快和使用便捷的優(yōu)點(diǎn),支持各種主流數(shù)據(jù)源連接,可對(duì)數(shù)據(jù)進(jìn)行編輯、數(shù)據(jù)建模和可視化展示,能滿足本研究醫(yī)療設(shè)備多維數(shù)據(jù)分析的設(shè)計(jì)需求,可為數(shù)據(jù)分析提供從源頭到末端的全流程服務(wù)[8]。Power BI工具由Power Pivot、Power Query和Power View模塊組成,其中Power Pivot模塊可實(shí)現(xiàn)數(shù)據(jù)建模,Power Query模塊工具可實(shí)現(xiàn)經(jīng)過篩選、合并、轉(zhuǎn)化和組合后的數(shù)據(jù)整合,Power View數(shù)據(jù)模塊可視化組件可提供多種數(shù)據(jù)展示樣式以匹配不同的場(chǎng)景使用。
目前,醫(yī)院現(xiàn)有的醫(yī)療設(shè)備檔案管理系統(tǒng)包括醫(yī)療設(shè)備綜合管理系統(tǒng)、醫(yī)療設(shè)備工作量管理系統(tǒng)、醫(yī)療設(shè)備計(jì)量與質(zhì)量控制管理系統(tǒng)以及固定資產(chǎn)管理系統(tǒng)等[9-10]。①醫(yī)療設(shè)備綜合管理系統(tǒng)以醫(yī)療設(shè)備出入庫(kù)管理工作為核心,包含儀器設(shè)備合同管理、儀器設(shè)備庫(kù)房管理、在用儀器設(shè)備檔案管理、儀器設(shè)備維修管理、儀器設(shè)備效率、效益管理、儀器設(shè)備退役處理、儀器設(shè)備折舊處理、儀器設(shè)備質(zhì)量等級(jí)調(diào)整處理、儀器設(shè)備綜合統(tǒng)計(jì)查詢以及子系統(tǒng)維護(hù)等11個(gè)子系統(tǒng),共40余個(gè)子功能,涵蓋醫(yī)療設(shè)備購(gòu)置到報(bào)廢的全過程;②醫(yī)療設(shè)備工作量管理系統(tǒng)以醫(yī)療設(shè)備管理人員為核心,包含人員字典、分組及工作量管理等業(yè)務(wù)內(nèi)容[11-12];③醫(yī)療設(shè)備計(jì)量與質(zhì)量控制系統(tǒng)包括受檢設(shè)備管理、檢測(cè)事件管理及檢測(cè)記錄管理等內(nèi)容;④固定資產(chǎn)管理系統(tǒng)以經(jīng)費(fèi)管理為核心,涉及資產(chǎn)入庫(kù)、出庫(kù)、標(biāo)識(shí)和賬目管理等業(yè)務(wù)內(nèi)容。由于上述系統(tǒng)業(yè)務(wù)數(shù)據(jù)主要圍繞醫(yī)療設(shè)備及其相關(guān)事件,因此,選擇醫(yī)療設(shè)備作為數(shù)據(jù)主題[13]。
多維數(shù)據(jù)檢索系統(tǒng)的數(shù)據(jù)建模數(shù)據(jù)劃分為設(shè)備及人員2個(gè)主題,其中,設(shè)備主題包括設(shè)備信息和設(shè)備事件,設(shè)備事件包含采購(gòu)、驗(yàn)收、出入庫(kù)、安裝、維修、維護(hù)養(yǎng)護(hù)、計(jì)量及質(zhì)量控制和報(bào)廢等;人員主題包括設(shè)備管理人員信息、分組、工作記錄、受訓(xùn)以及請(qǐng)(休)假等信息。設(shè)備主題數(shù)據(jù)來(lái)源于醫(yī)療設(shè)備綜合管理系統(tǒng)、計(jì)量與質(zhì)量控制管理系統(tǒng)、固定資產(chǎn)管理系統(tǒng)等;人員信息來(lái)源于醫(yī)療設(shè)備工作量管理系統(tǒng)以及請(qǐng)(休)假記錄、人員檔案和培訓(xùn)記錄等文檔記錄。數(shù)據(jù)主題模型見圖2。
圖2 多維數(shù)據(jù)檢索系統(tǒng)數(shù)據(jù)主題模型
使用Power Pivot模塊的“數(shù)據(jù)導(dǎo)入向?qū)А惫δ埽x擇數(shù)據(jù)表及試圖、檢索字段、更新周期和數(shù)據(jù)轉(zhuǎn)換,完成數(shù)據(jù)導(dǎo)入[13]。為實(shí)現(xiàn)多數(shù)據(jù)集關(guān)聯(lián)查詢,需要在不同數(shù)據(jù)集中建立關(guān)聯(lián)性,Power Pivot模塊可通過構(gòu)建事實(shí)表與維度表實(shí)現(xiàn)。以建立多維數(shù)據(jù)檢索系統(tǒng)的設(shè)備主題為例,設(shè)備檔案記錄、設(shè)備事件記錄及文檔記錄為事實(shí)表[14];設(shè)備類型字典、科室字典、生產(chǎn)廠家字典、代理廠家字典及經(jīng)費(fèi)來(lái)源等為維度表。
多維數(shù)據(jù)分析可通過Power Query模塊工具實(shí)現(xiàn),Power Query采用數(shù)據(jù)分析表達(dá)式(data analysis expressions,DAX)數(shù)據(jù)分析語(yǔ)言實(shí)現(xiàn)檢索功能,DAX支持Excel運(yùn)算式及Query查詢語(yǔ)言,便于功能移植及重構(gòu)。結(jié)合業(yè)務(wù)需求,集合數(shù)據(jù)模型及組織結(jié)構(gòu),整理分析業(yè)務(wù)模型7種,見表1。
表1 業(yè)務(wù)模型功能
以醫(yī)療設(shè)備檔案多維數(shù)據(jù)分析為例,抽取設(shè)備基礎(chǔ)信息、維修記錄、計(jì)量質(zhì)量控制等關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù),并分別針對(duì)招標(biāo)計(jì)劃、審批、采購(gòu)、驗(yàn)收記錄、維修記錄、報(bào)廢申請(qǐng)與批復(fù)等文本資料建立Mongo DB數(shù)據(jù)庫(kù)存儲(chǔ)文本記錄;采用Power Pivot模塊建立數(shù)據(jù)抽取策略,基于設(shè)備基礎(chǔ)信息建立記錄主索引,并以設(shè)備申請(qǐng)?zhí)?、序列?hào)(serial number,SN)、設(shè)備批復(fù)號(hào)及人員工號(hào)等建立多數(shù)據(jù)集合關(guān)聯(lián);分別以設(shè)備標(biāo)準(zhǔn)名、生產(chǎn)廠家、代理廠家、經(jīng)費(fèi)來(lái)源、事件類型、時(shí)間以及使用科室等維度建立多維數(shù)據(jù)查詢;按照維修參數(shù)(事件記錄數(shù)、維修費(fèi)用、維修設(shè)備類別和時(shí)間段)統(tǒng)計(jì)單項(xiàng)、多項(xiàng)或全部數(shù)據(jù),分析和推測(cè)設(shè)備組成、使用、故障及維護(hù)工作量等規(guī)律,并研究季節(jié)、型號(hào)規(guī)格、費(fèi)用以及使用科室等因素間因果關(guān)系,制定適合醫(yī)院發(fā)展的采購(gòu)及維修依據(jù)。
Power BI工具采用Power View模塊實(shí)現(xiàn)數(shù)據(jù)可視化功能,該組件具有操作簡(jiǎn)單和效率高的優(yōu)點(diǎn)[15]。Power View模塊中,通過定義可視化類型并選擇數(shù)據(jù)源快速創(chuàng)建可視化效果,支持基于數(shù)據(jù)表格建立預(yù)覽,幫助實(shí)現(xiàn)最佳闡述數(shù)據(jù)的可視化效果。Power View模塊搭配Power BI工具的其他組件形成數(shù)據(jù)建模、數(shù)據(jù)檢索和數(shù)據(jù)可視化一體化操作流程[16]。通過預(yù)定義數(shù)據(jù)模型,實(shí)現(xiàn)聯(lián)動(dòng)顯示,最終可通過構(gòu)建Restful服務(wù)、Power BI工具服務(wù)注冊(cè)和Web應(yīng)用模塊嵌入等方式發(fā)布,支持用戶通過客戶端應(yīng)用、Web頁(yè)面以及服務(wù)調(diào)用等方式訪問。
隨著醫(yī)療設(shè)備領(lǐng)域信息化的發(fā)展,面對(duì)日積月累的海量數(shù)據(jù),傳統(tǒng)分析手段已無(wú)法滿足快速而簡(jiǎn)便地分析利用數(shù)據(jù)的難題。近年來(lái)涌現(xiàn)出的分析方法中,Power BI工具的解決方案以其特有的優(yōu)勢(shì),在類似應(yīng)用環(huán)境中取得了廣泛的應(yīng)用,該策略主要包括數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)建模、數(shù)據(jù)分析和數(shù)據(jù)展示等步驟。通過數(shù)據(jù)建模,在異構(gòu)數(shù)據(jù)源中整合并實(shí)現(xiàn)符合條件的查詢,采用圖形化、動(dòng)態(tài)化數(shù)據(jù)報(bào)表,展示事實(shí)表與維度表相互的關(guān)聯(lián)和變化。在面對(duì)海量數(shù)據(jù)管理和復(fù)雜分析需求時(shí),用戶可通過圖形化操作界面采取拖拽、點(diǎn)擊等簡(jiǎn)單操作解決醫(yī)療設(shè)備管理中日趨復(fù)雜的業(yè)務(wù)統(tǒng)計(jì)分析要求。
基于Power BI工具應(yīng)用于醫(yī)療設(shè)備數(shù)據(jù)分析的多維數(shù)據(jù)檢索系統(tǒng),降低了數(shù)據(jù)利用難度,增強(qiáng)了設(shè)備檔案查閱的即時(shí)性,可幫助設(shè)備管理人員快速歸檔并調(diào)閱醫(yī)療設(shè)備檔案信息。在測(cè)試應(yīng)用過程中,以查詢某季度某種類型設(shè)備維修及維護(hù)信息(包括計(jì)量檢定及日常維護(hù))為例,通過35次的查詢時(shí)間平均值顯示,基于Power BI工具的多維數(shù)據(jù)檢索系統(tǒng)查詢時(shí)間隨業(yè)務(wù)復(fù)雜度變化仍較穩(wěn)定,尤其是查詢業(yè)務(wù)為多維度且涉及跨庫(kù)數(shù)據(jù)集時(shí),手工查詢無(wú)法直接實(shí)現(xiàn)跨庫(kù)查詢,單庫(kù)查詢結(jié)果需要人工整合實(shí)現(xiàn),而基于Power BI工具的多維數(shù)據(jù)檢索系統(tǒng)查詢統(tǒng)計(jì)呈現(xiàn)出顯著優(yōu)勢(shì)。針對(duì)120萬(wàn)條關(guān)聯(lián)測(cè)試記錄進(jìn)行單條件跨庫(kù)查詢,多維數(shù)據(jù)檢索系統(tǒng)的平均查詢速度為48 ms,而手工跨庫(kù)查詢平均為770 ms,多維數(shù)據(jù)檢索系統(tǒng)的平均查詢速度為手工跨庫(kù)查詢的16倍。與此同時(shí),基于Power BI工具的多維數(shù)據(jù)檢索系統(tǒng)應(yīng)用于設(shè)備管理能規(guī)范醫(yī)療設(shè)備檔案管理流程,降低人為文檔交接、查詢、歸檔及備份等日常工作量,可增強(qiáng)數(shù)據(jù)的安全性,提高工作質(zhì)量以及醫(yī)院設(shè)備管理質(zhì)量和效率。多維數(shù)據(jù)檢索系統(tǒng)查詢性能測(cè)試比較見圖3。
圖3 多維數(shù)據(jù)檢索系統(tǒng)查詢性能測(cè)試比較
本研究基于Power BI工具的多維數(shù)據(jù)檢索系統(tǒng),實(shí)現(xiàn)了多渠道數(shù)據(jù)源資源整合,能以低耦合性和高擴(kuò)展性方式實(shí)現(xiàn)已有的醫(yī)療設(shè)備數(shù)據(jù)對(duì)接,為建立醫(yī)療設(shè)備全生命周期管理創(chuàng)造了平臺(tái)條件。以大數(shù)據(jù)為契機(jī),轉(zhuǎn)變管理模式,從傳統(tǒng)的被動(dòng)數(shù)據(jù)統(tǒng)計(jì)向知識(shí)發(fā)現(xiàn)和信息服務(wù)方向發(fā)展,凸顯了檔案數(shù)據(jù)在醫(yī)療設(shè)備管理中的價(jià)值,提升了醫(yī)療設(shè)備管理的科學(xué)性,為醫(yī)療設(shè)備全生命周期監(jiān)管提供信息支持。
基于Power BI工具工作組件及其處理流程設(shè)計(jì)的多維數(shù)據(jù)檢索系統(tǒng),實(shí)現(xiàn)了面向醫(yī)療設(shè)備、人員為業(yè)務(wù)主題的多維分析模型,可滿足靈活高效的醫(yī)療設(shè)備信息整合需求以及醫(yī)療設(shè)備管理中普遍存在的數(shù)據(jù)采集、檢索、分析及展示等現(xiàn)實(shí)需求,支持異構(gòu)化數(shù)據(jù)集成及業(yè)務(wù)擴(kuò)展,提高了醫(yī)療設(shè)備檔案管理的科學(xué)性,為醫(yī)療設(shè)備信息化建設(shè)構(gòu)建類似業(yè)務(wù)系統(tǒng)提供參考。