陳凌宇,鄧金城,盧燕妮
(1.玉林市第一人民醫(yī)院腫瘤科,廣西玉林 537000;2.深影醫(yī)療科技(深圳)有限公司,廣東深圳 518109;3.廣西醫(yī)科大學附設玉林衛(wèi)生學校學生工作部門,廣西玉林 537000)
放療數(shù)據(jù)是惡性腫瘤治療過程中產(chǎn)生的相關(guān)數(shù)據(jù),其產(chǎn)生的途徑主要分為3方面,一是由醫(yī)院信息管理系統(tǒng)、電子健康記錄以及個人健康記錄中產(chǎn)生;二是由放射治療計劃管理中產(chǎn)生;三是由醫(yī)學影像設備產(chǎn)生[1]。這些放射數(shù)據(jù)中包含患者所有的個人信息、診斷結(jié)果、治療記錄以及用藥和住院治療等多個方面的詳細信息[2];這些信息結(jié)構(gòu)復雜,類別較多,包含醫(yī)學影響、診斷記錄、病歷檔案等,整體可分為結(jié)構(gòu)化信息、半結(jié)構(gòu)化信息以及非結(jié)構(gòu)化信息[3],具有顯著的多源異構(gòu)特性,因此在一定程度上呈現(xiàn)相互孤立、且分散程度較高等分布狀態(tài)。除此之外,放療數(shù)據(jù)存儲于不同的治療科室內(nèi),導致醫(yī)生在進行臨床應用時,無法全面掌握數(shù)據(jù)情況,到時數(shù)據(jù)的可利用程度較低[4]。近幾年惡性腫瘤的臨床治療病例顯著增加,各大醫(yī)院對于該類患者進行治療過程中,均需依據(jù)放療數(shù)據(jù)完成,因此,導致各大醫(yī)院對于放療數(shù)據(jù)的管理需求也逐漸增加,如何有效、全面、合理的實現(xiàn)放療數(shù)據(jù)的整合和管理[5],對于患者情況的掌握以及其放療數(shù)據(jù)的分析具有重要意義。
數(shù)據(jù)挖掘技術(shù)屬于人工智能領域中的一項重要的大數(shù)據(jù)處理技術(shù),該技術(shù)具有良好的大數(shù)據(jù)處理能力,可獲取海量數(shù)據(jù)中的隱藏信息。并且該技術(shù)具有不同類型數(shù)據(jù)的挖掘和處理能力[6],能夠較好地完成具有多源異構(gòu)特性的分析和處理;除此之外,其還能夠完成數(shù)據(jù)庫的挖掘。因此,本文針對放療數(shù)據(jù)的管理需求,提出基于數(shù)據(jù)挖掘的放療數(shù)據(jù)分析與評估技術(shù),并對該技術(shù)的應用情況展開相關(guān)分析和測試。
由于放療數(shù)據(jù)為多源異構(gòu)數(shù)據(jù),數(shù)據(jù)的類別較多、結(jié)構(gòu)較為復雜,因此,本文為實現(xiàn)放療數(shù)據(jù)的全面、有效管理,主要依據(jù)基于數(shù)據(jù)挖掘模型進行放療數(shù)據(jù)的挖掘,該模型結(jié)構(gòu)如圖1描述。
圖1 放療數(shù)據(jù)挖掘模型結(jié)構(gòu)
數(shù)據(jù)挖掘模型在進行放療數(shù)據(jù)挖掘時,可以對各個部門中的患者檔案、電力病例以及相關(guān)治療記錄文檔和表格進行深度挖掘,并且對挖掘和抽取的放療數(shù)據(jù)進行加載和轉(zhuǎn)換處理后,實現(xiàn)放療數(shù)據(jù)的高效整合[7],以此構(gòu)建統(tǒng)一的元數(shù)據(jù)庫。以元數(shù)據(jù)庫為基礎,利用數(shù)據(jù)引擎獲取其中的放療數(shù)據(jù)和信息,并且通過可視化界面,將所需的放療數(shù)據(jù)呈現(xiàn)給用戶。通過該模型即可有效解決臨床中放療數(shù)據(jù)的分散現(xiàn)象,實現(xiàn)放療數(shù)據(jù)的整體化管理,提升放療數(shù)據(jù)的管理水平。
由圖1 可知,放療數(shù)據(jù)庫的構(gòu)建是以元數(shù)據(jù)庫為基礎,因此,本文為保證放療數(shù)據(jù)庫構(gòu)建后數(shù)據(jù)的調(diào)用能力以及數(shù)據(jù)完整性,文中采用MVC 框架作為放療數(shù)據(jù)的數(shù)據(jù)庫結(jié)構(gòu),該框架主要分為模型層、視圖層以及控制層,通過3層之間的相互支撐,完成數(shù)據(jù)庫基礎結(jié)構(gòu)的構(gòu)建。其中,模型層是數(shù)據(jù)庫框架的基礎,其主要作用是為數(shù)據(jù)庫構(gòu)建提供相應功能支撐,保證放療數(shù)據(jù)業(yè)務處理流程滿足相關(guān)標準和規(guī)則;視圖層主要是用于實現(xiàn)數(shù)據(jù)庫的可視化和交互,使用戶能夠查看數(shù)據(jù)庫中的數(shù)據(jù)結(jié)果;控制層屬于數(shù)據(jù)庫框架中的中間層,主要用于另外兩層之間的數(shù)據(jù)傳送和操作的協(xié)調(diào)和控制。
采用數(shù)據(jù)挖掘技術(shù)進行放療數(shù)據(jù)挖掘時,以元數(shù)據(jù)庫為基礎,利用數(shù)據(jù)挖掘引擎獲取其中的放療數(shù)據(jù),形成不同主題的放療數(shù)據(jù)集,實現(xiàn)放療數(shù)據(jù)庫構(gòu)建。本文為保證放療數(shù)據(jù)的挖掘效果以及數(shù)據(jù)庫的質(zhì)量,在進行放療數(shù)據(jù)挖掘和存儲過程中,主要采用聚類算法完成。
式中:me表示所有質(zhì)心數(shù)量;αi表示質(zhì)心,屬于同一個放療數(shù)據(jù)樣本,其計算公式為:
式中:X表示放療數(shù)據(jù)總樣本。
為避免挖掘的放療數(shù)據(jù)存在儲過程中發(fā)生畸變,文中引入畸變函數(shù)對挖掘的放療數(shù)據(jù)進行約束,其計算公式為:
式中:J(c,α)表示距離平方和,對應樣本點和其質(zhì)心之間,保證其取值為最小結(jié)果,同時完成(c,α)的收斂,以此獲取放療數(shù)據(jù)局部最優(yōu)結(jié)果。在此基礎上,依據(jù)概率強度和關(guān)聯(lián)重要程度,提升放療數(shù)據(jù)庫的應用效果,確保放療數(shù)據(jù)的存儲和管理效果。
依據(jù)上述小節(jié)完成放療數(shù)據(jù)的挖掘后,為衡量挖掘結(jié)果對于臨床的應用效果,挖掘的放療數(shù)據(jù)是否為有價值數(shù)據(jù),文中直接對數(shù)據(jù)挖掘結(jié)果進行評估。該評估主要從兩個方面進行,分別為用戶的主觀層面以及挖掘模型的客觀層面;前者主要通過3種標準進行衡量,分別為易于理解程度、數(shù)據(jù)有效程度、潛在價值情況;后者則通過主觀度量進行評估,該度量需具有放療數(shù)據(jù)特征給定能力,同時滿足已經(jīng)定義的信息需求。
本文在進行挖掘模型客觀層面評估時,度量信息能夠通過3個層次的度量,進行數(shù)據(jù)挖掘模型的評估,分別為基本度量、派生度量以及指示器。挖掘模型的評估度量構(gòu)造模型如圖2描述。
圖2 數(shù)據(jù)挖掘模型的評估度量結(jié)構(gòu)
對數(shù)據(jù)挖掘模型在進行放療數(shù)據(jù)挖掘后,會獲取若干條模式,其中也會存在一定的無價值模式,因此,對挖掘模型的挖掘結(jié)果進行評估,是保證數(shù)據(jù)挖掘結(jié)果的有效手段;依據(jù)評估結(jié)果可去除沒有價值的模式,并且提升數(shù)據(jù)挖掘的效率。
為分析數(shù)據(jù)挖掘技術(shù)在放療數(shù)據(jù)分析與評估上的應用效果,以某醫(yī)院的放療數(shù)據(jù)作為實例分析對象展開相關(guān)測試,測試主要包含兩個方向:一是放療數(shù)據(jù)庫構(gòu)建效果,二是放療數(shù)據(jù)分析效果。
放療數(shù)據(jù)庫構(gòu)建效果對于放療數(shù)據(jù)的應用效果存在直接影響,文中采用離散度常數(shù)作為衡量指標,用于分析數(shù)據(jù)庫中,同類放療數(shù)據(jù)的差異性,該指標的取值范圍在0~1 之間,越接近1 表示數(shù)據(jù)庫的構(gòu)建效果越差。該指標的計算公式為:
式中:mean表示加權(quán)平均數(shù);ij表示放療數(shù)據(jù)元素的一個項。
依據(jù)該公式獲取本文技術(shù)進行放療數(shù)據(jù)庫構(gòu)建后,在不同的數(shù)據(jù)類別下,隨著數(shù)據(jù)量的逐漸增加,σ2的測試結(jié)果,如表1描述。
表1 離散度常數(shù)測試結(jié)果
由表1結(jié)果可知:在數(shù)字化結(jié)構(gòu)數(shù)據(jù)、影像數(shù)據(jù)以及結(jié)構(gòu)化數(shù)據(jù)三種數(shù)據(jù)類別下,隨著數(shù)據(jù)量的逐漸增加,采用本文技術(shù)進行數(shù)據(jù)挖掘后,構(gòu)建數(shù)據(jù)庫,數(shù)據(jù)庫發(fā)的離散度常數(shù)σ2結(jié)果均在0.025 以下,表示同類放療數(shù)據(jù)之間的差異性較小,能夠有效完成放療數(shù)據(jù)挖掘,數(shù)據(jù)庫的構(gòu)建效果較好。
為驗證本文技術(shù)應用后,對于放療數(shù)據(jù)的分析效果,隨機抽取一條數(shù)據(jù)庫中存儲的放療信息,并對該信息記性分析,獲取分析結(jié)果如圖3所示。
圖3 放療數(shù)據(jù)的分析效果
由圖3結(jié)果可知:本文技術(shù)應用后,能夠?qū)崿F(xiàn)數(shù)據(jù)庫中放療數(shù)據(jù)的解析,并獲取解析結(jié)果,該結(jié)果中包含患者的CT 檢查數(shù)據(jù)以及部分的治療信息。因此,本文技術(shù)具有放療數(shù)據(jù)分析能力,能夠精準掌握數(shù)據(jù)庫中放療數(shù)據(jù)詳情。
數(shù)據(jù)挖掘技術(shù)對于大數(shù)據(jù)的處理具有顯著優(yōu)勢,放療數(shù)據(jù)包含多個類別的數(shù)據(jù)信息,對于數(shù)據(jù)的利用、患者情況分析等均具有一定影響。因此,為保障放療數(shù)據(jù)的二次利用,同時分析數(shù)據(jù)挖掘結(jié)果的可靠程度,本文探析數(shù)據(jù)挖掘技術(shù)在放療數(shù)據(jù)分析與評估上的應用情況。以數(shù)據(jù)挖掘模型為基礎,并依據(jù)該模型挖掘放療數(shù)據(jù),構(gòu)建數(shù)據(jù)庫,實現(xiàn)放療數(shù)據(jù)的統(tǒng)一封裝和管理,并且評估挖掘效果,確保放療數(shù)據(jù)的管理效果。