覃盛媚,周潔,耿朝輝
(上海中醫(yī)藥大學(xué) 護(hù)理學(xué)院,上海 201203)
在腫瘤臨床護(hù)理實(shí)踐中,患者及醫(yī)護(hù)人員在疾病不同階段常面臨抉擇[1]。近年來(lái),醫(yī)院信息系統(tǒng)(hospital information system,HIS )、移動(dòng)護(hù)理系統(tǒng)等產(chǎn)生海量的醫(yī)學(xué)數(shù)據(jù),發(fā)現(xiàn)潛藏在數(shù)據(jù)庫(kù)中的有效信息,并將其應(yīng)用到臨床實(shí)踐,有助于為抉擇提供證據(jù)支持,同時(shí)又能兼顧患者偏好,進(jìn)而提供個(gè)性化的診療護(hù)理服務(wù)。這種由數(shù)據(jù)驅(qū)動(dòng)、個(gè)性化的臨床護(hù)理實(shí)踐,可最大限度地提高臨床療效,并可及早發(fā)現(xiàn)、有的放矢地干預(yù)治療不良反應(yīng)或并發(fā)癥,或改善腫瘤患者生命末期的生活質(zhì)量。數(shù)據(jù)挖掘(data mining,DM)也稱為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),能夠從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)集中識(shí)別有效的、新穎的、潛在有用的以及最終可理解的知識(shí)[2],為腫瘤臨床護(hù)理實(shí)踐提供了新的思路。挖掘出醫(yī)學(xué)數(shù)據(jù)庫(kù)中潛在的數(shù)據(jù)價(jià)值是其得以有效應(yīng)用的前提條件。本文針對(duì)數(shù)據(jù)挖掘技術(shù)在腫瘤臨床護(hù)理實(shí)踐中的應(yīng)用做一綜述,以期為科研人員及臨床工作者更好地對(duì)腫瘤臨床護(hù)理數(shù)據(jù)進(jìn)行挖掘提供參考。
1.1 數(shù)據(jù)挖掘技術(shù)的特征 數(shù)據(jù)挖掘是一門涉及面很廣的交叉學(xué)科,技術(shù)來(lái)源包括機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)、數(shù)據(jù)庫(kù)、模式識(shí)別學(xué)等,其特點(diǎn)是處理大量數(shù)據(jù)時(shí)可兼容多種類型的原始數(shù)據(jù)(如時(shí)間序列的、空間的、文本的、多媒體的),將大量原始數(shù)據(jù)轉(zhuǎn)換成為更有價(jià)值且易于理解的知識(shí),用于描述過(guò)去或預(yù)測(cè)未來(lái)的趨勢(shì)和規(guī)律,并做出快速響應(yīng),以指導(dǎo)臨床實(shí)踐和研究[3]。挖掘出的知識(shí)可以用規(guī)律、模式、規(guī)則等形式展現(xiàn),數(shù)據(jù)挖掘通常按模式的作用,分為描述性與預(yù)測(cè)性模式。描述性模式是對(duì)數(shù)據(jù)集中已經(jīng)存在的規(guī)則、規(guī)律、知識(shí)特征進(jìn)行描述,而不進(jìn)行任何預(yù)測(cè)(回顧性)[4];預(yù)測(cè)性模式是從已知的數(shù)據(jù)集中挖掘出某些特征信息,進(jìn)而對(duì)未知的數(shù)據(jù)集進(jìn)行預(yù)測(cè)(前瞻性)。數(shù)據(jù)挖掘本質(zhì)上也是一種高級(jí)、深層次的數(shù)據(jù)分析手段,成熟的相關(guān)技術(shù)加上高效的數(shù)據(jù)庫(kù)搜索引擎,利用數(shù)據(jù)挖掘技術(shù)可發(fā)現(xiàn)以往數(shù)據(jù)集的規(guī)則,進(jìn)而利用這些規(guī)則預(yù)測(cè)未知數(shù)據(jù)集,達(dá)到科學(xué)預(yù)測(cè)的目的[5]。數(shù)據(jù)挖掘技術(shù)的流程主要包括數(shù)據(jù)的采集(根據(jù)研究主題從數(shù)據(jù)庫(kù)或醫(yī)院信息系統(tǒng)中選出需要分析的相關(guān)臨床數(shù)據(jù),構(gòu)建數(shù)據(jù)集)、處理(缺失值、標(biāo)準(zhǔn)化術(shù)語(yǔ)、特征選取等)、分析(根據(jù)研究目的和數(shù)據(jù)特征選擇合適的算法并建立模型)和解釋(對(duì)所得模型性能進(jìn)行評(píng)價(jià))。有學(xué)者[6]認(rèn)為,使用特定算法對(duì)臨床實(shí)踐數(shù)據(jù)(如當(dāng)變量之間的關(guān)系復(fù)雜、多維和非線性時(shí))進(jìn)行挖掘,能夠提供一組有用的規(guī)則,區(qū)分一系列假定風(fēng)險(xiǎn),在預(yù)測(cè)臨床結(jié)果方面比傳統(tǒng)統(tǒng)計(jì)技術(shù)更為精準(zhǔn)[7]。
1.2 數(shù)據(jù)挖掘技術(shù)常用算法 數(shù)據(jù)挖掘中用于分類的常用算法有[5,8]:人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)、支持向量機(jī)(support vector machine, SVM)、貝葉斯法(Bayes)、決策樹(decision tree, DT)等。根據(jù)數(shù)據(jù)的特點(diǎn)選用合適的算法,能夠提取更為有效的內(nèi)容特征,挖掘出更有價(jià)值的信息,這在腫瘤臨床護(hù)理實(shí)踐中提高分類準(zhǔn)確率方面具有十分重要的意義。ANN是一種非參數(shù)機(jī)器學(xué)習(xí)方法,模擬生物神經(jīng)系統(tǒng),由大量的節(jié)點(diǎn)(或稱神經(jīng)元)相互聯(lián)接構(gòu)成。其通常有三層,即輸入層、中間層(隱藏層,可以有多個(gè))和輸出層,所有的輸入層信息都以分層的方式傳遞到輸出層。輸入層既可以是第一層的原始數(shù)據(jù),也可以是另一層的輸出(輸出形式可以是數(shù)值數(shù)據(jù)、文字、圖像等)。SVM是一種按監(jiān)督學(xué)習(xí)對(duì)數(shù)據(jù)進(jìn)行二分類的廣義線性分類器,其可以很好地應(yīng)用于高維、高通量數(shù)據(jù),如用于癌癥基因組分類或子分類,尤其在識(shí)別復(fù)雜數(shù)據(jù)集中的細(xì)微模式方面功能非常強(qiáng)大。Bayes是檢驗(yàn)多元關(guān)系的一種強(qiáng)有力的方法,通過(guò)直觀的圖形來(lái)可視化變量之間的相互關(guān)系,被廣泛地應(yīng)用于基因組學(xué)和醫(yī)學(xué)領(lǐng)域,此外,可指導(dǎo)干預(yù)研究的設(shè)計(jì)。DT因其決策分支圖形和樹的枝干相似而得名。它采用樹枝狀解釋對(duì)象屬性與對(duì)象值之間的關(guān)系,樹中每個(gè)節(jié)點(diǎn)表示某個(gè)對(duì)象,而每個(gè)分叉路徑則代表某個(gè)可能的屬性值,具有根據(jù)數(shù)據(jù)的不同屬性歸為不同類別的特性。DT算法的優(yōu)點(diǎn)是不易受到噪聲、變量冗余屬性的影響。基于此,筆者認(rèn)為,根據(jù)不同的數(shù)據(jù)特點(diǎn)和研究目的,靈活選擇合適的分類算法,才能使數(shù)據(jù)挖掘技術(shù)在腫瘤臨床護(hù)理實(shí)踐中真正發(fā)揮作用。
2.1 輔助最佳診療、護(hù)理方案的選擇 腫瘤患者的決策過(guò)程非常復(fù)雜,需要一個(gè)共同的決策過(guò)程,隨著醫(yī)療信息化不斷推進(jìn),數(shù)據(jù)正以多形式、前所未有的速度增長(zhǎng),借助數(shù)據(jù)挖掘技術(shù)從龐大的數(shù)據(jù)中去偽存真,提取有用的信息,在選擇診療、護(hù)理方案方面發(fā)揮著舉足輕重的作用。Wong等[9]在最新研究中,指導(dǎo)新診斷為前列腺癌的患者在密歇根泌尿外科改進(jìn)合作組織(the Michigan Urological Surgery Improvement Collaborative, MUSIC)開發(fā)的網(wǎng)絡(luò)系統(tǒng)--askMUSIC上完成自我評(píng)估(https://ask.musicurology.com/),隨后嵌套在系統(tǒng)里的算法為患者提供答案:“類似于我這種情況的患者選擇了什么治療和護(hù)理?”。askMUSIC讓患者感覺(jué)自己在控制、管理自己的疾病、治療和生活,有了客觀信息的證據(jù)支持,可以促進(jìn)患者參與決策過(guò)程,改善體驗(yàn),提高護(hù)理滿意度。再如一些研究[10-11]利用影像學(xué)特征的ANN實(shí)現(xiàn)腫瘤反應(yīng)的客觀和自動(dòng)化評(píng)估,并發(fā)現(xiàn)高通量的成像生物標(biāo)志物,建立了比傳統(tǒng)成像指標(biāo)具有更高預(yù)測(cè)價(jià)值的模型,進(jìn)而幫助實(shí)現(xiàn)更為精準(zhǔn)的治療方案調(diào)整。Mantravadi[12]使用決策樹建模比較了基于《床頭抬高和誤吸風(fēng)險(xiǎn)指南》最佳實(shí)踐和常規(guī)(標(biāo)準(zhǔn))護(hù)理干預(yù)老年癌癥幸存者吸入性風(fēng)險(xiǎn)的成本效益,證實(shí)了居住在專業(yè)護(hù)理機(jī)構(gòu)的老年癌癥幸存者接受最佳護(hù)理實(shí)踐后吸入性風(fēng)險(xiǎn)有所降低,同時(shí)護(hù)理機(jī)構(gòu)成本也有所減少。這些結(jié)果的提出,有助于患者與醫(yī)護(hù)人員共同選擇和調(diào)整最佳方案,既能使患者真正獲益,又能充分利用有限的醫(yī)療資源。
2.2 早期識(shí)別并治療不良反應(yīng),預(yù)測(cè)并發(fā)癥 在腫瘤臨床護(hù)理實(shí)踐中,對(duì)于不良反應(yīng)、疾病或治療相關(guān)并發(fā)癥的早期識(shí)別,進(jìn)而采取防范措施,將有利于提高醫(yī)治效果,改善患者生活質(zhì)量。利用數(shù)據(jù)挖掘技術(shù)可從大量數(shù)據(jù)中發(fā)現(xiàn)各種癥狀、檢查結(jié)果與不良反應(yīng)或并發(fā)癥之間的相關(guān)性,及早提醒醫(yī)護(hù)人員可能出現(xiàn)的情況,從而實(shí)施早期干預(yù)。Carmona等[13]利用決策樹模型對(duì)癌癥合并肺栓塞患者的嚴(yán)重并發(fā)癥(包括死亡、急性呼吸衰竭、心力衰竭、腎功能衰竭和大出血等)進(jìn)行預(yù)測(cè),進(jìn)而將患者分為低、中、高并發(fā)癥風(fēng)險(xiǎn)組,模型結(jié)果顯示進(jìn)展期腫瘤或因無(wú)法評(píng)估反應(yīng)而有進(jìn)展風(fēng)險(xiǎn)的患者發(fā)生嚴(yán)重并發(fā)癥的風(fēng)險(xiǎn)更高,這提示醫(yī)護(hù)人員需要對(duì)這部分患者進(jìn)行持續(xù)監(jiān)測(cè),及時(shí)處理。腫瘤患者在接受治療后,需重點(diǎn)觀察治療效果及不良反應(yīng),護(hù)士的職業(yè)特性決定了護(hù)士處在觀察并及時(shí)發(fā)現(xiàn)不良反應(yīng)的最佳位置。如淋巴水腫是乳腺癌治療最痛苦的不良反應(yīng)之一,對(duì)患者生活造成嚴(yán)重的負(fù)面影響,其發(fā)生的時(shí)間點(diǎn)(可在術(shù)后、術(shù)后幾個(gè)月或幾年等)具有極大個(gè)體差異,早期發(fā)現(xiàn)可以幫助患者得到及時(shí)的干預(yù),從而有效地管理淋巴水腫,然而在繁忙的臨床實(shí)踐中,護(hù)士分身乏術(shù),難以同時(shí)對(duì)大量患者尤其是出院患者進(jìn)行實(shí)時(shí)監(jiān)測(cè),數(shù)據(jù)挖掘技術(shù)則有望突破這一瓶頸。Fu 等[14]評(píng)估了基于癥狀實(shí)時(shí)報(bào)告的多種技術(shù)(ANN、SVM和DT等)檢測(cè)淋巴水腫狀態(tài)的準(zhǔn)確性、敏感性和特異性,結(jié)果顯示,ANN取得較好的實(shí)時(shí)精確預(yù)測(cè),準(zhǔn)確率為93.75%,靈敏度為95.65%,特異性為91.03%,可作為目前除常用的生物阻抗分析等評(píng)估方法外的有效補(bǔ)充,這可以降低淋巴水腫進(jìn)展為慢性或嚴(yán)重階段的風(fēng)險(xiǎn)。此外,也有研究者發(fā)現(xiàn),數(shù)據(jù)挖掘技術(shù)在預(yù)測(cè)腫瘤患者焦慮抑郁狀態(tài)、認(rèn)知功能受損風(fēng)險(xiǎn),從而指導(dǎo)個(gè)性化干預(yù)等方面也有較大優(yōu)勢(shì)[15]。運(yùn)用數(shù)據(jù)挖掘技術(shù)分析臨床實(shí)踐的相關(guān)數(shù)據(jù),可以發(fā)現(xiàn)影響不良反應(yīng)、并發(fā)癥發(fā)生的因素,識(shí)別出高危人群,有助于前瞻性地制訂相應(yīng)的干預(yù)措施減少不良反應(yīng)、并發(fā)癥的發(fā)生[16]。
2.3 輔助終末期照護(hù)品質(zhì)的提升 在疾病晚期,某些腫瘤患者即使接受了最佳治療,其預(yù)期壽命也相對(duì)較短,及時(shí)、準(zhǔn)確的臨終期判斷有助于患者和醫(yī)護(hù)人員在姑息治療和其他治療之間做出選擇,從而制定個(gè)性化的診療、咨詢服務(wù)、隨訪計(jì)劃或臨床護(hù)理,最大程度改善終末期患者的生活質(zhì)量[17]。有研究[18]表明,對(duì)于臨終期癌癥患者,早期接受臨終關(guān)懷和姑息治療可以顯著減輕疼痛,減少心理痛苦,改善生命末期的生活質(zhì)量。一項(xiàng)針對(duì)胰腺癌患者的研究[19]顯示,通過(guò)ANN能準(zhǔn)確預(yù)測(cè)胰腺癌患者7個(gè)月的生存期,其敏感性為91%,這一結(jié)果的提出,可使醫(yī)護(hù)人員根據(jù)特定于個(gè)體患者的信息為患者提供轉(zhuǎn)診建議或強(qiáng)化的隨訪。Chan等[20]在不增加晚期癌癥患者評(píng)估負(fù)擔(dān)的基礎(chǔ)上,利用電子數(shù)據(jù)挖掘晚期癌癥患者在接受姑息治療時(shí)所處的不同狀態(tài),以便更好地提供臨終護(hù)理(如軀體癥狀管理、心理護(hù)理、情緒咨詢、體育鍛煉、精神支持、志愿者探訪和娛樂(lè)活動(dòng)等),使患者在住院期間體驗(yàn)有意義的生活質(zhì)量,并最終體驗(yàn)“善終”。Almasalha等[21]發(fā)現(xiàn),使用關(guān)聯(lián)挖掘、聚類和分類技術(shù)識(shí)別隱藏信息,可為改善腫瘤患者臨終護(hù)理的質(zhì)量和效率提供強(qiáng)有力的技術(shù)支持。如當(dāng)系統(tǒng)通過(guò)分類和訓(xùn)練發(fā)現(xiàn)與數(shù)據(jù)庫(kù)中歷史數(shù)據(jù)相匹配的癥狀時(shí),發(fā)出警報(bào),并適時(shí)提出最佳護(hù)理實(shí)踐建議。當(dāng)前,加速采用電子病歷的激勵(lì)政策將會(huì)導(dǎo)致臨床數(shù)據(jù)的數(shù)量和可用性不斷增加,電子病歷有望成為知識(shí)發(fā)現(xiàn)的潛在金礦。然而,目前姑息治療機(jī)構(gòu)能夠充分代表住院患者標(biāo)準(zhǔn)化語(yǔ)言護(hù)理的電子病歷較為缺乏,導(dǎo)致其數(shù)據(jù)的可用性成為數(shù)據(jù)挖掘技術(shù)實(shí)施推廣的瓶頸,今后有待完善標(biāo)準(zhǔn)化的電子數(shù)據(jù)錄入,以利于利用數(shù)據(jù)挖掘技術(shù)最大限度地挖掘?qū)εR終期癌癥患者護(hù)理最為有意義的信息。
數(shù)據(jù)挖掘技術(shù)(如ANN、SVM、DT等)給腫瘤臨床護(hù)理實(shí)踐帶來(lái)了極大的發(fā)展動(dòng)力,在輔助最佳診療、護(hù)理方案選擇、早期識(shí)別不良反應(yīng)、預(yù)測(cè)并發(fā)癥、提升臨終期照護(hù)品質(zhì)等方面取得了較大的成果。相信在大數(shù)據(jù)的時(shí)代背景下,信息化的不斷發(fā)展,腫瘤領(lǐng)域與信息化的不斷深入結(jié)合,會(huì)給涵蓋腫瘤患者健康生命全周期的護(hù)理實(shí)踐帶來(lái)新的發(fā)展契機(jī),同時(shí)為護(hù)理科研工作的開展提供更為有力的技術(shù)支持。
目前,盡管我國(guó)護(hù)士工作站相關(guān)系統(tǒng)已廣泛普及應(yīng)用,但是較之國(guó)際上現(xiàn)有標(biāo)準(zhǔn)化護(hù)理術(shù)語(yǔ)集,國(guó)內(nèi)很多護(hù)理記錄術(shù)語(yǔ)仍不夠標(biāo)準(zhǔn),導(dǎo)致數(shù)據(jù)需要經(jīng)過(guò)大量的預(yù)處理后方能成為數(shù)據(jù)挖掘的原始數(shù)據(jù)。因此,如果想要充分挖掘腫瘤臨床護(hù)理實(shí)踐中產(chǎn)生的數(shù)據(jù),形成新的護(hù)理知識(shí),并有效指導(dǎo)臨床實(shí)踐,那么發(fā)展標(biāo)準(zhǔn)化護(hù)理術(shù)語(yǔ)集,實(shí)現(xiàn)護(hù)理記錄的標(biāo)準(zhǔn)化則是關(guān)鍵的前提基礎(chǔ)。
基于此,今后的研究及實(shí)踐重點(diǎn)應(yīng)包括:首先,將數(shù)據(jù)挖掘技術(shù)植入統(tǒng)一標(biāo)準(zhǔn)化的醫(yī)療信息平臺(tái),整合各個(gè)醫(yī)療信息系統(tǒng),創(chuàng)建統(tǒng)一的數(shù)據(jù)庫(kù),降低數(shù)據(jù)融合難度;其次,探索多學(xué)科協(xié)作模式(醫(yī)療、護(hù)理、計(jì)算機(jī)、數(shù)據(jù)分析師等),開展大樣本、多中心的前瞻性研究,進(jìn)一步提高、驗(yàn)證數(shù)據(jù)挖掘技術(shù)在腫瘤臨床護(hù)理實(shí)踐中的前瞻性、精準(zhǔn)性和高效性,實(shí)現(xiàn)數(shù)據(jù)利用率的最大化;最后,由于腫瘤患者大多具有較長(zhǎng)的居家康復(fù)期,需自主、持續(xù)進(jìn)行疾病和癥狀的自我管理,隨著電子化醫(yī)療和護(hù)理系統(tǒng)的普遍覆蓋,對(duì)腫瘤患者院內(nèi)、外聯(lián)動(dòng)數(shù)據(jù)的正確存儲(chǔ)、挖掘及利用具有很大空間和潛力,可進(jìn)一步開展數(shù)據(jù)挖掘技術(shù)在分析腫瘤患者疾病特征、癥狀及癥狀群與生活質(zhì)量之間復(fù)雜關(guān)系的研究,并證實(shí)、細(xì)化最佳的數(shù)據(jù)挖掘算法,進(jìn)而推動(dòng)前瞻性、個(gè)體化、全程性的癥狀管理,改善患者體驗(yàn),從而優(yōu)化腫瘤臨床護(hù)理實(shí)踐。