孟雨
器官損傷總是不易察覺,往往會(huì)因此錯(cuò)過最佳治療時(shí)機(jī)?;谌斯ぶ悄艿男路椒艹掷m(xù)監(jiān)測病人的健康數(shù)據(jù)并及時(shí)預(yù)測即將發(fā)生的腎臟損傷。
在美國的醫(yī)院中,急性腎功能損傷的發(fā)病率高達(dá)20 %,包括異常血壓和血容量等多種因素都會(huì)誘發(fā)這種十分普遍的病癥。但目前醫(yī)療界卻缺乏有效的手段來預(yù)測病人是否會(huì)發(fā)生以及何時(shí)會(huì)發(fā)生急性腎損傷。目前,對(duì)于高危病人的臨床處理手段是每天檢測血液中的肌酸酐濃度,濃度過高就意味著腎功能出現(xiàn)了問題。
近日,來自DeepMind等多個(gè)機(jī)構(gòu)的研究人員提出了一種基于人工智能的新方法,能夠有效預(yù)測病人即將發(fā)生的腎功能損傷。相較于傳統(tǒng)方法,這種新方法可以提前一到兩天檢測出大部分病人腎臟損傷的發(fā)生風(fēng)險(xiǎn)。由于腎臟損傷往往在最后階段才被察覺,此時(shí)腎臟已經(jīng)發(fā)生不可逆的損害,嚴(yán)重時(shí)將會(huì)留下需要暫時(shí)或長期透析的后遺癥,甚至引起病人死亡。對(duì)于腎臟損傷的早期檢測方法將為有效的臨床治療贏得寶貴的時(shí)間。
深度學(xué)習(xí)作為近年來發(fā)展最快的人工智能方法,可以有效識(shí)別出數(shù)據(jù)中隱含的與特定結(jié)果相關(guān)的模式。在這一研究中,研究人員利用深度學(xué)習(xí)的方法來檢測急性腎損傷。訓(xùn)練深度學(xué)習(xí)算法需要大量的數(shù)據(jù),研究人員從美國退伍軍人事務(wù)部(US Department of Veterans Affairs,為美國退伍軍人及其家屬提供服務(wù))負(fù)責(zé)運(yùn)營的172家醫(yī)院和1062家門診中,收集了超過70萬例成年病例的數(shù)據(jù)(2011- 2015年)。這些經(jīng)過匿名處理的數(shù)據(jù)為研究人員提供了人口統(tǒng)計(jì)信息、電子健康檔案、化驗(yàn)結(jié)果、藥物處方和過往治療記錄等數(shù)據(jù)。論文的第一作者Tomasev和同事們從數(shù)據(jù)中整理出了約60億個(gè)數(shù)據(jù)點(diǎn)和60多萬個(gè)記錄特征,他們選擇了一種被稱為循環(huán)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法來處理時(shí)序數(shù)據(jù)并對(duì)計(jì)算機(jī)進(jìn)行訓(xùn)練,這種方法在深度學(xué)習(xí)領(lǐng)域被證明非常適合處理時(shí)序數(shù)據(jù)。
在訓(xùn)練完成后,研究人員利用事先分離出的獨(dú)立數(shù)據(jù)集對(duì)算法的有效性進(jìn)行了測試?;跍y試數(shù)據(jù),計(jì)算機(jī)將生成接下來48小時(shí)內(nèi)連續(xù)的概率值來追蹤每個(gè)病人隨時(shí)間推移發(fā)生急性腎損傷的可能性。如果預(yù)測的概率值超過一定閾值,這個(gè)預(yù)測結(jié)果將被標(biāo)記為陽性(如圖一所示)。病人后續(xù)是否被檢查出病情則會(huì)驗(yàn)證算法的預(yù)測精度。該模型同時(shí)還提供了預(yù)測概率值的不確定性,為醫(yī)生提供了評(píng)估預(yù)測信號(hào)的強(qiáng)度指標(biāo)。
Tomasev團(tuán)隊(duì)提出的方法可以給出急性腎損傷的預(yù)警信號(hào)。研究人員利用人工智能中的深度學(xué)習(xí)方法來訓(xùn)練計(jì)算機(jī)從數(shù)據(jù)中檢測與后續(xù)腎損傷相關(guān)的模式。研究人員利用這種算法來分析過往的醫(yī)療數(shù)據(jù),包括電子健康檔案和化驗(yàn)結(jié)果等等。計(jì)算機(jī)分析某個(gè)病人的歷史數(shù)據(jù)后,將生成接下來48小時(shí)內(nèi)的連續(xù)概率值,對(duì)應(yīng)病人發(fā)生急性腎功能損傷的可能性。如果概率超過一定閾值,預(yù)測結(jié)果將被標(biāo)記為陽性,并向醫(yī)生發(fā)出警報(bào)。
在此假設(shè)場景下,Tomasev團(tuán)隊(duì)的研究方法將提供比傳統(tǒng)方法更早的預(yù)警信號(hào),為醫(yī)生和病人贏得了寶貴的治療時(shí)間。
Tomasev和同事們提出的新方法比其他基于統(tǒng)計(jì)或機(jī)器學(xué)習(xí)的方法更為精確地預(yù)測了即將要發(fā)生的腎損傷,而且對(duì)于醫(yī)院內(nèi)病人的預(yù)測精度最高———醫(yī)院內(nèi)病人發(fā)生急性腎損傷的比門診診所更為頻繁,同時(shí)時(shí)間窗口也更為短暫。對(duì)于所有病人和所有類別的腎損傷,包括較為輕微的損傷,這一系統(tǒng)的平均預(yù)測精度達(dá)到了56 %;而針對(duì)更為嚴(yán)重的腎損傷預(yù)測,對(duì)于后續(xù)30天和后續(xù)90天內(nèi)需要透析的病人預(yù)測精度則分別達(dá)到了84 %和90 %。該模型在不同的醫(yī)療場所和不同時(shí)間周期內(nèi)具有相似的預(yù)測精度。
此外,研究人員使用了消融性分析方法來鑒別與腎損傷發(fā)生風(fēng)險(xiǎn)相關(guān)的因素,結(jié)果發(fā)現(xiàn)有很多,這也許解釋了為何過去讓研究人員分析這種風(fēng)險(xiǎn)是一件棘手的事。
假設(shè)病例顯示了研究人員所開發(fā)的新方法的重大應(yīng)用潛力。如果利用傳統(tǒng)方法檢測,醫(yī)生將在第四天才能獲悉腎損傷的發(fā)生,而新方法則可以提前兩天預(yù)測出來,為醫(yī)務(wù)人員提供了更多寶貴的時(shí)間和更多干預(yù)治療的手段,包括增加病人的液體攝取,或者避免使用可能造成腎毒性的藥物。
然而這一系統(tǒng)也存在一定問題:生成一系列假陽性的預(yù)測結(jié)果,即誤報(bào)一些沒有發(fā)生的腎損傷。每個(gè)精確的預(yù)測會(huì)對(duì)應(yīng)兩個(gè)假陽性結(jié)果。假陽性絕大多數(shù)來源于患有慢性腎病的病人,疾病的癥狀會(huì)與急性腎損傷疊加,造成結(jié)果難以預(yù)測。
本研究的另一局限在于這是一項(xiàng)回顧性研究,利用回顧性研究構(gòu)建的人工智能方法將在前瞻性研究中發(fā)生一定程度的退化,這可能是因?yàn)榕R床中的真實(shí)數(shù)據(jù)會(huì)比預(yù)先存在的經(jīng)過清洗的“干凈”數(shù)據(jù)要復(fù)雜得多。
前瞻性研究是檢測預(yù)測系統(tǒng)的真實(shí)臨床價(jià)值的根本所在,而預(yù)測成功與否不是唯一應(yīng)加以評(píng)估的因素。要確定計(jì)算機(jī)生成的預(yù)警信號(hào)是否在臨床中減少了急性腎損傷的發(fā)生率,一種方法是開展隨機(jī)設(shè)計(jì)的臨床試驗(yàn),只將其中一半的預(yù)測傳遞給醫(yī)生。此外,作者的模型也應(yīng)該在其他人群身上進(jìn)行有效性的測試。作者的研究只包含了不到7 %的女性病例,那么,模型對(duì)于不同性別的病人是否具有相同的預(yù)測精度,也值得在未來進(jìn)行深入地研究。
雖然這一研究包含了不同種類的數(shù)據(jù),但還有其他數(shù)據(jù)源也值得納入進(jìn)來,例如病歷上的手寫內(nèi)容,來自可穿戴傳感器的連續(xù)生命監(jiān)測信號(hào),如心率等,這些都有可能提供有價(jià)值的相關(guān)信息。
對(duì)于非重癥病人來說,常規(guī)監(jiān)測方法是每天測量一次生命體征,但病人經(jīng)常會(huì)突然出現(xiàn)病情急轉(zhuǎn)直下的情況。Tomasev和同事的研究對(duì)于這樣的病人來說十分有用,可以在病人發(fā)生嚴(yán)重的器官衰竭之前發(fā)出預(yù)警,為病人贏得寶貴的救治時(shí)機(jī)。先前,很多臨床背景下基于人工智能的預(yù)測性研究主要著重于研究疾病轉(zhuǎn)歸,包括死亡、再入院或住院時(shí)間等,而Tomasev等人的研究結(jié)果則提供了獨(dú)特的視角,為臨床干預(yù)提供了有效的預(yù)測信號(hào)。
深度學(xué)習(xí)有望為醫(yī)生提供針對(duì)任何器官狀況的有力預(yù)警手段,它的廣泛應(yīng)用也許需要醫(yī)療界改變思維方式。但是從非經(jīng)常的一次性測試轉(zhuǎn)向系統(tǒng)性的連續(xù)監(jiān)測,或?qū)獒t(yī)務(wù)人員提供更有效的手段來預(yù)測病人的病情變化。