急性腎損傷常常令醫(yī)生束手無策,這種疾病很難在早期發(fā)現(xiàn),且一旦發(fā)病,進(jìn)展會非常迅速?,F(xiàn)在利用大數(shù)據(jù)和人工智能的方法,科學(xué)家設(shè)計(jì)出了一種算法,能夠預(yù)測病人在隨后48小時內(nèi)出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)。對于很多人來說,這48小時也許意味著生死之別。
南方周末特約撰稿 陳彬
腎臟是人體的重要器官,擔(dān)負(fù)著清除代謝產(chǎn)生的廢物、維持體液和電解質(zhì)平衡等重要的功能。不難想象,如果腎臟出現(xiàn)了病變,人體將會受到多大的傷害。在諸多腎病中,急性腎損傷(曾經(jīng)被稱作急性腎衰竭,但國際腎病研究界于2005年達(dá)成共識,將這種疾病更名為急性腎損傷)不僅發(fā)病快、在特定的人群中發(fā)病率高,而且很多時候會在較晚的時候才能被發(fā)現(xiàn),因此在被診斷出患有急性腎損傷時,很多病人的腎臟已經(jīng)受到了嚴(yán)重的不可逆損傷,需要接受透析甚至腎臟移植。
英國和美國的科學(xué)家最近利用大數(shù)據(jù)和人工智能的方法設(shè)計(jì)出了一種算法,利用這種算法,科學(xué)家可以預(yù)測病人在隨后48小時內(nèi)出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)。對于那些將會發(fā)生嚴(yán)重急性腎損傷的病人來說,這48小時也許意味著生死之別。
時間就是生命
有很多原因都可能引發(fā)急性腎損傷,但這些原因?qū)е碌淖罱K結(jié)果都是腎功能在很短的時間內(nèi)出現(xiàn)了嚴(yán)重的下降。這種腎功能的急劇下降不僅會導(dǎo)致代謝廢物在血液中累積,也會使腎臟無法正常調(diào)節(jié)機(jī)體的體液平衡。由于腎臟這一機(jī)體的“廢物處理工廠”出現(xiàn)了問題,隨之而來的生理功能紊亂還會對身體的其他臟器造成傷害。
在急性腎損傷的患病人群中,有很大一部分都是住院病人(并不一定是因?yàn)槟I病住院的)。這些急性腎損傷的病人的死亡率高達(dá)20%,而那些已經(jīng)在重癥監(jiān)護(hù)室接受治療的病人中,急性腎損傷的死亡率更是高達(dá)50%。在世界范圍內(nèi),急性腎損傷的發(fā)病率為每100萬人中有2100人患病,每年有大約200萬人死于這種疾病。在中國,全國范圍內(nèi)有關(guān)急性腎損傷的大樣本研究還很少,但根據(jù)南方醫(yī)科大學(xué)侯凡凡院士團(tuán)隊(duì)2015年發(fā)表的一篇論文,在中國9家地區(qū)中心醫(yī)院入院的659945名病人中,急性腎損傷的發(fā)生率為11.6%,這些患病病人的死亡率則為15.3%。這樣大的患病人群和死亡率,不僅給萬千病人和他們的家人帶來了無盡的痛苦,也會給各國的醫(yī)療衛(wèi)生系統(tǒng)帶來沉重的經(jīng)濟(jì)負(fù)擔(dān):根據(jù)2011年美國的一項(xiàng)研究,為了救治該年約50萬名因?yàn)榧毙阅I損傷入院的病人,美國的醫(yī)療系統(tǒng)共花費(fèi)了近47億美元。
急性腎損傷的一個特點(diǎn)是難以在疾病發(fā)生的早期發(fā)現(xiàn),因?yàn)閯傞_始時病人不一定會表現(xiàn)出很明顯的癥狀。在有的時候,病人被診斷出發(fā)生了急性腎損傷,甚至是因?yàn)樵谧銎渌麑?shí)驗(yàn)室檢測時“無意”發(fā)現(xiàn)的。在這種情況下,當(dāng)診斷出病人出現(xiàn)了急性腎損傷時,醫(yī)生的救治手段也已經(jīng)相當(dāng)有限了。這種疾病的另一個特點(diǎn)則是發(fā)病時間非常快,慢的話也許需要幾天,快的話則是以小時計(jì)。另外,即使病人得到了救治,但由于腎臟已經(jīng)受到了一些損傷,病人后續(xù)罹患慢性腎病的風(fēng)險(xiǎn)也將增加8.8倍。基于這些原因,醫(yī)學(xué)界迫切需要盡早發(fā)現(xiàn)急性腎損傷征兆的有效方法,因?yàn)閷τ诩毙阅I損傷的病人來說,時間或許就是生命。
通過跨領(lǐng)域的合作,數(shù)據(jù)科學(xué)家和醫(yī)學(xué)研究者找到了這樣一種有效的方法。在最近一期的世界著名學(xué)術(shù)期刊《自然》雜志上,英國人工智能公司DeepMind和美國多家醫(yī)療機(jī)構(gòu)的科學(xué)家合作發(fā)表了一篇研究論文。結(jié)合大數(shù)據(jù)和人工智能的方法,這些科學(xué)家設(shè)計(jì)出了一種算法(下文中將使用人工智能的英語縮寫AI來表示),能夠根據(jù)病人的電子醫(yī)療記錄預(yù)測病人在隨后48小時內(nèi)出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)。
用海量信息訓(xùn)練
在這項(xiàng)研究發(fā)表之前,已經(jīng)有科學(xué)家設(shè)計(jì)出了用于監(jiān)測急性腎損傷的AI。這些AI的策略是通過監(jiān)測血液中一種叫做肌酐的代謝廢物的水平,來盡早發(fā)現(xiàn)病人可能出現(xiàn)的急性腎損傷。但這種策略有一個嚴(yán)重的缺陷:與腎臟受到的損傷相比,肌酐水平出現(xiàn)異常存在嚴(yán)重的滯后。也就是說當(dāng)AI通過分析肌酐的水平,發(fā)現(xiàn)病人出現(xiàn)了急性腎損傷時,腎臟已經(jīng)受到了相當(dāng)程度的損傷。
在這項(xiàng)新的研究中,DeepMind的數(shù)據(jù)科學(xué)家采取了完全不同的策略。他們總共使用了取自超過1000家醫(yī)療機(jī)構(gòu)共計(jì)703782名成年病人的電子醫(yī)療記錄來設(shè)計(jì)、訓(xùn)練并評估AI的預(yù)測能力。
這些醫(yī)療記錄中記錄有病人的各類信息,比如病人接受的各種醫(yī)學(xué)檢查的結(jié)果、醫(yī)生的診斷、使用了那些藥物等。研究的形式則是回顧性研究,也就是說在進(jìn)行研究的時候,每一名病人在研究者選定的時間范圍內(nèi)是否最終出現(xiàn)了急性腎損傷(根據(jù)腎病研究界廣泛使用的一種評判標(biāo)準(zhǔn)來判定)、損傷程度(如果出現(xiàn)了損傷的話)有多嚴(yán)重、在這期間的各類生理和病理指標(biāo)等等信息,在醫(yī)療信息中均有詳細(xì)的記錄。
科學(xué)家的研究方式是將這703782名病人(這些病人有的出現(xiàn)了急性腎損傷,有的沒有)分成兩組,把其中一組病人的數(shù)據(jù)用于訓(xùn)練研究人員設(shè)計(jì)的AI。另一組病人的數(shù)據(jù)則用來考核AI:科學(xué)家會把這些病人入院(不一定是因?yàn)槟I病入院)前48小時的醫(yī)療信息提供給AI,讓AI據(jù)此預(yù)測病人在隨后48小時里出現(xiàn)急性腎損傷的風(fēng)險(xiǎn),并把AI的預(yù)測和實(shí)際情況進(jìn)行對比,評估AI預(yù)測的準(zhǔn)確性。
除了病人的數(shù)量巨大以外,這些病人的電子醫(yī)療記錄中包含的信息也非常豐富??茖W(xué)家從這些信息中提取出了62萬種,共計(jì)63.5億個數(shù)據(jù)點(diǎn)來訓(xùn)練和評估AI。其中90%的病人的信息用于訓(xùn)練和校準(zhǔn)AI,10%的病人的信息則被用來評估AI的準(zhǔn)確性。
計(jì)算模型
DeepMind的科學(xué)家設(shè)計(jì)的AI使用了一種名叫遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,中文世界中也有翻譯成“循環(huán)神經(jīng)網(wǎng)絡(luò)”的,但全國科學(xué)技術(shù)名詞審定委員會審定的翻譯建議是“遞歸神經(jīng)網(wǎng)絡(luò)”)的計(jì)算模型。這種神經(jīng)網(wǎng)絡(luò)的一個優(yōu)點(diǎn)是擅長處理序列數(shù)據(jù)以及這些序列數(shù)據(jù)間的關(guān)聯(lián)。在這項(xiàng)研究中,序列數(shù)據(jù)就是病人在不同的時間點(diǎn)上的醫(yī)療信息,因?yàn)檫@些信息并不是完全孤立的,同一種信息在不同的時間點(diǎn)上的值之間存在關(guān)聯(lián)(不同種類的信息在不同時間點(diǎn)上的值之間甚至也有可能存在某些關(guān)聯(lián)),因此其變化趨勢可以為AI的預(yù)測提供有效的信息。
研究人員把病人每24小時的數(shù)據(jù)信息分成了4個單元,每個單元6小時。由于有一部分信息沒有記錄時間,因此這些信息被匯總到一起,作為第5個單元,放在這個24小時信息序列的最后。在訓(xùn)練時,研究人員會把病人入院前48小時內(nèi)每一個時間單元的醫(yī)療信息(這些信息都是數(shù)字形式的,有一部分信息需要用“是”或者“否”這樣的二元描述來呈現(xiàn),因此也可以看作數(shù)字)逐一提供給AI。另外,在分析每一個時間單元時,還會把這個時間單元之前的48小時、6個月以及5年的信息分別“提煉匯總”成一份數(shù)據(jù),提供給AI。
在把這些數(shù)據(jù)輸入AI之后,AI會以時間單元為單位(按照時間順序),來“解讀”這個時間單元內(nèi)的每一種信息。每一種信息都會被賦予一個權(quán)重,以體現(xiàn)這種信息在被用于預(yù)測病人出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)時的“有用度”。
在分析完一個時間單元的信息后,AI會對病人在這個時間單元之后48小時內(nèi)出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)給出一個預(yù)測值。這個預(yù)測值會被AI“記下來”,在“解讀”下一個時間單元的信息,進(jìn)而預(yù)測病人在后面這個時間單元之后的48小時內(nèi)出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)時用作“參考”。
在分析完病人入院前48個小時里最后一個時間單元的信息后,AI會給出一個最終版的風(fēng)險(xiǎn)預(yù)測值。由于AI在分析每一個時間單元并給出一個風(fēng)險(xiǎn)預(yù)測值時,都會“參考”前一個時間單元的分析結(jié)果,而前一個時間單元的預(yù)測值又“參考”了更早的時間單元的預(yù)測值,因此這個最終版的風(fēng)險(xiǎn)預(yù)測值,呈現(xiàn)的并不僅僅是最后一個時間單元的信息,而是在過去整個48小時內(nèi),隨著時間的推移,病人生理特征變化的匯總信息,同時還體現(xiàn)出了時間越靠后的信息,對于預(yù)測出現(xiàn)急性腎損傷的風(fēng)險(xiǎn)也許會更有用這一點(diǎn)。
對于這個風(fēng)險(xiǎn)預(yù)測值,科學(xué)家設(shè)置了一個閾值(也就是“門檻”),如果最終版的預(yù)測值高于這個閾值,那么AI就會報(bào)警,提示醫(yī)生病人在未來48小時內(nèi)將會出現(xiàn)急性腎損傷。
由于這是一項(xiàng)回顧性研究,所以實(shí)際上對于每個病人在入院后48小時內(nèi)是否發(fā)生了急性腎損傷,病人的醫(yī)療信息中都有記錄。在接受訓(xùn)練的過程中,AI每完成一次最終版的預(yù)測,就會將預(yù)測結(jié)果與醫(yī)療信息中記錄下的真實(shí)情況進(jìn)行比對。如果預(yù)測結(jié)果一致,那么AI就會進(jìn)行下一輪訓(xùn)練;如果預(yù)測結(jié)果不一致,AI就會對數(shù)據(jù)中某些信息在預(yù)測時所占的權(quán)重進(jìn)行調(diào)整,然后進(jìn)行下一輪訓(xùn)練并再次做出預(yù)測。這一次,新的預(yù)測可能會和實(shí)際情況一致,這時AI就會接著進(jìn)行下一輪訓(xùn)練。但預(yù)測的結(jié)果也有可能和實(shí)際情況仍然不一致,這時AI就會再次對某些信息所占的權(quán)重進(jìn)行調(diào)整,然后進(jìn)行下一輪訓(xùn)練。
通過不斷重復(fù)這一過程,AI的預(yù)測能力就會越變越好。在訓(xùn)練的時候,沒有哪一輪訓(xùn)練一定會使AI的預(yù)測能力增強(qiáng)。實(shí)際上,如果某一輪預(yù)測失敗了,甚至可能說明上一輪的調(diào)整使AI的預(yù)測能力發(fā)生了倒退。但基于海量的數(shù)據(jù)和很多輪的訓(xùn)練,AI會不斷吸收“成功的經(jīng)驗(yàn)”并積累“失敗的教訓(xùn)”,逐漸增強(qiáng)其預(yù)測的準(zhǔn)確率。
假陽性與誤報(bào)
在整個訓(xùn)練完成后,研究人員用剩下的10%的病人的醫(yī)療信息對AI預(yù)測的準(zhǔn)確性進(jìn)行了評估(就好像是期末考試)。評估結(jié)果相當(dāng)出色。
對于這一部分用于檢驗(yàn)AI預(yù)測準(zhǔn)確性的病人,AI預(yù)測的準(zhǔn)確率達(dá)到了55.8%,假陽性的誤報(bào)率則為2:1。這個2:1的假陽性誤報(bào)率是指,AI每預(yù)測對一個將會出現(xiàn)急性腎損傷的病人,就會把兩個并不會出現(xiàn)損傷的病人誤報(bào)為將會出現(xiàn)急性腎損傷。
這個數(shù)據(jù)也許看起來并不出色,但實(shí)際上這是由多方面的原因?qū)е碌?。一方面,科學(xué)家給AI定下的“標(biāo)尺”非常高:任何病人,如果在入院后48小時內(nèi)出現(xiàn)了哪怕是非常輕微的急性腎損傷(根據(jù)嚴(yán)重程度,急性腎損傷被劃分為多個等級),而AI的預(yù)測為“否”,那么仍然算作AI預(yù)測失敗。
如果說這還算“高標(biāo)準(zhǔn),嚴(yán)要求”的話,那么在另一個方面,AI就顯得很無辜了:有的病人雖然并沒有在隨后的48小時內(nèi)出現(xiàn)急性腎損傷,但卻在48小時后稍晚一點(diǎn)時出現(xiàn)了急性腎損傷,在這種情況下AI的預(yù)測也被判定為失敗,同時也被判定為誤報(bào)。在這種情況下,AI的“高瞻遠(yuǎn)矚”反而被無情地否定了!在所有假陽性的誤報(bào)中,這種一定程度上“錯怪”AI的情況占了24.9%。
不過即使把這些情況納入考慮,AI也確實(shí)遠(yuǎn)稱不上完美。一些較為復(fù)雜的原因的確使AI出現(xiàn)了誤報(bào),比如有一些病人不久前出現(xiàn)過急性腎損傷(但已經(jīng)得到了救治),這使AI“過分解讀”了醫(yī)療記錄中的相關(guān)信息,進(jìn)而做出了錯誤的預(yù)測;還有一些病人則已經(jīng)患有其他腎病,這也許使AI“誤讀”了一些與腎臟相關(guān),但與急性腎損傷關(guān)聯(lián)較小的信息,從而做出了錯誤的預(yù)測。好在科學(xué)家并沒有只是讓AI簡單地輸出一個“是”或者“否”的預(yù)測結(jié)果,而是同時還會給出一個預(yù)測結(jié)果的“確定度”,也就是說AI還把這個預(yù)測正確的“把握”有多大的信息也呈現(xiàn)給了醫(yī)生,這使醫(yī)生還可以結(jié)合自己的經(jīng)驗(yàn)來做出判斷。
表現(xiàn)驚艷
對于那些后來證明將會出現(xiàn)嚴(yán)重急性腎損傷的病人來說,AI的預(yù)測就堪稱驚艷了。在那些入院48小時內(nèi)就會出現(xiàn)急性腎損傷,并且在隨后的30天內(nèi)就必須要接受血液透析的病人(不論在入院48小時內(nèi)出現(xiàn)的急性腎損傷的程度是輕是重),AI預(yù)測的準(zhǔn)確率達(dá)到了84.3%;而對于那些入院48小時內(nèi)就會出現(xiàn)急性腎損傷,并且在隨后的90天內(nèi)就必須要接受血液透析的病人,AI預(yù)測的準(zhǔn)確率則高達(dá)90.2%。
毫無疑問,對于這些病人,如果不在盡可能早的階段進(jìn)行救治,那么他們的腎臟將會出現(xiàn)嚴(yán)重的不可逆損傷,有可能在隨后的一生中都需要接受血液透析,甚至需要接受腎臟移植。對于他們來說,AI提前48小時的預(yù)測將可能改變他們的人生,甚至可能意味著生死之別。
盡管AI的表現(xiàn)已經(jīng)非常優(yōu)異,但論文的作者仍然認(rèn)為其性能還有很大的提升空間。一方面,AI還存在不小比例的假陽性誤報(bào)的情況,這在未來也許可以通過使用更大量的數(shù)據(jù)(尤其是更多患有或者此前患過腎病的病人的數(shù)據(jù))訓(xùn)練AI等方法得到解決。另外,在這項(xiàng)研究使用的數(shù)據(jù)中,絕大多數(shù)病人都是白人男性,這有可能會使AI在預(yù)測女性或者其他族裔的病人的患病風(fēng)險(xiǎn)時,準(zhǔn)確性不如白人男性病人。
實(shí)際上,這是目前大數(shù)據(jù)和人工智能技術(shù)普遍面臨的一個問題:如果用于訓(xùn)練的數(shù)據(jù)只集中在某一個特定的群體中,那么AI在其他群體中的表現(xiàn)也許并不會非常好,甚至可能會非常糟糕。要解決個問題,唯一的辦法就是使用更加廣泛、充分代表各個群體的數(shù)據(jù)來訓(xùn)練AI。還有一點(diǎn)需要注意的是,這項(xiàng)研究是回顧性的研究。但此前其他領(lǐng)域的一些研究發(fā)現(xiàn),當(dāng)把這類回顧性研究中訓(xùn)練出的AI用于現(xiàn)實(shí)中的時候,AI的表現(xiàn)有時候會不如研究中評估得出的結(jié)果那么好。因此,DeepMind的這一AI的表現(xiàn)還有待在臨床應(yīng)用中進(jìn)行檢驗(yàn)。
未來將使醫(yī)生失業(yè)?
也許有人對完成這項(xiàng)研究的公司DeepMind并沒有太多印象,但圍棋人工智能AI“阿爾法狗”可能很多人都聽說過。研發(fā)出阿爾法狗并戰(zhàn)勝柯潔等世界圍棋冠軍的,正是谷歌旗下的這家英國公司。
2016年2月,DeepMind成立了專門致力于醫(yī)療健康領(lǐng)域研究的部門DeepMind Health。預(yù)測急性腎損傷的AI便是DeepMind Health的研究成果。而在此之前,DeepMind Health還于2018年研發(fā)出了一款檢測眼部疾病的AI。通過讀取病人眼部掃描的影像,這一AI能夠?qū)Τ^50種眼病進(jìn)行診斷并提出治療建議,其準(zhǔn)確性已經(jīng)達(dá)到了相關(guān)領(lǐng)域世界頂級專家的水平。
實(shí)際上在過去幾年間,借助于人工智能和大數(shù)據(jù)技術(shù),科學(xué)家已經(jīng)研發(fā)出了很多達(dá)到醫(yī)學(xué)專家水平的AI:有的AI可以通過病人的眼底影像來預(yù)測病人未來罹患心血管疾病的風(fēng)險(xiǎn);有的AI能夠通過讀取病人病理切片的影像發(fā)現(xiàn)醫(yī)生難于發(fā)現(xiàn)的癌癥特征;有的AI能夠通過閱讀和學(xué)習(xí)數(shù)以千萬篇醫(yī)學(xué)文獻(xiàn)診斷出醫(yī)生無法診斷的疾病。IBM的超級計(jì)算機(jī)“沃森”在2016年通過閱讀和學(xué)習(xí)超過2000萬篇癌癥研究論文,診斷出一名病人患有一種極為罕見的白血病,全程僅花了十分鐘。
盡管這些AI可能還算不上盡善盡美,但隨著計(jì)算機(jī)技術(shù)、人工智能和大數(shù)據(jù)等領(lǐng)域的進(jìn)步,相信AI將在未來實(shí)現(xiàn)更多醫(yī)學(xué)領(lǐng)域的突破,幫助醫(yī)生和病人更好地預(yù)防和治療疾病、提高病人的生活質(zhì)量并減輕社會的負(fù)擔(dān)。