柳青青,田國祥,宋偉倫,耿輝,王雪,呂軍
重癥醫(yī)學(xué)是研究任何損傷或疾病導(dǎo)致機(jī)體向死亡方向發(fā)展過程的特點(diǎn)和規(guī)律性,并對重癥進(jìn)行治療的學(xué)科[1]。該學(xué)科重點(diǎn)是對危重患者實(shí)施監(jiān)護(hù)、對器官功能低下或衰竭臟器實(shí)施器官支持,使患者在保證氧輸送和維持器官功能條件下贏得去除病因的時(shí)間[2]。由于有完整的學(xué)術(shù)內(nèi)涵與自身特點(diǎn),重癥醫(yī)學(xué)已成為應(yīng)對突發(fā)公共事件、搶救危重患者時(shí),不可替代的專業(yè)學(xué)科[3]。重癥醫(yī)學(xué)科已被證明能夠適應(yīng)變化,并引領(lǐng)學(xué)科發(fā)展。大數(shù)據(jù)時(shí)代為重癥醫(yī)學(xué)的研究提供了前所未有的機(jī)遇,可以預(yù)見,通過加強(qiáng)基礎(chǔ)與臨床研究,充分利用大數(shù)據(jù)與人工智能是未來重癥醫(yī)學(xué)的發(fā)展趨勢[4]。
為了促進(jìn)重癥醫(yī)學(xué)研究工作,在美國國立衛(wèi)生研究院的資助下,由美國麻省理工學(xué)院計(jì)算生理學(xué)實(shí)驗(yàn)室、貝斯以色列迪康醫(yī)學(xué)中心以及飛利浦醫(yī)療共同發(fā)布的MIMIC(Medical Information Mart for Intensive Care)數(shù)據(jù)庫收集整理了2001~2012年間住在貝斯以色列迪康醫(yī)學(xué)中心重癥監(jiān)護(hù)室共4萬余例真實(shí)患者的臨床診療信息[5]。該數(shù)據(jù)庫樣本量大、信息全面、跟蹤患者時(shí)間長、并且可免費(fèi)申請使用,為重癥醫(yī)學(xué)的研究提供了豐富資源。但MIMIC數(shù)據(jù)庫在使用過程中涉及到編碼的工作,這對于臨床醫(yī)生來言是一個(gè)挑戰(zhàn)。github(網(wǎng)址:https://github.com/MIT-lcp/mimic-code)是一個(gè)開放的平臺(tái),該平臺(tái)提供了分析患者特征的開源代碼包,可以免費(fèi)下載使用,當(dāng)發(fā)現(xiàn)代碼包需要改進(jìn)時(shí),可修改并在討論區(qū)分享,供其他研究者下載使用。該代碼庫是研究人員使用MIMIC數(shù)據(jù)庫的有利工具。
MIMIC是一個(gè)重癥醫(yī)學(xué)數(shù)據(jù)庫,全稱是Medical Information Mart for Intensive Care。在美國國立衛(wèi)生研究院的資助下,來自貝斯以色列執(zhí)事醫(yī)療中心、麻省理工、牛津大學(xué)和麻省總醫(yī)院的急診科醫(yī)生、重癥科醫(yī)生、計(jì)算機(jī)科學(xué)專家等在2003年共同建立了這個(gè)數(shù)據(jù)庫。該數(shù)據(jù)庫在建立之初的名字為Multiparameter Intelligent Monitoring in Intensive Care Ⅱ,簡寫為MIMIC Ⅱ。2016年MIMIC Ⅱ升級(jí)為MIMIC Ⅲ。 目前的版本是1.4(V1.4),共包含了2001年6月~2012年10月間在重癥監(jiān)護(hù)病房住院的38 645例成年個(gè)體和7875例新生兒的58 000余次住院資料。這些資料被整理成了26個(gè)CSV格式的表格供研究者查詢。不僅如此,MIMIC Ⅱ及MIMIC Ⅲ都與社保數(shù)據(jù)庫相連接,記錄了患者的隨訪時(shí)間和結(jié)局,這一點(diǎn)對于開展遠(yuǎn)期預(yù)后研究來說極為關(guān)鍵。
MIMIC Ⅲ數(shù)據(jù)庫一共有26個(gè)CSV格式的表格,這些表格詳細(xì)記錄了患者在ICU治療期間的幾乎所有的數(shù)據(jù),比如實(shí)驗(yàn)室檢查數(shù)據(jù)、人口學(xué)特征、微生物學(xué)檢查結(jié)果、住院期間的流轉(zhuǎn)、治療過程、液體進(jìn)出量等。表格主要分為兩種,一種是以D開頭的,表示該表格為字典,比如d_labitems,表示實(shí)驗(yàn)室檢查字典,內(nèi)含每個(gè)實(shí)驗(yàn)室檢查結(jié)果的說明;沒有以D打頭的表格則是記錄患者信息的表格,比如labevents表示患者住院期間的所有實(shí)驗(yàn)室檢查結(jié)果。
MIMIC代碼庫的代碼可在線獲取,而且是開源的。根據(jù)網(wǎng)址https://github.com/MIT-lcp/mimiccode打開網(wǎng)頁,進(jìn)入代碼庫,界面如圖1所示。
圖1 代碼庫界面
代碼庫主要由基準(zhǔn),buildmimic,概念,notebooks,notebooks/aline,測試以及教程這七個(gè)部分構(gòu)成(表1)。
表1 代碼庫內(nèi)容及功能
研究過程中要使用的代碼主要集中在概念部分,因此,本文將著重介紹概念部分,方便讀者快速了解代碼庫的內(nèi)容并查找所需代碼。概念部分的結(jié)構(gòu)如圖2所示。
3.1 合并癥合并癥是指由一種疾病的發(fā)展所引起的另一種疾病或癥狀。住在重癥監(jiān)護(hù)室的患者都是危重患者,住院時(shí)間長,損傷性操作多,留置管道較多,護(hù)理中稍有不慎,極易發(fā)生各種合并癥(如院內(nèi)感染等)。大多數(shù)ICU患者在急性發(fā)作前都患有慢性疾病,這些疾病會(huì)影響他們在危重疾病下幸存的可能性[6]。MIMIC數(shù)據(jù)庫樣本量大,患者信息全面,可提供充足的并發(fā)癥資料,幫助臨床工作人員進(jìn)行相關(guān)研究。Elixhauser等利用代碼將這些合并癥分類[7],如肥胖,凝血病和電解質(zhì)紊亂等。美國健康與研究質(zhì)量小組繼續(xù)利用項(xiàng)目維護(hù)這些代碼,并根據(jù)診斷和治療的變化對其進(jìn)行相應(yīng)調(diào)整[8]。這些代碼都可以在MIMIC代碼庫中找到并下載使用,界面如圖3所示。
圖2 概念部分內(nèi)容
圖3 合并癥代碼界面
3.2 膿毒癥膿毒癥是指由感染因素引起的全身炎癥反應(yīng)綜合征,嚴(yán)重時(shí)可導(dǎo)致器官功能障礙和(或)循環(huán)障礙,是嚴(yán)重創(chuàng)傷、燒傷、休克、感染和外科大手術(shù)等常見的并發(fā)癥。按膿毒癥嚴(yán)重程度可分膿毒癥、嚴(yán)重膿毒癥和膿毒性休克,進(jìn)一步發(fā)展可導(dǎo)致多器官功能障礙綜合征等[9]。流行病學(xué)研究顯示其發(fā)生率呈逐漸上升趨勢,已成為導(dǎo)致人類死亡的重要因素之一[10]。許多學(xué)者都致力于膿毒癥的研究,但MIMIC數(shù)據(jù)庫中并沒有直接表示膿毒癥的代碼。Angus和Martin等利用管理數(shù)據(jù),特別是在出院時(shí)獲得的賬單編碼,回顧性進(jìn)行膿毒癥的鑒定,使用一組代碼定義了膿毒癥的算法[11]。Angus等提出的標(biāo)準(zhǔn)在Iwashyna等的后續(xù)研究中得到了驗(yàn)證[12]。這些代碼可以在存儲(chǔ)庫中下載使用(圖4)。
圖4 膿毒癥代碼界面
3.3 疾病嚴(yán)重程度評分ICU患者病情復(fù)雜多變,因此,風(fēng)險(xiǎn)水平的準(zhǔn)確判定對ICU患者極為重要,規(guī)范標(biāo)準(zhǔn)化的、具高精確度和特異度的評分標(biāo)準(zhǔn)為臨床醫(yī)生的診治提供了依據(jù)。近幾十年來,疾病的嚴(yán)重程度評分不斷發(fā)展。這些評分可客觀評估新入住患者的病情嚴(yán)重程度及判斷預(yù)后。在臨床研究工作中,可以對患者人群進(jìn)行風(fēng)險(xiǎn)調(diào)整,以進(jìn)行基準(zhǔn)測試和研究,例如臨床試驗(yàn)中的比較隊(duì)列和觀察性研究[13]。但這些評分納入的指標(biāo)較多,計(jì)算較復(fù)雜,不同疾病的嚴(yán)重程度評分所納入的指標(biāo)也不同,在MIMIC數(shù)據(jù)庫中,也無法直接獲取表示疾病嚴(yán)重程度評分的指標(biāo),增加了利用MIMIC數(shù)據(jù)庫研究膿毒癥的難度。這一問題在MIMIC代碼庫中得到了解決,目前在該代碼庫中包含了三種疾病嚴(yán)重程度評分:牛津大學(xué)疾病嚴(yán)重程度評分(OASIS)(圖5),簡化急性生理學(xué)評分(圖6)(SAPS)以及序貫性器官功能衰竭評分(SOFA)(圖7)。疾病嚴(yán)重程度評分代碼界面如圖8所示。
圖5 牛津大學(xué)疾病嚴(yán)重程度評分
圖6 簡化急性生理學(xué)評分
圖7 序貫性器官功能衰竭評分
圖8 疾病嚴(yán)重程度評分
OASIS是由Johnson等建立的疾病嚴(yán)重程度評分系統(tǒng),旨在簡化危重護(hù)理中的風(fēng)險(xiǎn)調(diào)整。與傳統(tǒng)疾病嚴(yán)重程度評分不同的是,OASIS的計(jì)算僅涉及10個(gè)參數(shù),包括轉(zhuǎn)入ICU前住院時(shí)間、年齡、心率、平均動(dòng)脈壓、呼吸頻率、體溫以及尿量等,不依賴于任何實(shí)驗(yàn)室檢驗(yàn)指標(biāo)[14]。SAPS是目前臨床上常用的疾病嚴(yán)重程度評分之一[15],由17項(xiàng)變量[生理學(xué)變量12項(xiàng)、年齡、住院類型及3種慢性疾病——獲得性免疫缺陷綜合征(AIDS)、轉(zhuǎn)移癌和血液惡性腫瘤]構(gòu)成,每項(xiàng)變量分值不等,最低0分,最高26分,總分0~163分。生理學(xué)變量仍取患者入住ICU后第1個(gè)24 h內(nèi)的最差值(即得分最高者),缺如項(xiàng)視為正常,總分越高,表示病情越重,預(yù)后越差。SOFA評分的目的是描述多器官功能障礙綜合征的發(fā)生、發(fā)展并評價(jià)發(fā)病率;定量的、盡可能客觀地描述群體患者乃至個(gè)體患者在不同時(shí)間臟器功能失?;蛩ソ叩膰?yán)重程度;評價(jià)新療法對臟器功能失常或衰竭病程的影響,具有客觀、簡單、容易獲得及可靠的特點(diǎn),對所評價(jià)的器官功能有特異性,每個(gè)醫(yī)療機(jī)構(gòu)都能以常規(guī)的方法每天檢測,避免了有創(chuàng)性操作。這些變量與患者來源、病種、人口統(tǒng)計(jì)學(xué)特征等因素?zé)o關(guān),與治療措施無關(guān),它能區(qū)分單個(gè)器官功能障礙或衰竭的程度。在MIMIC代碼庫中有直接上述三種評分的代碼,可極大程度節(jié)省研究人員的時(shí)間與精力。
除此之外,該代碼庫還提到了三種可通過編碼獲得,但目前尚未完成的疾病嚴(yán)重程度評分(圖9),分別是簡化急性生理評分Ⅱ,簡化急性生理學(xué)評分Ⅲ以及急性生理與慢性健康評分Ⅳ,研究人員可以自行編寫代碼并上傳到討論區(qū)與其他用戶進(jìn)行交流。
圖9 文件查找頁面
3.4 其它MIMIC代碼庫中還包含了人口統(tǒng)計(jì)學(xué)資料,診斷,第1 d入住ICU的情況,液體平衡,器官衰竭及各種治療的起止時(shí)間或各種現(xiàn)象的持續(xù)時(shí)間等指標(biāo)的代碼。研究者在使用MIMIC數(shù)據(jù)庫的過程中,可直接下載并使用這些代碼。為方便用戶快速找到所需代碼MIMIC代碼庫還設(shè)置了文件查找功能(圖9),極大提高了研究者的工作效率。
醫(yī)學(xué)研究是不斷在進(jìn)步的,代碼庫中現(xiàn)有的代碼并不能夠滿足全球科研工作者的需求。MIMIC代碼庫不僅可提供代碼,還支持全球的研究者在討論區(qū)上傳自己的代碼(圖10),可加強(qiáng)MIMIC數(shù)據(jù)庫的維護(hù)者與普通用戶之間的交流。研究人員可以在討論區(qū)提出關(guān)于收集和分析數(shù)據(jù)的問題,有經(jīng)驗(yàn)的用戶可以提供見解和建議。這種對應(yīng)關(guān)系有助于對數(shù)據(jù)進(jìn)行適當(dāng)和有意義的使用,并且由于所有討論都是公開的,討論結(jié)果可直接被下載使用。這項(xiàng)功能可以鼓勵(lì)研究人員為MIMIC代碼庫做出貢獻(xiàn),也可促進(jìn)代碼庫的不斷發(fā)展。
MIMIC數(shù)據(jù)庫收集整理了2001~2012年間住在貝斯以色列迪康醫(yī)學(xué)中心重癥監(jiān)護(hù)室共計(jì)4萬余名真實(shí)患者的臨床診療信息,樣本量大,信息全面,且免費(fèi)向全球的研究者開放,為重癥醫(yī)學(xué)的研究提供了豐富的數(shù)據(jù)。但MIMIC數(shù)據(jù)庫使用過程中涉及到編寫代碼的問題,對于普通的臨床工作者來說,操作難度太大。Github為MIMIC代碼庫搭建了一個(gè)平臺(tái),該代碼庫中有大量分析患者特征的開源代碼包,包括合并癥、疾病嚴(yán)重程度評分、膿毒癥及人口統(tǒng)計(jì)學(xué)資料等,為大多數(shù)研究者解決了編寫分析代碼的困難。此外,該平臺(tái)還提供了討論交流區(qū),用戶可提出問題并與其它用戶探討,或上傳自己的代碼,經(jīng)驗(yàn)證后供其他用戶下載使用,這種交流可以促進(jìn)MIMIC代碼庫不斷的發(fā)展。本文介紹了MIMIC代碼庫的主要內(nèi)容,旨在減少科研工作者在編寫代碼等方面所花費(fèi)的時(shí)間和精力,從而幫助科研工作者快速、高效的進(jìn)行科研工作。
圖10 討論區(qū)界面