朱京京 尹瑞華 葛琛陽(yáng) 胡 斌 王小紅 單 前何國(guó)斌 鄭紅娟 凌麗仙 傅健飛
1浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院病案室,321000浙江 金華;2浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院腫瘤內(nèi)科,321000浙江 金華;3浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院結(jié)直腸肛門外科,321000浙江 金華;4浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院病理科,321000浙江 金華;5金華市疾病預(yù)防控制中心,321000浙江 金華;6浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院信息科,321000浙江 金華;7浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院統(tǒng)計(jì)室,321000浙江 金華
在中國(guó),結(jié)直腸癌的發(fā)病率及死亡率仍在增加[1]。最近資料統(tǒng)計(jì)顯示,我國(guó)2018年結(jié)直腸癌新發(fā)病例37.6萬(wàn)例,死亡病例19.1萬(wàn)例,已成為全球結(jié)直腸癌每年新發(fā)病例數(shù)和死亡病例數(shù)最多的國(guó)家[2]。
臨床數(shù)據(jù)庫(kù)是反映患者的基本特征、疾病特點(diǎn)、治療方式以及疾病轉(zhuǎn)歸等多個(gè)因素的合集,是全球研究腫瘤的有效工具[3-4]。美國(guó)國(guó)立癌癥研究所 “監(jiān)測(cè)流行病學(xué)和結(jié)果”數(shù)據(jù)庫(kù)(the surveillance,epidemiology,and end fesults,SEER)是美國(guó)國(guó)家癌癥研究所在1973年建立的綜合性癌癥數(shù)據(jù)庫(kù),收集了患者的人口統(tǒng)計(jì)學(xué)信息、癌癥特征、病理分期等,并統(tǒng)計(jì)了患者預(yù)后相關(guān)的信息情況[5]。美國(guó)國(guó)家癌癥數(shù)據(jù)庫(kù)(the national cancer database,NCDB)是世界上最大的癌癥注冊(cè)機(jī)構(gòu)之一。其之所以得到迅速的發(fā)展,重要原因就是利用信息化將患者的信息整合在了一起。到2016年,NC-DB積累記錄了超過(guò)3 400萬(wàn)例癌癥患者的信息[6]。
而我國(guó)目前尚未建立一個(gè)綜合的大型腫瘤數(shù)據(jù)庫(kù),通過(guò)醫(yī)院信息化系統(tǒng)建立癌癥數(shù)據(jù)庫(kù)更是鮮有報(bào)道。只有華西醫(yī)院在2013年將醫(yī)院信息系統(tǒng)、檢驗(yàn)科信息系統(tǒng)相結(jié)合,建立了首個(gè)基于醫(yī)院科研系統(tǒng)的疾病數(shù)據(jù)庫(kù)——“肺癌外科病例管理數(shù)據(jù)庫(kù)”[7]。
目前我國(guó)醫(yī)院現(xiàn)有的病案首頁(yè)系統(tǒng)是按照ICD-10的診斷編碼和《國(guó)際疾病分類第九版臨床修訂本手術(shù)與操作》(ICD-9-CM-3)的操作編碼,依據(jù)疾病診斷、患者年齡、治療方式、疾病嚴(yán)重程度及轉(zhuǎn)歸等因素,將病例進(jìn)行分組[8]。浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院是最早應(yīng)用病案首頁(yè)ICD-10編碼系統(tǒng)對(duì)疾病進(jìn)行分組的醫(yī)院之一,盲法于醫(yī)保體系,數(shù)據(jù)真實(shí)。對(duì)患者人口特征信息、診斷、有創(chuàng)的操作、手術(shù)都有記錄;對(duì)于死亡病例,有死亡時(shí)間和死亡疾病編碼,采用ICD-10進(jìn)行死因進(jìn)行分類和編碼。
從浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院病案首頁(yè)系統(tǒng)ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)、病理數(shù)據(jù)庫(kù)和腫瘤報(bào)卡數(shù)據(jù)庫(kù)中檢索出所有2013年1月至2019年12月的結(jié)腸癌病人。ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)中提取字段包括人口學(xué)特征(姓名、年齡、性別、住院號(hào)、入院日期、出院日期)、主診斷疾病、ICD-10編碼、治療情況(手術(shù)、化療)、轉(zhuǎn)歸情況。檢索詞采用 “主診斷ICD類目編碼=C18”,年份采用出院日期進(jìn)行限制。治療包括手術(shù)和化療,手術(shù)操作碼不為空?;熐闆r,采用主診斷ICD亞目編碼=Z51.1,而全診斷疾病編碼類目包含C18,進(jìn)行檢索。死亡情況采用轉(zhuǎn)歸為死亡,全診斷疾病編碼類目包含C18碼,進(jìn)行檢索。以身份證號(hào)為唯一字段,通過(guò)住院號(hào)、住院日期、年齡對(duì)身份證號(hào)進(jìn)行修正,刪除同一姓名伴有多個(gè)身份證的記錄,建立ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)。
病理庫(kù)采用包含 “腸”和 “癌”進(jìn)行篩選,再根據(jù)病理報(bào)告人工篩選出符合結(jié)腸癌的病人。同樣采用身份證號(hào)為唯一號(hào)構(gòu)建數(shù)據(jù)庫(kù),對(duì)于同一個(gè)病人存在的多次病理報(bào)告進(jìn)行合并。
腫瘤報(bào)卡數(shù)據(jù)庫(kù),采用報(bào)卡單位=浙江大學(xué)醫(yī)學(xué)院附屬金華醫(yī)院,ICD編碼類目=C18進(jìn)行檢索。同樣采用身份證號(hào)為唯一號(hào),構(gòu)建數(shù)據(jù)庫(kù)?;颊呱嫫谧栽\斷日期起,到最后一次隨訪時(shí)間為止。隨訪終點(diǎn)時(shí)間為2019年12月,計(jì)算出患者的生存時(shí)間。
根據(jù)惡性腫瘤主診斷選擇原則,統(tǒng)計(jì)C18多次編碼的復(fù)發(fā)與死亡情況。對(duì)死亡病人,根據(jù)主診斷明確是否死于結(jié)腸癌,若并非死于結(jié)腸癌則明確具體死亡原因。根據(jù)全診斷包含有C18,主診斷為其他C碼(C01~C76),統(tǒng)計(jì)第二腫瘤發(fā)生情況。
不同組別生存差異的比較采用Kaplan-Meier方法,采用Log-rank對(duì)組間生存差異進(jìn)行檢驗(yàn),檢驗(yàn)水準(zhǔn)α雙側(cè)=0.05。所有統(tǒng)計(jì)均采用R 4.0.3進(jìn)行分析,生存分析采用R軟件的 “survminer”“survival”軟件包。
根據(jù)入組標(biāo)準(zhǔn)共檢索出C18碼1 262人次,通過(guò)身份證去重,最后入組1 148例結(jié)腸癌患者,生成ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)。將ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)與1 060例的病理數(shù)據(jù)庫(kù)取交集,合成具有988例的病理病案數(shù)據(jù)庫(kù)。將病理病案數(shù)據(jù)庫(kù)與831例的腫瘤報(bào)卡數(shù)據(jù)庫(kù)匯合,建立581例的結(jié)腸癌隊(duì)列。隊(duì)列涵蓋了所有患者的病理分期、治療信息與隨訪信息。見(jiàn)圖1。
圖1 病人入組流程圖
化療通過(guò)主診斷亞目編碼=Z51.1進(jìn)行整理,根據(jù)費(fèi)用里涉及的化療藥費(fèi)(大于1 000元),明確3 786人次化療,通過(guò)去重明確化療病人767例,組成化療庫(kù)。通過(guò)匹配發(fā)現(xiàn),化療庫(kù)中有575例病人同時(shí)存在于ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù),192例未在ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)檢索到。在ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù)入組的1 148例病人中,573例(49.9%)病人賦值為 “無(wú)或者unknown”,575例(50.1%)病人進(jìn)行了化療。進(jìn)一步分析,化療次數(shù)1~49次不等,其中只化療1次的病人110例(9.58%),化療8次的112例(9.76%)。根據(jù)腫瘤手術(shù)操作碼情況進(jìn)行匹配,發(fā)現(xiàn)無(wú)手術(shù)操作碼的病人有77例(6.7%)。見(jiàn)表1。
表1 結(jié)腸癌患者化療及手術(shù)次數(shù)
根據(jù)惡性腫瘤主診斷選擇選擇原則,結(jié)腸癌初診斷、結(jié)腸癌手術(shù)、結(jié)腸癌初次復(fù)發(fā)、因結(jié)腸癌死亡編碼C18。分析多次C18碼,統(tǒng)計(jì)出共有216條C18記錄存在重復(fù),涉及102例結(jié)腸癌患者。12例(11.8%)出現(xiàn)3次C18碼,4例死亡病例。90例(88.2%)出現(xiàn)2次C18碼,其中有18例死亡病例。
死亡轉(zhuǎn)歸,C18碼出現(xiàn)在全診斷中的病人47例,出現(xiàn)在以C18碼為主診斷的記錄中,共有38例(80.9%)。死亡原因?yàn)榉墙Y(jié)腸癌的有9例(19.1%)。
主診斷ICD-10編碼類目是其他C碼而在全診斷中出現(xiàn)C18碼,共有165例。通過(guò)甄別,有79例(47.9%)可以通過(guò)編碼來(lái)明確第二腫瘤的發(fā)生;但86例(52.1%)將轉(zhuǎn)移灶視為原發(fā)灶,如肺轉(zhuǎn)移被編碼為C78碼,其實(shí)并非肺原發(fā)。
根據(jù)病理結(jié)果進(jìn)行TNM分期。Ⅰ期、Ⅱ期、Ⅲ期、Ⅳ期病人分別有89例(15.3%)、248例(42.7%)、210例(36.1%)、34例(5.9%)。截至末次隨訪時(shí)間2019年12月,全組581例結(jié)腸癌患者中位隨訪時(shí)間為23.0月(范圍0.17~95.3月),3年生存率分別為81.4%、79.7%、67.1%、66.3%,P=0.008,差異有統(tǒng)計(jì)學(xué)意義。見(jiàn)圖2、表2。
圖2 I-IV期結(jié)腸癌生存曲線
表2 不同隨訪時(shí)間和TNM分期的結(jié)腸癌生存人數(shù)
利用醫(yī)院信息化系統(tǒng)建立結(jié)腸癌隊(duì)列的同時(shí),我們也通過(guò)手工錄入的形式收集了所有在金華醫(yī)院進(jìn)行手術(shù)治療的患者信息,包括患者術(shù)前檢查情況、術(shù)后病理分期、治療情況與隨訪信息,建立了金華醫(yī)院結(jié)直腸科研數(shù)據(jù)庫(kù)。將其中的結(jié)腸癌患者篩選出來(lái),再將結(jié)腸癌信息化隊(duì)列數(shù)據(jù)與其匹配,驗(yàn)證所建立的結(jié)腸癌隊(duì)列的完成率。見(jiàn)表3。
表3 建立的結(jié)腸癌信息化隊(duì)列與結(jié)腸癌科研數(shù)據(jù)庫(kù)匹配情況
浙江大學(xué)附屬金華醫(yī)院結(jié)腸癌隊(duì)列的建立,充分利用了醫(yī)院的信息化系統(tǒng),將病案首頁(yè)系統(tǒng)、病理科數(shù)據(jù)、疾控中心隨訪信息整合。通過(guò)ICD-10首頁(yè)編碼系統(tǒng)獲取了患者的人口統(tǒng)計(jì)學(xué)信息并通過(guò)全診斷包含有C18,主診斷為其他C碼(C01~C76)統(tǒng)計(jì)多原發(fā)腫瘤患者的患病情況。通過(guò)將ICD-10首頁(yè)編碼系統(tǒng)與疾控?cái)?shù)據(jù)整合又可以獲取患者的轉(zhuǎn)歸情況,充分利用了現(xiàn)代化信息建設(shè),可以簡(jiǎn)單而快捷地建立腫瘤數(shù)據(jù)庫(kù)。
根據(jù)結(jié)果進(jìn)行分析,設(shè)置主診斷ICD編碼類目=Z51.1碼,次診斷中出現(xiàn)C18碼,可以得出結(jié)腸癌患者的化療信息。以此類推,將檢索關(guān)鍵詞設(shè)置為Z51.0,可以得到患者放療信息,通過(guò)主診斷為Z51.1,次診斷中出現(xiàn)Z51.0得到進(jìn)行放化療患者的人數(shù),充分獲取患者的治療情況。
對(duì)于死亡病人數(shù)據(jù)的獲取,分為院內(nèi)院外2種途徑,其中最主要的是通過(guò)腫瘤報(bào)卡數(shù)據(jù)庫(kù)獲取,疾控中心通過(guò)電話隨訪得到患者院外死亡的數(shù)據(jù)。而通過(guò)ICD-10首頁(yè)編碼系統(tǒng)數(shù)據(jù)庫(kù),可以篩選出同一個(gè)病人出現(xiàn)多次主診斷C18碼的信息,然后將 “轉(zhuǎn)歸情況”字段設(shè)置為死亡,獲取院內(nèi)死亡病人的信息。
對(duì)于全診斷包含有C18,主診斷為其他C碼(C01~C76)的病人,如果編碼正確,則可以統(tǒng)計(jì)多原發(fā)腫瘤的發(fā)生情況。但是本研究建立的隊(duì)列還不能完美地實(shí)現(xiàn)這一點(diǎn),轉(zhuǎn)移灶和原發(fā)第二腫瘤的編碼不能很好地區(qū)分開(kāi),在今后的工作中應(yīng)引起重視。
葉斯斯[9]建立了解放軍總醫(yī)院的結(jié)直腸癌數(shù)據(jù)庫(kù),按照主診斷編碼C18、C19篩選出結(jié)直腸癌患者,通過(guò)隨訪數(shù)據(jù)研究了各線化療藥物與患者預(yù)后之間的關(guān)系。他們更多是通過(guò)手工查詢的方法建立數(shù)據(jù)庫(kù),大大增加了工作量。而我們將ICD-10首頁(yè)編碼系統(tǒng)與結(jié)腸癌病理庫(kù)聯(lián)系起來(lái),利用醫(yī)院信息化高效地完成隊(duì)列的建立。另外,對(duì)于需要花費(fèi)更多人力資源的隨訪工作,我們通過(guò)腫瘤報(bào)卡系統(tǒng)與疾控中心對(duì)接,信息化地獲取治療結(jié)局。數(shù)據(jù)庫(kù)的建設(shè),更多是為了滿足科研的需要,為此我們對(duì)所建立數(shù)據(jù)庫(kù),通過(guò)基于分期的生存分析,明確數(shù)據(jù)庫(kù)信息的準(zhǔn)確性。從生存結(jié)果發(fā)現(xiàn)各個(gè)不同分期之間的生存曲線明確分開(kāi),中位生存時(shí)間與國(guó)內(nèi)外報(bào)告的數(shù)據(jù)基本符合,表明該數(shù)據(jù)可以很好服務(wù)于個(gè)性化科研工作的開(kāi)展[10]。同時(shí),結(jié)腸癌數(shù)據(jù)庫(kù)的成功建立也為其他病種數(shù)據(jù)庫(kù)的建立打下了基礎(chǔ),未來(lái)將有更廣泛的應(yīng)用價(jià)值。
為了更好地了解信息化建立數(shù)據(jù)庫(kù)樣本量丟失情況,本研究將同時(shí)期手工錄入的結(jié)直腸科研數(shù)據(jù)庫(kù),作為金標(biāo)準(zhǔn)進(jìn)行分析,表明入組率約為69.8%。針對(duì)未能正確入組原因進(jìn)行深入分析,主要在于 “病理報(bào)告”和 “腫瘤報(bào)卡”規(guī)范化,目前缺乏有效的監(jiān)管,在做數(shù)據(jù)庫(kù)交集時(shí)比較容易出現(xiàn) “紕漏”。我們建議,病理報(bào)告采用格式報(bào)告,同時(shí)采用ICD-10進(jìn)行規(guī)范診斷,將有助于提高信息化建立數(shù)據(jù)庫(kù)的病人入組率。
同時(shí),數(shù)據(jù)庫(kù)的構(gòu)建過(guò)程中還存在著一些不足。第一,本研究的核心數(shù)據(jù)庫(kù)來(lái)源于一家樣本醫(yī)院,雖然該醫(yī)院為本地市最大醫(yī)療機(jī)構(gòu),醫(yī)療服務(wù)總量占市本級(jí)近五成,但從前期數(shù)據(jù)中發(fā)現(xiàn)Ⅰ期、Ⅳ期的病人較少,可能存在選擇偏倚,后續(xù)還需擴(kuò)大樣本的數(shù)量及覆蓋面。第二,對(duì)于化療信息,通過(guò)我們建立的數(shù)據(jù)庫(kù),只能得到患者化療與否,具體的化療方案尚不明確。這是通過(guò)信息化建立數(shù)據(jù)庫(kù)的通病,SEER數(shù)據(jù)庫(kù)等大型數(shù)據(jù)庫(kù)也同樣存在這樣的問(wèn)題,隨著數(shù)據(jù)庫(kù)信息的進(jìn)一步補(bǔ)充,我們將對(duì)隊(duì)列進(jìn)一步完善。
利用醫(yī)院信息化與腫瘤報(bào)卡系統(tǒng)、疾控的隨訪系統(tǒng)相結(jié)合建立數(shù)據(jù)庫(kù)是可行的。利用該模式有助于在區(qū)域(地區(qū)市)內(nèi)、省級(jí)乃至國(guó)家層面形成腫瘤數(shù)據(jù)庫(kù),從而建立起類似SEER、NCDB這樣的大型腫瘤數(shù)據(jù)庫(kù),為腫瘤發(fā)病、治療、生存分析等相關(guān)研究,提供確切有用的數(shù)據(jù)支持。