陳罡 何融泉 馬劼 馮振博
【中圖分類號】R259 【文獻標識碼】A 【文章編號】2095-3089(2018)11-0233-02
近年來,在精準醫(yī)學(xué)推動下,深度測序技術(shù)不斷普及,測序成本不斷降低,海量的數(shù)據(jù)不斷涌入臨床醫(yī)學(xué)領(lǐng)域[1]。醫(yī)療大數(shù)據(jù)不斷沖擊傳統(tǒng)醫(yī)學(xué),也不斷更新和呼吁新的醫(yī)學(xué)教學(xué)、科研教學(xué)和臨床醫(yī)學(xué)行為模式,作為生物學(xué)分支的——計算生物學(xué)由此得以迅速發(fā)展,大數(shù)據(jù)挖掘分析已成為基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)發(fā)現(xiàn)問題的重要途徑,分子病理學(xué)是臨床醫(yī)學(xué)中采用高通量技術(shù)最頻繁的主力,因此,緊跟前沿技術(shù),培養(yǎng)能夠正確處理、充分解讀、全面應(yīng)用醫(yī)學(xué)大數(shù)據(jù)的臨床人才,將對我國新世紀醫(yī)療人才培養(yǎng)產(chǎn)生積極推動作用。本課題組前期通過結(jié)合臨床大數(shù)據(jù),初步嘗試探索分子病理科研教學(xué)新體系,旨在推動符合時代需求的新型教學(xué)模式。
1.從大數(shù)據(jù)本體論到分子病理科研教學(xué)的任務(wù)
古希臘哲學(xué)家畢達哥提出“數(shù)是萬物的始基”。早在1988年《科學(xué)》首先提出大數(shù)據(jù)概念, 2008年《自然》設(shè)立了??榻B大數(shù)據(jù),大數(shù)據(jù)正逐步發(fā)展和受到重視。人體本身就是一個數(shù)字化的整體,臨床診療的行為最大的特點是以人為對象,在精準醫(yī)學(xué)的背景下,得益于深度測序技術(shù)的普及,臨床行為正日益產(chǎn)生大量數(shù)據(jù)。一方面,大數(shù)據(jù)產(chǎn)生不斷挑戰(zhàn)著傳統(tǒng)的臨床醫(yī)學(xué)模式,另一方面,大數(shù)據(jù)也正引導(dǎo)臨床研究邁向更加高層次的整體觀照。大數(shù)據(jù)使得人類活動進入了一個新階段,在大數(shù)據(jù)基礎(chǔ)上,世界的一切關(guān)系均可用數(shù)據(jù)表征。具體到臨床醫(yī)學(xué),大數(shù)據(jù)本體論需要我們回答臨床數(shù)據(jù)本質(zhì)是什么?數(shù)據(jù)與疾病之間有何因果關(guān)系?大數(shù)據(jù)如何解釋疾病等問題?
傳統(tǒng)分子病理學(xué)作為臨床醫(yī)學(xué)診斷的前沿學(xué)科,也是臨床科研問題發(fā)現(xiàn)的最基本的途徑。在過去由于技術(shù)和檢測手段的限制,對疾病描述的數(shù)據(jù)結(jié)構(gòu)以疏松和零散為主要特點。大數(shù)據(jù)時代下,分子病理對疾病本身的描述進入密集型高分辨率型的時代。這些由分子病理產(chǎn)生的臨床大數(shù)據(jù)正賦予分子病理科研更多的可能性,而如何解讀密集型數(shù)據(jù)的本質(zhì)?如何將大數(shù)據(jù)有機結(jié)合到疾病本身的科學(xué)問題上來?如何解釋疾病數(shù)據(jù)的差異?這便是大數(shù)據(jù)對分子病理科研教學(xué)提出的時代新要求。
2.從大數(shù)據(jù)思維模式到分子病理科研教學(xué)的模式
傳統(tǒng)分子病理技術(shù),如顯色原位雜交、熒光原位雜交、聚合酶鏈反應(yīng)等,在精度上給予分子病理科研極大的便利。隨著基因芯片、基因測序等技術(shù)普及,使得數(shù)據(jù)在精度和廣度上都有了新的突破。大數(shù)據(jù)不僅是對一種臨床科學(xué)問題研究和認識的存在形式,也是臨床科學(xué)研究的一種方法和途徑,這種新的認識論范式與傳統(tǒng)分子病理科研推斷邏輯式表現(xiàn)形式不同,它是一種數(shù)據(jù)模型的思維模式,這種思維模式基本的目標有兩個——描述和預(yù)測:通過描述刻畫大數(shù)據(jù)的潛在模式,通過利用這些數(shù)據(jù)潛在模式,進行科研問題的預(yù)測,從而發(fā)現(xiàn)數(shù)據(jù)中有具有臨床價值的模型和規(guī)律。
具體說來,從方法論層面看,大數(shù)據(jù)思維模式對傳統(tǒng)的機械還原論進行了深入批判,提出了多樣與整體、關(guān)聯(lián)與動態(tài)分析的大數(shù)據(jù)思維,這些新思維具有復(fù)雜性思維特征。分子病理的大數(shù)據(jù)實現(xiàn)了還原論與整體論的融貫,首先承認疾病和科學(xué)問題本質(zhì)是復(fù)雜的多樣性,強調(diào)了疾病表征和基因型的關(guān)聯(lián)性,認為存在比因果關(guān)系更加重要。通過對疾病和具體科學(xué)問題的數(shù)據(jù)化,實現(xiàn)了定性定量的綜合集成;因此如何實現(xiàn)描述和預(yù)測的功能,成為分子病理科研教學(xué)的大挑戰(zhàn)。
2.1大數(shù)據(jù)重新認識疾病的復(fù)雜性
分子病理產(chǎn)生的臨床大數(shù)據(jù)是指導(dǎo)臨床精準醫(yī)療和開展前沿醫(yī)學(xué)研究的前提,指導(dǎo)學(xué)生正確認識大數(shù)據(jù)便是首要的問題。本課題組緊跟大數(shù)據(jù)趨勢,在2013年起在傳統(tǒng)分子病理教學(xué)中引入大數(shù)據(jù)教學(xué)模式,幫助學(xué)生理解疾病和尋找科研問題。
大數(shù)據(jù)之大,在于深度和廣度。以肺癌為例,肺癌驅(qū)動基因的研究一直是攻克肺癌的關(guān)鍵所在,目前越來越熱的表觀遺傳學(xué)的研究揭示了非小細胞肺癌發(fā)生發(fā)展更多的可能性。在肺癌分子病理科研教學(xué)上,我們首先以傳統(tǒng)分子病理科研教學(xué)為切入點,帶領(lǐng)學(xué)生了解具體有特色的肺癌特點,比如臨床上對非小細胞肺癌常規(guī)檢測的EGFR、ALK等基因的情況。眾所周知,腫瘤是異質(zhì)性極大的疾病,為了讓學(xué)生更加深入的了解腫瘤的復(fù)雜性,我們引入大數(shù)據(jù),我們從傳統(tǒng)教學(xué)幾十例的患者,過渡到TCGA公共數(shù)據(jù)庫及GEO,CaArray, ArrayExpress數(shù)據(jù)庫等上千例非小細胞肺癌患者中來[2],從廣度上讓學(xué)生對非小細胞肺癌的特點有了全面的了解。從傳統(tǒng)教學(xué)的有限的研究成熟的基因數(shù),到大宗病例分析產(chǎn)生的海量差異表達的基因數(shù)及其它分子事件,使得分子病理教學(xué)從已知向未知過渡,從傳統(tǒng)認知型教學(xué)向科研型教學(xué)過渡。
分子病理科研教學(xué)中,善于利用大數(shù)據(jù)可以更加高分辨率的展示疾病與臨床表型之間的聯(lián)系。以非小細胞肺癌為例,個人史、吸煙史對非小細胞肺癌的發(fā)生和發(fā)展至關(guān)重要,EGFR不同突變型的患者臨床治療策略和生存預(yù)后也都不一樣。我們整合分析了患者基本臨床參數(shù),包括性別、年齡、吸煙史、治療史、病理類型等,我們還分析了非小細胞肺癌中可能存在的轉(zhuǎn)錄調(diào)控和表觀遺傳學(xué)機制,包括甲基化信息、miRNA表達譜,lncRNA表達譜,CNV,可變剪切等。區(qū)別于傳統(tǒng)分子病理科研教學(xué),通過上述嘗試,我們將分子病理科研教學(xué)引導(dǎo)至一個信息更加全面,事件更加精確,機制更加復(fù)雜的高分辨率科研教學(xué)模式中,這樣的模式使得對疾病的了解更加全面,賦予研究對象更多的可能性,碰撞出更多的火花。
2.2循證法評價大數(shù)據(jù)的可靠性
大數(shù)據(jù)帶來分子病理科研教學(xué)的思維模式的變革,其優(yōu)勢是改變了傳統(tǒng)分子病理尋找科學(xué)問題的模式。在以往,現(xiàn)象知識驅(qū)動徑路下,尋找具體科學(xué)問題需要看到具體現(xiàn)象,有已知知識支撐作為前提。而如今,大數(shù)據(jù)驅(qū)動徑路下,科學(xué)假說都可以先從公共數(shù)據(jù)進行驗證。大數(shù)據(jù)在深度給了我們?nèi)娴男畔ⅲ覀兡軌蛲ㄟ^加大疾病樣本來力求接近事實真相。盡管如此,由于高通量測序本身技術(shù)的限制,隨機抽樣誤差是客觀存在的,導(dǎo)致很有可能假陽性的信息被我們選取。因此,本課題組在分子病理科研教學(xué)過程中將循證醫(yī)學(xué)的理念整合到大數(shù)據(jù)應(yīng)用中,審慎的評價用于臨床研究和基礎(chǔ)研究中大數(shù)據(jù)的可靠性。
高通量提供給我們海量的數(shù)據(jù)是受人為因素的影響,離不開敏感度和特異度問題。在分子病理科研教學(xué)中,我們從多渠道獲取數(shù)據(jù)來評價大數(shù)據(jù)的可靠性:以原發(fā)性肝細胞癌為例,我們對TCGA的數(shù)據(jù)進行整合分析獲得原發(fā)性肝細胞癌差異表達微小RNA后,我們從GEO,CaArray, ArrayExpress等多個芯片及測序數(shù)據(jù)庫獲取數(shù)據(jù),對TCGA的數(shù)據(jù)進行初步驗證;同時,我們也進行相應(yīng)的臨床檢測,體內(nèi)體外實驗來驗證TCGA數(shù)據(jù)的可靠性,從而獲取全面的信息,同時保證信息的高敏感度高和準確性、特異性[3]。
2.3 學(xué)科交叉,更高分辨率解讀大數(shù)據(jù)
疾病臨床表征和基因型的聯(lián)系,是數(shù)據(jù)科研價值的體現(xiàn)。而具體的科研問題能夠解決臨床問題,則需要余多學(xué)科互補交叉。從大方向上來看是基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)的優(yōu)勢互補,在方法學(xué)上,大數(shù)據(jù)的分析更加依賴于多學(xué)科。例如,在我們非小細胞肺癌的病理科研教學(xué)中,我們有機融合了生物信息學(xué)、分子生物學(xué)、臨床腫瘤學(xué)的內(nèi)容。生物信息學(xué)將大數(shù)據(jù)可視化展示,使得具體描述和預(yù)測更加直觀;通過分子生物學(xué)理論分析和實驗驗證,使得大數(shù)據(jù)預(yù)測更為精準;而通過結(jié)合臨床腫瘤學(xué),使得分析所得的數(shù)據(jù)更加富有臨床應(yīng)用價值。使得學(xué)生在了解疾病普遍的規(guī)律和現(xiàn)象的同時,看到了每個案例的獨特之處,進而發(fā)現(xiàn)和理解科研問題和臨床治療問題,理解分子病理學(xué)數(shù)據(jù)的潛在價值。
綜上,高通量技術(shù)正改變?nèi)藗冊谡J識自身和疾病的方式,大數(shù)據(jù)使得人們能夠更加的深入和精確理解自身,科學(xué)有效的利用大數(shù)據(jù)來解碼臨床具體問題,指導(dǎo)科學(xué)研究更好的更精確的服務(wù)臨床問題,也設(shè)計新興的生物信息學(xué)、計算生物學(xué)的內(nèi)容,這些將是分子病理科研教學(xué)面臨的新任務(wù)和挑戰(zhàn)。
參考文獻:
[1]Chin-Yee B, Upshur R. Clinical judgement in the era of big data and predictive analytics. J Eval Clin Pract. 2017. [Epub ahead of print].
[2]Cohen AL, Piccolo SR, Cheng L, et al. Genomic pathway analysis reveals that EZH2 and HDAC4 represent mutually exclusive epigenetic pathways across human cancers. BMC Med Genomics. 2013,6:35.
[3]Liang HW, Yang X, Wen DY, et al. Utility of miR?鄄133a?鄄3p as a diagnostic indicator for hepatocellular carcinoma: An investigation combined with GEO, TCGA, meta?鄄analysis and bioinformatics. Mol Med Rep. 2018,17(1):1469-1484.