董惠 王衛(wèi)峰 馮玉良 朱琴 叢衍群 張虹 鄭培奮
結直腸癌是常見的惡性腫瘤之一,其病死率較高[1]。近年來由于飲食結構及生活環(huán)境的變化,我國結直腸癌發(fā)病率也逐年升高[2]。結直腸癌的發(fā)生涉及復雜的生物遺傳方面的多級聯反應[3],而血管緊張素轉化酶2(ACE2)變化可能是結直腸癌發(fā)生、發(fā)展過程中的機制之一。筆者基于當前Oncomine、人類蛋白質圖譜(human protein atls,HPA)、GEPIA可視化的癌癥大數據公共在線平臺,分析ACE2在結直腸癌組織中的表達以及與結直腸癌預后的關系,現將結果報道如下。
1.1 資料來源 本研究資料來源于Oncomine數據庫(http://www.oncomine.org/resource)、HPA數據庫(http://www.proteinatlas.org/)、GEPIA數據庫(http://gepia.cancer-pku.cn)。
1.2 數據提取 (1)Oncomine數據庫:可提供腫瘤和正常組織的基因差異表達分析。本研究設定的數據挖掘及篩選條件:①gene:ACE2:colorectal cancer;②cancer type;③data type:mRNA;④analysis type:cancer vs normal analysis;⑤設定臨界值(P<0.01,fold change>2,gene rank=top10%)。(2)HPA數據庫:研究人員使用高度特異性的抗體,用免疫檢測技術測定蛋白在細胞系、人類正常組織和腫瘤組織中的表達情況,該數據庫繪制了人體正常組織、細胞以及腫瘤組織、細胞中表達基因編碼的蛋白位置。本研究以ACE2、結直腸癌為關鍵篩選條件:①search:ACE2;②type:tissue atlas:colorectal caner。在搜索框中輸入ACE2,分別選擇“tissue”及“pathology”,組織來源選擇“colon”。(3)GEPIA 數據庫:可整合分析癌癥表達譜數據。在搜索框中輸入ACE2,分析工具欄里選擇“correlation analysis”,datasets selection為“COAD、READ”,置信區(qū)間設置為95%。其他參數均設置為數據庫默認。分析ACE2基因與結直腸癌發(fā)生關系密切的錯配修復基因表達的相關性后,再應用“survival plots”模塊進一步分析ACE2基因與結直腸癌生存預后的關系。
1.3 統計學處理 采用數據庫自帶模塊進行統計分析。結直腸癌組織與正常結直腸組織中ACE2基因表達的比較采用兩獨立樣本t檢驗;ACE2基因表達量與錯配修復基因表達量的相關性分析采用Pearson相關;Kaplan-Meier法繪制生存曲線,結直腸癌患者ACE2基因高、低表達組生存率的比較采用log-rank檢驗。P<0.05為差異有統計學意義。
2.1 ACE2在常見腫瘤組織中的基因表達情況 Oncomine數據庫共收集330項關于ACE2在不同類型腫瘤組織與正常組織中基因表達比較的研究結果,其中29項研究結果顯示差異有統計學意義(均P<0.05),包括ACE2基因表達增高的研究5項,降低的研究24項。其中ACE2在結直腸癌中基因表達增高的研究0項,降低的研究2項,見圖1(插頁)。
2.2 ACE2在結直腸癌組織中的表達情況 Oncomine數據庫有7個數據集包括583個樣本涉及結直腸癌組織與正常結直腸組織ACE2基因表達的比較,選擇低表達數據庫,結果其中3個數據集中的3項分析顯示結直腸癌組織中ACE2基因表達量低于正常結直腸組織(均P<0.01),見圖2(插頁)和圖3。若選擇高表達數據庫,發(fā)現3項數據集中ACE2基因表達量在結直腸癌組織中呈高表達,但3者進行差異基因分析,結果顯示差異無統計學意義(P>0.05)。GEPIA數據庫中結腸癌及直腸癌的研究包括1 034個樣本,分別對結直腸癌組織及正常組織ACE2轉錄水平情況進行比較,結果顯示ACE2在結直腸癌組織中的轉錄水平明顯高于正常結直腸組織(均 P<0.05),見圖4。
2.3 ACE2在正常結腸組織與結腸癌組織中的蛋白表達比較 從HPA數據庫中得到ACE2基因表達篩選結果,顯示ACE2在結直腸癌組織中的蛋白表達明顯高于正常結直腸組織,見圖5(插頁)。
2.4 ACE2基因表達量與錯配修復基因表達量的相關性 利用GEPIA數據庫相關性分析模塊,對ACE2基因表達量與MLH1、MSH2、MSH3、MSH6、PMS1、PMS2等6種錯配修復基因表達量進行分析,結果顯示均有明顯相關性(均 P<0.05),見圖 6(插頁)。
2.5 結直腸癌患者ACE2基因高、低表達組生存率比較 利用GEPIA數據庫生存分析模塊進行分析,結果顯示結腸癌或直腸癌患者ACE2基因高、低表達組總生存率、無病生存率比較,差異均無統計學意義(均P>0.05),見圖 7(插頁)。
圖1 Oncomine數據庫ACE2在常見腫瘤組織中的基因表達情況
圖2 Oncomine數據庫ACE2在結直腸癌組織中的基因表達(1~3表示3項研究結果,藍色越深表示ACE2基因在該芯片中的表達越低)
圖3 Oncomine數據庫3項研究關于結直腸癌組織與正常結直腸組織ACE2基因表達的比較
圖4 GEPIA數據庫ACE2在結直腸癌組織與正常結直腸組織中的基因表達(*P<0.05)
圖5 HPA數據庫ACE2在正常結腸組織與結腸癌組織中的蛋白表達(免疫組化染色,電子顯微鏡下觀察,×40)
圖6 GEPIA數據庫ACE2基因表達量與錯配修復基因表達量相關性的散點圖(a、b、c、d、e、f分別表示ACE2基因表達量與MLH1、MSH2、MSH3、MSH6、PMS1、PMS2 基因表達量的相關性)
圖7 GEPIA數據庫ACE2基因高、低表達的結直腸癌患者生存曲線(a、c:結腸癌;b、d:直腸癌)
ACE2發(fā)現于2000年,是ACE同系物[4],大量存在于腸上皮細胞、肺泡Ⅱ型細胞、微血管內皮細胞和肝細胞[5]。動物實驗證實,ACE2過表達可以減少內質網應激、氧化應激及炎癥反應等,進而減少胰島細胞[6]、肺內皮細胞[7]、人臍靜脈內皮細胞[8]的凋亡,抑制心肌梗死后心肌纖維化[9]。但是,目前關于ACE2在腸道中的作用尚未完全明確。Bernardi等[10]研究發(fā)現,結腸腫瘤患者ACE2蛋白活性明顯升高,但差異無統計學意義,可能與樣本量有限及樣本間存在高度變異性相關。房靜遠教授團隊近期對正常人和結直腸腫瘤患者結腸上皮細胞ACE2進行單細胞測序,發(fā)現正常結腸上皮細胞、腺瘤、結直腸癌組織中ACE2表達量逐漸增加[11]。
本研究通過Onconimine數據庫挖掘ACE2基因在常見腫瘤中的表達情況,結果在差異有統計學意義的29項研究中,24項研究的ACE2基因表達量降低;其中關于結直腸癌的研究中有2項研究提示低表達。進一步分析發(fā)現結直腸癌ACE2在不同研究的數據集中,結果顯示高、低表達均有報道,這可能與樣本量大小有關。通過GEPIA數據庫發(fā)現,ACE2在結腸癌及直腸癌的轉錄水平較正常組織高。利用HPA數據庫提供的免疫組化信息,在蛋白水平上比較結直腸癌組織與正常組織中ACE2表達,發(fā)現結直腸癌組織中ACE2蛋白呈高表達,提示ACE2在結直腸癌的發(fā)病過程中可能發(fā)揮重要的作用。另外,結直腸癌患者中ACE2在基因及蛋白水平的表達也存在差異:一方面,ACE2在腫瘤的不同分期及病理類型中基因表達量可能不同;另一方面,蛋白的表達不僅受基因豐度水平的影響,還涉及轉錄后基因產物的修飾等機制[12]。但在Oncomine數據庫中,不同數據集中ACE2基因在結直腸癌的表達存在分歧,提示目前仍需要開展大樣本的臨床研究,以進一步明確ACE2在基因水平的表達情況。
結腸細胞在DNA復制過程中若出現堿基錯配,可引起子代DNA鏈突變,進而造成新生細胞性狀的改變,甚至引起癌變[13]。機體內的基因錯配修復系統包括MLH1、MLH3、MSH2、MSH3、MSH4、MSH5、MSH6、PMS1和PMS2。錯配修復基因的突變或功能缺失,是結腸癌發(fā)生的重要機制之一[14]。通過GEPIA數據庫提供的相關性分析模塊,發(fā)現ACE2與基因錯配修復系統中的MLH1、MSH2、MSH3、MSH6、PMS1 和 PMS2 基因的表達具有明顯相關性,表明ACE2基因可能參與結直腸癌的發(fā)病過程。但是ACE2的表達水平與結直腸癌的生存預后無相關性。鑒于目前的研究結果,仍需要探究結直腸癌在不同分期及淋巴結轉移情況下ACE2基因及蛋白的表達變化,以進一步明確ACE2在結直腸癌發(fā)病過程中的作用。
綜上所述,本研究通過多種大樣本的公共在線數據庫和系統的生物信息學方法明確了ACE2蛋白在結直腸癌中高表達,同時表明生物信息學分析可提供更多潛在的結直腸癌的重要基因,為結直腸癌的治療研究提供新的方向。