占萍 王沖 劉維達(dá)
(北京協(xié)和醫(yī)學(xué)院,中國(guó)醫(yī)學(xué)科學(xué)院皮膚病研究所真菌科,南京 210042)
基因組學(xué)是近代科學(xué)界最突出的前沿性科學(xué)之一,帶動(dòng)了生命科學(xué)領(lǐng)域日新月異的變革。1996年完成的對(duì)釀酒酵母(Saccharomyces cerevisiae)全基因組測(cè)序,不僅是酵母菌的一個(gè)革命性的里程碑,也激起了真核生物基因功能和表達(dá)的全球性研究[1]。近年來(lái)全基因組測(cè)序 (whole genome sequencing,WGS)技術(shù)應(yīng)用于醫(yī)學(xué)研究后,醫(yī)學(xué)真菌的研究也從單個(gè)基因水平迅速提高到了大規(guī)模、群體和組學(xué)研究水平,為人類認(rèn)識(shí)真菌的遺傳進(jìn)化、致病機(jī)制、真菌病防治等各個(gè)方面提供了新視野和新捷徑。本文就醫(yī)學(xué)真菌基因組學(xué)及相關(guān)測(cè)序技術(shù)發(fā)展歷史及現(xiàn)狀、研究?jī)?nèi)容以及其應(yīng)用價(jià)值進(jìn)行綜述。
1986年美國(guó)科學(xué)家Thomas Rodefick首先提出“基因組學(xué)”概念,緊接著的“人類基因組計(jì)劃”帶動(dòng)了模式生物和其他重要生物體基因組學(xué)的研究[2]。闡明各種生物基因組DNA中堿基對(duì)的序列信息及破譯相關(guān)遺傳信息的基因組學(xué)已經(jīng)成為與生物學(xué)和醫(yī)學(xué)研究不可分割的學(xué)科。1996年,由歐洲、美國(guó)、加拿大和日本等近百個(gè)實(shí)驗(yàn)室合作,首次完成第一個(gè)真核生物釀酒酵母的基因組測(cè)序[1]。而2002年和2003年完成的Schizosaccharomyces pombe和Neurospora crassa基因組的研究顯示釀酒酵母作為真菌模式生物的局限性[3-4]。這些研究尚未涉及到致病真菌,但是為后者WGS的研究提供了思路和方法。
2000年由美國(guó)Broad研究所與真菌學(xué)研究團(tuán)體發(fā)起真菌基因組行動(dòng) (fungal genome initiative,F(xiàn)GI),目的是促進(jìn)在醫(yī)藥、農(nóng)業(yè)和工業(yè)上具有重要作用的真菌代表性物種的全基因組測(cè)序。2002年5月FGI發(fā)布了第一份關(guān)于測(cè)定15種真菌基因組計(jì)劃的白皮書。2003年6月,該組織發(fā)布第二份白皮書,列出44種重要真菌作為測(cè)序的目標(biāo),強(qiáng)調(diào)對(duì)其中 10個(gè)屬即青霉 (Penicillium)、曲霉(Aspergillus)、組織胞漿菌 (Histoplasma)、球孢子菌 (Coccidioides)、鐮刀菌 (Fusarium)、脈孢菌 (Neurospora)、念珠菌 (Candida)、裂殖酵母(Schizosaccharomyces)、 隱 球 酵 母(Cryptococcus)和柄銹病菌(Puccinia)的物種優(yōu)先進(jìn)行測(cè)序[2]。之后,于2011年11月11日啟動(dòng)了“1000基因組計(jì)劃”(1000 fungal genomes)。參與單位包括多個(gè)著名大學(xué)、國(guó)家級(jí)研究機(jī)構(gòu)及知名生物公司,如圣約翰大學(xué)、加利福尼亞大學(xué)、美國(guó)能源部聯(lián)合基因組研究所 (JGI DOE)、美國(guó)Broad研究所、法國(guó)國(guó)家農(nóng)業(yè)研究所INRA、英國(guó)Sanger研究所、Monsanto、Syngenta、Biozentrum、Bayer Crop Science AG和Exelixis等著名公司。該項(xiàng)目計(jì)劃在未來(lái)5 a時(shí)間內(nèi)將1 000多種真菌進(jìn)行全基因組測(cè)序和注釋。選擇的種類以Hibbett 2007描繪的真菌進(jìn)化樹“Assembly the Fungal Tree of Life”為框架,覆蓋了目前發(fā)現(xiàn)的生命樹上140個(gè)目 (order)550個(gè)科(family)內(nèi)所有重要真菌,旨在通過(guò)豐富的真菌基因組信息,幫助人類詳盡而深入的了解真菌信息,包括其生物多態(tài)性、遺傳進(jìn)化關(guān)系、植物-微生物相互作用、微生物散射 (microbial emission)、溫室效應(yīng)、環(huán)境宏基因組學(xué)等。目前,真菌的注釋基因組學(xué)已經(jīng)開始啟動(dòng),對(duì)全球開放了未知菌的基因組注釋平臺(tái)。以上內(nèi)容及其他相關(guān)信息可在多個(gè)研究機(jī)構(gòu)的網(wǎng)站上實(shí)時(shí)查詢,如http://www.broadinstitute.org/,http://1000.fungalgenomes.org 和 http://genome.jgi.doe.gov/programs/fungi/genome-releases.jsf等。
第一代基因測(cè)序方法主要有鏈終止法和化學(xué)降解法。前者是1977年由英國(guó)化學(xué)家Frederick Sanger發(fā)明,他利用該技術(shù)成功測(cè)出Φ-X174噬菌體的基因組序列,這是首次完整的基因組測(cè)序工作,具有里程碑意義,成為人類基因組計(jì)劃等研究得以開展的前提之一。由于Sanger的突出貢獻(xiàn),他于1980年再次獲得諾貝爾化學(xué)獎(jiǎng)。與此同時(shí),Maxam和Gilbert兩位化學(xué)家發(fā)明了化學(xué)降解法。但由于Sanger法既簡(jiǎn)便又快速,經(jīng)過(guò)后續(xù)的不斷改良,成為了上世紀(jì)末DNA測(cè)序的主流,直到現(xiàn)在,該方法仍舊廣泛應(yīng)用于小、中片段DNA片段測(cè)序。后來(lái)發(fā)展起來(lái)的熒光標(biāo)記技術(shù)和毛細(xì)管電泳技術(shù),使測(cè)序方法全自動(dòng)化,大大提高了測(cè)序效率。人類基因組計(jì)劃的絕大部分工作運(yùn)用第一代測(cè)序技術(shù)完成[5]。
第二代測(cè)序技術(shù)伴隨著計(jì)算機(jī)技術(shù)的高速發(fā)展而來(lái),其核心思想是“邊合成邊測(cè)序”(Sequencing by Synthesis),即通過(guò)捕捉新合成的末端標(biāo)記來(lái)確定DNA的序列,現(xiàn)有的技術(shù)平臺(tái)主要包括Roche公司的454平臺(tái)、Illumina公司Solexa和ABI公司SOLID系統(tǒng)。這三個(gè)技術(shù)平臺(tái)各有優(yōu)缺點(diǎn),Roche454的測(cè)序效率最高,Solexa測(cè)序低成本高性價(jià)比,而SOLID測(cè)序的準(zhǔn)確度最高。第二代測(cè)序技術(shù)不需要引物,高通量和高速度,但價(jià)格昂貴,結(jié)果分析復(fù)雜,需要專門的技術(shù)人員和軟件。第二代測(cè)序儀中,只有Roche454技術(shù)能獨(dú)立完成真核生物基因組的從頭測(cè)序工作,Solexa和SOLID技術(shù)則只能完成簡(jiǎn)單生物如細(xì)菌的基因組的從頭測(cè)序。在真核生物測(cè)序過(guò)程中,可以將454技術(shù)與Solexa/SOLID或與傳統(tǒng)的Sanger測(cè)序技術(shù)結(jié)合,分別利用它們的高通量和較長(zhǎng)讀長(zhǎng)的優(yōu)勢(shì),大大降低測(cè)序成本,提高測(cè)序速度和效率[5-7]。
近來(lái),以單分子測(cè)序?yàn)樘攸c(diǎn)的第三代DNA測(cè)序技術(shù)已經(jīng)出現(xiàn),如BioScience公司的單分子測(cè)序儀(HeliScope Single Molecular Sequencer)以及正在研制的Pacific Biosciences的單分子實(shí)時(shí)DNA測(cè)序技術(shù)[Single Molecule Real Time(SMRT)DNA sequencing technology]和 Oxford Nanopore Technologies lad的納米單分子測(cè)序技術(shù)等。其中最受關(guān)注的為納米技術(shù),其基本原理是利用納米技術(shù)直接讀取核酸分子上不同堿基側(cè)鏈進(jìn)行測(cè)序,但目前還處于研發(fā)階段,預(yù)計(jì)樣機(jī)2013年可以推出,以將人類基因組測(cè)序的成本降到1 000美元以下為終極目標(biāo)。屆時(shí),醫(yī)學(xué)真菌的研究將進(jìn)一步獲益,先進(jìn)低廉的測(cè)序技術(shù)使得醫(yī)學(xué)真菌領(lǐng)域的科學(xué)家花較少的錢就可以對(duì)自己熟悉的物種基因組進(jìn)行測(cè)序,從而更好地指導(dǎo)試驗(yàn)設(shè)計(jì),取得更多新發(fā)現(xiàn)[5,8]。
DNA測(cè)序技術(shù)的快速發(fā)展,改變了醫(yī)學(xué)視野,昭示著個(gè)體化醫(yī)療世紀(jì)的來(lái)臨,人類站在了一個(gè)全新的歷史轉(zhuǎn)折點(diǎn),如果能測(cè)定社區(qū)中每個(gè)個(gè)體的全基因組序列,儲(chǔ)存于國(guó)家公共衛(wèi)生系統(tǒng),這將大大方便易感基因檢測(cè)和個(gè)體化診療。測(cè)序成本降低是WGS技術(shù)推向醫(yī)療個(gè)體化的重要前提。事實(shí)上,測(cè)定DNA系列的成本已經(jīng)每年內(nèi)2~3次下降,而效率呈指數(shù)級(jí)升高。1990年開始的“人類基因組計(jì)劃”,原計(jì)劃多國(guó)合作、花15 a時(shí)間、30億美元完成了人體4萬(wàn)個(gè)基因30億個(gè)堿基對(duì)的測(cè)定,在上世紀(jì)末已提前完成了人類基因組草圖。1995年自動(dòng)化測(cè)序儀出現(xiàn),單臺(tái)儀器的測(cè)序速度提高到每天100 000 bp,每一個(gè)堿基的成本降至1美元。1998年ABI 3700 DNA自動(dòng)化測(cè)序儀問(wèn)世,測(cè)定一個(gè)堿基0.1美元,測(cè)序速度提高到每天900 000 bp。2008年,同樣還是ABI 3700,平均每個(gè)堿基的成本是0.008美元。在醫(yī)學(xué)真菌領(lǐng)域,基因組測(cè)序從逐步克隆到全基因組鳥槍法 (whole genome shotgun)策略,同樣呈現(xiàn)效率不斷提高而成本顯著下降的趨勢(shì)。1996年,斯坦福大學(xué)基因技術(shù)中心開始對(duì)白念珠菌SC5314進(jìn)行全基因組鳥槍法測(cè)序,到2003年完成了10.7×的基因序列圖,相關(guān)文章2005年發(fā)表于《PNAS》,歷時(shí)近十年。而如今,運(yùn)用新一代測(cè)序儀Roche 454檢測(cè)一個(gè)20 Mb的真菌基因組花費(fèi)僅需要2~3個(gè)月時(shí)間,約10萬(wàn)人民幣。盡管如此,該費(fèi)用和周期仍舊超出絕大多數(shù)科學(xué)家和患者的承受能力,需要不斷改進(jìn),應(yīng)憑借樣本微量化、多通道平行測(cè)序等方法,實(shí)現(xiàn)測(cè)序高通量。有望在未來(lái)數(shù)年內(nèi),單細(xì)胞測(cè)序方法將會(huì)指數(shù)級(jí)提高效率,真正實(shí)現(xiàn)個(gè)體化醫(yī)療[5-7]。
基因組學(xué)研究?jī)?nèi)容主要包括結(jié)構(gòu)基因組學(xué)、比較基因組學(xué)和功能基因組學(xué)的研究。結(jié)構(gòu)基因組以全基因組測(cè)序?yàn)槟康?,包括物理作圖、核苷酸序列分析等,其基本方法與其他微生物相同。而大量獨(dú)特的醫(yī)學(xué)真菌信息則來(lái)自于比較基因組和功能基因組學(xué)的研究,在此僅介紹后面兩類。
比較基因組學(xué)是在結(jié)構(gòu)基因組學(xué)基礎(chǔ)上,對(duì)已知的基因和基因組結(jié)構(gòu)進(jìn)行比較,以了解基因的功能、表達(dá)和物種進(jìn)化的學(xué)科。醫(yī)學(xué)真菌基因數(shù)據(jù)的分析,需要與已知的真核模式菌株和相近的種屬的DNA序列進(jìn)行比較,發(fā)現(xiàn)其相似及不同之點(diǎn),以揭示菌種進(jìn)化關(guān)系、致病菌的致病機(jī)制、尋找可能的新的抗真菌藥物靶點(diǎn)。
2007年,Cornell等比較了34種真菌全基因組,這是首次對(duì)真核類生物進(jìn)行最廣泛的比較基因組學(xué)分析,其中包括子囊菌 (Ascomycete)、擔(dān)子菌(Basidiomycete)和結(jié)合菌 (Zygomycete)。另外還采用了2個(gè)卵菌(Oomycetes)的基因組數(shù)據(jù),后者已從真菌分化出去,但在生物活性上顯示出與植物真菌病原菌趨同進(jìn)化特點(diǎn)。分析發(fā)現(xiàn)這些基因組從2.5~40 Mb大小不等,開放讀碼框 (ORFs)1 996~17 467個(gè)。其中微孢子蟲Encephalitozoon cuniculi基因組最小,而子囊菌Pezizomycotina最大,一般序列多者編碼框多,但不盡然,基因組大小并不與編碼框數(shù)量成正比。該研究以現(xiàn)有的基因組數(shù)據(jù)為基礎(chǔ),探討相關(guān)序列的基因簇和進(jìn)化關(guān)系,揭示了一些前人所未見(jiàn)的真菌的功能及生化多樣性現(xiàn)象[9]。
白念珠菌為第一個(gè)被測(cè)序的醫(yī)學(xué)真菌。在其數(shù)據(jù)分析初期,其參照菌為釀酒酵母,由此發(fā)現(xiàn)了白念珠菌一些特殊之處:富含短序列重復(fù)片段,其脂類和氨基酸降解酶的組成更為復(fù)雜;長(zhǎng)度大于16 kb的重復(fù)片度(major repeat sequence,MRS)廣泛分布于每條染色體(除外染色體3)上。與釀酒酵母相比,兩者僅64%的序列相同,并不高于白念珠菌與人及其他進(jìn)化關(guān)系較遠(yuǎn)的酵母菌的序列同源性;同樣,兩者染色體也不具有高度同線性;在全基因組和線粒體基因組,均存在代謝上較大的差異;白念珠菌存在毒力相關(guān)的一些大的基因家族(如ALS)、鐵轉(zhuǎn)運(yùn)蛋白、分泌型天冬氨酸蛋白酶和脂酶等。這些比較基因?qū)W獲得的信息,初步揭示了白念珠菌作為醫(yī)學(xué)真菌的獨(dú)特致病性[10-11]。
都柏林念珠菌(Candida dubliniensis)是目前知道的在進(jìn)化上與白念珠菌最靠近的菌種,兩者共有諸多相近的形態(tài)學(xué)特點(diǎn)。但是,臨床上都柏林念珠菌致病性遠(yuǎn)小于白念珠菌。通過(guò)比較這兩者的基因組信息,也許可以發(fā)現(xiàn)一些白念珠菌特異的毒力因子。2009年9月,都柏林全基因組被測(cè)序,與已知的白念系列相比,發(fā)現(xiàn)兩者在基因組序列上具有高度的一致性,如共有168個(gè)種特異性基因包括編碼菌絲的基因 (天門氨酸蛋白酶sap 4和sap 5)和侵襲素als 3等,都柏林的115個(gè)假基因也與白念菌絲生長(zhǎng)調(diào)節(jié)素 (filamentous growth regulator,F(xiàn)GR)基因同源,而菌絲生長(zhǎng)是白念主要的致病機(jī)制之一。兩者差異在于:白念具有一些獨(dú)特的基因現(xiàn)象,如全基因組內(nèi)廣泛存在的TLO(一種轉(zhuǎn)錄子)基因家族擴(kuò)展和膜轉(zhuǎn)運(yùn)蛋白IFA家族,這些代表了白念珠菌新的候選毒力相關(guān)因子;白念珠菌一些基因發(fā)生了倒置、插入缺失和移位,破壞了基因的高度同線性,這些細(xì)小的變異影響了白念珠菌的致病能力,如SAP基因家族,在白念對(duì)宿主的各個(gè)病理過(guò)程中均是重要的致病因子。都柏林缺乏了四個(gè)sap位點(diǎn)中的2個(gè)??傊m然都柏林和白念珠菌具有高度一致同源性,但兩者在近期的進(jìn)化是截然不同的,白念珠菌的基因家族變得更為復(fù)雜和精細(xì),導(dǎo)致其致病能力大大增強(qiáng)[12]。
同樣,對(duì)同一菌種不同特點(diǎn)的菌株WGS信息比較中,也可以發(fā)現(xiàn)其致病毒力因子。新生隱球菌進(jìn)行全基因組測(cè)序時(shí),采用的是兩個(gè)臨床菌株:JEC21和B-3501,兩者均為血清D型,但后者比前者更能耐受高溫,在動(dòng)物模型上顯示更強(qiáng)的致病性。比較基因組數(shù)據(jù)發(fā)現(xiàn),B-3501株具有鳥苷三磷酸酶激活蛋白和兩個(gè)功能未知的特異性蛋白,而JEC21則具有另外4個(gè)功能未知的特異基因,還具有22個(gè)復(fù)制片段??茖W(xué)家由此假設(shè)這些基因參與了該菌的致病過(guò)程,當(dāng)然最終結(jié)論還需要進(jìn)一步研究[13]。
功能基因組學(xué)又稱“后基因組學(xué)”(Postgenomics),它利用結(jié)構(gòu)基因組所提供的信息和產(chǎn)物來(lái)了解基因功能。其研究?jī)?nèi)容包括基因功能發(fā)現(xiàn)、基因表達(dá)分析及突變檢測(cè)等。研究的傳統(tǒng)手段包括經(jīng)典的減法雜交、差示篩選、cDNA代表差異分析以及mRNA差異顯示等,但這些技術(shù)不能對(duì)基因進(jìn)行全面系統(tǒng)的分析,新一代的技術(shù)包括基因表達(dá)的系統(tǒng)分析 (serial analysis of gene expression,SAGE)、cDNA 微陣列 (cDNA microarray)、DNA芯片 (DNA chip)、序列標(biāo)志片段顯示(sequence tagged fragments display)技術(shù)和微流控芯片實(shí)驗(yàn)室等[14]。
煙曲霉的致病相關(guān)基因編碼的蛋白參與基礎(chǔ)代謝、信號(hào)傳遞、胞壁合成、色素合成以及調(diào)控二級(jí)代謝產(chǎn)物等非常復(fù)雜的機(jī)制,因此,對(duì)曲霉功能的研究不能單純依靠分析基因結(jié)構(gòu),而是采用了微陣列方法。比如,為研究煙曲霉對(duì)熱適應(yīng)的能力,構(gòu)建了不同溫度下 (30℃、37℃和48℃)的基因表達(dá)譜,結(jié)果顯示,在不同的溫度水平,煙曲霉表達(dá)的基因譜類似,但是基因表達(dá)量存在差異。在10個(gè)與該功能相關(guān)的基因簇中,簇1和簇2共含有323個(gè)基因,其中有與高溫耐受有關(guān)的多個(gè)熱休克蛋白相關(guān)基因,這類基因在48℃時(shí)表達(dá)比37℃時(shí)明顯增高。而含有135個(gè)基因的簇3則剛好相反,37℃時(shí)表達(dá)量更高。這些溫度依賴性基因散在分布于煙曲霉全基因組。另外,微陣列分析也發(fā)現(xiàn),與釀酒酵母相比,在各種應(yīng)急情況下,煙曲霉表達(dá)的基因存在差異,有些甚至完全相反。這些數(shù)據(jù)顯示,煙曲霉的致病機(jī)制及抵抗機(jī)體能力與酵母菌是不同的[15-16]。
針對(duì)新生隱球菌全基因組序列,也獲得一個(gè)龐大的cDNA文庫(kù),共包括23 000個(gè)cDNA克隆?;虮磉_(dá)譜發(fā)現(xiàn),新生隱球菌結(jié)構(gòu)比其他已知基因組序列的子囊菌復(fù)雜得多;存在選擇性剪接和內(nèi)源性反義轉(zhuǎn)錄,這些均與基因調(diào)節(jié)機(jī)制相關(guān)。新生隱球菌一個(gè)重要的毒力因子為夾膜多糖,這也是其獨(dú)特的致病因子,結(jié)構(gòu)復(fù)雜,具有流動(dòng)性,在侵襲人體時(shí)發(fā)揮著重要的功能。新生隱球菌有50個(gè)以上細(xì)胞壁甘露糖蛋白編碼基因,其中大多數(shù)為該菌所特有。與釀酒酵母相比,兩者在細(xì)胞壁的蛋白聯(lián)系上有很大的不同,釀酒酵母主要通過(guò)PIR蛋白和GPI錨定蛋白共價(jià)鍵結(jié)合于細(xì)胞壁,但這兩類蛋白在新生隱球菌均缺失[17]。
自然界的真菌超過(guò)150萬(wàn)種,致病菌在500種左右,借助對(duì)真菌基因組數(shù)據(jù)進(jìn)行分析,可以了解不同真菌的生物學(xué)特征和進(jìn)化多態(tài)性機(jī)制。曲霉是一類具有生物學(xué)多態(tài)性的一種真菌,其中包括以制藥和食品工業(yè)為代表的米曲霉 (A.oryzae),引起人類動(dòng)物致病的煙曲霉(A.fumigatus)、構(gòu)巢曲霉 (A.nidulans)和黃曲霉 (A.flavus)等,而絕大部分曲霉廣泛存在自然界,對(duì)人類不產(chǎn)生危害。為何不同的曲霉具有如此大的區(qū)別呢?還有,煙曲霉作為一種自然界廣泛存在的寄生菌,為何具有侵襲人體的毒力,而此現(xiàn)象并不常見(jiàn)于其他絲狀菌中?科學(xué)家們一直試圖通過(guò)各種手段如基因缺失來(lái)探討其原因。早期基因突變的研究發(fā)現(xiàn)了一些與煙曲霉致病相關(guān)的基因,如:pyr G,pks P,sid A,lae A等。但這些基因在真菌的基礎(chǔ)代謝中起重要作用,暗示煙曲霉侵襲人體時(shí)這些基因并不是真正的毒力因子,比較基因組學(xué)的發(fā)展為這種研究提供了的捷徑。煙曲霉為第一個(gè)被測(cè)序的絲狀醫(yī)學(xué)真菌。將煙曲霉基因組序列與白念珠菌和新生隱球菌相比,發(fā)現(xiàn)該菌與酵母菌共有序列不多。與酵母菌相比,煙曲霉細(xì)胞壁缺乏酵母細(xì)胞壁上的β-1,6-葡聚糖和肽聚甘露聚糖,也缺乏酵母細(xì)胞GPI錨定蛋白和PIR蛋白的同源物,這些結(jié)構(gòu)在維持酵母細(xì)胞壁結(jié)構(gòu)完整性中發(fā)揮重要作用。但是,在煙曲霉基因組序列中存在一類疏水蛋白,類似于GPI錨定蛋白,在真菌連接到疏水表面、提供立體結(jié)構(gòu)以及孢子存活中占據(jù)重要地位。與其他無(wú)致病性或弱致病性的曲霉相比,煙曲霉基因組與構(gòu)巢曲霉和米曲霉序列相差甚遠(yuǎn)。500多個(gè)特異性蛋白在后兩者未發(fā)現(xiàn)同源物,其中1/3表現(xiàn)出與其他真菌產(chǎn)物的相似性,一些參與次級(jí)代謝物的生物合成[15]。煙曲霉進(jìn)化相近的菌種為棒曲霉和Neosartorya fischeri,后者目前未發(fā)現(xiàn)引起人類疾病??茖W(xué)家將煙曲霉 Af1163、Af293與N.fischeri和棒曲霉基因組系列進(jìn)行對(duì)比,發(fā)現(xiàn)煙曲霉具有增強(qiáng)侵襲力的特殊的遺傳決定因素。比如,其家系特異性基因(Lineage-specific genes)組成了煙曲霉85%的基因組,在棒曲霉和N.fischeri中沒(méi)有同源物,而這些基因發(fā)揮著很多重要的生物學(xué)功能,如碳和氨基酸的代謝、轉(zhuǎn)運(yùn)、解毒和次級(jí)代謝產(chǎn)物的生物合成等。進(jìn)一步研究發(fā)現(xiàn),這些基因具有異質(zhì)性,其基因長(zhǎng)度和內(nèi)含子數(shù)量差異很大,集中分布于亞染色體基因島,這提示煙曲霉可能具有復(fù)雜的基因調(diào)節(jié)機(jī)制,使其適應(yīng)外界迥然不同的外界環(huán)境,土壤和人體內(nèi)都能存活[16]。
基于形態(tài)學(xué)的傳統(tǒng)分類方法存在很多缺陷,使得目前學(xué)術(shù)界對(duì)真菌的分類學(xué)出現(xiàn)混亂場(chǎng)面。近年來(lái)基于基因組信息的數(shù)據(jù),可以通過(guò)比較系列同源性來(lái)確定不同真菌的進(jìn)化關(guān)系,比基于形態(tài)學(xué)來(lái)對(duì)真菌進(jìn)行鑒定更科學(xué)可信。目前WGS已經(jīng)用于細(xì)菌和病毒的流行病學(xué)分型,有望很快在醫(yī)學(xué)真菌領(lǐng)域得到應(yīng)用[17]。
人類皮膚黏膜定植著無(wú)數(shù)的微生物,包含大量的細(xì)菌、病毒和真菌,組成了每一個(gè)特定解剖部位的微生態(tài),各成分間相互影響。宏基因組學(xué)(Metagenomics)又叫微生物環(huán)境基因組學(xué),它通過(guò)直接從環(huán)境樣品中提取全部微生物的DNA即宏基因組(metagenomic),構(gòu)建宏基因組文庫(kù),利用基因組學(xué)的研究策略研究環(huán)境樣品所包含的全部微生物的遺傳組成及其群落功能。該技術(shù)主要應(yīng)用于研究環(huán)境微生物群落多樣性,其應(yīng)用的主要技術(shù)仍舊為第二代測(cè)序技術(shù),最多見(jiàn)的為Roche454平臺(tái)。理論上來(lái)說(shuō),宏基因組學(xué)比實(shí)時(shí)定量PCR等技術(shù)更尊重微生態(tài)原狀,因?yàn)槊恳粋€(gè)集合均應(yīng)該作為一種整體來(lái)研究,其中的微生物并不是獨(dú)立存在的。宏基因組學(xué)中數(shù)據(jù)分析更為復(fù)雜,建立在非培養(yǎng)基礎(chǔ)上的研究不僅縮短檢測(cè)時(shí)間,還可以避免培養(yǎng)基的選擇性培養(yǎng)等缺陷。這些研究將揭示不同生物個(gè)體間、不同解剖部位間和不同生理病理狀態(tài)下的生物多樣性。宏基因組學(xué)最初應(yīng)用于生態(tài)和環(huán)境研究,目前在醫(yī)學(xué)領(lǐng)域已被用于研究人類口腔和腸道微生態(tài)及抗生素抵抗的報(bào)道[18-20]。
將WGS數(shù)據(jù)與其前人的研究相結(jié)合,尋找可能的致病基因和家族,并借此發(fā)現(xiàn)更多的相關(guān)基因。另一方面,基因組發(fā)現(xiàn)的信息也可以被用來(lái)提出假設(shè),針對(duì)一些可疑基因建立動(dòng)物模型、細(xì)胞或組織模型,進(jìn)一步發(fā)現(xiàn)和驗(yàn)證這些毒力因子,有助于加深人類去了解真菌與人類細(xì)胞相互作用、導(dǎo)致疾病的機(jī)制,從而更好地去治療和預(yù)防該類疾病。
2012年,紅色毛癬菌基因組和其他4種相關(guān)皮膚癬菌(斷發(fā)毛癬菌、同心毛癬菌、犬小孢子菌和石膏樣小孢子菌)基因組被測(cè)定,分析顯示皮膚癬菌富含LysM結(jié)構(gòu)域,該結(jié)構(gòu)域與結(jié)合細(xì)胞壁上的幾丁質(zhì)及相關(guān)糖類有關(guān)。皮膚癬菌也編碼一系列真菌特異性激酶,但具體特異性功能未知,包括非功能性pseudokinases,后者可能與底物競(jìng)爭(zhēng)結(jié)合位點(diǎn),抑制磷酸化,發(fā)揮異位效應(yīng),或扮演信息通路中的信號(hào)分子。皮膚癬菌還富含大量合成二級(jí)代謝產(chǎn)物的酶類,如合成新的化合物的皮膚癬菌特異性基因;另外,皮膚癬還富含幾類蛋白酶類,與其在角質(zhì)層上生長(zhǎng)或獲得營(yíng)養(yǎng)有關(guān)。這些基因組信息分析,大大有利于我們了解皮膚癬菌如何與角質(zhì)細(xì)胞作用、應(yīng)對(duì)機(jī)體免疫系統(tǒng)、引起皮膚慢性感染等機(jī)制[21]。
同樣,在2011發(fā)表的親動(dòng)物性皮膚癬菌 (須癬毛癬菌與疣狀皮膚癬菌)的WGS數(shù)據(jù)中,也發(fā)現(xiàn)了一些與其致病性相關(guān)基因,如較多的基因家族擴(kuò)展現(xiàn)象,較其他真菌更富含合成二級(jí)代謝產(chǎn)物的基因簇,且均富含水解酶,包括降解角質(zhì)的蛋白酶和脂解酶,這些編碼基因與球孢子菌和煙曲霉存在數(shù)量和種類上的差異,考慮與皮膚癬菌的親角質(zhì)性相關(guān)[22]。進(jìn)一步的研究發(fā)現(xiàn)了須癬毛癬菌hypA基因,編碼細(xì)胞壁上HypA疏水蛋白,該蛋白為一種細(xì)胞表面優(yōu)勢(shì)蛋白,在真菌生長(zhǎng)和出芽過(guò)程中也存在。體內(nèi)和體外模型發(fā)現(xiàn),該基因缺失后真菌的疏水性下降,激發(fā)人中性粒細(xì)胞和樹突狀細(xì)胞的能力增強(qiáng),分泌 IL-6,IL-8,IL-10、TNF-α 等炎癥因子的水平升高,導(dǎo)致人體殺傷真菌孢子的能力明顯增強(qiáng)。該研究為探討皮膚癬菌誘導(dǎo)皮膚細(xì)胞免疫耐受機(jī)制提供了參考[23]。
長(zhǎng)期抗真菌藥物治療會(huì)導(dǎo)致耐藥,最常見(jiàn)的耐藥是參與甾醇14α-脫甲基酶編碼基因cyp 51以及參與藥物外流泵的ABC(ATB-binding cassette)家族和MFS(Major Facilitator Superfamily)超家族。這些是唑類藥物耐藥機(jī)制研究的熱點(diǎn)。但Camps等[24]最近通過(guò)全基因組測(cè)序方法發(fā)現(xiàn)了一種新的耐藥機(jī)制 HapE P88L突變。hapE基因編碼CCAAT-binding factor complex的亞單位Hap E,該復(fù)合物是一種原核基因轉(zhuǎn)錄因子,誘導(dǎo)前導(dǎo)鏈和反義鏈在啟動(dòng)子區(qū)特異性識(shí)別CCAAT原件。作者從一個(gè)長(zhǎng)期接受唑類藥物治療的患者身上獲得一序列敏感和耐藥菌株 (相距17周),然后通過(guò)Illumina de novo全基因組測(cè)序,證實(shí)不存在cyp 51和藥物外流泵的突變,而存在hapE基因突變。作者將這兩株菌的序列與其他兩株已知全基因組序列的參考菌株兩兩比較,發(fā)現(xiàn)敏感株和耐藥株間僅存在6個(gè)可能的蛋白編碼區(qū)非同義突變。通過(guò)性別交叉試驗(yàn)發(fā)現(xiàn),耐藥的子代菌中由P88L亞基取代了HapE,而其他5個(gè)突變與耐藥無(wú)關(guān)。進(jìn)一步的hapE突變株顯示煙曲霉明顯的出芽減少和生長(zhǎng)減速,并顯示HapE P88L單個(gè)突變就能導(dǎo)致煙曲霉耐藥[24]。
與此研究類似的報(bào)道,Singh-Babak等用WGS發(fā)現(xiàn)了對(duì)棘白菌素耐藥的光滑念珠菌的9個(gè)非同義突變基因。進(jìn)一步建立的體外和小鼠模型中,發(fā)現(xiàn)了與FKS2-T1987C相關(guān)的代償性耐藥機(jī)制,而分子伴侶Hsp90及其下游效應(yīng)物磷酸酶可以消除棘白菌素抵抗現(xiàn)象[25]。
闡明耐藥機(jī)制,發(fā)現(xiàn)新的代謝通路和作用靶點(diǎn),可為開發(fā)抗真菌藥物提供新的方向。在隱球菌與子囊菌的比較基因組中發(fā)現(xiàn),很多隱球菌細(xì)胞壁合成的基因是保守的,與子囊菌相同,這種相似使得他們成為廣譜抗真菌藥物的理想作用靶點(diǎn)[16]。
隨著重要醫(yī)學(xué)真菌不斷被測(cè)定全基因組信息,該領(lǐng)域已經(jīng)進(jìn)入了后基因組時(shí)代,對(duì)大量數(shù)據(jù)進(jìn)行分析和注釋顯得更為重要和復(fù)雜,對(duì)醫(yī)學(xué)科學(xué)工作者提出了新的挑戰(zhàn)。2012年12月31日,“1000 fungal genomes”項(xiàng)目組宣布:緊接著一個(gè)滿意的開端之后,“1000 fungal genomes”工程掀開了新的一頁(yè),有50個(gè)全基因組正在準(zhǔn)備之中。截止目前為止,626個(gè)科中的真菌,至少有1/4獲得了一個(gè)樣本的基因組序列,其中80個(gè)科有2個(gè)全基因組序列。自2013年開始,JGI網(wǎng)站對(duì)全球開放真菌注釋工作。
[1]Goffeau A,Barrell BG,Bussey H,et al.Life with 6000 genes[J].Science,1996,274(5287):546,563-567.
[2]余知和,高元鋼,曾昭清,等.真菌基因組學(xué)研究進(jìn)展[J].菌物學(xué)報(bào),2008,27(5):778-787.
[3]Wood V,Gwilliam R,Rajandream MA,et al.The genome sequence of Schizosaccharomyces pombe[J].Nature,2002,415(6874):871-880.
[4]Galagan JE,Calvo SE,Borkovich KA,et al.The genome sequence of the filamentous fungusNeurospora crassa[J].Nature,2003 ,422(6934):859-868.
[5]解增言,林俊華,譚軍,等.DNA測(cè)序技術(shù)的發(fā)展歷史與最新進(jìn)展[J].生物技術(shù)通報(bào),2010,13(8):64-70.
[6]Pettersson E,Lundeberg J,Ahmadian A.Generations of sequencing technologies[J].Genomics.2009,93(2):105-111.
[7]劉蓉蓉.高等植物基因組測(cè)序回顧與展望[J].生物醫(yī)學(xué)通報(bào),2011(5):10-14.
[8]Zhou X,Ren L,Meng Q,et al.The next-generation sequencing technology and application[J].Protein Cell,2010,1(6):520-536.
[9]Cornell MJ,Alam I,Soanes DM,et al.Comparative genome analysis across a kingdom of eukaryotic organisms:Specialization and diversification in the Fungi[J].Genome Res,2007 ,17(12):1809-1822.
[10]Jones T,F(xiàn)ederspiel NA,Chibana H,et al.The diploid genome sequence ofCandida albicans[J].Proc Natl Acad Sci USA,2004,101(19):7329-7334.
[11]Odds FC,Brown AJ,Gow NA.Candida albicansgenome sequence:a platform for genomics in the absence of genetics[J].Genome Biol,2004,5(7):230.
[12]Jackson AP,Gamble JA,Yeomans T,et al.Comparative genomics of the fungal pathogensCandida dubliniensisandCandida albicans[J] Genome Res,2009,19(12):2231-2244.
[13]Loftus BJ,F(xiàn)ung E,Roncaglia P,et al.The genome of the basidiomycetous yeast and human pathogenCryptococcus neoformans[J].Science,2005,307(5713):1321-1324.
[14]周冰炎,蔣瑋瑩.后基因組時(shí)代的功能基因組學(xué)[J].國(guó)際遺傳學(xué)雜志,2007,30(4):261-265.
[15]Nierman WC,Pain A,Anderson MJ,et al.Genomic sequence of the pathogenic and allergenic filamentous fungusAspergillus fumigatus[J].Nature,2005,22:438(7071):1151-1156.
[16]Fedorova ND,Khaldi N,Joardar VS,et al.Genomic islands in the pathogenic filamentous fungusAspergillus fumigatus.PLoS Genet,2008,11,4(4):e1000046.
[17]Kser CU,Ellington MJ,Cartwright EJ,et al.Routine use of microbial whole genome sequencing in diagnostic and public health microbiology[J].PLoS Pathog,2012,8(8):e1002824.
[18]Baquero F.Metagenomic epidemiology:a public health need for the control of antimicrobial resistance[J].Clin Microbiol Infect,2012,18(Suppl 4):67-73.
[19]Alcaraz LD,Belda-Ferre P,Cabrera-Rubio R,et al.Identifying a healthy oral microbiome through metagenomics[J].Clin Microbiol Infect,2012,18(Suppl 4):54-57.
[20]Gosalbes MJ,Abellan JJ,Durbán A,et al.Metagenomics of human microbiome:beyond 16s rDNA[J].Clin Microbiol Infect,2012 ,18(Suppl 4):47-49.
[21]Martinez DA,Oliver BG,Grser Y,et al.Comparative genome analysis ofTrichophyton rubrumand related dermatophytes reveals Candidate genes involved in infection[J].MBio,2012,3(5):e00259-212.
[22]Burmester A,Shelest E,Glckner G,et al.Comparative and functional genomics provide insights into the pathogenicity of dermatophytic fungi[J].Genome Biol,2011,12(1):R7.
[23]Heddergott C,Bruns S,Nietzsche S,et al.The Arthroderma benhamiae hydrophobin HypA mediates hydrophobicity and influences recognition by human immune effector cells[J].Eukaryot Cell,2012 ,11(5):673-682.
[24]Camps SM,Dutilh BE,Arendrup MC,et al.Discovery of a hapE mutation thatcausesazoleresistanceinAspergillus fumigatusthrough whole genome sequencing and sexual crossing[J].PLoS One,2012,7(11):e50034.
[25]Singh-Babak SD,Babak T,Diezmann S,et al.Global analysis of the evolution and mechanism of echinocandin resistance inCandida glabrata[J].PLoS Pathog,2012,8(5):e1002718.