李向陽(yáng)何蘭
四氫嘧啶基因簇在假單胞菌基因組中的分布研究
李向陽(yáng)1,2,何蘭1
(1.凱里學(xué)院 大健康學(xué)院,貴州 黔東南苗族侗族自治州 556011;2.復(fù)旦大學(xué) 環(huán)境科學(xué)與工程系,上海 200433)
四氫嘧啶(Ectoine)是由細(xì)菌產(chǎn)生的一種次級(jí)代謝產(chǎn)物,賦予細(xì)菌抵御高滲透壓環(huán)境的一種相容性溶質(zhì)。研究顯示許多細(xì)菌具有四氫嘧啶基因簇(ectABCD-ask),然而關(guān)于該基因簇在假單胞菌屬(Pseudomonas)中的分布還沒(méi)有系統(tǒng)報(bào)道。鑒于此,以公共數(shù)據(jù)庫(kù)中已測(cè)序的9 548株假單胞菌屬菌株全基因組序列為數(shù)據(jù),采用深度生物信息學(xué)分析方法探究假單胞菌中的四氫嘧啶基因簇分布及其組成共線性特征。結(jié)果顯示165株假單胞菌攜帶有四氫嘧啶基因簇,占假單胞菌株總數(shù)的1.78%,歸屬于32個(gè)不同的種,超過(guò)一半的菌株屬于施氏假單胞菌(P.stutzeri);同一種內(nèi)菌株間,ectABCD-ask及其側(cè)翼基因高度保守,共線性水平程度高。系統(tǒng)地揭示了假單胞菌基因組中四氫嘧啶基因簇分布規(guī)律,將為開(kāi)展生物合成四氫嘧啶提供重要菌種資源信息。
假單胞菌;基因組;四氫嘧啶;四氫嘧啶合成基因簇
四氫嘧啶(1,4,5,6-四氫-2-甲基-4-嘧啶羧酸)是由某些嗜鹽和耐鹽微生物生物合成的相容性溶質(zhì),能夠賦予細(xì)菌抵御胞外高滲透壓環(huán)境壓力[1]。由于這些相容性溶質(zhì)對(duì)蛋白質(zhì)、細(xì)胞膜、核酸,甚至整個(gè)細(xì)胞都具有良好的穩(wěn)定性能,因此在皮膚護(hù)理、食品加工、農(nóng)業(yè)以及生物技術(shù)等領(lǐng)域具有廣泛應(yīng)用價(jià)值[1-2]。
假單胞菌(Pseudomonas)是一類革蘭氏陰性菌,廣泛分布于空氣、土壤、水中等各種環(huán)境中,假單胞菌屬種類繁多,約200余種[3-4],其中不乏有對(duì)人體造成危害的種類,例如銅綠假單胞菌可引起慢性感染[5]。根據(jù)本研究團(tuán)隊(duì)前期相關(guān)研究顯示,一些斯氏假單胞菌(P.stutzeri)攜帶有由ectA、ectB、ectC、ectD、ask_ect 呈簇分布的基因組成的四氫嘧啶生物基因簇[6],如生物固氮菌P.stutzeri A1501[7]和砷氧化菌株P(guān).stutzeri TS44[8]。該基因簇能夠以L-天冬氨酸β半醛(ASA)為前體物質(zhì),通過(guò)二氨基丁酸轉(zhuǎn)氨酶(由ectB基因編碼)、二氨基丁酸乙酰轉(zhuǎn)移酶(由ectA基因編碼)和四氫嘧啶合成酶(由ectC基因編碼)進(jìn)行一系列的生物化學(xué)反應(yīng)最終合成四氫嘧啶[1]。
隨著高通量基因組測(cè)序技術(shù)的發(fā)展,使得細(xì)菌全基因組序列所需的時(shí)間和成本急劇下降。目前美國(guó)國(guó)立生物信息與技術(shù)中心(NCBI)基因組數(shù)據(jù)庫(kù)中已有將近10 000株假單胞菌屬菌株完成了全基因組序列測(cè)定,因而利用大量基因組系統(tǒng)分析四氫嘧啶基因簇在該屬菌株基因中的分布、組成及側(cè)翼序列共線性成為可能。
在惠普服務(wù)器DL388G9中安裝有Bio-Linux系統(tǒng)[9],該系統(tǒng)集成了常用生物信息學(xué)分析軟件。主要硬件配置為:CPU為雙核16線程,內(nèi)存容量128 GB,硬盤(pán)存儲(chǔ)總?cè)萘?0 TB。本研究所有分析均使用該服務(wù)器完成。
本研究以NCBI基因組資源庫(kù)中已測(cè)序的9 548株假單胞菌全基因組為實(shí)驗(yàn)數(shù)據(jù)。具體獲取方法如下:打開(kāi)NCBI基因組FTP資源庫(kù)網(wǎng)址http://www.ncbi.nlm.nih.gov/genome/ browse/,輸入假單胞菌屬名“Pseudomonas”進(jìn)行檢索,共獲得9 548個(gè)基因組信息列表;下載基因組信息列表文件后,采用Excel軟件打開(kāi)從中獲取所有假單胞菌屬菌株基因組數(shù)據(jù)FTP存儲(chǔ)地址和菌株名列表;然后根據(jù)每一個(gè)基因組數(shù)據(jù)的FTP地址,采用Aspera(https://downloads.asperasoft.com)高速批量下載所有假單胞菌屬菌株基因組數(shù)據(jù)(Genbank 格式)。
本研究結(jié)合ectC基因預(yù)篩選和基因簇可視化復(fù)篩方法分析四氫嘧啶基因簇在所有已測(cè)序假單胞菌中的分布情況。
ectC預(yù)篩選:ectC是四氫嘧啶合成酶基因簇關(guān)鍵基因,該基因編碼四氫嘧啶合成酶,為了減少計(jì)算量,首先分析ectC基因在假單胞菌中的分布情況。將所有9 548個(gè)基因組序列文件批量解壓后,采用Gcluster[10]軟件中自帶的interested_gene_generation.pl腳本獲取菌株攜帶的候選四氫嘧啶合成酶編碼基因。
interested_gene_generation.pl主要利用本地Blastp方法來(lái)分析同源基因,其主要分析過(guò)程為:批量提取所有基因組的蛋白組編碼基因的氨基酸序列,然后以P.stutzeri A501四氫嘧啶合成酶基因ectC氨基酸序列為數(shù)據(jù)庫(kù),采用16個(gè)線程多線程進(jìn)行本地Blastp分析,最后根據(jù)BlastP設(shè)定的同源蛋白默認(rèn)閾值(期望值=1-e10,覆蓋度≥70%,相似度≥50%),對(duì)結(jié)果進(jìn)行解析,即可獲得所有假單胞菌中所有潛在ectC基因分布情況。
基因簇可視化復(fù)篩:為了進(jìn)一步排除低質(zhì)量ectC比對(duì)結(jié)果,采用Gcluster軟件對(duì)所有含有候選ectC基因的假單胞菌進(jìn)行ectABCD-ask基因簇及其側(cè)翼序列進(jìn)行可視化與比較分析,具體操作方法詳見(jiàn)該軟件使用說(shuō)明(https://github. com/Xiangyang1984/Gcluster)。對(duì)獲得的結(jié)果進(jìn)行手工篩選,確定含有完整ectABCD-ask基因簇的為有效攜帶四氫嘧啶合成酶基因簇的菌株。
將所有含有完整四氫嘧啶基因簇的假單胞菌基因組GenBank文件置于同一個(gè)文件夾下,并從“1.2 ectC預(yù)篩選”步驟中獲得相應(yīng)基因組的ectC基因Locus tag,然后根據(jù)Gcluster默認(rèn)設(shè)置參數(shù)對(duì)ectABCD-ask基因簇及其側(cè)翼序列進(jìn)行基因組成圖繪制,同時(shí)開(kāi)展同源基因分析。
經(jīng)以P.stutzeri A1501 ectC蛋白質(zhì)序列為數(shù)據(jù)庫(kù)進(jìn)行Blastp比對(duì)分析,發(fā)現(xiàn)553株假單胞菌含有潛在ectC基因。為了排除假陽(yáng)性,采用Gcluster軟件對(duì)所有553株菌的四氫嘧啶合成酶基因簇進(jìn)行可視化,并進(jìn)行手工核對(duì),結(jié)果顯示541個(gè)(分布在541株假單胞菌中)為真正的四氫嘧啶合成酶基因ectC。在這些菌株中,絕大多數(shù)菌株(346株,占比為63.96%)只攜帶有單一的ectC基因,而沒(méi)有完整的ectABCD-ask基因;僅有165株假單胞菌含有完整的ectABCD-ask基因簇,占所有假單胞菌屬菌株總數(shù)的1.73%(165/9 548)。攜帶ect基因簇的菌株歸屬于29個(gè)不同的種以及一些未知種,超過(guò)一半的菌株屬于施氏假單胞菌(P.stutzeri),并且所有的施氏假單胞菌均攜帶有四氫嘧啶基因簇。
對(duì)165株假單胞菌的生物合成基因簇ectABCD-ask及側(cè)翼20個(gè)基因進(jìn)行分析顯示,ect基因簇由ectA、ectB、ectC、ectD、ask共5個(gè)基因組成。在部分菌株存在個(gè)別基因缺失,如Pseudomonas sp. A3170、Pseudomonas sp. CCUG 58779、Pseudomonas sp. SD129、P.stutzeri 28a24、P. stutzeri 28a3、P. stutzeri DSM 17088、P. stutzeri MF28、P. stutzeri NT0128、P. stutzeri PM101005等菌株不存在ectA基因,并且ectB基因較長(zhǎng);P.oceani DSM 100277、P. aestusnigri CECT 8317和P.aestusnigri VGXO14缺失ectD基因;P.stutzeri NP 8HO、P.yangmingensis DSM 24213等7個(gè)菌株不含有ask基因。
在同一種內(nèi)菌株間,ectABCD-ask及其側(cè)翼基因高度保守,共線性水平程度高;在不同種間菌株之間,該基因簇左側(cè)基因序列保守型高,但右側(cè)基因差異較大。
本研究首次利用大量假單胞菌屬基因組序列數(shù)據(jù),系統(tǒng)地分析了四氫嘧啶基因簇的分布規(guī)律,并對(duì)其基因組成及側(cè)翼基因進(jìn)行了共線性分析。研究發(fā)現(xiàn)四氫嘧啶基因簇在假單胞菌基因組中分布頻率極低,證明假單胞菌不是該基因簇的主要宿主。超過(guò)一半的四氫嘧啶基因簇分布在施氏假單胞菌中,并且所有施氏假單胞菌全部攜帶有四氫嘧啶基因簇,因此在假單胞菌中,施氏假單胞菌是攜帶四氫嘧啶基因簇的宿主。本結(jié)果對(duì)深入理解四氫嘧啶基因簇在假單胞菌屬中的分布規(guī)律具有一定價(jià)值,為生物合成四氫嘧啶篩選菌株資源提供了重要信息[11-12]。
[1]ZHAO Q,LI S,LV P,et al. High ectoine production by an engineered Halomonas hydrothermalis Y2 in a reduced salinity medium[J].Microb Cell Fact,2019,18(1):184.
[2]劉偉.四氫嘧啶類抗寄生蟲(chóng)藥在獸醫(yī)臨床上的應(yīng)用[J].畜牧獸醫(yī)科技信息,2018(10):158.
[3]李海碧.甘蔗根際假單胞菌的分離鑒定及其對(duì)甘蔗的促生作用[D].南寧:廣西大學(xué),2017.
[4]劉海明.甜椒根際合成抗生素假單胞菌遺傳多樣性分析及GP72菌株生防機(jī)制研究[D].上海:上海交通大學(xué),2007.
[5]丁燁,戴璐,俞娟.抗銅綠假單胞菌感染治療方法研究進(jìn)展[J].中華醫(yī)院感染學(xué)雜志,2020(6):955-960.
[6]李向陽(yáng),張國(guó)輝,湯宏.施氏假單胞菌四氫嘧啶/羥基四氫嘧啶合成基因簇進(jìn)化分析[J].凱里學(xué)院學(xué)報(bào),2015,33(6):70-73.
[7]STOVEKEN N,PITTELKOW M,SINNER T,et al.A specialized aspartokinase enhances the biosynthesis of the osmoprotectants ectoine and hydroxyectoine in Pseudomonas stutzeri A1501[J].J Bacteriol,2011,193(17):4456-4468.
[8]LI X,GONG J,HU Y,et al.Genome sequence of the moderately halotolerant,arsenite-oxidizing bacterium Pseudomonas stutzeri TS44[J].J Bacteriol,2012,194(16):4473-4486.
[9]FIELD D,TIWARI B,BOOTH T,et al.Open software for biologists:from famine to feast[J].Nat Biotechnol, 2006,24(7):801-803.
[10]LI X,CHEN F,CHEN Y.Gcluster:a simple-to-use tool for visualizing and comparing genome contexts for numerous genomes[J].Bioinformatics,2020(28):40.
[11]高波.吉蘭泰鹽湖土壤中嗜鹽堿放線菌的分離鑒定及四氫嘧啶工程菌株的構(gòu)建[D].咸陽(yáng):西北農(nóng)林科技大學(xué),2016.
[12]徐蕊.四氫嘧啶合成工程菌株構(gòu)建[D].大連:大連海事大學(xué),2012.
S476
A
10.15913/j.cnki.kjycx.2020.12.058
2095-6835(2020)12-0132-02
李向陽(yáng)(1984—),男,凱里學(xué)院大健康學(xué)院副教授,復(fù)旦大學(xué)環(huán)境科學(xué)與工程系在職博士后,研究方向?yàn)榄h(huán)境微生物學(xué)及生物信息學(xué)。
〔編輯:張思楠〕