国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

烏蘇里貉KIT基因及編碼蛋白生物信息學分析

2020-08-04 09:12白秀娟姜恩澤朱宇航徐逸男韓志強
東北農(nóng)業(yè)大學學報 2020年7期
關(guān)鍵詞:位點氨基酸編碼

白秀娟,姜恩澤,蘇 杭,朱宇航,許 愿,徐逸男,李 雪,韓志強,徐 超

(1.東北農(nóng)業(yè)大學動物科學技術(shù)學院,哈爾濱,150030;2.中國農(nóng)業(yè)科學院特產(chǎn)研究所,長春 130112)

KIT基因,又名c-KIT基因,編碼的肥大/干細胞生長因子受體(Mast/stem cell growth factor receptors)最初于貓肉瘤病毒中被發(fā)現(xiàn)[1]。在色素沉著方面,KIT基因主要調(diào)控黑色素細胞前體沿特定路徑遷移到真皮、表皮、內(nèi)耳和眼脈絡(luò)膜的過程[2]。KIT基因非正常編碼或表達量較少時,黑色素細胞不會正常增殖和遷移,機體產(chǎn)生不同程度白化[3]。白癜風患者KIT基因表達量極顯著低于正常人[4]。目前,KIT基因在動物中已發(fā)現(xiàn)多種突變體。狐貍白色被毛與KIT基因外顯子12缺失有關(guān)[5]。KIT基因易位使牛表現(xiàn)不同程度白斑[6]。阿拉伯駱駝白色斑點與KIT基因突變有關(guān)[7]。研究表明KIT基因在毛色調(diào)控中發(fā)揮重要作用。

烏蘇里貉(Nyctereutes procyonoides)屬于犬科(Canidae),經(jīng)濟價值較高的毛皮動物。研究表明野豬KIT基因與毛色表型不相關(guān)[8],烏蘇里貉KIT基因編碼區(qū)未發(fā)現(xiàn)與毛色相關(guān)單核苷酸位點[9-10],烏蘇里貉KIT基因與毛色關(guān)系未見報道,為了解烏蘇里貉KIT基因及編碼蛋白結(jié)構(gòu)特性,基于機器學習和人工神經(jīng)網(wǎng)絡(luò)等在線軟件對其編碼蛋白一級、二級、三級結(jié)構(gòu)作全面生物信息學分析。研究結(jié)果旨在比較烏蘇里貉與其他動物KIT基因提供參考,為了解KIT基因潛在功能提供新思路。

1 材料與方法

1.1 KIT基因轉(zhuǎn)錄本定量

根據(jù)中國農(nóng)業(yè)科學院特產(chǎn)研究所上傳到SRA數(shù)據(jù)庫的烏蘇里貉皮膚轉(zhuǎn)錄組數(shù)據(jù):野生貉(SRS1620675,SRS1620679,SRS1620678),白貉(SRR4158185,SRR4158184,SRR4158183),紅棕貉(SRR4034955, SRR4034954,SRR4034953)各3只,原始數(shù)據(jù)均由Illumina HiSeqTM 2000雙端測序獲得,按文獻[11]方法分析轉(zhuǎn)錄本數(shù)據(jù)。為獲得clean reads便于后續(xù)分析,將接頭、低質(zhì)量序列和未知核苷酸序列過濾,使用Trinity軟件序列組裝,獲得盡可能長非冗余unigenes。通過Bowtie軟件比對unigenes。使用RSEM工具精確量化每個樣本轉(zhuǎn)錄豐度。使用FPKM方法計算每個轉(zhuǎn)錄產(chǎn)物基因表達水平。最后,分別提取不同毛色烏蘇里貉KIT基因表達量方差分析。

1.2mRNA序列收集

從GenBank數(shù)據(jù)庫檢索已公布的烏蘇里貉KIT基因mRNA序列,登錄號:KM083121,保存完整CDS序列,以便進一步生物信息學分析。

1.3 烏蘇里貉KIT基因序列分析

使用DNAMAN軟件中display sequence程序分析CDS序列總長度及4種堿基含量。通過在線軟件ORF finder(https://www.ncbi.nlm.nih.gov/orffinder/)分析CDS區(qū)開放閱讀框。

1.4 烏蘇里貉KIT基因編碼蛋白一級結(jié)構(gòu)預(yù)測

為了解烏蘇里貉KIT基因編碼蛋白一級結(jié)構(gòu)特征,運用Protparam(https://web.expasy.org/protparam/)在線軟件預(yù)測KIT基因編碼蛋白理化性質(zhì)。運用基于Hphob./Kyte&Doolittle模型在線軟件Protscale(https://web.expasy.org/protscale/)預(yù)測KIT蛋白親水性和疏水性。運用在線軟件NetOGly 4.0 Server(http://www.cbs.dtu.dk/services/NetOGlyc/)和 NetNG-ly 1.0 Server(http://www.cbs.dtu.dk/services/NetNG-lyc/)分別預(yù)測KIT蛋白O-糖基位點和N-糖基位點。最后,使用在線軟件NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)預(yù)測烏蘇里貉KIT蛋白磷酸化位點[12]。

1.5 烏蘇里貉KIT基因編碼蛋白二級結(jié)構(gòu)及定位分析

使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)在線軟件預(yù)測烏蘇里貉KIT蛋白二級結(jié)構(gòu)[12]。運用在線軟件SingalP(http://www.cbs.dtu.dk/services/SignalP/)定 位分析KIT蛋白信號肽[13]。通過TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)在線工具預(yù)測分析KIT蛋白質(zhì)跨膜區(qū)位置[14]。通過在線軟件PSORT(https://www.genscript.com/psort.html)和 Softberry(http://linux1.softberry.com/)網(wǎng)站預(yù)測KIT蛋白亞細胞定位。通過NCBI Conserved Domain(https://www.ncbi.nlm.nih.gov/cdd/)尋找KIT蛋白保守結(jié)構(gòu)域[13]。

1.6 烏蘇里貉KIT基因編碼蛋白三級結(jié)構(gòu)及蛋白互作分析

通過SWISS-MODEL(https://swissmodel.expasy.org/interactive)網(wǎng)站構(gòu)建KIT蛋白三級結(jié)構(gòu)模型。運用 STRING(https://string-db.org/cgi/input.pl)交互數(shù)據(jù)庫分析與KIT蛋白密切作用的蛋白質(zhì)。

1.7 不同物種KIT基因編碼蛋白序列進化分析

根據(jù)烏蘇里貉KIT蛋白序列,運行BLAST,獲得家犬(AAD28369.1,Canis lupus familiaris)、家貓(NP_001009837.3,F(xiàn)elis catus)、野豬(AFK92989.1,Sus scrofa)、牦牛(XP_005905988.1,Bos mutus)、藏羚羊(XP_005961702.1,Pantholops hodgsonii)、家 馬(NP_001157338.2,Equus caballus)、 家 牛(XP_005207994.2,Bos taurus)7個物種KIT蛋白序列,運用在線軟件Clustal Omeaga(https://www.ebi.ac.uk/Tools/msa/clustalo/)對8個物種KIT蛋白序列比對分析,通過MEGA5.1軟件中鄰近法構(gòu)建系統(tǒng)發(fā)育樹。

2 結(jié)果與分析

2.1 3種毛色KIT基因定量表達

在3種毛色烏蘇里貉轉(zhuǎn)錄本定量表達中,白貉KIT基因表達量最高,為1.4746,其次為紅棕貉(0.0748),野生貉KIT基因表達量最低(0.0246),且白貉KIT基因表達量顯著高于紅棕貉和野生貉(P<0.05)。

2.2 烏蘇里貉KIT基因序列

DNAMAN序列分析結(jié)果顯示,烏蘇里貉KIT基因CDS區(qū)長度為2 919 bp,4種堿基含量依次為A(27.4%,800)>T(25.6%,748)>G(24.6%,719)>C(22.4%,652),其中A+T含量(53%)略高于G+C含量(47%),說明該基因穩(wěn)定性較差,ssDNA分子質(zhì)量為902.77,dsDNA分子質(zhì)量為1 799.47。ORF finder開放閱讀框預(yù)測結(jié)果顯示,起始密碼子ATG編碼Met,終止密碼子TGA不編碼氨基酸,該序列共編碼972個氨基酸。

2.3 烏蘇里貉KIT基因編碼蛋白一級結(jié)構(gòu)特性

2.3.1 理化特性

在線工具Protparam分析理化性質(zhì)結(jié)果表明,烏蘇里貉KIT基因編碼蛋白分子式為C4863H7546N1294O1451S52,由15 206個原子組成,分子質(zhì)量為109 022.33,消光系數(shù)在280 nm處測量值為135 120,推測烏蘇里貉體內(nèi)半衰期為30 h,不穩(wěn)定指數(shù)為37.79(<40),為穩(wěn)定氨基酸,脂肪族氨基酸指數(shù)為81.39,該蛋白質(zhì)序列等電點為6.15,屬于酸性蛋白質(zhì)。

2.3.2 親水性和疏水性

在線工具Proscal分析親水性和疏水性結(jié)果表明,烏蘇里貉KIT基因編碼蛋白中疏水性氨基酸(Ala、Val、Leu、Ile、Phe、Trp、Met、Pro)399個,親水性氨基酸(Gly、Thr、Ser、Cys、Asn、Gln、Tyr、Lys、Arg、His、Asp、Glu)573個,其中,第14位氨基酸為最大疏水性氨基酸(3.589),第364位氨基酸為最大親水性氨基酸(-2.789),且親水性氨基酸(<0)多于疏水性氨基酸(>0),平均親水系數(shù)為負值(-0.224),因此該蛋白質(zhì)是親水性蛋白質(zhì),結(jié)果見圖1。

2.3.3 烏蘇里貉KIT蛋白的糖基位點和磷酸化位點預(yù)測

在線軟件NetOGly 4.0 Server分析結(jié)果顯示,烏蘇里貉KIT蛋白共存在12個O-糖基位點,分別在第 28、 30、 38、 709、 939、 950、 955、 958、959、961、962、963位氨基酸。NetNGly 1.0 Server分析結(jié)果表明,烏蘇里貉KIT蛋白共存在9個N-糖基位點,位置分別在第94、130、145、283、300、352、367、400、486位氨基酸。通過Net-Phos分析磷酸化位點結(jié)果發(fā)現(xiàn),烏蘇里貉KIT蛋白共60個磷酸化位點分值高于0.5,其中包括35個絲氨酸(Ser)、10個蘇氨酸(Thr)、15個酪氨酸(Tyr),具體位置如表1所示。

2.4 烏蘇里貉KIT蛋白二級結(jié)構(gòu)分析

通過SOPMA在線軟件預(yù)測烏蘇里貉KIT蛋白二級結(jié)構(gòu)。預(yù)測結(jié)果顯示,該蛋白有247個(25.41%)氨基酸形成α螺旋;220個(22.63%)氨基酸形成延伸直鏈;50個(5.14%)氨基酸形成β-轉(zhuǎn)角;455個(46.81%)氨基酸形成無規(guī)卷曲,因此無規(guī)卷曲為烏蘇里貉KIT蛋白主要二級結(jié)構(gòu)。

2.5 預(yù)測烏蘇里貉KIT蛋白結(jié)構(gòu)及定位

2.5.1 信號肽和跨膜區(qū)

在線分析軟件TMHMM預(yù)測該蛋白存在兩個跨膜區(qū)結(jié)構(gòu),分別在第517~539、649~671位氨基酸,其余第1~516、672~972位氨基酸位于細胞膜外側(cè),第540~648位氨基酸位于細胞膜內(nèi)側(cè)(見圖2)。

在線SignalP軟件預(yù)測該蛋白質(zhì)信號肽結(jié)果顯示,該蛋白在第1~25位氨基酸為信號肽序列,因此推測該蛋白為分泌型蛋白(見圖3)。

2.5.2 保守結(jié)構(gòu)域

NCBI Conserved Domain預(yù)測結(jié)果表明,烏蘇里貉KIT蛋白共有4個保守結(jié)構(gòu)域,包括2個免疫球蛋白結(jié)構(gòu)域(Ig),分別位于第216~305、426~505位氨基酸殘基,1個干細胞因子受體第四免疫球蛋白樣域(Ig4_SCFR),位于第311~411位氨基酸殘基,1個蛋白激酶C(PKc-like),位于第549~924位氨基酸殘基(見圖4)。

2.5.3 亞細胞定位

在線軟件PSORT預(yù)測烏蘇里貉KIT基因編碼蛋白亞細胞定位結(jié)果顯示,該蛋白存在于內(nèi)質(zhì)網(wǎng)(21.7%)、高爾基體(13.0%)、細胞膜(34.8%)、細胞外(30.4%),Softberry網(wǎng)站分析該蛋白定位在細胞膜上評分為10.0(滿分)。

2.6 烏蘇里貉KIT蛋白同源建模

通過SWISS-MODEL對烏蘇里貉KIT蛋白同源建模,系統(tǒng)根據(jù)蛋白質(zhì)結(jié)構(gòu)域?qū)跆K里貉KIT蛋白分為兩大板塊。根據(jù)烏蘇里貉KIT蛋白第33~507位氨基酸同源建模獲得三級結(jié)構(gòu),如圖5a所示,包含KIT蛋白2個Ig和1個Ig4_SCFR。根據(jù)烏蘇里貉KIT蛋白第547~927位氨基酸同源建模獲得三級結(jié)構(gòu),如圖5b所示,包含1個PKc-like。

2.7 KIT蛋白互作網(wǎng)絡(luò)

運用STRING預(yù)測與KIT蛋白相互作用蛋白質(zhì),如圖6所示,其中共有5個蛋白相關(guān)系數(shù)在0.950以上,包括KIT配體(KITLG),相關(guān)系數(shù)0.998;磷酸肌苷-3激酶(PIK3R1),相關(guān)系數(shù)0.962;磷脂酰肌醇4,5-二磷酸3激酶(PIK3CA),相關(guān)系數(shù)0.961;還有兩個RAS家族原癌基因NRAS、HRAS,相關(guān)系數(shù)分別為0.960、0.957。

2.8 系統(tǒng)發(fā)育樹構(gòu)建

通過鄰近法構(gòu)建系統(tǒng)發(fā)育樹,其中重復(fù)參數(shù)為1 000,采用鄰近法計算距離,從系統(tǒng)發(fā)育樹中可見,如圖7所示,烏蘇里貉和家犬進化距離較近,與家貓聚合為1支,家牛、牦牛、藏羚羊、野豬、家馬聚合為另1支。

3 討論

3.1 烏蘇里貉KIT基因表達量與黑色素含量關(guān)系

黑色素細胞起源于胚胎發(fā)育時神經(jīng)嵴細胞,KIT基因可調(diào)控神經(jīng)嵴細胞分化、存活和遷移[15-16],是黑色素細胞成熟關(guān)鍵。理論上,KIT基因表達量較多利于黑色素細胞成熟,可產(chǎn)生較多黑色素,機體顏色加深。斑嘴野鴨KIT基因在褐羽和黃白羽中表達量均顯著高于白羽(P<0.05)[17],騮色蒙古馬KIT基因表達量極顯著高于白色蒙古馬(P<0.01)[3],Du等研究結(jié)果表明,白貉被毛中黑色素含量顯著低于野生貉[11]。3種毛色烏蘇里貉轉(zhuǎn)錄本定量結(jié)果表示,KIT基因在白貉中表達量最高,其次是紅棕貉,而野生貉KIT基因表達量最低,與烏蘇里貉KIT基因表達量和毛色表型關(guān)系不符,可能是烏蘇里貉KIT基因及其編碼蛋白結(jié)構(gòu)與其他動物不同所致。

3.2 烏蘇里貉KIT蛋白結(jié)構(gòu)分析

文章從全球最大基因數(shù)據(jù)庫GenBank中檢索到烏蘇里貉KIT基因CDS序列作生物信息學分析,結(jié)果表明,KIT基因CDS序列全長2 919 bp,共編碼972個氨基酸。使用TMHMM和SignalP在線網(wǎng)站,基于神經(jīng)網(wǎng)絡(luò)算法分別精準預(yù)測蛋白質(zhì)跨膜區(qū)和信號肽,根據(jù)分析結(jié)果推測該信號肽位于氨基酸序列N端且分布在細胞膜外側(cè),信號肽可調(diào)控大多數(shù)蛋白質(zhì)分泌[18-19]。根據(jù)跨膜區(qū)和結(jié)構(gòu)域分析結(jié)果,2個Ig和1個Ig4_SCFR位于氨基酸序列N端且分布在細胞膜外側(cè),1個PKc-like位于氨基酸序列C端且分布在細胞膜外側(cè)。根據(jù)跨膜區(qū)和糖基化分析結(jié)果預(yù)測,O-糖基和N-糖基全部在細胞膜外側(cè),且O-糖基主要分布在氨基酸序列C端,少數(shù)分布在N端。N-糖基分布在氨基酸序列N端。烏蘇里貉KIT蛋白首先在內(nèi)質(zhì)網(wǎng)中作N端糖基化修飾,再轉(zhuǎn)運到高爾基體中作復(fù)雜的糖基化修飾,最后到細胞膜表面表現(xiàn)生物學功能[20-21]。Softberry和PSORT為預(yù)測蛋白質(zhì)亞細胞定位常用在線網(wǎng)站,Softberry網(wǎng)站功能全面,預(yù)測結(jié)果以評分表示,內(nèi)容較詳細。PSORT網(wǎng)站功能較單一,預(yù)測結(jié)果百分比表示。通過PSORT網(wǎng)站對烏蘇里貉KIT蛋白亞細胞定位預(yù)測分析結(jié)果顯示,該蛋白質(zhì)主要在細胞膜上發(fā)揮功能,與Softberry預(yù)測結(jié)果一致。根據(jù)跨膜區(qū)和磷酸化分析結(jié)果,KIT蛋白磷酸化位點有7個在細胞膜內(nèi)側(cè),53個在細胞膜外側(cè),其中氨基酸序列N端存在30個,氨基酸序列C端存在23個,兩個跨膜區(qū)均不存在磷酸化位點。因此,研究結(jié)果闡明烏蘇里貉KIT基因編碼蛋白的性質(zhì),可為進一步研究提供參考數(shù)據(jù)。

3.3 KIT基因及蛋白序列比較分析

根據(jù)BLAST分析結(jié)果構(gòu)建系統(tǒng)發(fā)育樹,發(fā)現(xiàn)烏蘇里貉、家犬和家貓聚合為一大支,表明烏蘇里貉KIT蛋白結(jié)構(gòu)與家犬、家貓相似。紅褐貉第二外顯子長為276 bp,與家犬、家貓同源性分別為97%、92%,且對野生貉、白貉、紅褐貉第二外顯子分析未發(fā)現(xiàn)突變位點[9],張巧靈等分析羊駝KIT基因exon10-19表明,其酪氨酸激酶活性位點僅橫跨12個氨基酸,而烏蘇里貉酪氨酸激酶549~924位于氨基酸殘基之間[22],約占KIT蛋白總長度一半。不同動物KIT蛋白結(jié)構(gòu)不同,酪氨酸激酶結(jié)構(gòu)域活性可影響KIT蛋白磷酸化,磷酸化轉(zhuǎn)化調(diào)控對干細胞遷移和下游信號轉(zhuǎn)導具有關(guān)鍵作用[23]。在具有白色斑點的冰島馬皮膚中發(fā)現(xiàn),KIT基因17號外顯子中缺失一個堿基,證實該缺失可阻礙黑色素細胞內(nèi)酪氨酸激酶結(jié)構(gòu)域功能。狐貍KIT基因17號外顯子缺失導致酪氨酸激酶域結(jié)構(gòu)和功能發(fā)生改變,赤狐被毛表現(xiàn)為鉑金色[24]。藍狐KIT基因12號外顯子缺失導致酪氨酸激酶活性發(fā)生改變,被毛表現(xiàn)為白色[5]。而在烏蘇里貉KIT基因中并未發(fā)現(xiàn)與毛色相關(guān)的單核苷酸位點[10],F(xiàn)rischknecht報道全長7 125 bp的FERV1插入KIT基因內(nèi)含子1中,導致貓產(chǎn)生白色斑點[25]。目前,對于各物種KIT基因結(jié)構(gòu)研究較少,烏蘇里貉KIT蛋白研究結(jié)果可為進一步比較分析提供參考。烏蘇里貉KIT基因轉(zhuǎn)錄及翻譯調(diào)控研究仍較少,是否存在miRNA調(diào)控仍未知,由于抗體有限,測定不同毛色烏蘇里貉KIT蛋白表達量仍有難度。推測烏蘇里貉毛色也可能受KIT基因非編碼區(qū)調(diào)控,或是通過一種負反饋調(diào)節(jié)黑色素形成。

猜你喜歡
位點氨基酸編碼
Pd改性多活性位點催化劑NH3-SCR脫硝反應(yīng)機理研究
胰島素受體底物氨基酸相互作用網(wǎng)絡(luò)魯棒性研究
生活中的編碼
鵝掌柴蜂蜜氨基酸組成識別研究
低蛋白日糧平衡氨基酸對生長豬生產(chǎn)性能的影響
基于網(wǎng)絡(luò)公開測序數(shù)據(jù)的K326煙草線粒體基因組RNA編輯位點的鑒定與分析
《全元詩》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應(yīng)用
Genome and healthcare
基因型和表現(xiàn)型的快速判斷法