楊 陽,侯 宇,趙樹林,李璐璐,孫小燕,阿迪萊·艾力,趙紅瓊
(新疆農(nóng)業(yè)大學(xué)動(dòng)物醫(yī)學(xué)學(xué)院,烏魯木齊 830052)
【研究意義】胃泌素-膽囊收縮素家族多肽包括胃泌素(Gastrin, GAS)、膽囊收縮素(Cholecystokinin,CCK)、雨蛙素(Cerulein)和原脊索動(dòng)物(Proctochordea)神經(jīng)肽(Cionin)等多肽[1],在哺乳動(dòng)物胃泌素-膽囊收縮素家族僅有GAS和CCK。GAS主要分泌于胃和十二指腸粘膜G細(xì)胞,而CCK主要分泌于十二指腸和空腸黏膜I細(xì)胞,它們對(duì)于消化液的分泌、消化道的生長(zhǎng)發(fā)育具有重要的調(diào)節(jié)作用。在進(jìn)行多肽功能研究、特異性抗體制備等過程中要注意動(dòng)物氨基酸序列不同與受體的親和力可能不同;多肽抗原序列不同,產(chǎn)生的抗體特異性不同,有必要了解目的多肽及其受體在動(dòng)物種屬之間的差異以及進(jìn)化關(guān)系。【前人研究進(jìn)展】根據(jù)氨基酸序列的長(zhǎng)短,GAS主要包括具有34和17個(gè)氨基酸的GAS-34和GAS-17,CCK主要包括具有58、33和8個(gè)氨基酸的CCK-58、CCK-33和CCK-8。根據(jù)GAS和CCK羧基端(C-端)分別對(duì)應(yīng)的第6位和第7位酪氨酸(Tyr)是否發(fā)生硫酸化,分為非硫酸化(-I)和硫酸化(-II)GAS和CCK,例如含17個(gè)氨基酸序列的非硫酸化胃泌素可表示為GAS-17-I,含33個(gè)氨基酸序列的硫酸化膽囊收縮素可表示為CCK-33-II。GAS-CCK家族包括CCK-A受體和CCK-B受體,均為7次跨膜(7-Transmembrane,7-TM)受體。7-TM受體一般包括N-端胞外域(含糖基化位點(diǎn))、跨膜域(含三個(gè)細(xì)胞外環(huán),三個(gè)細(xì)胞質(zhì)環(huán)和七個(gè)疏水的跨膜片段)和C-端胞漿域(含蛋白激酶硫酸化位點(diǎn))[3-4]。CCK-A僅同CCK-II結(jié)合力強(qiáng)[5],而CCK-B無論GAS和CCK酪氨酸硫酸化的程度如何均可結(jié)合,因而CCK-B也稱為GAS/CCK-B受體[6-8]?!颈狙芯壳腥朦c(diǎn)】目前,針對(duì)不同動(dòng)物GAS和CCK及其受體氨基酸序列信息學(xué)的比較分析研究較少。研究對(duì)胃泌素和膽囊收縮素及其受體的氨基酸序列信息學(xué)進(jìn)行比較分析?!緮M解決的關(guān)鍵問題】研究比較GAS和CCK兩種激素及其受體的氨基酸序列在不同動(dòng)物種間的差異性,特別是羊同其他動(dòng)物之間的序列差異,并進(jìn)行生物信息學(xué)分析,為GAS-CCK家族多肽或受體對(duì)羊生長(zhǎng)調(diào)控等領(lǐng)域的研究提供參考。
通過UniProt數(shù)據(jù)庫 (https://www.uniprot.org/)用“Gastrin”或“CCK”為關(guān)鍵詞檢索Gastrin和CCK及其受體的氨基酸序列,在同一種動(dòng)物有多個(gè)數(shù)據(jù)信息的時(shí)候,主要選用Swiss-Prot 標(biāo)記“引用(Reviewed)”的數(shù)據(jù)。再用“排列(Align)”功能進(jìn)行綿羊(Sheep)的某一種GAS和CCK多肽或受體蛋白氨基酸序列(主要為成熟肽或蛋白區(qū)域,不包括信號(hào)肽和原肽等)與其他動(dòng)物序列差異進(jìn)行比較。同時(shí),比對(duì)了綿羊CCK-A與CCK-B氨基酸序列,并標(biāo)明各自7次跨膜區(qū)域,為其抗原設(shè)計(jì)提供膜內(nèi)外區(qū)域參考。
用1.1篩選出的不同動(dòng)物GAS和CCK全肽或受體蛋白氨基酸,包括信號(hào)肽(Signal peptide)、原肽(Propeptide)、成熟肽(Peptide)等所有氨基酸序列,通過DNAstar的Megalign 7.1構(gòu)建GAS和CCK全肽或受體蛋白氨基酸序列進(jìn)化樹[9]。
研究表明,綿羊(Sheep,UniProt 登錄號(hào)O02 686,下同)GAS-34氨基酸序列同山羊(Goat,P04 564)、牛(Bovine,P01 352)、人(Human,P01 350)、小鼠(Mouse,P48 757)、大鼠(Rat,P04 563)、豬(Pig,P01 351)、豚鼠(Guinea pig,P06 885)、兔(Rabbit,G1TS39)、馬(Horse,P55 885)、狗(Dog,P01 353)、貓(Cat,P01 354)、駱駝(Camel,S9XCX3)、雞(Chicken,Q9PU41)、魚(Fish,A0A0M4JAV4)等14種動(dòng)物比對(duì)情況。從比對(duì)結(jié)果可知,除了雞和魚,其他動(dòng)物GAS-34的C-端7個(gè)氨基酸完全相同;綿羊、山羊和牛GAS-34氨基酸序列完全相同;雞和魚GAS僅C-端4個(gè)氨基酸序列同其它動(dòng)物。圖1
注:藍(lán)色背景氨基酸表示與綿羊GAS氨基酸序列比對(duì)不同的氨基酸
Note: The amino acids with blue background show differences compared to sheep gastrin
圖1 不同動(dòng)物GAS氨基酸序列比較
Fig.1 Comparison of gastrin amino acid sequences in different animals
在UniProt中用BLAST比較可知,綿羊的GAS氨基酸全長(zhǎng)序列同山羊比較完全相同,相似性為100%;其次為牛,相似性為95.2%;同人、大鼠和小鼠相似性分別為69.7%、67.7%和67%。未在BLAST所列的250個(gè)氨基酸序列數(shù)據(jù)庫中找到雞和魚的氨基酸比對(duì)數(shù)據(jù)。
用Megalign構(gòu)建進(jìn)化樹分析GAS全氨基酸序列表明,羊與牛,狗與貓,兔與駱駝,大鼠與小鼠,魚與雞分別在同一個(gè)分支上,草食動(dòng)物相對(duì)較近,而非草食動(dòng)物相對(duì)草食動(dòng)物遠(yuǎn);魚和雞與其他哺乳動(dòng)物相距最遠(yuǎn)。圖2
圖2 不同動(dòng)物GAS全氨基酸序列進(jìn)化樹
Fig. 2 Evolution tree of whole gastrin amino acid sequence in different animals
研究表明,綿羊(Sheep,W5NZD6)CCK-33氨基酸序列同牛(Bovine,P41 520)、貓(Cat,M3W5D6)、小鼠(Mouse,P09 240)、豬(Pig,P01 356)、兔(Rabbit,G1T9Y3)、狗(Dog,Q9TS44)、人(Human,P06 307)、大鼠(Rat,P01 355)、馬(Horse,F(xiàn)7BAG1)、駱駝(Camel,S9WZ08)、鴕鳥(Ostrich,Q9PU29)、雞(Chicken,Q9PU41)、金魚(Goldfish,O93 464)、豚鼠(Guinea pig,H0VR95)等14種動(dòng)物比對(duì)情況。所有比對(duì)的15種動(dòng)物CCK-4(C-端4個(gè)氨基酸)完全相同;綿羊、牛和貓CCK-33序列完全相同;除了豚鼠外,所有比對(duì)動(dòng)物CCK-8(C-端8個(gè)氨基酸,為具有生物活性的最小CCK)完全相同;鴕鳥、雞、金魚和豚鼠CCK-33氨基端與綿羊等比較差異較大。
用Megalign構(gòu)建進(jìn)化樹分析CCK氨基酸全序列表明,綿羊與牛,豬與貓,大鼠與小鼠,人與兔,鴕鳥與雞分別在同一個(gè)分支上;魚類和禽類與其他哺乳動(dòng)物相距較遠(yuǎn)。在UniProt中用BLAST比較可知,綿羊同牛CCK氨基酸序列全長(zhǎng)的相似性最高,達(dá)95.7%;其次為狗,達(dá)91.4%;同人、大鼠和小鼠相似性分別為80%、76.8%和74.8%;與鴕鳥的相似性最低,僅為49.2%。未在BLAST所列的250個(gè)氨基酸序列中檢索到與豚鼠的相似性數(shù)據(jù)。
注:藍(lán)色背景氨基酸表示與綿羊CCK氨基酸序列比對(duì)不同的氨基酸
Note: The amino acids with blue background show differences compared to sheep CCK
圖3 不同動(dòng)物CCK氨基酸序列比較
Fig. 3 Comparison of CCK amino acid sequence in different animals
圖4 不同動(dòng)物CCK全氨基酸序列進(jìn)化樹
Fig. 4 Evolution tree of whole CCK amino acid sequence in different animals
研究表明,CCK-A氨基酸序列進(jìn)化樹包括羊(Sheep,W5PET0)、牛(Bovine,A6QLH2)、人(Human,P32 238)、大鼠(Rat,P30 551)、小鼠(Mouse,O08 786)、豬(Pig,I3LFK5)、豚鼠(Guinea pig,Q63 931)、兔(Rabbit,O97772)、馬(Horse,F(xiàn)7AHW8)、狗(Dog,Q5D0K2)、貓(Cat,M3W880)、雞(Chicken,E5RVJ7)和魚(Fish,H2LRS6)。在進(jìn)化樹中,大鼠與小鼠、狗與貓、羊與牛分別在同一個(gè)分支上,魚類和禽類同其他哺乳動(dòng)物相距較遠(yuǎn)。BLAST分析顯示相對(duì)于綿羊CCK-A的氨基酸序列,與之相似性最高的是牛,為92.2%;其次為人、貓、豬,分別為87.6%、87.4%、87.2%;魚與綿羊CCK-A相似性最低,僅為59.4%。圖5
研究表明,CCK-B氨基酸序列進(jìn)化樹,包括羊(Sheep,W5QBM9)、牛(Bovine,P79266)、人(Human,P32239)、大鼠(Rat,P30553)、小鼠(Mouse,P56481)、豬(Pig,A0A287A2K5)、豚鼠(Guinea pig,H0VZC5)、兔(Rabbit,P46627)、馬(Horse,F(xiàn)6S229)、狗(Dog,P30552)、貓(Cat,M3WFK8),雞(Chicken,A0A1D5P3F3)和金魚(Goldish,A0A0D5CPE1)。在進(jìn)化樹中,羊與牛、狗與貓、兔與人、豚鼠、大鼠與小鼠分別在同一個(gè)分支上,魚類和禽類與其他哺乳動(dòng)物相距較遠(yuǎn)。BLAST分析顯示,對(duì)于綿羊CCK-B的氨基酸序列,相似性最高的為牛,達(dá)98.7%,其次為豬,達(dá)94.7% ,與雞相似性最低,僅為57%。圖6
圖5 不同動(dòng)物CCK-A全氨基酸序列進(jìn)化樹
Fig. 5 Evolution tree of whole CCK-A amino acid sequences in different animals
圖6 不同動(dòng)物CCK-B全氨基酸序列進(jìn)化樹
Fig. 6 Evolution tree of whole CCK-B amino acid sequences in different animals
從UniProt數(shù)據(jù)庫檢索發(fā)現(xiàn)綿羊CCK-A(W5PET0)和CCK-B(W5QBM9)氨基酸序列長(zhǎng)度分別為452個(gè)和454個(gè),位點(diǎn)相同氨基酸有216個(gè),相似性為45.094%,但兩個(gè)受體氨基酸序列均為“Unreviewed”。兩個(gè)受體氨基酸序列比較可知,CCK-A和CCK-B的N-端胞外域分別為1~59和1~57位,C-端胞漿域分別為397~452和400~454位;兩種受體七個(gè)疏水的跨膜片段氨基酸位置比較相近,但序列有所差異。圖7
注:藍(lán)色背景部分氨基酸為7次跨膜區(qū)域
Note:Amino acid with blue background means the 7-TM region
圖7 綿羊CCK-A和CCK-B氨基酸序列比較
Fig.7 Amino acid sequences of the sheep CCK-A and CCK-B
對(duì)不同動(dòng)物GAS和CCK及其受體氨基酸序列進(jìn)行了比較,該比較結(jié)果可為不同動(dòng)物這兩種多肽及其受體蛋白抗原設(shè)計(jì)和活性多肽篩選提供參考。無論GAS還是CCK其生物學(xué)活性部位均在C-端[10],序列比對(duì)結(jié)果顯示不同動(dòng)物之間C-端氨基酸序列相對(duì)于N-端序列具有高度的保守性。盡管在生理功能方面GAS被認(rèn)為主要是促進(jìn)胃液的分泌,而CCK主要是促進(jìn)膽囊收縮,但在生理功能方面兩者具有一定交叉性,例如刺激膽汁和ghrelin分泌等功能[11-13]。因此,在用ELISA、蛋白印跡和放射免疫等方法檢測(cè)和定位組織中GAS或CCK多肽的時(shí)候,要注意使用的抗體是否存在與CCK或GAS的交叉反應(yīng)問題,如果存在交叉反應(yīng),多肽含量檢測(cè)結(jié)果將偏高,而其組織定位可能出現(xiàn)假陽性。
從受體親和力看,CCK-A僅同C-端第7位酪氨酸硫酸化的CCK(即CCK-II)結(jié)合力強(qiáng),也就是說,如果要激活CCK-A受體,除了需要C-端保守的氨基酸序列外,第7位酪氨酸硫酸化也是必須的[14]。相反,無論GAS和CCK是否酪氨酸硫酸化,CCK-B均可與其結(jié)合[15]。目前,市面上出售的GAS或CCK產(chǎn)品,主要是根據(jù)人或鼠類氨基酸序列制備,因而在選購(gòu)用于其他動(dòng)物的GAS或CCK產(chǎn)品時(shí),要關(guān)注購(gòu)買多肽C-端序列是否和目的動(dòng)物的相似,相似性越高,則在目的動(dòng)物使用與其內(nèi)源性受體親和力越高,受體激活后表現(xiàn)出的生物學(xué)效應(yīng)也越強(qiáng)。Zhao等[16]研究表明,一次性靜脈注射牛GAS-17和GAS-34(無論是否第6位酪氨酸硫酸化)均可促進(jìn)犢牛血液生長(zhǎng)激素水平升高,而注射同樣摩爾劑量CCK-4或者GAS-9均未影響犢牛生長(zhǎng)激素水平,可見雖然后兩種多肽與前兩種多肽C-端部分氨基酸相同,但是卻無該促進(jìn)生長(zhǎng)激素分泌的生物學(xué)效應(yīng)。
CCK-A和CCK-B兩種受體亞型均屬于G蛋白偶聯(lián)7-TM受體家族,包括N-端胞外域(含糖基化位點(diǎn))、跨膜域(含三個(gè)細(xì)胞外環(huán),三個(gè)細(xì)胞質(zhì)環(huán)和七個(gè)疏水的跨膜片段)和C-端胞漿域(含蛋白激酶硫酸化位點(diǎn))[17-18]。研究顯示,羊CCK-A和CCK-B兩種受體相似性僅為45.094%,這可能是它們同內(nèi)源性配體(GAS和CCK)親和力不同的原因之一[19]。在用多肽片段為抗原制備膜受體特異性抗體的時(shí)候,最好選擇靶動(dòng)物N-端胞外域或跨膜域的三個(gè)細(xì)胞外環(huán)氨基酸序列,這樣利于將來獲得的抗體在不破壞細(xì)胞的情況下與靶動(dòng)物受體膜外區(qū)域結(jié)合。同樣,在選擇商品化受體抗體的時(shí)候,也要關(guān)注其使用的抗原氨基酸序列是否在靶動(dòng)物受體序列存在或相似度高,以此初步判定是否可使用該商品化受體抗體。
哺乳動(dòng)物血液循環(huán)中具有生物活性最小的GAS是GAS-17[20-21];研究顯示,雞和魚GAS的C-端僅有5個(gè)氨基酸與哺乳動(dòng)物相同,因而在禽類和魚類是否存在具有生物活性的GAS值得探討。哺乳動(dòng)物血液循環(huán)中具有生物活性最小的CCK是CCK-8,而雞和魚CCK的C-端有10個(gè)氨基酸與哺乳動(dòng)物相同,因而從氨基酸序列比對(duì)結(jié)果可以推測(cè)在禽類和魚類應(yīng)具有生物活性的CCK。
除了雞和魚,其他動(dòng)物GAS-34的C-端7個(gè)氨基酸完全相同;綿羊、山羊和牛GAS-34氨基酸序列相似性為100%;雞和魚GAS僅C-端4個(gè)氨基酸序列同其它動(dòng)物。所有比對(duì)的15種動(dòng)物CCK-4(C-端4個(gè)氨基酸)完全相同;綿羊、牛和貓CCK-33序列相似性為100%;除了豚鼠外,所有比對(duì)動(dòng)物CCK-8(C-端8個(gè)氨基酸,為具有生物活性的最小CCK)完全相同。
綿羊的GAS氨基酸全長(zhǎng)序列同山羊比較完全相同,相似性為100%;其次為牛,相似性為95.2%;綿羊同牛CCK氨基酸序列全長(zhǎng)的相似性最高,達(dá)95.7%;其次為狗,達(dá)91.4%。從GAS和CCK及受體全氨基酸序列(包括信號(hào)肽和原肽)來看,禽類和魚類序列同哺乳動(dòng)物差距均較大;綿羊CCK-A與CCK-B氨基酸序列相似性僅為45.094%。
GAS和CCK的C-端氨基酸序列在不同動(dòng)物之間均具有高度的保守性,而N-端為變化區(qū)域。該信息分析學(xué)結(jié)果為不同動(dòng)物這兩種多肽及其受體蛋白抗原設(shè)計(jì)和活性多肽篩選等研究提供參考。