康曉龍,李新海,馮登偵
(寧夏大學農(nóng)學院動物科學系,寧夏 銀川750021)
生命有機體在不同發(fā)育時期不同部位的基因表達具有差異性,其按照時間和空間順序有序地進行復雜而精細的網(wǎng)絡調控過程?;虻倪@種差異表達決定著每一個生命體的生長發(fā)育、分化、細胞周期調控、衰老及死亡等生命過程。比較不同細胞或不同基因型在基因表達上的差異,分離并克隆不同組織或同一組織不同發(fā)育階段差異表達的基因,不僅是研究生命過程分子機制的基礎,也是進行功能基因組學領域研究的前提。因此,尋找差異表達基因成為目前基因研究的一個非常重要的內容。
目前,篩選差異表達基因的方法主要有差別篩選技術、消減雜交技術、mRNA差異顯示技術、基因表達系列分析、抑制性消減雜交、基因芯片技術、Gene Calling技術等。各種方法廣泛應用于動植物差異表達基因的分離與克隆。這些方法各有優(yōu)劣,對某項具體研究而言,選擇合適的方法是十分重要的。本文就此對目前差異表達篩選基因中幾種主要方法進行了歸納概述。
消減雜交(Subtractive Hybridization,SH)是一種富集差異表達基因的有效方法。這種方法最初在20世紀60年代中期由Bautz等[1]用于純化噬菌體T4 mRNA。20世紀80年代中期,Lamar和Palmer[2]經(jīng)過對前人技術的不斷完善,建立了新的消減雜交技術。消減雜交利用細胞基因表達的差異性,并結合分子雜交技術去除共同序列、保留差異序列,從而達到分離出兩類同源分子間差異表達的基因。
消減雜交原理及過程為:從來源相似而功能有異的兩種樣品獲得mRNA,含有目的基因的樣品為檢測方(Tester),不含目的基因的樣品稱為驅動方(Driver)。以Oligo-dT為引物,從Tester中制備放射性標記的單鏈cDNA文庫。然后將這些cDNA探針與過量的來自Driver的 mRNA(其poly-A尾已與生物素耦聯(lián))雜交,經(jīng)兩輪充分雜交后,大部分單鏈cDNA探針和Driver中的mRNA形成異源雙鏈,通過羥基磷灰石柱層除去cDNA-mRNA雜交體,以此富集Tester中特異的cDNA,其本質是將共同擁有的序列消減掉,以富集目的基因序列,提高分離的敏感性。
消減雜交適用于未被克隆的基因組片段,并且特別適于尋找那些由于缺失造成突變的基因。優(yōu)化后的消減雜交可明顯提高富集效率。Duguid和Dinauer[3]通過優(yōu)化在cDNA后加接頭進行選擇性PCR擴增;Zhu等[4]采用LD-PCR及旋轉柱層析法對其進行改進;Low等[5]通過建立基于外切核酸酶的消減雜交法克服了消減雜交對起始材料的需要及雜交過程中RNase的污染等問題。但消減雜交的弊端也較顯著,首先對起始材料對照組mRNA的質和量要求高,很難獲得低豐度的差異基因;同時經(jīng)羥基磷灰石柱層析后回收得到的cDNA量也很低;操作步驟復雜、耗資費時、重復性差;如果基因組過大,則會導致野生基因組和變異基因組間的雜交復雜化。
mRNA差異顯示技術(Differential Display of mRNA Reverse Transcription Polymerase Chain Reaction,DDRT-PCR )是由 Liang和 Pardee[6]于1992年建立的以PCR技術和聚丙烯凝膠電泳技術為基礎,結合銀染或放射性自顯影等顯色技術進行差異基因篩選的方法。
這一方法的原理及流程為真核細胞mRNA 3′端有一個由30~300個腺苷酸連成的多聚苷酸(poly-A)尾巴,3′末端與poly A相鄰的2個堿基只有12種組合。根據(jù)這一特點在3′端設計12種錨定引物,通式為5′-T12MN-3′(M=A,C,G;N=A,C,G,T),5′端有20種10bp長的隨機引物。每組引物錨定總mRNA的1/12。錨定引物與 mRNA 3′端錨定后,在逆轉錄酶作用下,逆轉錄合成cDNA的第一鏈;而后加入任意引物,經(jīng)變性后以cDNA第一鏈為模板,經(jīng)過低溫復性造成任意引物與cDNA第一鏈錯配,之后加入Taq DNA聚合酶,dNTP,5′端和3′端引物進行PCR擴增。因不同 mRNA擴增產(chǎn)物大小不同,經(jīng)聚丙烯酰胺凝膠電泳分離,通過自顯影或熒光顯色檢測,獲得平行材料間的差異cDNA片段;最后回收差異片段、擴增、克隆并測序、用Northern-blot檢測差異cDNA片段是否為陽性片段。
mRNA差異顯示技術最大的優(yōu)勢是它的簡便。它將3種常用分子生物學技術(poly-A RNA逆轉錄,多聚酶鏈式反應及聚丙烯酰胺凝膠電泳)結合使用,可以進行兩個或兩個以上樣本之間的差異基因表達比較;其次該技術反應靈敏,其周期短,對起始材料要求也少。
從已發(fā)表的相關報道來看,mRNA差異顯示技術尚存在不少問題。首先就是假陽性率較高(70%)[7];對高拷貝的 mRNA 有很強的傾向性;同位素放射自顯影安全系數(shù)低,易造成污染等;引物組合數(shù)多,檢測工作量很大;只能擴增 mRNA 3′端不大于600bp的片段,使上游的差異達信息得不到檢測,不能代表真正差異表達的基因。隨著mRNA差異顯示技術的推廣應用,上述缺點也不斷得到改進。如將3′端引物由12條改進為3條,即T12dA、T12dC、T12dG,簡化試驗操作[8];通過對兩端引物增加堿基CGGAATTCGG使得兩端都帶上EcoRⅠ酶切位點從而增強其重復性、敏感性并便于差異PCR產(chǎn)物克?。?]。通過改進并與其他技術結合也產(chǎn)生了一系列衍生技術,如 ODD(Ordered DD)[10]、GDD(Genomic DD)[11],這些技術在克服 DD-PCR不足的同時提高了篩選效率。
代表性差示分析技術(Representational Difference Analysis,RDA)是在基因組消減雜交方法的基礎上,由Lisitsyn等[12]提出的一種基因克隆新策略。通過引入cDNA消減雜交技術,1994年Hubank等[13]建立了cDNA代表性差示分析技術 (cDNA Representational Difference Analysis,cDNARDA),并得到推廣應用。
cDNA-RDA技術基本原理為,通過特異設計的接頭和引物,利用PCR技術對兩個基因組進行消減雜交,扣除共有序列,而以指數(shù)級擴增僅在待測組(Tester)中存在,而對照組或驅動組中沒有的特異雙鏈cDNA,并有效富集的差異片段。即由處理組和對照組mRNA反轉錄出cDNA,采用識別4個堿基的限制性內切酶進行消化待檢測樣本(Tester)和對照樣本(Driver)cDNA,產(chǎn)生兩端帶有可識別和處理末端的片段,在5′末端接上寡核苷酸接頭(Adaptor),然后與過量的Driver混合雜交。雜交形成3種雜交體,即 Tester/Tester,Tester/Driver,Drive/Driver 3種雜交體中只有Tester/Tester雜交體兩個5′端都帶有新接頭,補平3′端后,兩條鏈均能與PCR擴增引物配對從而進行指數(shù)擴增,其他雜交體呈線性擴增或無法進行擴增,最后通過電泳分析將富集的差異分子克隆到載體等方法獲得差異表達基因。
cDNA-RDA兼有RDA和差減雜交的優(yōu)點,實現(xiàn)了對靶序列的消減雜交富集和動力學富集,可以使靶序列在三輪雜交后被富集百萬倍以上,僅占Tester中0.0005%的靶序列也可以得到分離與富集,同時長引物(24mer)及高退火溫度(70℃/72℃)避免了引物錯配問題[14];此外,其對起始材料要求低、周期短、敏感、省事,非常適合小型實驗室開展。cDNA-RDA也存在明顯不足,如當Tester靶序列濃度較低時低豐度的分子富集受抑制;酶切連接步驟多,cDNA會損失,可能漏掉關鍵基因等。
基因表達系列分析技術(Serial Analysis of Gene Expression,SAGE)是由美國霍普金斯大學醫(yī)學院Velculescu等[15]在1995年建立的一種新的基因表達轉錄組(transcriptomes)分析技術。這是一個以測序為基礎的定量分析全基因組表達模式的技術。
其主要原理是:根據(jù)轉錄體特定位置一個9~13bp的核苷酸短序列(即標簽)特異地代表該轉錄體;其次,分離自不同轉錄體的標簽可被串聯(lián)成一定長度的多聯(lián)體(concatemers),克隆入載體并測序;根據(jù)測序結果計算某一標簽重復次數(shù)來確定相應轉錄體的表達水平,結合生物信息學方法進一步確定表達的基因種類和基因的表達豐度。
SAGE方法的基本步驟為:(1)提取mRNA并將其與生物素標記的Oligo(dT)經(jīng)逆轉錄反應合成雙鏈cDNA。(2)用一種特異性的限制性內切酶-錨定酶(anchoring enzyme,AE)進行消化。(3)用磁珠將帶poly(A)尾的cDNA 3′端分離出來,每個3′片段代表一個cDNA。(4)把cDNA分成兩份并連上接頭A和B,接頭3′端包含特定的標簽內切酶識別位點(該酶屬ⅡS類限制酶,能在距識別位點20堿基位置切割雙鏈DNA,產(chǎn)生平末端);再用標簽酶TE消化,產(chǎn)生單側平末端cDNA;(5)利用DNA聚合酶補平標簽的黏性末端,由連接酶將含有接頭的cDNA連接形成雙標簽。(6)根據(jù)A和B接頭序列設計引物,進行PCR擴增,利用酶消化切除接頭后的雙標簽靠其平末端首尾串聯(lián)成長短不一的多聯(lián)體。(7)經(jīng)PAGE電泳回收目的條帶,并克隆到高拷貝載體中,構建SAGE文庫;隨機挑選并測序,利用專門的SAGE軟件對標簽進行統(tǒng)計歸類,結合GenBank、SAGE map等數(shù)據(jù)庫進行比對,比較SAGE文庫標簽的類型及豐度,并分析其生物學意義。
SAGE不僅可以全面提供生物體基因表達譜信息,還可用來定量比較不同狀態(tài)下的組織或細胞的所有差異表達基因。SAGE對低豐度表達基因有較好檢測效果,具有假陽性率低、可重復性強、試驗周期相對較短、大量數(shù)據(jù)可用于多重比較等諸多優(yōu)點。該方法的不足之處在于產(chǎn)生雙標簽時接頭會降低雙標簽的連接效率;而且要求克隆所含的標簽數(shù)盡可能的多;另外,SAGE的費用昂貴,操作煩瑣,結果分析數(shù)據(jù)龐大,也是限制其應用范圍的一個重要因素。
隨著對SAGE技術的不斷引用,對其不足之處有人進行了相應改進。如利用生物素化的PCR引物產(chǎn)生生物素化連接子,通過與相應的抗鏈霉素蛋白包被的磁珠結合除去不需要的連接子,增加雙標簽數(shù)目及單克隆的平均長度[16];利用凝膠電泳前加熱來排除串聯(lián)形成的較短的多聚體[17];針對傳統(tǒng)SAGE技術中14個堿基(10bp特異序列+4bp酶切位點)的標簽較短不能覆蓋人類等大基因組內所有的基因序列,以及在進行BLAST時多個基因序列的匹配現(xiàn)象,又相繼衍生建立了Long SAGE技術[18]、Super SAGE技術[19]。
cDNA微陣列(cDNA microarray)又稱基因芯片(gene chips)或DNA芯片,是將已知序列的基因探針固定在固相支持物表面,集成的探針陣列與被測生物組織或細胞中標記的核酸序列進行雜交,通過檢測相應位置的雜交探針,進而快速高效的檢測基因的生物學信息[20-21]。
cDNA微陣列采用光刻合成或高速打印技術在硅片、玻璃或尼龍膜上制造DNA微陣列,以熒光標記的DNA探針,借助堿基互補雜交原理進行雜交,然后用放射自顯影或雙色熒光成像技術顯示雜交結果,利用陣列掃描儀及相應軟件進行全自動檢測和分析。通過一次雜交,在大于1 000個cDNA/cm2點陣密度的芯片可定量檢測成千上萬個基因表達活性。它是將生命科學、計算機科學、光電化學和微電子學融為一體,在原來核酸雜交的基礎上發(fā)展而來的一項新的生物學技術[22],也是目前基因分離鑒定的最有效的方法之一。
cDNA微陣列技術的優(yōu)點很顯著:大規(guī)模、高通量、快速高效、高平行性、高度自動化及高靈敏度等,從而使其在差異表達基因篩選中得到了廣泛的應用。但該技術也存在著一些問題,首先對基因序列信息的依賴使該方法只能用于研究較深入的少數(shù)物種,對于基因組研究相對薄弱,沒有足夠的已知序列制備探針,就無法使用該技術篩選差異表達基因;其次,費用昂貴,小型實驗室無力購買使用;玻片上的微陣列不能重復使用以及信號捕獲系統(tǒng)的敏感性等造成假陰性等問題也是目前限制該方法廣泛應用的主要因素。此外,DNA芯片不能很好的分析低豐度轉錄體,要確保某種低豐度轉錄體包含于DNA芯片上,需要挑選許多的克隆進行擴增點樣。
目前,將cDNA微陣列技術與其他方法相結合在差別表達基因篩選中取得了顯著效果。例如,Yang等[23]將SSH與cDNA芯片聯(lián)合使用,通過微陣列技術快速分析經(jīng)SSH得到的差異基因,取得了很好的結果
高等真核生物約含有10余萬個不同基因,但在生物體的發(fā)育過程中只有15% 的基因得以表達。除了上述介紹的幾種方法外,其他如Gene Calling技術、抑制性消減雜交技術也都具有自己獨特的優(yōu)勢??偟膩碚f,隨著技術的不斷進步,篩選差異表達基因已從既費時又費力的方法(如聚丙酰胺凝膠為基礎的差異顯示)發(fā)展到自動高通量檢測(DNA微陣列),每項技術都在實際應用中不斷改進和發(fā)展,還沒有哪項技術占據(jù)統(tǒng)治地位,因此,只有根據(jù)研究目的及試驗條件選擇合適的試驗方法才能事半功倍,取得優(yōu)良的試驗結果。但可以肯定的是隨著現(xiàn)代科技的不斷發(fā)展與進步,分子生物學領域的研究方法也會往更快,更高效,更靈敏,更準確的方向發(fā)展。
[1]Bautz E K,Reilly E.Gene-specific messenger RNA:isolation by the deletion method[J].Science,1966,151:328-330.
[2]Lamar E E,Palmer E.Y-encoded,species-specific DNA in mice:Evidence that the Y chromosome exists in two polymorphic forms in inbred strains[J].Cell,1984,37(1):171-177.
[3]Duguid J R,Dinauer M C.Library subtraction of in vitro cDNA libraries to identify differentially expressed genes in scrapieinfection[J].Nucleic Acids Research,1990,18:2789-2792.
[4]Zhu F,Yan W,Zhao Z L,et al.Improved PCR-based subtractive hybridization strategy for cloning differentially expressed genes[J].Biotechniques,2000,29:310-313.
[5]Low R K W,Prakash A P,Swarup S,et al.λExonuclease-Based Subtractive Hybridization Approach to Isolate Differentially Expressed Genes from Leaf Cultures of Paulownia kawakamii[J].Analytical Biochemistry,2001,295:240-247.
[6]Liang P,Pardee A B.Differential display of eukaryotic messenger RNA by means of the polymerase chain reaction[J].Science,1992,257(5027):967-971.
[7]Sun Y,Hegamyer G,Colburn N H.Molecular cloning of five messenger RNAs differentially expressed in preneoplasmic or neoplasmic JB6mouse epidermal cells:one is homologous to human tissue inhibitor of metalloproteinases-3[J].Cancer Research,1994,54(5):1139-1144.
[8]Ito T,Kito K,Adati N,et al.Fluorescent differential display:Arbitrarily primed RT-PCR fingerprinting on an automated DNA sequencer[J].FEBS Letters,1994,351(2):231-236.
[9]Ayala M,Balint R F,F(xiàn)ernández de Cossio M E,et al.Variable region sequence modulates periplasmic export of a single chain Fv antibody fragment in E.coli[J].Biology Techniques,1995,18(5):832-842.
[10]Matz M,Usman N,Shagin D,et al.Ordered differential display:a simple method for systematic comparison of gene expression profiles[J].Nucleic Acids Research,1997,25(12):2541-2542.
[11]Broude N E,Chandra A,Smith C L.Differential display of genome subsets containing specific interspersed repeats[J].Proceeding National Academy Sciences USA,1997,94:4548-4553.
[12]Lisitsyn N,Lisitsyn N,Wigler M.Cloning the differences between two complex genomes[J].Science,1993,259:946-951.
[13]Hubank M,Schatz D G.Identifying differences inmRNA expression by representational difference analysis of cDNA[J].Nucleic Acids Research,1994,22:5640-5648.
[14]Hubank M,Schatz D G.cDNA representational difference analysis:a sensitive and flexible method for identification of differentially expressed genes[J].Methods Enzymol,1999,303:325-349.
[15]Velculescu V E,Zhang L,Vogelstein B,et al.Serial analysis of gene expression[J].Science,1995,270(5235):484-487.
[16]Powell J.Enhanced concatemer cloning-a modification to the SAGE(Serial Analysis of ene Expression)technique[J].Nucleic Acids Research,1998,26:3445-3446.
[17]Kenzelmann M,Muhlemann K.Substantially enhanced cloning efficiency of SAGE(Serial Analysis of Gene Expression by adding a heating step to the original protocol[J].Nucleic Acids Research,1999,27(3):917-918.
[18]Dyhrman S T,Haley S T,Birkeland S R,et al.Long serial analysis of gene expression for gene discovery and transcriptome profiling in the widespread marine coccolithophore Emiliania huxleyi[J].Applied Environment Microbiology,2006,72(1):252-260.
[19]Matsumura H,Ito A,Saitoh H,et al.Super SAGE[J].Cell Microbiol,2005,7(1):11-18.
[20]Suzuki T,Tazoe H,Semura M.DNA microarray analysis of changes in gene expression induced by 1,25-dihydroxyvitamin D3in human promyelocytic leukemia HL-60cells[J].Biomed Research,2006,27(3):99-109.
[21]Andersson H,Hartmanova B.A microarray analysis of the murine macrophage response to infection with Francisella tularensis LVS[J].Medicine Microbiology,2006,55(8):1023-1033.
[22]Hacia J G.Resequencing and mutational analysis using oligonucleotide microarrays[J].Nature Genetics,1999,21(1):42-47.
[23]Yang G P,Kuang W W,Weigel R J.Combining SSH and cDNA microarrays for rapid identification of differentially expressed genes[J].Nucleic Acids Research,1999,27 (6):1517-1523.