朱向星,文健聰,林子盛,陳彩悅,吳耀冰,林曉微,羅靖維,鐘 斐,田壯壯,龔道元,翁閃凡(通信作者)
(佛山科學(xué)技術(shù)學(xué)院醫(yī)學(xué)院醫(yī)學(xué)檢驗(yàn)系 廣東 佛山 528000)
CRISPR 基因編輯技術(shù)是過(guò)去十多年來(lái)全球生物科技領(lǐng)域的重大突破。1987 年,日本科學(xué)家石野良純?cè)谘芯繅A性磷酸酶同工酶相互轉(zhuǎn)化機(jī)理時(shí),意外發(fā)現(xiàn)了5 個(gè)具有高度同源性的間隔重復(fù)序列[1]。這一序列的主要結(jié)構(gòu)特征是:重復(fù)序列與非重復(fù)序列交替排列,并且二者大小在21 ~37 bp 不等。進(jìn)一步研究發(fā)現(xiàn)重復(fù)序列普遍存在于細(xì)菌和古細(xì)菌基因組中[2],這種間隔重復(fù)序列在2002 年被統(tǒng)一命名為“成簇的規(guī)律間隔的短回文重復(fù)序列”(Clustered regularly interspaced short palindromic repeats, CRISPR)。通過(guò)比對(duì)不同原核生物CRISPR 序列兩側(cè)的基因,發(fā)現(xiàn)了4 種具有同源性的CRISPR 相關(guān)蛋白(CRISPR-associated protein, Cas)編碼基因。2005 年,發(fā)現(xiàn)CRISPR 序列中的間隔序列與噬菌體和接合質(zhì)粒內(nèi)的序列具有相似性[3-4]。后續(xù)研究表明CRISPR 序列及Cas基因與細(xì)菌抵抗噬菌體入侵有關(guān),并且發(fā)現(xiàn)CRISPR/Cas系統(tǒng)能夠限制細(xì)菌的水平基因轉(zhuǎn)移[5-6]。2012 年,CRISPR/Cas 系統(tǒng)最終被闡釋為一種在細(xì)菌和古細(xì)菌中抵抗噬菌體和質(zhì)粒入侵的適應(yīng)性免疫系統(tǒng)[7]。
經(jīng)過(guò)近幾年的研究,大多數(shù)CRISPR/Cas 系統(tǒng)已經(jīng)被明確,利用不同類型系統(tǒng)的生物學(xué)特征開(kāi)發(fā)出了許多CRISPR 工具?;贑RISPR/Cas 原理的新型核酸檢測(cè)技術(shù)在傳染性病原微生物核酸快速檢測(cè)中具有重要。結(jié)合快速核酸提取技術(shù)、等溫?cái)U(kuò)增技術(shù)等體外診斷技術(shù),使得CRISPR/Cas 系統(tǒng)在病原微生物核酸快速檢測(cè)領(lǐng)域有了更加廣泛的應(yīng)用[8]。
研究表明,由于CRISPR 系統(tǒng)進(jìn)化迅速,因而其分類體系異常復(fù)雜。為了更好地展示CRISPR 分類面貌,科學(xué)界設(shè)計(jì)了一種特殊的分類方法,該方法多方面考慮了CRISPR 系統(tǒng)的亞型Cas 基因特征、多個(gè)同源Cas 蛋白之間的序列相似度、最保守的Cas1 蛋白的系統(tǒng)發(fā)育、CRISPR/Cas 基因座中基因的結(jié)構(gòu)以及CRISPR 序列自身的結(jié)構(gòu)[9-10]。這些標(biāo)準(zhǔn)的綜合應(yīng)用使得CRISPR 系統(tǒng)被劃分為2 個(gè)不同的大類別,進(jìn)一步細(xì)分為6 種類型和48 個(gè)亞型[11]。第一大類別約占已鑒定的CRISPR 系統(tǒng)約90%,最常見(jiàn)于細(xì)菌和古細(xì)菌,包括類型Ⅰ、Ⅲ、Ⅳ,共22 個(gè)亞型。這3 個(gè)類型的共同特點(diǎn)是具有異聚體多蛋白效應(yīng)復(fù)合物。第二大類別約占已鑒定CRISPR 系統(tǒng)約10%,幾乎只存在于細(xì)菌中,以具有單個(gè)多結(jié)構(gòu)域效應(yīng)蛋白為特征,包括類型Ⅱ、Ⅴ、Ⅵ,共26 個(gè)亞型[12]。
由于第2 大類別效應(yīng)器復(fù)合體具有相對(duì)更簡(jiǎn)單的結(jié)構(gòu),使得其能夠被開(kāi)發(fā)成核酸檢測(cè)技術(shù)[13]。應(yīng)用最為廣泛的Ⅱ型系統(tǒng)即CRISPR/Cas9 系統(tǒng)被研究開(kāi)發(fā)成各種工具。Cas9 效應(yīng)蛋白具有HNH 和RuvC 兩種核酸酶結(jié)構(gòu)域,HNH 活性位點(diǎn)負(fù)責(zé)切割與CRISPR RNA(crRNA)結(jié)合的(+)鏈上,RuvC 活性位點(diǎn)則切割另一條鏈,造成靶序列發(fā)生雙鏈斷裂(double-strand break,DSB)[14-15]。CRISPR/Cas9 系統(tǒng)中存在一個(gè)額外的小非編碼RNA,稱為反式激活核糖核酸(trans-activating crRNA,tracrRNA),與crRNA 上的重復(fù)序列互補(bǔ),形成成熟的crRNA[16]。成熟的crRNA 指導(dǎo)Cas9 蛋白切割含有20 個(gè)互補(bǔ)核苷酸(nt)和相鄰PAM 的靶序列[17]。屬于Ⅴ型系統(tǒng)的Cas12 蛋白只包含一個(gè)RuvC 樣核酸酶結(jié)構(gòu)域,不存在tracrRNA,是由單個(gè)crRNA 引導(dǎo)的核酸內(nèi)切酶[18]。屬于Ⅵ型系統(tǒng)中的Cas13 蛋白具有兩個(gè)HEPN 結(jié)構(gòu)域[19],同樣也是利用crRNA 指導(dǎo)實(shí)現(xiàn)干擾靶向目標(biāo)序列,同時(shí)也具有靶識(shí)別效應(yīng)觸發(fā)的非特異性核糖核酸酶活性的特性[20]。以上這些生物學(xué)特性很好地被應(yīng)用到病毒核酸體外診斷技術(shù)上[21]。
CRISPR/Cas 免疫反應(yīng)包括適應(yīng)、表達(dá)和干擾3 個(gè)主要階段[22]。在適應(yīng)階段,Cas 蛋白復(fù)合物在識(shí)別出一個(gè)獨(dú)特的短基序(Protospacer-adjacent motif, PAM)后,與靶DNA 結(jié)合并切割出靶DNA 的一部分,即原間隔序列[22]。然后原間隔片段插入CRISPR 陣列中,使成為間隔序列的其中一員。適應(yīng)階段由Cas1 和Cas2 蛋白的復(fù)合物介導(dǎo),是已知的CRISPR-Cas 系統(tǒng)所共有的,有時(shí)還會(huì)涉及額外的Cas 蛋白,例如幾個(gè)亞型中的Cas4 核酸酶、Ⅱ-A 亞型中的Csn2 蛋白和許多Ⅲ型系統(tǒng)中的逆轉(zhuǎn)錄酶[23]。
在表達(dá)階段,CRISPR 陣列大多情況下被轉(zhuǎn)錄為單個(gè)轉(zhuǎn)錄物——pre-crRNA,然后pre-crRNA 再被加工成為成熟的crRNA,每個(gè)轉(zhuǎn)錄物都包含間隔序列和部分側(cè)翼重復(fù)序列[22]。在不同的CRISPR/Cas 衍生體中,pre-crRNA加工由Cas 蛋白復(fù)合物的不同亞基、單結(jié)構(gòu)域、多結(jié)構(gòu)域Cas 蛋白或非Cas 的宿主核糖核酸酶(RNases)介導(dǎo)。在第一大類CRISPR/Cas 系統(tǒng)中,根據(jù)類型和亞型有不同的組合,效應(yīng)模塊由多種Cas 蛋白組成,已知有Cas3、Cas5、Cas6、Cas7、Cas8、Cas10 和Cas11。相比之下,在第二大類CRISPR/Cas 系統(tǒng)中,通過(guò)單一的大蛋白質(zhì)Cas9、Cas12 或Cas13 中的功能結(jié)構(gòu)域發(fā)揮作用[23]。在干擾階段,成熟crRNA 識(shí)別噬菌體或質(zhì)粒入侵基因組中的原間隔區(qū),募集Cas 核酸酶或多種核酸酶切割外源基因而使其沉默[23-24]。
寨卡病毒是一種節(jié)肢動(dòng)物傳播的RNA 病毒,其引發(fā)的寨卡熱的臨床表現(xiàn)并無(wú)特異性,易誤診為其他傳染病,例如登革熱等蟲媒病毒引起的傳染病[25]。傳統(tǒng)診斷依賴于病毒分離或ZIKV 特異性RNA 的檢測(cè)。由于黃病毒屬成員之間的交叉反應(yīng)使血清學(xué)診斷變得復(fù)雜起來(lái),因此開(kāi)發(fā)一種更加快速高效、靈敏、重復(fù)性好的新型檢測(cè)方法很有必要[26]。2016 年Collins 團(tuán)隊(duì)開(kāi)發(fā)了一種用于檢測(cè)寨卡病毒的便攜式低成本診斷平臺(tái),靈敏度達(dá)到fM 水平[27]。Collins 團(tuán)隊(duì)利用生物分子傳感器和基于CRISPR/Cas9 的診斷平臺(tái),允許在實(shí)驗(yàn)室外快速、特異和低成本地檢測(cè)寨卡病毒。使用依賴核酸序列的擴(kuò)增技術(shù)將提取的病毒RNA 進(jìn)行擴(kuò)增,利用設(shè)計(jì)好的Cas9-sgRNA 復(fù)合體特異性結(jié)合病毒RNA 的原理,結(jié)合凍干紙基傳感器,寨卡病毒RNA 檢測(cè)便可通過(guò)紙基的顏色轉(zhuǎn)變判斷。2017 年Zhang 實(shí)驗(yàn)室將等溫?cái)U(kuò)增技術(shù)和CRISPR/Cas 系統(tǒng)相結(jié)合,建立了全新的核酸檢測(cè)技術(shù)——SHERLOCK(Specific High-sensitivity Enzymatic Reporter unLOCKing)[28]。該研究通過(guò)重組聚合酶擴(kuò)增(Recombinase Polymerase Amplification, RPA)技術(shù)進(jìn)行核酸預(yù)擴(kuò)增,再通過(guò)T7 RNA 聚合酶轉(zhuǎn)錄以得到大量RNA拷貝,而后用Cas13-靶特異性crRNA 復(fù)合體識(shí)別擴(kuò)增產(chǎn)物,激發(fā)Cas13 非特異性核酸內(nèi)切酶活性,連接淬滅基團(tuán)和熒光報(bào)告基團(tuán)的雙鏈DNA 被切割,從而產(chǎn)生熒光信號(hào)。一年后,該團(tuán)隊(duì)進(jìn)一步開(kāi)發(fā)了新版本SHERLOCKv2,相比第一代技術(shù)顯著降低了反應(yīng)體系引物濃度,并增加多種熒光信號(hào)同時(shí)可檢測(cè)多個(gè)靶序列,對(duì)于寨卡病毒檢測(cè)限低至2aM(2×10-18mol/L)[29]。同年該團(tuán)隊(duì)繼續(xù)推進(jìn)SHERLOCK 在病毒快速檢測(cè)領(lǐng)域的應(yīng)用,采取患者的尿液或唾液經(jīng)HUDSON(Heating Unextracted Diagnostic Samples to Obliterate Nucleases)處理,無(wú)需提取步驟即可在復(fù)雜現(xiàn)環(huán)境下部署快速檢測(cè),達(dá)到2 h 內(nèi)從患者樣本中直接進(jìn)行無(wú)儀器寨卡病毒檢測(cè)的目的,進(jìn)一步設(shè)計(jì)還可以區(qū)分區(qū)域特異性毒株[30]。
宮頸癌是由人乳頭瘤病毒(Human papilloma virus,HPV)感染所引起的一種可傳染性癌癥[31]。大部分人感染HPV 是無(wú)臨床癥狀的并且會(huì)被免疫系統(tǒng)所清除,但是感染高風(fēng)險(xiǎn)人乳頭瘤病毒(尤其是16 型)會(huì)導(dǎo)致宮頸癌、外陰癌和口咽癌等各種上皮癌癥。HPV 檢測(cè)對(duì)于低級(jí)別細(xì)胞學(xué)分診的二級(jí)預(yù)防和治療后治愈的檢測(cè)具有良好的臨床價(jià)值[32]。2018 年?yáng)|南大學(xué)王進(jìn)科團(tuán)隊(duì)開(kāi)發(fā)了一種基于Cas9 核酸酶檢測(cè)和分型的方法,被命名為CRISPR 分型PCR(CRISPR-typing PCR, ctPCR)[33]。該技術(shù)可以簡(jiǎn)單、快速、特異、靈敏地檢測(cè)和分型目標(biāo)基因。該技術(shù)主要步驟如下:使用一對(duì)通用引物對(duì)目標(biāo)DNA 進(jìn)行擴(kuò)增;Cas9/sgRNA 復(fù)合體特異性切割擴(kuò)增產(chǎn)物;切割產(chǎn)物加上A 加尾和T 接頭;而后通過(guò)一對(duì)通用特異性引物擴(kuò)增處理后的DNA;對(duì)處理后的產(chǎn)物進(jìn)行電泳,從而判斷是否感染人乳頭瘤病毒。在該方法中,進(jìn)行第一次PCR以確定檢測(cè)到的DNA 樣本是否包含目標(biāo)DNA,而執(zhí)行第二次PCR 則可以區(qū)分檢測(cè)到的DNA 樣本中存在哪些病毒亞型。該研究提供了一種新的基于CRISPR/Cas9 系統(tǒng)的DNA 檢測(cè)和分型方法。
不久后,王進(jìn)科團(tuán)隊(duì)又開(kāi)發(fā)了ctPCR2.0 版本,即Cas9/sgRNAs 相關(guān)反向PCR(Cas9/sgRNAs-associated reverse PCR, CARP)[34]。該技術(shù)主要步驟如下:靶DNA首先在含有兩種特異性sgRNA 的復(fù)合物中被Cas9 核酸酶切割。用T4 DNA 連接酶連接Cas9 切割的靶DNA,最后用PCR 擴(kuò)增。由于擴(kuò)增所選的是一對(duì)反向引物,方向相反導(dǎo)致無(wú)法擴(kuò)增靶DNA。然而,一旦靶基因被Cas9/sgRNA 復(fù)合體切割,連接后形成分子間相接的線性或分子內(nèi)環(huán)形DNA,反向引物就會(huì)變成正常引物,這樣靶基因就可以通過(guò)PCR 擴(kuò)增。為了進(jìn)一步簡(jiǎn)化流程,該團(tuán)隊(duì)很快又開(kāi)發(fā)了ctPCR3.0 版本,這項(xiàng)技術(shù)只需一個(gè)步驟就能檢測(cè)到目標(biāo)DNA:定量聚合酶鏈反應(yīng)(qPCR)擴(kuò)增Cas9/sgRNA 復(fù)合體切割的DNA 樣本。在整個(gè)檢測(cè)流程中無(wú)需打開(kāi)檢測(cè)管,就可以像傳統(tǒng)的qPCR 檢測(cè)一樣檢測(cè)目的基因。該技術(shù)同樣得到了人乳頭瘤病毒檢測(cè)分型實(shí)驗(yàn)充分驗(yàn)證[35]。2018 年,諾獎(jiǎng)得主Doudna JA 的實(shí)驗(yàn)室創(chuàng)立了一種DNA 核酸內(nèi)切酶靶向CRISPR 的反式報(bào)告方法(DNA Endonuclease Targeted CRISPR TransReporter,DETECTR)[36]。Cas12a 蛋白是RNA 引導(dǎo)的DNA 靶向酶。當(dāng)RNA 引導(dǎo)Cas12a 與DNA 結(jié)合時(shí),就會(huì)觸發(fā)Cas12a 切割單鏈DNA(ssDNA)活性,能夠完全降解線性和環(huán)狀ssDNA 分子。為了提高檢測(cè)靈敏度,進(jìn)一步結(jié)合了重組聚合酶擴(kuò)增(RPA)技術(shù)。通過(guò)熒光基團(tuán)-ssDNA-淬滅基團(tuán)復(fù)合物在反應(yīng)過(guò)程中釋放的熒光信號(hào)來(lái)達(dá)到檢測(cè)目的。在一小時(shí)內(nèi),DETECTR 準(zhǔn)確地識(shí)別了25 個(gè)患者樣本中是否存在HPV16 和HPV18,PCR 的強(qiáng)度和DETECTR 熒光信號(hào)之間具有良好的相關(guān)性,并且相比ctPCR 技術(shù)在時(shí)間上有了很大的提升。
2020 年,賓夕法尼亞州立大學(xué)Guan 團(tuán)隊(duì)開(kāi)發(fā)了一種利用CRISPR/Cas12a 輔助納米孔序列特異性地識(shí)別HIV-1 基因的技術(shù)[37]。固態(tài)納米孔傳感器由于其對(duì)單分子的高靈敏度和可重復(fù)使用性,在檢測(cè)單分子方面顯示出巨大的潛力。當(dāng)帶電荷的生物大分子(如DNA)被電場(chǎng)驅(qū)動(dòng)通過(guò)納米孔,這暫時(shí)妨礙了離子的通過(guò),導(dǎo)致電流下降。通過(guò)對(duì)電流的下降幅度、形狀、持續(xù)時(shí)間和速率的分析可以解析出分子的長(zhǎng)度、形狀、電荷。該技術(shù)使用玻璃納米孔可對(duì)單鏈環(huán)狀DNA 進(jìn)行準(zhǔn)確的定量,Cas12a 在crRNA 的引導(dǎo)之下特異性地結(jié)合目標(biāo)DNA,激發(fā)Cas12a 切割單鏈環(huán)狀DNA 的活性,線性和環(huán)狀的DNA分子通過(guò)玻璃納米孔時(shí)產(chǎn)生特異性的電流信號(hào),以此來(lái)檢測(cè)HIV。大多數(shù)CRISPR 介導(dǎo)的檢測(cè)技術(shù)使用熒光來(lái)產(chǎn)生信號(hào)。在此之前需要報(bào)告基團(tuán)的額外設(shè)計(jì)和合成,如熒光/猝滅劑報(bào)告復(fù)合物??傊搱F(tuán)隊(duì)將Cas12a 依賴靶DNA 激活的非特異性核酸內(nèi)切酶特性和玻璃納米孔傳感器的高靈敏度結(jié)合到一個(gè)電子傳感平臺(tái)上,用于序列特異性HIV-1 檢測(cè),為在檢測(cè)點(diǎn)開(kāi)發(fā)快速和低成本的核酸檢測(cè)提供了一種可靠的方法[37]。
CRISPR/Cas 系統(tǒng)由于具備特異性識(shí)別和切割核酸序列的能力,基于其開(kāi)發(fā)的核酸檢測(cè)技術(shù)具備高靈敏度、高特異性和簡(jiǎn)便快速等諸多優(yōu)點(diǎn),因而在病原微生物核酸體外診斷行業(yè)有著巨大的發(fā)展?jié)摿?。目前CRISPR/Cas體外診斷技術(shù)尚處于基礎(chǔ)研發(fā)階段,在廣泛用于臨床之前,還需要不斷改進(jìn)。隨著等溫?cái)U(kuò)增技術(shù)、SHERLOCK、DETECTR、SHINE 等技術(shù)不斷更新應(yīng)用,將極大推動(dòng)CRISPR/Cas 體外診斷技術(shù)在更廣闊的領(lǐng)域得到普及。