賴丹昀,胡傳圣,祁 環(huán),馬明亮,李 華,陶生策
1.上海交通大學系統(tǒng)生物醫(yī)學研究院,系統(tǒng)生物醫(yī)學教育部重點實驗室,上海200240;2.上海交通大學生物醫(yī)學工程學院,上海200240
血清作為重要的生物樣品,其組成和濃度含有豐富的信息,能反映個體的健康狀況,為醫(yī)學診斷提供依據[1]。血清蛋白質組學是血清研究的一個重要領域,即以血清為研究對象的蛋白質組學,已成為尋找生物標志物的有效手段。在血清的生物標志物領域,除了差異表達蛋白和修飾異常蛋白之外,差異自身抗體的發(fā)現也有重要價值[2]。自身抗體,是識別自身抗原的抗體總稱,已被用于自身免疫性疾病和腫瘤等疾病標志物研究[3-4]。從血清采集到檢測,不可避免地會出現長短不同的時間間隔,血清中各組分往往因為時間滯后、保存條件差異等而出現不可預知的變化,可能導致不同程度的實驗錯誤,嚴重時可能出現假陰性和假陽性結果[5]。所以有效的血清質控和質量評估是非常必要的。已有的研究中,以全血樣品為目標的有血細胞計數法[6],而以血漿/血清樣品為目標的方法則有基于質譜技術的全局性分析[7-8]。但目前還沒有有效的方法來判斷血清中抗體的整體質量。因此,我們希望建立一種高效的全局性評估策略,以評價血清樣品中抗體的質量,這對于血清樣品的實驗室保存、疾病隊列的建立等都有重要的意義。
噬菌體展示技術和高通量測序技術的聯合應用已經取得多項成果。噬菌體肽展示文庫(phage display peptide library)作為極為重要的資源之一,分為物種特異性肽文庫和隨機肽文庫。2010 年,首個人類蛋白質組噬菌體肽展示文庫構建成功,用于尋找疾病自身抗原[9]。隨后,利用物種特異性肽文庫的研究不斷涌現[10-11]。與物種特異性肽文庫相比,隨機肽文庫(如NEB 公司的Ph.D.-12)多樣性高達109數量級,與目標蛋白結合時,沒有物種特異性肽文庫的偏好性[12]。聯合Ph.D.-12 噬菌體隨機肽展示文庫和高通量測序技術,我們已成功地篩選了系統(tǒng)性紅斑狼瘡的肽生物標志物[13],建立了高效且高通量的抗體識別表位解析技術[14]。香農熵(Shannon entropy)經常被用于表示組成某群體的個體多樣性及豐度[15],在癌癥研究領域,熵可用于計算DNA 拷貝數畸變情況[16];熵還可用于與免疫系統(tǒng)相關數據分析,例如將熵值應用于建立抗體獨特型網絡[17]。基于隨機肽庫的多樣性和無偏性,我們用香農熵來表示樣品各自的肽結合模式,將復雜的個體情況轉換為數字形式,并對不同樣品進行質量評估,旨在初步建立一套能夠快速評價血清樣品中抗體整體質量的量化指標。
噬菌體隨機肽展示文庫Ph.D.-12、Q5 DNA 聚合酶(NEB,美國),無IgG 牛血清白蛋白(翊圣,中國),anti-6×His 抗體(Millipore,美國),Protein G 磁珠(Invitrogen,美國),膠回收純化試劑盒(諾唯贊,中國),96 孔聚苯乙烯板(百賽,中國)。Illumina 測序指定引物由生工生物工程(上海)股份有限公司合成。
1.2.1 血清樣品的制備 收集上海交通大學醫(yī)學院附屬仁濟醫(yī)院臨床體檢的50 例健康者血清(臨床健康體檢報告中各項檢測結果均在參考范圍內)。本研究得到了上海交通大學醫(yī)學院附屬仁濟醫(yī)院醫(yī)學倫理委員會的批準,所有參與者或監(jiān)護人已簽署知情同意書。每個樣品各取2 μL加入EP 管中混勻,作為標準樣品。將標準樣品分至20 個EP 管中,每個EP 管5 μL,將EP 管置于不同的溫度條件下:以-80 ℃為對照溫度;-20 ℃、4 ℃、37 ℃ 3 個溫度各設置3 個放置時間,分別為12、24、48 h;另設95 ℃孵育10 min 組。處理完畢后與噬菌體隨機肽展示文庫Ph.D.-12 進行反應。
1.2.2 血清結合噬菌體的分離 根據已發(fā)表的噬菌體文庫篩選相關報道[13],對其方法進行了簡單修改。取96 孔板,每孔用200 μL 3%無IgG 牛血清白蛋白封閉,放置于4 ℃環(huán)境中振蕩過夜(12 ~16 h)。封閉完畢后棄封閉液,用TBST 緩沖液200 μL/孔清洗1 遍。向96 孔板中加入TBST 緩沖液90 μL/孔,隨后將已經處理好的血清樣品依次加入96 孔板中,每孔加入1 μL 血清,每種樣品重復3 個復孔。在96 孔板上設置陽性對照(加入1 μL 的anti-6×His 抗體)和空白對照(不加入血清)。最后加入噬菌體隨機肽展示文庫10 μL/孔,將該體系置于4 ℃環(huán)境中振蕩過夜(12 ~16 h)。每孔加入10 μL 清洗過的Protein G 磁珠,4 ℃下振蕩4 h。使用TBST 緩沖液200 μL/孔清洗后將96 孔板置于磁力架,把磁珠以外的液體除盡,該步驟重復3 次,最后使用去離子水清洗1 次。向96 孔板中加入去離子水20 μL/孔重懸,即為Protein G 磁珠、IgG及其結合的噬菌體三者的復合物(圖1)。
圖1 噬菌體淘選流程圖Fig 1 Work flow of phage screening
1.2.3 高通量測序文庫構建 根據已發(fā)表的噬菌體文庫篩選相關報道[13],對其方法進行了簡單修改,具體流程:將上述得到的復合物,95 ℃加熱20 min 使噬菌體釋放出DNA,凍存于-20 ℃,待用。使用時通過96 孔磁力架固定磁珠,排槍吸取上清液作為第1 輪PCR 的模板。
用2 輪延伸PCR 法構建高通量測序文庫,用Q5 熱啟動DNA 聚合酶進行擴增。引物序列見表1。用于擴增的引物序列中,標記的序列代表由8 個核苷酸組成的編號序列,用于樣品的混合。第1 輪PCR 的總體系為25 μL,包括噬菌體DNA(擴增模板)、1×Q5 緩沖液、100 μmol/L dNTP( 脫氧核糖核苷三磷酸,deoxy-ribonucleoside triphosphate)、0.25 μmol/L 正 向 引 物(01-S502-23R 至12-S517-23R)、0.25 μmol/L 反向引物(01-N701-18 至11-N714-18)、Q5 聚合酶0.25 μL。PCR 反應條件:98 ℃預變性2 min;98 ℃變性10 s,55 ℃退火30 s,72 ℃延伸30 s,共25 個循環(huán);72 ℃延伸2 min。PCR 結束后配制2.5%瓊脂糖凝膠電泳驗證產物。按照試劑盒說明書從凝膠中回收產物。第2 輪PCR 的反應體系為25 μL,包括第1 輪PCR擴增后的膠回收產物1 μL 作為擴增模板,1×Q5 緩沖液、0.25 μmol/L Index-S518 正向引物、0.25 μmol/L Index-N718反 向 引 物、100 μmol/L dNTP、Q5 聚 合 酶0.25 μL。PCR反應條件:98 ℃預變性2 min;98 ℃變性10 s,55 ℃退火30 s,72 ℃延伸30 s,共10 個循環(huán);72 ℃延伸2 min。PCR 結束后配制2.5%瓊脂糖凝膠電泳驗證產物,并回收產物。在測量濃度后,將核酸產物等量混合在一起。合并的文庫在Illumina HiSeq5000 平臺上以2×150 配對末端作為測序模式進行測序。
表1 高通量測序相關引物序列Tab 1 Primers for next generation sequencing
Continued Tab
1.2.4 生物信息學分析 在噬菌體中插入的片段共103個堿基對,結構見圖2。根據高通量文庫構建過程中在核酸樣品兩端擴增引入的標簽(表1 中帶下劃線的序列)將所有讀出的多肽歸類至每個血清樣品中,核酸序列進一步被翻譯為氨基酸序列。將一個樣品中每條多肽的數量除以該血清樣品中所有多肽的數量之和,乘100 000 作為歸一化后的數值,減去空白對照組的數值,得到最終一個樣品中每條多肽的讀數,取讀數排名前10 000 的多肽進行后續(xù)分析。通過MEME 網站(http://meme-suite.org/tools/meme)對陽性對照組的4 個復孔anti-6×His 抗體的多肽序列進行基序分析,以檢測實驗的可靠性。每個溫度處理條件下樣品的閾值都設在0.01 以上,將符合該條件的多肽進行香農熵的計算,公式為H =-∑p (x) ×log[p (x) ],其中p (x)表示多肽x 的出現概率。
圖2 擴增產物二代測序結構圖Fig 2 Sequence structure of amplified product for next generation sequencing
為了檢測上述淘選實驗的可靠性,我們采取具有已知結合表位的抗體anti-6×His 抗體作為陽性對照,陽性對照進行了4 次重復,分散在96 孔板上的不同位置。淘選流程與血清樣品一致,經二代測序將富集的噬菌體中的核酸信息轉化為多肽信息后,通過在線Motif 模擬工具MEME 進行表位的發(fā)現[參數設置:-evt(篩選閾值)為0.001,-nepitopes(epitope 出現次數)為8,-minw(功能域長度最小值)為6,-maxw(功能域長度最大值)為10,其余參數為默認值]。結果顯示4 個陽性對照識別的表位均與6×His 匹配,說明本實驗操作流程是可靠的(圖3)。
為了驗證淘選實驗的可重復性,將-80 ℃條件下的2 個血清樣品(80S1 和80S2)和陽性對照組的2 個樣品(80H1 和80H2)每條多肽的讀數經歸一化處理后,進行Pearson 相關性分析。最終血清重復實驗和anti-6×His 抗體重復實驗的Pearson 相關系數r 分別為0.986 和0.976,說明淘選實驗的可重復性較好(圖4)。
圖4 在多肽水平對血清樣品及陽性對照的淘選實驗可重復性分析Fig 4 Reproducibility of biopanning of serum sample and positive control on peptide level
為了研究極端條件下血清的多樣性系數,并將此作為所有處理條件的極值,我們選擇能使蛋白質變性的條件——95 ℃下孵育10 min。血清樣品處理后呈淡黃色沉淀,幾乎無殘留液體。經過噬菌體淘選、二代測序、數據分析等過程,讀數大于0.01 的多肽數量相比-80 ℃保存的樣品明顯減少,香農熵從3.45 降至3.20,2 組樣品間差異有統(tǒng)計學意義(P=0.008)(圖5)。雖然95 ℃處理后的樣品抗體幾乎完全失活,但由于測序數據并不完全相同,減去空白對照后多肽仍有少量剩余,因而香農熵并非完全為零。
圖5 95 ℃處理后血清樣品中IgG 識別多肽的多樣性Fig 5 Diversity of peptides recognized by antibodies in serum treated at 95 ℃
為了探究血清樣品在不同溫度條件下香農熵是否發(fā)生變化以及這些變化是否能用香農熵進行表征,我們將樣品在-20 ℃、4 ℃、37 ℃下分別處理12、24、48 h,并通過噬菌體淘選、二代測序、數據分析等過程,分別將各時間段樣品計算得到的香農熵與-80 ℃條件下樣品的香農熵進行比較(-80 ℃在X 軸上標示為“0”)。
其中,-20℃下處理不同時間的血清樣品,其香農熵較-80℃未出現明顯變化。該結果表明,在凍存條件下,血清中抗體所識別的多肽的多樣性基本相同,抗體的結合能力保持穩(wěn)定。在4 ℃條件下處理的血清樣品在12 h 后,香農熵呈下降趨勢,處理48 h 后從3.45 降至3.39。該結果表明,在4 ℃時,抗體的多樣性在12 h 內已發(fā)生變化,抗體結合能力在12 h 內開始下降。同樣地,樣品在37 ℃下放置12 h 后,香農熵也呈現下降趨勢,并且其下降幅度比4 ℃更大;處理48 h 后,香農熵已降至3.32。該結果表明,在37 ℃時,抗體的多樣性在處理的12 h 內已發(fā)生明顯變化,抗體結合能力在處理的12 h 內開始較大程度地降低(圖6)。結合幾個溫度條件下的實驗結果可見,香農熵能夠表征血清抗體的結合能力。
圖6 不同溫度下血清樣品中IgG 識別多肽的多樣性變化趨勢Fig 6 Diversity trend of peptides recognized by antibodies in serum at different temperatures
優(yōu)質的臨床生物樣品是生物標志物發(fā)現、鑒定和確認的關鍵。血液樣品加工和處理方式的變化會影響蛋白質豐度和測定的可靠性[5]。對不同類型的血樣有不同的質量檢查方法,如全血樣品各組分的分析方法,主要包括全細胞計數、綜合代謝分析,其中代謝分析中對蛋白質和酶類的分析也僅限于已知蛋白質(如血紅蛋白、白蛋白、堿性磷酸酶等)[6]。血樣中蛋白相關生物標志物以蛋白質為主。蛋白質相關生物標志物主要有2 種:①基于豐度和修飾改變的蛋白質標志物。②基于抗體變化,尤其是自身抗體改變的生物標志物。對前者已有了相關的質控手段[1],但對后者則嚴重欠缺。
本文采用高效方便的噬菌體展示技術和高通量測序技術,將不同溫度下貯存的血清與噬菌體隨機肽展示文庫進行反應,通過免疫沉淀法捕捉噬菌體與IgG 的多肽復合物,在高溫條件下獲取噬菌體內的核酸后擴增進行二代測序,最后轉換成每個樣品中IgG 識別的多肽信息。經歸一化、減去空白對照后,保留出現頻率大于0.01 的多肽,以全面評價血清中抗體的結合能力。經多樣性分析,在-80 ℃與-20 ℃這2 種相似的凍存狀態(tài)處理12、24、48 h 后,多肽的多樣性沒有明顯變化,這與已有報道[18]的全血樣品蛋白質組的變化情況一致。但當溫度分別為4 ℃、37 ℃時,其多樣性在12 h 內呈下降趨勢,且并隨著時間變化逐漸接近極端條件。因此,我們認為香農熵有潛力成為評價血清中抗體質量的指標,以及將噬菌體展示技術與高通量測序技術結合起來用于評價血清質量具備可行性,而且整個血清樣品的狀態(tài)還可通過抗體水平的結合能力來評價。
同時,我們認為現行的評估體系可以得到進一步改進。第一個問題是樣品的設計,可以進行更長時間的處理,使多樣性的變化趨勢更加明顯以及處理時間達到多久時樣品的香農熵會達到極端值,這將指導后續(xù)實驗樣品的存儲和實驗隊列的建立。第二,數據分析應從更多方面進行。一方面,測序通量大小引起的多肽數目的多少,本次實驗選取的1 萬條多肽較文獻[15]報道的少,因此可以擴大測序通量選擇的范圍,以擴大香農熵的評估庫容量。另一方面,即空白對照的選取。95 ℃處理后,血清的真實狀態(tài)與空白對照比較接近,但由于二代測序后不同樣品的讀數并不完全相同,所以在減去空白對照后,95 ℃樣品的多肽讀數雖然接近于0,但仍可作為多樣性分析的輸入,香農熵也因此不是0。所以在數據分析中選擇閾值也值得進一步探討。由于血清中有多種IgG,結合的肽序列復雜,不能獲得顯著的motif,因此與單抗的質檢對比缺少了表位這一評估特征。盡管香農熵已被證明具有評價血清中抗體質量的潛力,但血清中含有的抗體比單抗復雜得多,在后續(xù)實驗改進時,可以擴大其范圍,增加其他的參數,從多個方面對血清的抗體質量進行綜合 評價。
綜上所述,我們首次將噬菌體展示技術和高通量測序技術聯合起來,利用香農熵對血清中抗體的質量進行表征,建立了一套通用性強,易于擴展,通量高,適用于全血清抗體質量控制的初步評價體系。
參·考·文·獻
[1] Geyer PE, Voytik E, Treit PV, et al. Plasma Proteome Profiling to detect and avoid sample-related biases in biomarker studies[J]. EMBO Mol Med, 2019, 11(11): e10427.
[2] Betteridge Z, McHugh N. Myositis-specific autoantibodies: an important tool to support diagnosis of myositis[J]. J Intern Med, 2016, 280(1): 8-23.
[3] McHugh NJ, Tansley SL. Autoantibodies in myositis[J]. Nat Rev Rheumatol, 2018, 14(5): 290-302.
[4] Yang B, Li XY, Ren TY, et al. Autoantibodies as diagnostic biomarkers for lung cancer: a systematic review[J]. Cell Death Discov, 2019, 5: 126.
[5] Hassis ME, Niles RK, Braten MN, et al. Evaluating the effects of preanalytical variables on the stability of the human plasma proteome[J]. Anal Biochem, 2015, 478: 14-22.
[6] Wu DW, Li YM, Wang F. How long can we store blood samples: a systematic review and meta-analysis[J]. EBioMedicine, 2017, 24: 277-285.
[7] Daniels JR, Cao ZJ, Maisha M, et al. Stability of the human plasma proteome to pre-analytical variability as assessed by an aptamer-based approach[J]. J Proteome Res, 2019, 18(10): 3661-3670.
[8] Zimmerman LJ, Li M, Yarbrough WG, et al. Global stability of plasma proteomes for mass spectrometry-based analyses[J]. Mol Cell Proteomics, 2012, 11(6): M111.014340.
[9] Larman HB, Zhao ZM, Laserson U, et al. Autoantigen discovery with a synthetic human peptidome[J]. Nat Biotechnol, 2011, 29(6): 535-541.
[10] Xu GJ, Kula T, Xu QK, et al. Viral immunology. Comprehensive serological profiling of human populations using a synthetic human virome[J]. Science, 2015, 348(6239): aaa0698.
[11] Larman HB, Laserson U, Querol L, et al. PhIP-Seq characterization of autoantibodies from patients with multiple sclerosis, type 1 diabetes and rheumatoid arthritis[J]. J Autoimmun, 2013, 43: 1-9.
[12] Paull ML, Daugherty PS. Mapping serum antibody repertoires using peptide libraries[J]. Curr Opin Chem Eng, 2018, 19: 21-26.
[13] Wu FL, Lai DY, Ding HH, et al. Identification of serum biomarkers for systemic lupus erythematosus using a library of phage displayed random peptides and deep sequencing[J]. Mol Cell Proteomics, 2019, 18(9): 1851- 1863.
[14] Qi H, Ma ML, Hu CS, et al.Antibody binding epitope Mapping (AbMap) of two hundred antibodies in a single run[J]. BioRxiv, 2019, 8: 739342.
[15] Wang L, Whittemore K, Johnston SA, et al. Entropy is a simple measure of the antibody profile and is an indicator of health status: a proof of concept[J]. Sci Rep, 2017, 7(1): 18060.
[16] Kebede D, Aklilu M, Sanders E. The HIV epidemic and the state of its surveillance in Ethiopia[J]. Ethiop Med J, 2000, 38(4): 283-302.
[17] Adjei AA, Kudzi W, Armah H, et al. Prevalence of antibodies to syphilis among blood donors in Accra, Ghana[J]. Jpn J Infect Dis, 2003, 56(4): 165-167.
[18] Rai AJ, Gelfand CA, Haywood BC, et al. HUPO Plasma Proteome Project specimen collection and handling: towards the standardization of parameters for plasma proteome samples[J]. Proteomics, 2005, 5(13): 3262-3277.