林長松,邵嬌芳,武 劍,汪強虎
(南京醫(yī)科大學(xué) 江蘇 南京 211166)
近些年興起的單細胞轉(zhuǎn)錄組測序技術(shù)已經(jīng)成為生物醫(yī)藥研究中的一把利劍,在研究腫瘤異質(zhì)性,發(fā)育等方面起著重要的作用,是生物信息學(xué)本科生教學(xué)中不可或缺的一塊內(nèi)容。然而單細胞轉(zhuǎn)錄組測序產(chǎn)生的數(shù)據(jù)量巨大,從下機數(shù)據(jù)處理到后續(xù)分析也是異常復(fù)雜,并且分析環(huán)境也多種多樣,極大地增加了教學(xué)難度,因此需要老師對整塊教學(xué)內(nèi)容進行有效編排。
單細胞轉(zhuǎn)錄組測序是一門新興學(xué)科,不單單是轉(zhuǎn)錄組測序的延續(xù),目前國內(nèi)很少學(xué)校開設(shè)該課程[1-3]。教學(xué)中面臨的兩大問題:①單細胞轉(zhuǎn)錄組分析環(huán)境復(fù)雜,涉及眾多R 包和python 軟件包,分析環(huán)境難以配置,學(xué)生需要耗費大量時間用以配置分析環(huán)境,是學(xué)習(xí)單細胞轉(zhuǎn)錄組過程中主要的障礙;②涉及眾多知識點,學(xué)生容易掌握單個知識點,但難以融會貫通,串成一根主線,分析完整的案例時顯得力不從心;如果老師繼續(xù)使用傳統(tǒng)的講授方式,學(xué)生無法產(chǎn)生學(xué)習(xí)興趣,對單細胞轉(zhuǎn)錄組測序內(nèi)容難以理解,并且學(xué)生不能理解單細胞轉(zhuǎn)錄組測序這門課設(shè)置的目的與意義,無法激發(fā)學(xué)好一門學(xué)科應(yīng)該有的積極性,因此恰當?shù)慕虒W(xué)方式就顯得尤為重要。于是,在此情形下,突破傳統(tǒng)的大課堂,導(dǎo)入其他教學(xué)模式是極為必要的。為了解決配置環(huán)境方面的問題,引入容器化技術(shù),基于singularity 構(gòu)建單細胞分析的R 環(huán)境容器文件以及shell 環(huán)境下的容器文件,徹底解決單細胞轉(zhuǎn)錄組分析環(huán)境的軟件配置難題。在教學(xué)方法上,采用問題導(dǎo)向式學(xué)習(xí)(problem-based learning,PBL)教學(xué)方法,將完整的案例穿插在單個知識點的教學(xué)中,引導(dǎo)學(xué)生運用單細胞轉(zhuǎn)錄組測序分析方法對科學(xué)問題進行探索[4]。
當前部署生物信息分析平臺常借助于容器化技術(shù):
①借助于conda 軟件安裝生物信息分析軟件,可以將單個的生物信息分析軟件安裝在獨立的虛擬環(huán)境中,也可以將多生物信息分析軟件安裝在一個conda環(huán)境,但conda軟件會安裝額外的環(huán)境所需軟件,環(huán)境臃腫,安裝時受網(wǎng)速影響很大,另外不便于跨平臺移植使用[5-6];②docker 是一種輕量級的虛擬化技術(shù),在生物信息學(xué)中使用廣泛[7]。docker 可為單一的生物信息學(xué)分析流程建立一個可移植的容器,并且在該容器內(nèi)可以放置分析代碼,配置文件,而當前在很多生信公司中使用成熟的代碼進行規(guī)范化分析時多使用docker 技術(shù)[8-9]。docker hub 網(wǎng)站中也有單細胞分析所需的docker鏡像,但在教學(xué)中,有一致命性缺陷,即運行時需要服務(wù)器的root 權(quán)限,增加了服務(wù)器的不安全性,而且不好修改,不便于實際中使用;③近些年隨著超算興起的singularity 軟件,和docker 軟件的功能很類似,卻不需要root 權(quán)限,在生信領(lǐng)域具有很廣闊的使用前景。相較于docker,singularity 有獨特的優(yōu)勢:容易對分析環(huán)境進行打包遷徙,和現(xiàn)有系統(tǒng)無縫整合,無須運行daemon 進程,支持多種鏡像和容器文件格式,易于和現(xiàn)有的超算系統(tǒng)整合,國內(nèi)多個超算平臺已部署singularity 軟件,并且可以使用singularity pull 命令獲取docker 資源。另外,在教學(xué)中融入構(gòu)建singularity 容器的內(nèi)容,使學(xué)生從底層掌握容器構(gòu)建過程,提高他們的科研技能。
穩(wěn)定的生物信息學(xué)分析軟件環(huán)境不僅是教學(xué)的需要,同樣也是科研之必需。在教學(xué)中采用的策略是:linux 基礎(chǔ)一般的學(xué)生掌握容器化軟件的使用,了解容器化軟件的構(gòu)建流程,而學(xué)有余力的學(xué)生可以掌握容器化軟件的構(gòu)建過程,圖1 所示搭建單細胞轉(zhuǎn)錄組測序分析軟件,具體構(gòu)建過程如下:①下載純凈版的Ubuntu(版本18.0.6),構(gòu)建沙盒,設(shè)置沙盒的讀寫屬性,安裝常見的庫文件,將linux shell環(huán)境中使用的軟件Sratools(sra 文件下載及轉(zhuǎn)換),Samtools(sam/bam 文件操作),Cellranger(單細胞測序文件比對),cellphonedb(python 環(huán)境下的細胞通訊分析軟件),velocyto(python 環(huán)境下的RNA 速率分析軟件),pySCENIC(python 環(huán)境下的單細胞轉(zhuǎn)錄調(diào)控軟件)軟件安裝在純凈的Ubuntu 操作系統(tǒng)中,打包封裝成是以sif 結(jié)尾的singularity 容器文件。②R 包分析環(huán)境的構(gòu)建:在純凈的ubuntu環(huán)境中裝R 所需的庫文件,然后裝R-base 軟件(版本4.0.6),接著將單細胞分析的R 包都安裝在該環(huán)境下,安裝過程中需要安裝眾多依賴的庫文件,安裝完成后封裝成是以sif 結(jié)尾的singularity 文件。該R 包分析環(huán)境主要涉及以下R 包軟件:數(shù)據(jù)讀入整合R 包(Seurat,harmony);雙細胞鑒別R 包(DoubletFinder);細胞亞群識別(scMCA,scHCL,singleR);細胞通訊(iTALK,Nichenet,CellChat);CNV的推斷(inferCNV,copyKAT);軌跡分化(velocyto.R,Monocle2,Monocle3);轉(zhuǎn)錄調(diào)控(SCENIC);功能化分析(clusterprofiler,org.Hs.eg.db,GSVA),以上R 包能夠滿足本科生單細胞轉(zhuǎn)錄組測序課程的教學(xué)。
圖1 單細胞轉(zhuǎn)錄組測序分析環(huán)境的容器化軟件
從教育心理學(xué)的定義來看,問題本身可分為結(jié)構(gòu)良好問題和結(jié)構(gòu)不良問題。單細胞轉(zhuǎn)錄組教學(xué)中的案例教學(xué)內(nèi)容問題就屬于后者,適用于PBL 中的案例教學(xué),其被解決的過程和可能的答案常常不具有規(guī)律性和穩(wěn)定性,即新的問題不能按部就班照著舊的問題的解決方法去處理,因此這種教學(xué)方式不是枯燥且一成不變地學(xué),而是基于真實情景的問題,以解決問題為起點,從問題出發(fā)延伸,從而對知識進行探索、掌握中心分析與理解運用,是一種“高水平學(xué)習(xí)”[10]。單細胞轉(zhuǎn)錄組測序技術(shù)分析這門課要求學(xué)生理清并掌握概念間的各式復(fù)雜聯(lián)系,學(xué)以致用,且因事制宜,運用到具體的科學(xué)問題(肺腺癌的異質(zhì)性)中去。而逐漸掌握的過程也是從案例問題中學(xué)習(xí)的過程;運用的過程則對應(yīng)著加強理解的過程,并能檢驗掌握程度。正如實踐是認識的唯一來源,也是目的和歸宿。因此,問題的發(fā)現(xiàn)者即學(xué)生,是PBL 教學(xué)的主體與核心[11]。因此,PBL 教學(xué)對于生物信息學(xué)專業(yè)本科學(xué)生將來的學(xué)習(xí)和工作的能力塑造至關(guān)重要。
傳統(tǒng)的教學(xué)方法更傾向于授人以“魚”,雖一直提倡學(xué)習(xí)是學(xué)生自己的事,但在現(xiàn)當代的填鴨式教育模式下,老師在教學(xué)中處于主體地位,通常是學(xué)生學(xué)了什么取決于老師教了什么,PBL 教學(xué)法則傾向于授人以“漁”,其差別便在于將從教為中心翻轉(zhuǎn)為了以學(xué)生自主學(xué)為中心[12]。本課程中老師的作用相當于其中的“根節(jié)點”,給學(xué)生提供一個綜合的框架或者一個問題,學(xué)生根據(jù)老師提供的框架和問題,通過自身對資料的查閱來解決問題,其過程本身則更傾向于對問題的探尋,而不是拘泥于那“正確”的答案。由此不難看出,學(xué)生在這種學(xué)習(xí)模式當中占據(jù)了主體地位,問題導(dǎo)向式學(xué)習(xí)的過程也極大地增加了學(xué)生學(xué)習(xí)的自主性和去盲從性,脫離了無意義的“死記硬背”,激發(fā)學(xué)生的求知欲,活躍其思維,迸發(fā)出更多的“頭腦風暴”。
傳統(tǒng)的教學(xué)模式中,教師是“灌輸式教育”的主導(dǎo)者,而在PBL 教育模式當中,教師是學(xué)生獲得知識的教練,即“教”學(xué)生如何自主達到“練”的目的。教師和學(xué)生之間構(gòu)成了一種新型的關(guān)系,從只教與學(xué)轉(zhuǎn)變?yōu)閰f(xié)作關(guān)系。所謂“協(xié)作”,即教師與學(xué)生的關(guān)系是平等的,其通過共同的合作達到所設(shè)定的目標。傳統(tǒng)教學(xué)當中,教師的身份大多數(shù)“替代”了學(xué)生一職,鼓勵學(xué)生提出問題無錯之有,不恰當?shù)氖枪膭顚W(xué)生提出問題之后,并未鼓勵其自己解決,教師反倒成了“學(xué)生”,鉆研出成果之后直接告訴學(xué)生,學(xué)生只知其結(jié)果而不知探求的過程之樂[13]。單細胞轉(zhuǎn)錄組測序課程中教師應(yīng)當發(fā)揮“教”的長處,滲透了“一葉黃而知天下秋”的教育理念,給學(xué)生提供一“點”供其發(fā)展為一“面”,并在學(xué)生毫無頭緒或與所達目的有所偏差的情況下參與討論,提點其一二,充當學(xué)生獲得知識的教練和指導(dǎo)者的同時,給學(xué)生最大的發(fā)揮空間。至此,一貫盛行的教師應(yīng)當講滿課程、充分利用好一節(jié)課的每一分鐘的觀點則不攻自破,一幅好的畫須“留白”,教學(xué)亦如此,在本課程中教師的身份很好地詮釋了“留白”的作用,留白才可供學(xué)生發(fā)揮。誠然,新的教育模式也需要教師具備更高水平的、多學(xué)科的專業(yè)知識、專業(yè)技能,才能有足夠的能力給予學(xué)生幫助,所謂教學(xué)相長,應(yīng)是如此。
采用理論課和實驗課相結(jié)合的方式介紹單細胞轉(zhuǎn)錄組測序的基本知識,讓學(xué)生從宏觀角度對單細胞轉(zhuǎn)錄組測序技術(shù)有初步的認識,以及每個細小問題的分析方法。主要涉及數(shù)據(jù)讀入,整合、雙細胞鑒別;細胞亞群識別;細胞通訊;CNV 的推斷;軌跡分化;轉(zhuǎn)錄調(diào)控;功能化分析。
完整的案例是以O(shè)ncogene 雜志中Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma 這一文章為基礎(chǔ),提出的問題為:如何用單細胞轉(zhuǎn)錄組測序技術(shù)探索肺腺癌的異質(zhì)性。圍繞這一主要問題衍生出子問題:①腫瘤的異質(zhì)性是什么,如何用分析結(jié)果展示;②多樣本數(shù)據(jù)怎么整合;③如何注釋肺腺癌微環(huán)境中多種細胞;④肺腺癌微環(huán)境中多種細胞的細胞間通訊如何;⑤如何鑒定肺腺癌腫瘤細胞;⑥細胞內(nèi)的調(diào)控網(wǎng)絡(luò)中核心的轉(zhuǎn)錄因子是哪些?⑦肺腺癌微環(huán)境中多種細胞的分化軌跡是什么。立足于原文,但又不限于原文,根據(jù)這些子問題對原始數(shù)據(jù)進行重新分析。
我們將學(xué)生分成不同小組,由小組長牽頭,討論以上的子問題,確定分析思路,并將上課時學(xué)到的零碎知識點串聯(lián)起來,組織代碼,加以分析。在實際運行中遇到的困難在小組群中加以討論。
對于實際分析過程中遇到的學(xué)生迷惑的知識點采用集中討論的方式,其中重點突出的問題有“如何鑒定肺腺癌腫瘤細胞”及“分析軌跡分化的多個軟件比較”。通過集中討論的方法有效地解決了學(xué)生的困惑,第一個問題是“如何鑒定肺腺癌腫瘤細胞”,經(jīng)過討論給出的解決方案:鑒定腫瘤細胞類型的方法是借助inferCNV 和標記基因兩種方法。第二個問題是“分析軌跡分化的多個軟件比較”,經(jīng)過大家討論給出的解決方案:Monocle2,SlingShot 及PAGA等軟件結(jié)果需同RNA 速率軟件結(jié)果結(jié)合,軟件的選擇取決于數(shù)據(jù)及真實的生物學(xué)意義。
以小組為單位展示本小組的分析結(jié)果,采用PPT 展示和小論文形式,PPT 展示分析的過程及思路,論文中展示詳細的代碼及處理過程。熟悉該領(lǐng)域的3 位老師對每一小組的匯報結(jié)果進行打分,取平均分,該部分占總成績的40%。
單細胞轉(zhuǎn)錄組測序技術(shù)課程中使用基于容器化技術(shù)部署生物信息學(xué)軟件和問題導(dǎo)向式學(xué)習(xí)在單細胞轉(zhuǎn)錄組測序課程教學(xué)中的應(yīng)用案例,從基礎(chǔ)、理論、實踐三方面的學(xué)習(xí),提高實際科學(xué)問題中的數(shù)據(jù)分析能力,激發(fā)了學(xué)生的學(xué)習(xí)潛能,為他們的數(shù)據(jù)分析及科研奠定良好的基礎(chǔ)。