向 恒 張瑞芝 潘國慶 周澤揚(yáng)*
(1.西南大學(xué)蠶學(xué)與系統(tǒng)生物學(xué)研究所;2.西南大學(xué)動(dòng)物科技學(xué)院;3.西南大學(xué)生物技術(shù)中心,重慶 北碚 400715)
當(dāng)今,高通量技術(shù)的應(yīng)用對(duì)于生物分子定量和定性的研究來說具有重要意義,也表明生命科學(xué)正在從一種以描述性為主的學(xué)科發(fā)展到以信息為主的學(xué)科。因此,生物學(xué)家就需要提高數(shù)學(xué)、計(jì)算機(jī)和統(tǒng)計(jì)分析等方面的技能,而提高學(xué)生在生命科學(xué)中信息分析能力的需要也是迫切的。然而,由于計(jì)算機(jī)硬件、軟件條件或者教師知識(shí)程度等多個(gè)方面的原因,基因組與生物信息學(xué)的教育水平卻遠(yuǎn)落后于生物化學(xué)和分子生物學(xué),表現(xiàn)出了諸如序列分析等多個(gè)方面技能上的不足。正是由于存在這些限制,基因組與生物信息學(xué)課程經(jīng)常被限制在研究生階段,而未引入本科生的學(xué)習(xí)范疇。隨著當(dāng)前基因組和蛋白質(zhì)組數(shù)據(jù)的爆炸性增長,本科生關(guān)于基因組與生物信息學(xué)的學(xué)習(xí)需要就如過去學(xué)習(xí)色譜層析和電泳技術(shù)的需要一樣,同等重要。早在2003年,西南大學(xué)家蠶研究團(tuán)隊(duì)就完成了家蠶基因組的框架圖譜,在此基礎(chǔ)上,2008年又公布了精細(xì)圖譜,序列覆蓋度高達(dá)8.48倍,精確鑒定了14.6萬個(gè)以上的基因?;谶@些基因組數(shù)據(jù),開展蠶學(xué)專業(yè)學(xué)生的基因組與生物信息學(xué)教學(xué)具有明顯的平臺(tái)優(yōu)勢(shì)。
近幾年,一些基于網(wǎng)絡(luò)的易操作程序,諸如Biology Workbench(http://workbench.sdsc.edu/)和 Protein Explorer (http://www.umass.edu/microbio/chime/pe_beta/pe/protexpl/),已經(jīng)大大降低了基因組與生物信息學(xué)的教學(xué)難度,可以運(yùn)用于該門課程中。這些程序大多都是免費(fèi)的,學(xué)生只要有能上網(wǎng)的電腦就可以訪問它們。這使得老師可以布置作業(yè),讓學(xué)生訪問基因組數(shù)據(jù)并進(jìn)行分析,進(jìn)而掌握這些程序及其生物信息分析思路。Biology Workbench是一款新穎的軟件,學(xué)生可以通過它的服務(wù)器存儲(chǔ)序列數(shù)據(jù)。這一應(yīng)用也相當(dāng)有用,因?yàn)閹熒鷤兛梢圆槐赜靡苿?dòng)磁盤攜帶著數(shù)據(jù)來進(jìn)行教學(xué)。而Protein Explorer是一種免費(fèi)的瀏覽器插件,與常用的RasMol軟件相似,能顯示出蛋白質(zhì)和核酸等大分子的三維結(jié)構(gòu)。而且,與RasMol輸入命令的方式不同,Protein Explorer采用菜單的形式,使得學(xué)生可以不用去死記那些命令,就能容易的進(jìn)行三維結(jié)構(gòu)分析。最終,學(xué)生可以利用Protein Explorer軟件對(duì)比已知晶體結(jié)構(gòu)的大分子序列,分析未知分子的結(jié)構(gòu)。
運(yùn)用上述軟件,我們可以設(shè)計(jì)兩套課程方案來傳授蠶學(xué)專業(yè)學(xué)生掌握家蠶基因組數(shù)據(jù)及其信息分析的方法。第一套方案是將基因組與生物信息學(xué)和目前學(xué)生正在開設(shè)的分子生物學(xué)課程進(jìn)行整合。在此前提下,學(xué)生將基因組與生物信息學(xué)認(rèn)作為一種分析生命科學(xué)問題的應(yīng)用性學(xué)科。該學(xué)科是開放式的、探究式的,允許學(xué)生從中學(xué)會(huì)如何去分析一些基因或蛋白質(zhì)所包含的具體生物學(xué)信息。總之,相對(duì)于開展生物學(xué)實(shí)驗(yàn)而言,學(xué)習(xí)基因組與生物信息學(xué)可以更容易的讓學(xué)生知道怎樣去發(fā)現(xiàn)生命科學(xué)問題,以及如何著手解答這些問題。這樣就給予了學(xué)生自主學(xué)習(xí),以及利用計(jì)算機(jī)輔助生命科學(xué)實(shí)驗(yàn)開展研究的機(jī)會(huì),提高了他們的科學(xué)研究素養(yǎng)。
例如,利用昆蟲桿狀病毒表達(dá)系統(tǒng)對(duì)家蠶熱激蛋白基因(heat shock protein,HSP)進(jìn)行亞克隆及cDNA表達(dá)的常規(guī)實(shí)驗(yàn)課程,老師能夠?qū)ζ溥M(jìn)行優(yōu)化。首先,可以教會(huì)學(xué)生怎樣從家蠶基因組數(shù)據(jù)中提取出該基因的DNA序列,并告訴他們?nèi)绾卫密浖M(jìn)行翻譯,從而得到蛋白質(zhì)序列。再將該序列輸入Biology Workbench中,并利用BLAST軟件檢索它的同源序列以進(jìn)行后續(xù)分析。接下來,學(xué)生可以通過分析開放閱讀框(open reading frame,ORF)得到該基因的cDNA序列及其編碼的蛋白質(zhì)序列。最后,學(xué)生還可以利用軟件分析該cDNA的限制性酶切位點(diǎn),從而更好的設(shè)計(jì)出亞克隆策略。所有這些生物信息分析的內(nèi)容與實(shí)驗(yàn)課程有機(jī)的結(jié)合在了一起,而在學(xué)期期末還可以讓學(xué)生提供除實(shí)驗(yàn)報(bào)告外的另一份信息分析報(bào)告。這樣的話,學(xué)生不僅獲得了實(shí)驗(yàn)操作的動(dòng)手能力,還學(xué)會(huì)了生物信息的分析能力,以及將基因組與生物信息學(xué)用于實(shí)驗(yàn)中,指導(dǎo)實(shí)驗(yàn)、輔助實(shí)驗(yàn),進(jìn)行真正的生物學(xué)研究的能力。比如,當(dāng)學(xué)生在挖膠抽提用于亞克隆的cDNA時(shí),就可以基于基因的預(yù)測信息知道哪條帶是自己需要的。同樣的,當(dāng)他們通過聚丙烯酰胺凝膠電泳(SDS-PAGE)比較表達(dá)的重組蛋白的時(shí)候,通過生物信息預(yù)測的蛋白質(zhì)大小就能派上用場。當(dāng)然,如果表達(dá)蛋白的分子量比預(yù)測的大,就認(rèn)為該蛋白很可能發(fā)生了糖基化作用,導(dǎo)致其分子量變大,更多的研究內(nèi)容隨之也被引出。因此,將基因組與生物信息學(xué)傳授給學(xué)生,不僅可以鼓勵(lì)他們拓寬挖深自己的實(shí)驗(yàn)結(jié)果,讓他們認(rèn)識(shí)到生物學(xué)的問題不是那么容易就能解決的,書本上的知識(shí)是多么的淺顯,還可以激發(fā)他們對(duì)生物學(xué)的興趣,以及采用更多更新的手段分析生命科學(xué)問題的能力。
第二套方案是針對(duì)學(xué)生單獨(dú)開設(shè)與家蠶基因組數(shù)據(jù)相關(guān)的基因組與生物信息學(xué)課程。該套方案僅需要一間配備有多臺(tái)計(jì)算機(jī)及其局域網(wǎng)的教室,而該條件在西南大學(xué)已經(jīng)得到滿足。而且,除了進(jìn)行上機(jī)實(shí)行直接操作外,還應(yīng)該具備相應(yīng)的理論課程。在理論課中,老師可以傳授學(xué)生家蠶基因組數(shù)據(jù)所包含的內(nèi)容、生物信息學(xué)常用軟件及其模型算法的理論背景知識(shí)、以及如何運(yùn)用這些軟件分析數(shù)據(jù)的方法思路。而在實(shí)驗(yàn)課中,學(xué)生可以利用這些軟件進(jìn)行常規(guī)的DNA、RNA和蛋白質(zhì)分析。大致設(shè)計(jì)為以下四個(gè)單元:1)基因組,2)蛋白質(zhì)結(jié)構(gòu),3)數(shù)據(jù)庫和多重序列對(duì)齊,4)小亞基核糖體RNA和系統(tǒng)進(jìn)化分析。每個(gè)單元開展至少10學(xué)時(shí)(7學(xué)時(shí)理論,3學(xué)時(shí)實(shí)驗(yàn)),以使得學(xué)生能掌握基因組與生物信息學(xué)的理論知識(shí),以及能通過分析一個(gè)基因或者蛋白質(zhì)數(shù)據(jù)來充分理解這些知識(shí),這樣在今后的研究過程中,他們就可以學(xué)以致用了。
比如,在蛋白質(zhì)結(jié)構(gòu)單元,老師可以提供家蠶銅鋅超氧化物歧化酶(Cu/Zn superoxide dismutase)的蛋白質(zhì)序列給學(xué)生,并告訴他們這是他們?cè)诨蚪M單元分析檢索到的基因所翻譯的。然后,學(xué)生可以利用Biology Workbench中的程序預(yù)測出該蛋白質(zhì)的功能基序、α螺旋、β折疊和跨膜結(jié)構(gòu)域等內(nèi)容。也可以利用Protein Explorer軟件分析它的三維結(jié)構(gòu),并對(duì)預(yù)測準(zhǔn)確性進(jìn)行測試。其次,學(xué)生可以運(yùn)用Biology Workbench對(duì)該蛋白質(zhì)及其其他物種中的同源序列進(jìn)行多重序列對(duì)齊,并使用Protein Explorer基于三維結(jié)構(gòu)來分析它們的多重序列重疊位點(diǎn)。這就讓學(xué)生理解了蛋白質(zhì)活性位點(diǎn)的氨基酸殘基保守性。最后,學(xué)生還可以利用多重序列對(duì)齊的結(jié)果,構(gòu)建系統(tǒng)進(jìn)化樹,對(duì)銅鋅超氧化物歧化酶基因在不同物種中的進(jìn)化歷程進(jìn)行探討。從而,將四個(gè)單元的知識(shí)都串了起來,讓學(xué)生可以更好的綜合掌握住基因組與生物信息學(xué)的理論知識(shí)和操作方法。當(dāng)然,也反過來促使學(xué)生更好的理解了分子生物學(xué)中關(guān)于基因和蛋白質(zhì)的結(jié)構(gòu)以及進(jìn)化的基本概念。
目前,基因組與生物信息學(xué)已經(jīng)成為了一套完整的學(xué)科,并在生命科學(xué)研究的多個(gè)方面都有所運(yùn)用。無論是將它與現(xiàn)有其他課程進(jìn)行整合,或者將其作為單獨(dú)的一門課程,都應(yīng)當(dāng)讓學(xué)生弄清掌握生物信息工具來解決生命科學(xué)問題是必要的也是必須的。幸運(yùn)的是,在國外,基因組與生物信息學(xué)已經(jīng)融入到了本科生的課程中,并取得了良好的效果。而通過西南大學(xué)蠶學(xué)專業(yè)的試點(diǎn)工作,我們相信國內(nèi)的高等院校最終也會(huì)發(fā)展到這條路上來。
[1]Ditty J L,et al.Incorporating genomics and bioinformatics across the life sciences curriculum[J].PLoS biology,2010,8(8):e1000448.
[2]Cooper S.Integrating bioinformatics into undergraduate courses[J].Biochemistry and Molecular Biology Education,2001,29(4):167-168.
[3]張春霆.生物信息學(xué)的現(xiàn)狀與展望[J].世界科技研究與發(fā)展,2000,22(6):17-20.