国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

云環(huán)境下“生物信息學(xué)”實(shí)驗(yàn)教學(xué)課程改革探索與實(shí)踐

2020-07-16 18:19陳前軍劉杰胡昀
教育教學(xué)論壇 2020年23期
關(guān)鍵詞:云環(huán)境生物信息學(xué)虛擬化

陳前軍 劉杰 胡昀

[摘 要] 該文基于某省部共建的大學(xué)本科生物信息學(xué)的實(shí)驗(yàn)教學(xué)建設(shè)與改革實(shí)踐,從實(shí)驗(yàn)教學(xué)內(nèi)容設(shè)計(jì)、實(shí)驗(yàn)教學(xué)平臺(tái)搭建、教學(xué)模式改革等方面進(jìn)行了研究與探索,并就一些難點(diǎn)問(wèn)題提出思考和解決方案,以期為相關(guān)類似專業(yè)課程的實(shí)驗(yàn)教學(xué)平臺(tái)建設(shè)提供參考。

[關(guān)鍵詞] 云環(huán)境;實(shí)驗(yàn)教學(xué);教學(xué)改革;生物信息學(xué);虛擬化

[基金項(xiàng)目] 云環(huán)境下高校計(jì)算機(jī)虛擬實(shí)驗(yàn)的建設(shè)與實(shí)踐省級(jí)教學(xué)改革項(xiàng)目

[作者簡(jiǎn)介] 陳前軍(1980—),男,博士,湖北大學(xué)生命科學(xué)學(xué)院/生物催化與酶工程國(guó)家重點(diǎn)實(shí)驗(yàn)室高級(jí)實(shí)驗(yàn)師,主要從事生物信息學(xué)研

究;劉 杰(1981—),男,博士,湖北大學(xué)生命科學(xué)學(xué)院/生物催化與酶工程國(guó)家重點(diǎn)實(shí)驗(yàn)室教授,博士生導(dǎo)師,主要從事蜘蛛分類學(xué)研究;胡 昀(1983—),女,博士,湖北大學(xué)生命科學(xué)學(xué)院/生物催化與酶工程國(guó)家重點(diǎn)實(shí)驗(yàn)室實(shí)驗(yàn)師,主要從事實(shí)驗(yàn)管理研究。

[中圖分類號(hào)] G647? ? [文獻(xiàn)標(biāo)識(shí)碼] A? ? [文章編號(hào)] 1674-9324(2020)23-0005-03? ? [收稿日期] 2019-12-24

生物信息學(xué)作為一門信息科學(xué),是研究生物信息的采集、處理、存儲(chǔ)、傳播、分析和解釋等各方面的學(xué)科。該學(xué)科集生物科學(xué)、計(jì)算機(jī)科學(xué)和數(shù)學(xué)之大成,是當(dāng)下最為火熱專業(yè)之一,也注定是未來(lái)熱門、高產(chǎn)出的學(xué)科之一,是一個(gè)交叉性極強(qiáng)的學(xué)科。然而,生物信息學(xué)所需處理的數(shù)據(jù)具備明顯的大數(shù)據(jù)特征,其對(duì)數(shù)據(jù)存儲(chǔ)容量、計(jì)算能力和實(shí)驗(yàn)環(huán)境要求極高,這給大學(xué)生物信息學(xué)實(shí)驗(yàn)教學(xué)帶來(lái)了諸多挑戰(zhàn)。本文以生物信息學(xué)實(shí)驗(yàn)教學(xué)在云環(huán)境下實(shí)驗(yàn)教學(xué)內(nèi)容設(shè)計(jì)和平臺(tái)建設(shè)等相關(guān)問(wèn)題為主題進(jìn)行探索與研究[1-2]。

一、生物信息學(xué)實(shí)驗(yàn)教學(xué)課程特點(diǎn)分析

生物信息學(xué)是建立在基因/蛋白質(zhì)(本文以基因?yàn)槔┬蛄形谋狙芯炕A(chǔ)上,綜合利用多種數(shù)據(jù)分析方法挖掘海量數(shù)據(jù)中暗藏的生物學(xué)問(wèn)題或規(guī)律的一門學(xué)科,歸納起來(lái)可將實(shí)驗(yàn)過(guò)程劃分為樣本文庫(kù)建立、上機(jī)測(cè)序和數(shù)據(jù)處理分析三個(gè)階段。形象描述為生物組織是原料、序列是半成品、算法是工具、“知識(shí)”是預(yù)測(cè)結(jié)論,從這個(gè)“生產(chǎn)線”可知,生物與計(jì)算機(jī)實(shí)驗(yàn)貫穿整個(gè)生產(chǎn)線全過(guò)程、全要素。

樣本文庫(kù)建立,通常可按①研究目標(biāo)組織的制樣,通過(guò)特異的探針庫(kù)提取目標(biāo)DNA或RNA,②純化目標(biāo)DNA或RNA,③采用EmPCR或橋式PCR擴(kuò)增之后建立待測(cè)文庫(kù)。樣本庫(kù)建立過(guò)程是傳統(tǒng)的生化過(guò)程,一般生物學(xué)實(shí)驗(yàn)室便可完成,但整個(gè)過(guò)程成本較高,如外顯子測(cè)序、RNA-Seq測(cè)序、ChIP-Seq測(cè)序都需要相應(yīng)的探針試劑來(lái)對(duì)細(xì)胞核中的DNA、RNA等目標(biāo)進(jìn)行篩選,這些試劑盒成本和操作的精準(zhǔn)性要求高、流程性強(qiáng),且有些理論不夠直觀、晦澀難以理解[3]。

上機(jī)測(cè)序目的是獲取DNA或RNA的序列數(shù)據(jù),測(cè)序儀器屬于高科技產(chǎn)品,目前市場(chǎng)價(jià)格比較昂貴。根據(jù)調(diào)研,國(guó)內(nèi)基本交由測(cè)序公司完成,如華大基因等科技公司,也就是說(shuō)國(guó)內(nèi)高?;静痪邆溥@樣的實(shí)驗(yàn)設(shè)備和條件。關(guān)于生物信息學(xué)中的測(cè)序技術(shù)只能講授理論部分,對(duì)學(xué)生來(lái)說(shuō)是一個(gè)“黑盒子”過(guò)程。上機(jī)測(cè)序最終產(chǎn)生大量的測(cè)序數(shù)據(jù),尤其NGS(Next Generation Sequencing),一次測(cè)序都能產(chǎn)生10GB、上百GB甚至達(dá)到TB級(jí)別的數(shù)據(jù),這對(duì)數(shù)據(jù)的存儲(chǔ)、計(jì)算帶來(lái)了不小的挑戰(zhàn),如Illumina的HighSeq2000一次測(cè)序便可產(chǎn)生200GB的有效數(shù)據(jù),其數(shù)據(jù)增長(zhǎng)明顯加速,其增長(zhǎng)規(guī)律已經(jīng)不符合摩爾定律。另外一方面上機(jī)測(cè)序產(chǎn)生的數(shù)據(jù)明顯符合大數(shù)據(jù)的4V特征,如何借助新的技術(shù)和新的思想處理這些新的問(wèn)題,成了比較現(xiàn)實(shí)的問(wèn)題[4-6]。

數(shù)據(jù)分析作為生物信息學(xué)非常重要的組成部分,在生物信息學(xué)整個(gè)生態(tài)中占據(jù)著非常重要的位置。根據(jù)目前調(diào)研看,生物信息學(xué)相關(guān)軟件不下1000個(gè),大部分運(yùn)行在Linux環(huán)境下,且對(duì)計(jì)算資源、內(nèi)存資源要求極高。對(duì)組裝40GB的序列數(shù)據(jù),建議內(nèi)存不小于64GB,如序列合并組裝步驟,大部分都采用命令行來(lái)操作,甚至有些工具和數(shù)據(jù)必須采用在線模式,實(shí)驗(yàn)過(guò)程需要訪問(wèn)國(guó)際互聯(lián)網(wǎng),也就是說(shuō)即便一些實(shí)驗(yàn)步驟都熟悉的情況下,如果網(wǎng)絡(luò)速度很慢或者國(guó)際互聯(lián)網(wǎng)不通,也能導(dǎo)致分析實(shí)驗(yàn)失敗。這使得學(xué)生在驗(yàn)證知識(shí)的正確性可能無(wú)法在實(shí)驗(yàn)教學(xué)過(guò)程中完成,而對(duì)于更高層次的知識(shí)靈活應(yīng)用和創(chuàng)新就顯得不具現(xiàn)實(shí)性[7]。因而需要采用新的模式建立實(shí)驗(yàn)平臺(tái),滿足日益增長(zhǎng)的本科生理論學(xué)習(xí)、實(shí)驗(yàn)教學(xué)要求。

二、變換思路構(gòu)建新一代實(shí)驗(yàn)室

(一)生物信息學(xué)實(shí)驗(yàn)平臺(tái)構(gòu)建的困境

根據(jù)生物信息學(xué)實(shí)驗(yàn)教學(xué)的目標(biāo),以及前文分析的學(xué)科特征,在現(xiàn)有的軟、硬件條件下,很難再按照傳統(tǒng)的模式來(lái)設(shè)計(jì)實(shí)驗(yàn)教學(xué)內(nèi)容、搭建實(shí)驗(yàn)教學(xué)平臺(tái)。

傳統(tǒng)實(shí)驗(yàn)平臺(tái)建設(shè),對(duì)于生物信息學(xué)實(shí)驗(yàn)室建設(shè)必定圍繞三個(gè)方面展開,即建立傳統(tǒng)的生物學(xué)實(shí)驗(yàn)室,以完成樣品的制備過(guò)程;建立測(cè)序平臺(tái),以完成上機(jī)測(cè)序動(dòng)作;構(gòu)建大規(guī)模超算中心,以完成數(shù)據(jù)處理分析。作為本科教學(xué),這些投入和產(chǎn)出比顯然難以接受、不切實(shí)際。

(二)學(xué)習(xí)模式革新

另一方面,學(xué)生學(xué)習(xí)的方式、知識(shí)獲取途徑發(fā)生著深刻的變化,互聯(lián)網(wǎng)思維日益廣泛地被學(xué)生所接受。學(xué)生更傾向于通過(guò)手機(jī)等移動(dòng)產(chǎn)品通過(guò)類似于游戲的方式快速、隨時(shí)隨地獲取知識(shí);以導(dǎo)航式、身臨其境的方式參與學(xué)習(xí)過(guò)程;并希望能夠根據(jù)自身特征接受個(gè)性教學(xué),接受個(gè)性化定制教育[8]。

(三)虛擬仿真技術(shù)的應(yīng)用

《教育部關(guān)于一流本科課程建設(shè)的實(shí)施意見(jiàn)》一文中,提出“雙萬(wàn)工程”,加強(qiáng)一流本科建設(shè),明確提出構(gòu)建“實(shí)驗(yàn)金課”要求。實(shí)施意見(jiàn)中,指出通過(guò)虛擬仿真技術(shù),搭建實(shí)驗(yàn)教學(xué)平臺(tái),通過(guò)線上、線下或混合模式的方式來(lái)完成實(shí)驗(yàn)教學(xué)目標(biāo)[9]。

生物信息學(xué)課程實(shí)驗(yàn)教學(xué)中,在樣品制備、上機(jī)測(cè)序等步驟完全符合虛擬仿真技術(shù)的應(yīng)用場(chǎng)景,具備構(gòu)建線上虛擬仿真實(shí)驗(yàn)室的先天優(yōu)勢(shì),如實(shí)驗(yàn)耗材損耗大、過(guò)程重復(fù)率高、實(shí)驗(yàn)流程性強(qiáng)、選項(xiàng)多等特征。這兩部分通過(guò)虛擬仿真技術(shù),借助HTML5(Flash在2020年后將不被Chrome等瀏覽器所支持)、B/S、數(shù)據(jù)庫(kù)等一系列信息技術(shù)能夠準(zhǔn)確地實(shí)現(xiàn)場(chǎng)景重現(xiàn)、流程定制、短視頻教學(xué)、智能問(wèn)答、在線評(píng)測(cè)教學(xué)功能,必將成為一個(gè)順應(yīng)時(shí)代潮流、符合學(xué)科特征的較優(yōu)的實(shí)驗(yàn)教學(xué)解決方案。

(四)云環(huán)境虛擬化實(shí)驗(yàn)教學(xué)平臺(tái)應(yīng)用

生物信息學(xué)實(shí)驗(yàn)數(shù)據(jù)處理分析方面,也是本專業(yè)教學(xué)的落腳點(diǎn),其教學(xué)的成功影響專業(yè)教學(xué)質(zhì)量。根據(jù)前文分析,生物信息數(shù)據(jù)處理信息量大、計(jì)算要求高且繁雜,但作為本科實(shí)驗(yàn)教學(xué),不需做到面面俱到,因而在實(shí)驗(yàn)內(nèi)容設(shè)計(jì)、軟件工具的選取、實(shí)驗(yàn)平臺(tái)搭建方面存在一定獨(dú)特性。

1.實(shí)驗(yàn)內(nèi)容設(shè)計(jì)。實(shí)驗(yàn)內(nèi)容設(shè)計(jì)對(duì)于實(shí)驗(yàn)教學(xué)也是至關(guān)重要的環(huán)節(jié),實(shí)驗(yàn)內(nèi)容設(shè)計(jì)需綜合考慮所講授的課程對(duì)象、學(xué)科特征和實(shí)驗(yàn)環(huán)境。目前生物信息學(xué)關(guān)于測(cè)序,研究的模式生物比較多,如人類基因組,而人類全基因組含有30億個(gè)堿基,也就是3Gb數(shù)據(jù),這個(gè)數(shù)據(jù)規(guī)模對(duì)于本科實(shí)驗(yàn)教學(xué)并不合適;另外一個(gè)模式生物,如大腸桿菌,它只有470萬(wàn)個(gè)堿基,也就是4.7Mb,這個(gè)基因數(shù)量只是人類基因的1/638,在NCBI上有大量的SRA短片測(cè)序數(shù)據(jù),從數(shù)據(jù)分析來(lái)看,大腸桿菌對(duì)于數(shù)據(jù)模擬、分析,耗費(fèi)的計(jì)算和存儲(chǔ)資源比人類基因小,因而作為本科教學(xué)是合適的實(shí)驗(yàn)對(duì)象,適合在虛擬環(huán)境下完成的計(jì)算任務(wù)。

2.工具集的集成是實(shí)驗(yàn)流程梳理。目前生物信息學(xué)軟件不下1000種,而且有很多軟件功能類似,這要求實(shí)驗(yàn)設(shè)計(jì)和系統(tǒng)集成密切配合,負(fù)責(zé)教學(xué)的教師積極參與實(shí)驗(yàn)設(shè)計(jì),過(guò)濾、歸納實(shí)驗(yàn)教學(xué)中用到的軟件,并研究設(shè)計(jì)實(shí)驗(yàn)完整流程和步驟。如RNA-seq數(shù)據(jù)分析,需考慮是否需要進(jìn)行序列組裝,是有指導(dǎo)組裝還是獨(dú)立組裝等問(wèn)題;如何進(jìn)行序列比對(duì),比對(duì)結(jié)果數(shù)據(jù)如何閱讀、如何分析;甚至是否需要引進(jìn)AI技術(shù)等等。表1所示,列舉部分常用軟件:

3.虛擬化實(shí)驗(yàn)室的發(fā)布。生物信息學(xué)虛擬化在線實(shí)驗(yàn)平臺(tái)最后一個(gè)問(wèn)題就是實(shí)驗(yàn)環(huán)境發(fā)布問(wèn)題。通過(guò)分析,不管采用何種技術(shù),目前最終給學(xué)生看到的人機(jī)界面可歸納為三個(gè)層次,即應(yīng)用級(jí)別的虛擬化、容器級(jí)別虛擬化和操作系統(tǒng)級(jí)別虛擬化。應(yīng)用級(jí)別虛擬化如虛擬仿真,即為一個(gè)軟件模擬實(shí)驗(yàn)環(huán)境,但實(shí)際并沒(méi)有調(diào)用相關(guān)的軟件進(jìn)行實(shí)際計(jì)算、分析;容器級(jí)別虛擬化,如Docker,即在Docker模式下運(yùn)行生物信息學(xué)軟件,可以形象認(rèn)為是瘦虛擬化。操作系統(tǒng)級(jí)別虛擬化,即基于VMware等虛擬化平臺(tái)搭建的虛擬化,可直接提供Linux等實(shí)驗(yàn)環(huán)境,并在此實(shí)驗(yàn)環(huán)境下搭建生物信息學(xué)真實(shí)的計(jì)算平臺(tái),以滿足教學(xué)要求,可以形象地認(rèn)為是胖虛擬化。生物信息學(xué)很多實(shí)驗(yàn)、實(shí)驗(yàn)數(shù)據(jù)存在上下文關(guān)系,采用Docker對(duì)于學(xué)生綜合分析能力的培養(yǎng)不是最優(yōu)解決方案,采用直接VMware級(jí)別的虛擬化能夠讓學(xué)生直接接觸真實(shí)生產(chǎn)環(huán)境,且可以通過(guò)擴(kuò)展虛擬化資源無(wú)縫將教學(xué)實(shí)驗(yàn)環(huán)境遷移到科研實(shí)驗(yàn)環(huán)境,但缺點(diǎn)明顯,如在性能、資源難以支撐科研實(shí)驗(yàn)。如圖1、圖2所示,胖虛擬化實(shí)驗(yàn)環(huán)境下實(shí)驗(yàn)平臺(tái)軟件運(yùn)行情況:

采用胖虛擬化模式,需要優(yōu)化虛擬化實(shí)驗(yàn)室對(duì)學(xué)生提供服務(wù)的途徑和方式。當(dāng)下主流是基于Web的虛擬化管理模式,也是容易被學(xué)生接受的模式。經(jīng)過(guò)調(diào)查和研究,采用B/S的模式,按照學(xué)生需求預(yù)設(shè)多套虛擬化實(shí)驗(yàn)室虛擬機(jī)模板。根據(jù)課程設(shè)計(jì)和教學(xué)方案,可以提供學(xué)生申請(qǐng)資源、下載虛擬化鏡像、管理虛擬化主機(jī)需求,并且可以錯(cuò)峰提供虛擬化計(jì)算服務(wù)[ 10 ]。

三、總結(jié)和展望

生物信息學(xué)是一個(gè)新型的信息學(xué)科,截至到2018年全國(guó)開設(shè)該專業(yè)的學(xué)校只有24所,開設(shè)該專業(yè)的學(xué)校分布在理、農(nóng)、林、牧、醫(yī)等類型學(xué)校。從現(xiàn)狀看,課程建設(shè)還處在建設(shè)起步和上升期。筆者所在的學(xué)校開設(shè)該專業(yè)三年,但根據(jù)課程合理性需求,期間已修改過(guò)一次培養(yǎng)方案,實(shí)驗(yàn)教學(xué)中還存在諸多不確定因素,也無(wú)可參照的成熟模式。本文通過(guò)生物信息課程特征分析入手,剖析傳統(tǒng)實(shí)驗(yàn)教學(xué)所存在的問(wèn)題,提出借助虛擬化技術(shù)的解決思路,重點(diǎn)研究胖環(huán)境下的實(shí)驗(yàn)虛擬化思路,并得到初步的驗(yàn)證。也以此拋磚引玉,供大家探討,未來(lái)我們也將進(jìn)一步拓展相關(guān)的改革思路、解決實(shí)驗(yàn)教學(xué)中存在的問(wèn)題。

參考文獻(xiàn)

[1]范丙友,賈小平,胥華偉,等.生物信息學(xué)課程教學(xué)改革與探索[J].大學(xué)教育,2013(16):61-62.

[2]馬明月,曾垂省,解增言,等.生物信息學(xué)大實(shí)驗(yàn)教學(xué)改革的探索與實(shí)踐[J].生物化工,2018,4(02):103-105+108.

[3]李宗瑋.基于高通量測(cè)序的微生物辨識(shí)、進(jìn)化與耐藥性生物信息學(xué)分析[D].中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院,2016.

[4]郝愛(ài)平,國(guó)會(huì)艷,薛巨坤,等.大數(shù)據(jù)時(shí)代提高生物專業(yè)研究生科研創(chuàng)新實(shí)踐能力教學(xué)改革探索——以“生物信息學(xué)”課程為例[J].安徽農(nóng)學(xué)通報(bào),2017,23(17):140-141.

[5]楊帥.面向組學(xué)大數(shù)據(jù)的生物信息學(xué)研究[D].中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院,2016.

[6]李廣林.大數(shù)據(jù)背景下的生物信息學(xué)教學(xué)探索[J].教育教學(xué)論壇,2015,(29):210-211.

[7]張渝潔,邢晉祎.生物信息學(xué)實(shí)驗(yàn)教學(xué)中的網(wǎng)絡(luò)資源及其利用[J].安徽農(nóng)業(yè)科學(xué),2019,47(11):276-278.

[8]鐘玉珍.“互聯(lián)網(wǎng)+”時(shí)代的計(jì)算機(jī)教學(xué)新模式[J].計(jì)算機(jī)產(chǎn)品與流通,2019(12):210.

[9]教育部發(fā)文推進(jìn)本科課程改革 理直氣壯為本科生“增負(fù)”[J].西部素質(zhì)教育,2019,5(22):154.

[10]Serdar Yegulalp,Serdar Yegulalp.VMware dresses up Docker for the enterprise[J].InfoWorld.com,2016.

Exploration and Practice of the Course Reform of Experimental Teaching of Bioinformatics in Cloud Environment

CHEN Qian-Jun,LIU Jie,HU Yun

(State Key Laboratory of Biocatalysis and Enzyme Engineering,School of life Sciences,Hubei University,Wuhan,Hubei 430062,China)

Abstract:The paper is based on the construction and reform of the experimental teaching of Bioinformatics for undergraduate students in a university co-sponsored by Hubei Province and the Ministry of Education.It makes a study on the content design,platform construction,and teaching model reform of this course.Meanwhile,it points out some problems which may happen during the teaching process and provides corresponding solutions as a reference to the experimental teaching of similar professional courses.

Key words:Cloud environment;experimental teaching;teaching reform;Bioinformatics;virtualization

猜你喜歡
云環(huán)境生物信息學(xué)虛擬化
基于OpenStack虛擬化網(wǎng)絡(luò)管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
對(duì)基于Docker的虛擬化技術(shù)的幾點(diǎn)探討
虛擬化技術(shù)在計(jì)算機(jī)技術(shù)創(chuàng)造中的應(yīng)用
“PBL+E—learning”教學(xué)模式探索
移動(dòng)教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
云環(huán)境下基于崗位素質(zhì)模型的過(guò)程性評(píng)價(jià)體系研究
存儲(chǔ)虛擬化還有優(yōu)勢(shì)嗎?