吳耀群
摘? ?要:應(yīng)用瀏覽器或者服務(wù)器創(chuàng)建微生物在線分析系統(tǒng),可以用于傳染病的預(yù)防與控制,系統(tǒng)開發(fā)中將分析軟件、遠(yuǎn)程桌面以及分布式運(yùn)算等運(yùn)行方案結(jié)合,使系統(tǒng)無需本地安裝,能夠通過瀏覽器直接使用。文章分析了微生物在線分析系統(tǒng)開發(fā)時(shí)需要的軟件資料和應(yīng)用技術(shù),結(jié)合實(shí)際情況探究系統(tǒng)實(shí)踐與應(yīng)用的有效結(jié)果。
關(guān)鍵詞:微生物;在線生物信息;分析系統(tǒng)
將已有的數(shù)據(jù)深入發(fā)掘,并轉(zhuǎn)化成生物信息,利用生物信息對傳染病加以診斷和控制,這是在線生物信息分析系統(tǒng)創(chuàng)建的目的,也是傳染病預(yù)防與控制工作展開的基礎(chǔ)。雖然已有多種分析軟件,但是這些軟件需要在各自的操作系統(tǒng)中使用互不相容,有的軟件依賴集群使用,功能無法簡化。因此,本文以特別研發(fā)一種兼容性、實(shí)用性較高的生物信息分析系統(tǒng)。
1? ? 微生物在線生物信息分析系統(tǒng)開發(fā)的材料和方法
1.1? 軟件資料來源
隨著現(xiàn)代化網(wǎng)絡(luò)信息技術(shù)的深入發(fā)展,關(guān)于微生物信息系統(tǒng)的研發(fā)問題已得到初步解決。通過構(gòu)建信息分析系統(tǒng),以瀏覽器或服務(wù)器作為系統(tǒng)架構(gòu)模式,改變過去客戶端與服務(wù)器的運(yùn)行方式。該信息分析系統(tǒng)以服務(wù)器為核心,無論是程序處理還是數(shù)據(jù)分析,都能在服務(wù)器終端完成,數(shù)據(jù)可以直接展示給用戶。應(yīng)用時(shí),無需安裝專業(yè)軟件,只需從網(wǎng)絡(luò)中將計(jì)算機(jī)與服務(wù)器相連即可,應(yīng)用瀏覽器就能實(shí)現(xiàn)微生物數(shù)據(jù)的分析和處理。
針對本研究的微生物信息分析系統(tǒng)(以下簡稱微系統(tǒng)),以現(xiàn)有的信息工具和微生物數(shù)據(jù)庫為主要基礎(chǔ)集成開發(fā)系統(tǒng),為研究人員提供微生物分析服務(wù),以解決實(shí)際問題為目的,提高傳染病預(yù)防控制的工作效率。本研究系統(tǒng)應(yīng)用到的軟件是互聯(lián)網(wǎng)中免費(fèi)公布的,可以在Windows系統(tǒng)或者Linux系統(tǒng)中應(yīng)用。因此,該微系統(tǒng)的開發(fā)和應(yīng)用不會涉及侵權(quán)的問題[1]。
1.2? 軟件與分類
本次研發(fā)的微系統(tǒng)提供了15種常用的生物信息軟件,以瀏覽器為介質(zhì)進(jìn)行訪問和應(yīng)用。按照功能劃分,主要可以分成以下幾種。
(1)引物設(shè)計(jì):Linux系統(tǒng)的Primer3。
(2)序列比對與進(jìn)化樹構(gòu)建:Windows系統(tǒng)的MEGA5;Linux系統(tǒng)的BLAST、MAUVE等;Windows與Linux兼用的MEGAN。
(3)數(shù)據(jù)統(tǒng)計(jì):Windows系統(tǒng)的Cluster,R,Cytoscape。
(4)圖形展示:Linux系統(tǒng)的BRIG、Aigo Gnome Browser。
1.3? 在線微生物信息分析系統(tǒng)的結(jié)構(gòu)設(shè)計(jì)
從業(yè)務(wù)邏輯角度可以將該微系統(tǒng)分成Web展示子系統(tǒng)、生物信息計(jì)算引擎子系統(tǒng)。這兩個(gè)子系統(tǒng)都是獨(dú)立的,互不干擾。
(1)生物部署角度:Web展示子系統(tǒng)主要由Web與NX服務(wù)器構(gòu)成,生物計(jì)算引擎系統(tǒng)由生物信息軟件服務(wù)器和Ftp服務(wù)器構(gòu)成。前者系統(tǒng)能夠提供NX技術(shù)遠(yuǎn)程支持,但是耗費(fèi)的硬件資源較多,應(yīng)用時(shí)需要將其配置到級別更高的設(shè)備中。相比之下,后者系統(tǒng)各有一個(gè)Windows與Linux系統(tǒng),可以在配置較低的物理設(shè)備中。
(2)功能方面:Web展示系統(tǒng)可以為用戶提供友好界面,實(shí)現(xiàn)對在線微生物數(shù)據(jù)的分析,可以下載常用微生物數(shù)據(jù);生物計(jì)算引擎系統(tǒng)需要通過虛擬遠(yuǎn)程桌面實(shí)現(xiàn)對數(shù)據(jù)計(jì)算要求的響應(yīng)[2]。
1.4? 在線生物信息系統(tǒng)應(yīng)用的技術(shù)
根據(jù)應(yīng)用的分層架構(gòu)設(shè)計(jì)風(fēng)格,將信息分析系統(tǒng)劃分為以下4層。
(1)表達(dá)層:應(yīng)用Java構(gòu)建框架(JavaServer Faces ,JSF)技術(shù),實(shí)現(xiàn)對瀏覽器的接收請求,為信息分析系統(tǒng)提供登錄、訪問控制、數(shù)據(jù)展示與模塊分發(fā)的功能。
(2)業(yè)務(wù)層:使用NX和Spring技術(shù),實(shí)現(xiàn)了J2EE開發(fā)標(biāo)準(zhǔn),使業(yè)務(wù)層成為信息分析系統(tǒng)的核心部位,負(fù)責(zé)對表現(xiàn)層的數(shù)據(jù)計(jì)算與分析請求進(jìn)行接收,實(shí)現(xiàn)業(yè)務(wù)邏輯的分析,并對業(yè)務(wù)層進(jìn)行模塊化設(shè)計(jì)。在網(wǎng)絡(luò)技術(shù)與信息技術(shù)支持下,用戶應(yīng)用信息分析系統(tǒng)時(shí)不需要本地安裝,可以直接從互聯(lián)網(wǎng)中訪問。
(3)集成層:應(yīng)用Hibernate技術(shù),向業(yè)務(wù)層提供資源訪問的接口,幫助業(yè)務(wù)層屏蔽數(shù)據(jù)存儲訪問技術(shù)。
(4)資源層:應(yīng)用美國的國際商業(yè)機(jī)器公司開發(fā)的一套關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(IBM DB2)技術(shù),成為信息分析系統(tǒng)的數(shù)據(jù)關(guān)聯(lián)庫。
1.5? 在線生物信息系統(tǒng)代碼架構(gòu)和場景設(shè)計(jì)
使用者從頁面提出申請,監(jiān)聽器Check Action對用戶的申請進(jìn)行驗(yàn)證,根據(jù)用使用情況確定用戶是否登錄。將Nx Action作為事件監(jiān)聽器,對本次事件的參數(shù)加以分析,根據(jù)信息分析系統(tǒng)的調(diào)用結(jié)構(gòu)確定頁面的實(shí)際遷移情況。Nx Action監(jiān)聽層主要負(fù)責(zé)信息分析系統(tǒng)的業(yè)務(wù)邏輯控制和生物數(shù)據(jù)實(shí)物控制,并對業(yè)務(wù)進(jìn)行執(zhí)行與編輯工作。根據(jù)多個(gè)業(yè)務(wù)邏輯的實(shí)情和通用公告邏輯,將存儲邏輯傳遞給DAO層分析與處理,封裝器再將微生物數(shù)據(jù)信息存儲。
2? ? 微生物在線生物信息分析系統(tǒng)開發(fā)與應(yīng)用的結(jié)果分析
2.1? 軟件收集與封裝
當(dāng)前信息分析系統(tǒng)收集整理了引物設(shè)計(jì)、序列比對、數(shù)據(jù)統(tǒng)計(jì)與圖形展示4類15個(gè)微生物在線分析軟件,并將其部署在服務(wù)器中,對軟件完成封裝。封裝后的操作十分復(fù)雜,只能在本機(jī)運(yùn)行的軟件被轉(zhuǎn)化成無需本地安裝、可通過瀏覽器直接操作的軟件工具。除了BLAET,其他14款分析軟件都需以圖形界面交互方式為基礎(chǔ)應(yīng)用,MEGA4,Tree View等5款微生物在線分析軟件需要在Windows中使用,其他9款軟件需要在Linux系統(tǒng)中應(yīng)用[3]。
2.2? 在線生物信息系統(tǒng)功能分析
2.2.1? 數(shù)據(jù)庫下載與用戶數(shù)據(jù)管理
微系統(tǒng)將歐洲分子生物學(xué)實(shí)驗(yàn)室(European Molecular Biology Laboratory,EMBL)與Gen Bank等生物網(wǎng)站數(shù)據(jù)庫高效整合,包含已經(jīng)測序的基因數(shù)據(jù)庫、蛋白質(zhì)序列與基因信息數(shù)據(jù)庫。各個(gè)數(shù)據(jù)庫中的微生物數(shù)據(jù)信息被高效整合,在信息分析系統(tǒng)中可以下載使用,實(shí)現(xiàn)了資源利用的最大化。為用戶提供信息數(shù)據(jù)的上傳和下載服務(wù),使用者登錄信息分析系統(tǒng)后,從文件管理頁面中對需要分析的目標(biāo)文件上傳,按照自己需要的格式,從文件管理中下載結(jié)果文件。為了保證使用者上傳或下載時(shí)所有數(shù)據(jù)的安全和穩(wěn)定,信息分析系統(tǒng)提供了不同的數(shù)據(jù)隔離。
此外,還有操作日志功能,用戶登錄系統(tǒng)后,任何操作都會被記錄在日志中,方便管理人員隨時(shí)查看,并對其行為展開管理。
2.2.2? 系統(tǒng)在線數(shù)據(jù)分析
為了更好地預(yù)防與控制傳染病,在生物學(xué)技術(shù)的發(fā)展進(jìn)程下,生物實(shí)驗(yàn)數(shù)據(jù)已經(jīng)呈現(xiàn)出海量化發(fā)展趨勢。本次研發(fā)的信息分析系統(tǒng)為使用者提供了多種數(shù)據(jù)統(tǒng)計(jì)與分析軟件,幫助使用者避開軟件繁瑣的安裝過程,使用步驟被簡化,提高了微生物數(shù)據(jù)快速分析與處理的可能性。如某一個(gè)程序可以用來統(tǒng)計(jì)和分析語言操作環(huán)境,該程序自身擁有多種微生物數(shù)據(jù)分析功能,涵蓋了大量統(tǒng)計(jì)學(xué)的知識。信息分析系統(tǒng)將該程序整合,并將程序轉(zhuǎn)化為網(wǎng)絡(luò)版本,提高了微生物數(shù)據(jù)計(jì)算的效率,增強(qiáng)了針對網(wǎng)絡(luò)平臺中海量數(shù)據(jù)的處理能力,如基因組測序和芯片雜交的研究結(jié)果可以在信息分析系統(tǒng)中更快得出。
2.2.3? 在線序列比對
不同物種基因組測序快速發(fā)展,大量DNA信息出現(xiàn)使人們需要應(yīng)用最快捷的信息分析工具,對這些DNA數(shù)據(jù)有效分析,提取有利信息。本信息分析系統(tǒng)為研究提供了多種序列比分析工具,能夠?qū)NA和蛋白質(zhì)序列進(jìn)行相似性比較,將序列之間的差異位點(diǎn)提取出來,并構(gòu)建信息分析系統(tǒng)發(fā)育樹,進(jìn)一步推斷不同物種之間的進(jìn)化差距。
2.2.4? 數(shù)據(jù)圖形化展示
微系統(tǒng)將BRIG和Argo Gennme Browser工具整合,為用戶提供了全基因組圖形化展示,將ATGG字母轉(zhuǎn)化成線性與環(huán)狀圖形。不僅如此,數(shù)據(jù)圖形化展示中,不同顏色的箭頭或波浪線將染色體不同位置或方向上的基因標(biāo)注出來,方便使用者進(jìn)一步研究基因和鳥嘌呤(Guanine)和胞嘧啶(Cytosine)所占的比率,即GC含量的實(shí)際變化情況。
伴隨各類測序手段在病原微生物研究和傳染病防控領(lǐng)域的應(yīng)用,現(xiàn)代化網(wǎng)絡(luò)信息技術(shù)下的微生物信息手段可以在傳染病診斷中發(fā)揮重要作用。國內(nèi)該領(lǐng)域雖然發(fā)展時(shí)間較早,但仍未研發(fā)出大型公共生物信息數(shù)據(jù)庫,缺乏專業(yè)的微系統(tǒng)。因此,本文針對這一背景狀況展開了信息分析系統(tǒng)的研發(fā)與應(yīng)用,將常用的信息工具集成,實(shí)現(xiàn)了系統(tǒng)的高效應(yīng)用。該信息分析系統(tǒng)的架構(gòu)體系可以讓使用者通過瀏覽器完成微生物數(shù)據(jù)扥分析和處理,系統(tǒng)升級快速,方便后期維護(hù),客戶端操作難度低,可以作為其他程序的拓展應(yīng)用。
3? ? 結(jié)語
國內(nèi)微系統(tǒng)的研發(fā)和應(yīng)用還處于起步階段,能夠提供幫助的信息工具有15個(gè)。文章通過對該信息分析系統(tǒng)的深入研發(fā),建立了軟件接口與構(gòu)建流程,為今后信息分析系統(tǒng)的研發(fā)和分析工具的使用奠定基礎(chǔ),并將其更好地應(yīng)用在傳染病預(yù)防控制領(lǐng)域中。
[參考文獻(xiàn)]
[1]閆津津,陳衛(wèi)東,楊虹,等.微生物標(biāo)本類型的實(shí)驗(yàn)室信息系統(tǒng)設(shè)置研究[J].國際檢驗(yàn)醫(yī)學(xué)雜志,2017(5):617-619.
[2]羅燕萍,葉麗艷,楊繼勇.臨床微生物信息管理數(shù)字化平臺的建設(shè)[J].臨床檢驗(yàn)雜志,2015(11):809-811.
[3]于偉文,杜鵬程,吳一雷,等.微生物在線生物信息分析系統(tǒng)的開發(fā)及應(yīng)用[J].疾病監(jiān)測,2016(4):316-319.
Development and application of microbial on-line biological information analysis system
Wu Yaoqun
(Shaoyang University, Shaoyang 422000, China)
Abstract:An on-line microbial analysis system can be created by a browser or server, which can be used for the prevention and control of infectious diseases. In the development of the system, analysis software, remote desktop and distributed computing are combined, so that the system does not need to be installed locally, can be used directly through the browser. This paper analyzes the software data and application technology needed in the development of microbial on-line analysis system, and probes into the effective results of the practice and application of the system according to the actual situation.
Key words:microorganism; on-line biological information; analytical system