紀(jì)兆華 尹成偉 王春云 高春紅
摘? ? 要:通過以農(nóng)業(yè)生產(chǎn)田間管理實(shí)際統(tǒng)計(jì)數(shù)據(jù)分析為例,探討生物數(shù)據(jù)可視化,直觀展現(xiàn)生物學(xué)數(shù)據(jù),幫助科學(xué)分析數(shù)據(jù)結(jié)果,將抽象的信息進(jìn)行直觀的分析并表示出來(lái),有助于更好地理解數(shù)據(jù),增強(qiáng)認(rèn)知數(shù)據(jù)。生物大數(shù)據(jù)可視化分析的結(jié)果可視化強(qiáng)、效率高,對(duì)生物學(xué)大數(shù)據(jù)進(jìn)行解構(gòu),去除其中的冗余信息和背景噪聲,得到更加具有科學(xué)意義的數(shù)據(jù)分析結(jié)果。
關(guān)鍵詞:田間管理;生物數(shù)據(jù);分析
文章編號(hào):1005-2690(2021)17-0036-02? ? ? ?中國(guó)圖書分類號(hào):C961? ? ? ?文獻(xiàn)標(biāo)志碼:B
對(duì)生物大數(shù)據(jù)的高效準(zhǔn)確解讀事關(guān)糧食安全等重要問題,由于生物大數(shù)據(jù)有類型復(fù)雜、結(jié)構(gòu)異質(zhì)、冗余性高和體積龐大等特點(diǎn),科研人員需要借助數(shù)據(jù)可視化等方法才能理解其組成特征和內(nèi)在聯(lián)系,進(jìn)而更加快速和有針對(duì)性地從中挖掘出相關(guān)知識(shí)信息[1]。
1? ?數(shù)據(jù)可視化
數(shù)據(jù)可視化將具有大量數(shù)據(jù)庫(kù)中的文本或者二進(jìn)制數(shù)據(jù)的特征信息,轉(zhuǎn)變?yōu)楦又庇^生動(dòng)的圖或表。計(jì)算機(jī)可視化操作能夠?qū)⒊橄蟮男畔⑦M(jìn)行直觀的分析并表示出來(lái),有助于更好地理解數(shù)據(jù),增強(qiáng)認(rèn)知數(shù)據(jù),并挖掘出大量數(shù)據(jù)中蘊(yùn)含的事物之間的規(guī)律或內(nèi)在信息[2]。
實(shí)現(xiàn)大數(shù)據(jù)可視化的過程一般需要有數(shù)據(jù)獲取、數(shù)據(jù)變換、數(shù)據(jù)分析與數(shù)據(jù)展現(xiàn)。數(shù)據(jù)分析和數(shù)據(jù)可視化在生物大數(shù)據(jù)可視化分析流程中為計(jì)算處理,數(shù)據(jù)分析包括基于表結(jié)構(gòu)和關(guān)系函數(shù)的查詢分析、基于數(shù)據(jù)、事件流的流分析,基于圖、矩陣、迭代計(jì)算的復(fù)雜分析;可視化通常為對(duì)分析結(jié)果的展示,通過交互、提問等形成迭代的分析和可視化[3]。
2? ?農(nóng)業(yè)生產(chǎn)田間管理生物數(shù)據(jù)分析可視化
以田間管理數(shù)據(jù)分析為例,分析生物數(shù)據(jù)可視化。
2.1? ?田間管理
以田間管理數(shù)據(jù)分析為例,在2019年5月20日進(jìn)行玉米播種,行長(zhǎng)5 m,行距0.6 m,每行種植20株,采用壟上直播。玉米3葉期對(duì)田間種植的轉(zhuǎn)基因玉米材料進(jìn)行抗除草劑草銨膦篩選,篩選方式為葉噴施,篩選效果明顯。對(duì)于缺株小區(qū)進(jìn)行移苗。間苗完畢后,采用點(diǎn)播器施肥法,即在3葉期使用點(diǎn)播器將化肥點(diǎn)施于兩株苗之間,其中100%施氮量每穴施肥11.24 g,70%施氮量每穴施肥8.43 g ,0%施氮量不施肥。
2.2? ?數(shù)據(jù)測(cè)定
在苗期、拔節(jié)期、大喇叭口期、抽雄開花期分別測(cè)定葉綠素相對(duì)含量;抽雄吐絲期測(cè)定植株株高、穗位高。收獲時(shí)測(cè)定植株生物產(chǎn)量、果穗產(chǎn)量等;室內(nèi)考種時(shí)測(cè)定植株干重、果穗產(chǎn)量構(gòu)成因子等。
2.3? ?不同梯度不同時(shí)期葉綠素含量
整理不同梯度不同時(shí)間葉綠素含量數(shù)據(jù),統(tǒng)計(jì)如表1所示。
苗期所有轉(zhuǎn)化體葉綠素含量顯著高于3個(gè)對(duì)照,p1和sd1轉(zhuǎn)化體在不同氮肥濃度下苗期均高于對(duì)照;推測(cè)兩個(gè)轉(zhuǎn)化體提高了苗期吸氮能力;轉(zhuǎn)化體拔節(jié)期葉綠素含量降低;大喇叭口期含量相比增加;ms1和zm1在棒三葉期葉綠素含量呈現(xiàn)增加趨勢(shì);推測(cè)兩個(gè)轉(zhuǎn)化體提高氮轉(zhuǎn)運(yùn)和分配能力。
2.4? ?不同梯度田株高
整理不同梯度田株高數(shù)據(jù),統(tǒng)計(jì)如表2所示。
商業(yè)雜交種鄭單958與鄭單958(aa),鄭單958(aa×aa)相比,株高差異較大。
3? ?生物數(shù)據(jù)可視化
3.1? ?生物學(xué)大數(shù)據(jù)可視化分析
當(dāng)數(shù)據(jù)量規(guī)模增加時(shí),需要采用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)分析。生物學(xué)大數(shù)據(jù)可視化分析的作用主要包括3個(gè)方面:首先,幫助科研人員快速?gòu)捏w積龐大、缺乏組織脈絡(luò)的原始數(shù)據(jù)集中抽取出本質(zhì)特征,為研究工作提供理論指引;其次,抽取出生物學(xué)大數(shù)據(jù)中某一維度的特征,以圖形化的方式進(jìn)行直觀展示和強(qiáng)調(diào);最后,可以有效地將生物學(xué)大數(shù)據(jù)進(jìn)行解構(gòu),去除其中的冗余信息和背景噪聲,得到更加具有科學(xué)意義的數(shù)據(jù)分析結(jié)果[4]。
研究是根據(jù)一定條件進(jìn)行設(shè)計(jì)的田間試驗(yàn),分別觀察了玉米生長(zhǎng)不同時(shí)期的數(shù)據(jù)。因?yàn)檫@些數(shù)據(jù)也是對(duì)于有限樣本的觀察得到的測(cè)試數(shù)據(jù),通常也具有變隱形、偶然性和局部性,或者說在表面上看來(lái)這些原始數(shù)據(jù)是雜亂無(wú)章的。因此,必須要對(duì)這些原始觀察的數(shù)據(jù)進(jìn)行整理分析,這樣就能發(fā)現(xiàn)其內(nèi)在的規(guī)律并分析出有科學(xué)性的結(jié)論。通常在數(shù)據(jù)分析方面如果比較復(fù)雜,也可采用數(shù)據(jù)分組的方法來(lái)分析。如運(yùn)用相關(guān)方法將玉米苗期、拔節(jié)期、大喇叭口期、抽雄開花期的葉綠素相對(duì)含量,和抽雄吐絲期的玉米植株株高、穗位高,以及收獲時(shí)的植株生物產(chǎn)量、果穗下茬產(chǎn)量,在室內(nèi)考種時(shí)測(cè)定植株干重、果穗產(chǎn)量構(gòu)成因子等數(shù)據(jù)記錄,研究不同時(shí)期的不同狀態(tài)數(shù)據(jù),分析其總體結(jié)構(gòu),并簡(jiǎn)化數(shù)據(jù)運(yùn)算程序[5]得到科學(xué)性的結(jié)論。
3.2? ?數(shù)據(jù)可視化特點(diǎn)
同傳統(tǒng)的靜態(tài)數(shù)據(jù)可視化展現(xiàn)方式比,基于HTML5可視化技術(shù),在交互性、界面等方面,具有表現(xiàn)更為直觀、容易和其他軟件工具結(jié)合起來(lái)進(jìn)行數(shù)據(jù)分析,以及方便傳播分享數(shù)據(jù)等優(yōu)勢(shì)[6]。采用生物學(xué)數(shù)據(jù)可視化平臺(tái),可以更加直觀地展現(xiàn)測(cè)試數(shù)據(jù)和分子層面的數(shù)據(jù)結(jié)構(gòu)、關(guān)系網(wǎng)絡(luò)數(shù)據(jù)和臨床分析數(shù)據(jù)等,為科研人員提供幫助[7]。
4? ?結(jié)束語(yǔ)
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)據(jù)化推動(dòng)了我國(guó)信息化開展進(jìn)程[8]。注入農(nóng)業(yè)作物生長(zhǎng)數(shù)據(jù)等可以實(shí)時(shí)提供給農(nóng)業(yè)管理技術(shù)人員,就可以精準(zhǔn)判別農(nóng)作物施肥、打藥或者灑水時(shí)間,從而有效防止天然因素造成的產(chǎn)值降低。經(jīng)過歸納處理的數(shù)據(jù),也可以有效調(diào)控農(nóng)業(yè)生產(chǎn);經(jīng)過對(duì)數(shù)據(jù)的剖析,可以擬定一系列調(diào)整和管理農(nóng)業(yè)生產(chǎn)的辦法,促使農(nóng)業(yè)生產(chǎn)高效、高質(zhì)發(fā)展。
參考文獻(xiàn):
[ 1 ] 趙方慶,周琳,孔雷.生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].科學(xué)通報(bào)(中文版),2015,60(5):547-557.
[ 2 ] 張廣旭.基于Spark的基因數(shù)據(jù)聚類分析及可視化[D].長(zhǎng)沙:湖南大學(xué),2017.
[ 3 ] 傅耀威,賈燕紅,張軍,等.大數(shù)據(jù)可視分析發(fā)展現(xiàn)狀與趨勢(shì)[J].中國(guó)基礎(chǔ)科學(xué),2019,21(4):53-58.
[ 4 ] 郭平仲.田間試驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)分析——試驗(yàn)數(shù)據(jù)的整理[J].生物學(xué)通報(bào),1989(10):18-21.
[ 5 ] 劉江濤,邢輝.淺析生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].中國(guó)新通信,2016,18(2):152.
[ 6 ] 崔曉軍,高子航.基于GIS與云計(jì)算的溫州市農(nóng)業(yè)大數(shù)據(jù)可視化平臺(tái)研究[J].電腦編程技巧與維護(hù),2020(4):113-115.
[ 7 ] 紀(jì)兆華,王春云,高春紅,等.生物數(shù)據(jù)可視化研究[J].中小企業(yè)管理與科技(中旬刊),2021(1):193-194.
[ 8 ] 姜侯,楊雅萍,孫九林.農(nóng)業(yè)大數(shù)據(jù)研究與應(yīng)用[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2019(1):5-15.