国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Neo4j的草莓種植管理知識(shí)圖譜構(gòu)建及驗(yàn)證

2022-01-17 07:17郭文忠文朝武龍潔花
現(xiàn)代農(nóng)業(yè)科技 2022年1期
關(guān)鍵詞:語(yǔ)句圖譜草莓

張 宇 郭文忠 林 森* 文朝武 龍潔花

(1吉林農(nóng)業(yè)大學(xué)信息技術(shù)學(xué)院,吉林長(zhǎng)春 130118;2北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097)

隨著物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等技術(shù)的快速發(fā)展,我國(guó)農(nóng)業(yè)經(jīng)歷了傳統(tǒng)農(nóng)業(yè)、半自動(dòng)化農(nóng)業(yè)、機(jī)械化農(nóng)業(yè)到現(xiàn)在的智慧農(nóng)業(yè)階段。智慧農(nóng)業(yè)的發(fā)展需要將互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算和人工智能等現(xiàn)代技術(shù)與農(nóng)業(yè)深度融合,從而實(shí)現(xiàn)現(xiàn)代信息感知、定量決策、精準(zhǔn)灌溉的全新農(nóng)業(yè)生產(chǎn)方式。中國(guó)作為農(nóng)業(yè)大國(guó),作物品種豐富。與其他作物相比,草莓適應(yīng)性強(qiáng)、結(jié)果早、成熟早、投資少、見(jiàn)效快,是提高農(nóng)民經(jīng)濟(jì)收入的一種重要農(nóng)作物[1-8]。2017年我國(guó)草莓種植面積達(dá)14.13萬(wàn) hm2,年產(chǎn)量375.30萬(wàn)t[9],草莓產(chǎn)業(yè)從業(yè)人員達(dá)到350萬(wàn)人。目前,國(guó)內(nèi)外的草莓品種較多,關(guān)于草莓的信息數(shù)據(jù)量較大,大量的書(shū)籍、論文、報(bào)刊、網(wǎng)絡(luò)文獻(xiàn)等資料對(duì)草莓均有記載,但僅限于文字,查閱資料和文獻(xiàn)需要大量時(shí)間,所以將這些知識(shí)以簡(jiǎn)單、高效的方式展示給草莓種植者具有重要意義。

知識(shí)圖譜(knowledge graph,KG)是以圖的形式表現(xiàn)客觀(guān)世界中的實(shí)體(概念、人、事物)及其之間關(guān)系的知識(shí)庫(kù)[10-14]。知識(shí)圖譜通常使用RDF模式來(lái)表達(dá)數(shù)據(jù)中的語(yǔ)義,受到了國(guó)內(nèi)外學(xué)者的熱捧,并已經(jīng)應(yīng)用到智能問(wèn)答、輔助決策和大數(shù)據(jù)分析等方面[15],是智慧農(nóng)業(yè)發(fā)展必不可少的技術(shù)之一。

本文借助知識(shí)圖譜構(gòu)建技術(shù),采用自頂向下的方式構(gòu)建草莓種植管理知識(shí)圖譜。通過(guò)圖結(jié)構(gòu)方式將草莓種植管理知識(shí)高效、準(zhǔn)確地提供給種植者,以節(jié)約大量查閱資料、閱讀書(shū)籍時(shí)間。

1 研究現(xiàn)狀

知識(shí)圖譜并非突然出現(xiàn)的新技術(shù),而是很多技術(shù)在發(fā)展中相互影響和繼承的結(jié)果,在20世紀(jì)70年代,就有研究者提出了知識(shí)圖譜的早期理念Semantic Networks[16-17],后來(lái)又相繼提出本體(Ontology)、Web、The Semantic Web、Linked Data。直到 2012 年,谷歌公司正式推出了知識(shí)圖譜搜索引擎服務(wù),大大提升了搜索的速度和質(zhì)量。隨后知識(shí)圖譜在輔助智能問(wèn)答、自然語(yǔ)言理解、大數(shù)據(jù)分析、智能決策、人工智能、電商領(lǐng)域、醫(yī)療領(lǐng)域以及金融領(lǐng)域等方面展現(xiàn)出了豐富的應(yīng)用價(jià)值。

吳賽賽等[18]提出一種基于深度學(xué)習(xí)的作物病蟲(chóng)害知識(shí)圖譜構(gòu)建方法,將抽取的知識(shí)存儲(chǔ)到Neo4j圖數(shù)據(jù)庫(kù)中,能直觀(guān)反映知識(shí)圖譜內(nèi)部結(jié)構(gòu),實(shí)現(xiàn)知識(shí)可視化和知識(shí)推理。該研究構(gòu)建的結(jié)構(gòu)化知識(shí)圖譜可以為作物病蟲(chóng)害智能問(wèn)答系統(tǒng)、推薦系統(tǒng)、智能搜索等下游應(yīng)用提供高質(zhì)量的知識(shí)庫(kù)基礎(chǔ)。袁培森等[19]針對(duì)水稻表型知識(shí)圖譜中的實(shí)體關(guān)系抽取問(wèn)題提出了一種基于本體論對(duì)水稻基因、環(huán)境、表型等表型組學(xué)實(shí)體進(jìn)行關(guān)系分類(lèi)的方法。試驗(yàn)結(jié)果表明,BERT模型的精確率達(dá)到了95.10%。劉寶珠等[10]針對(duì)RDF圖和屬性圖的不同數(shù)據(jù)管理、不統(tǒng)一的數(shù)據(jù)模式和查詢(xún)語(yǔ)言限制了知識(shí)圖譜的廣泛應(yīng)用,提出了KGDB(knowledge graph database)是統(tǒng)一模型和語(yǔ)言的知識(shí)圖譜數(shù)據(jù)庫(kù)管理系統(tǒng)。試驗(yàn)結(jié)果表明,KGDB平均比gStore和Neo4j節(jié)省了30%的存儲(chǔ)空間,同時(shí)提高了2個(gè)數(shù)量級(jí)的查詢(xún)速度。杜志強(qiáng)等[20]針對(duì)“數(shù)據(jù)—信息—知識(shí)”轉(zhuǎn)化能力的不足,提出了自頂向下和自底向上相結(jié)合的自然災(zāi)害應(yīng)急知識(shí)圖譜構(gòu)建方法,最后以洪澇災(zāi)害應(yīng)急知識(shí)圖譜為例驗(yàn)證。結(jié)果表明,該方法能夠形式化表達(dá)概念層關(guān)系及要素屬性、要素間語(yǔ)義的關(guān)系,實(shí)現(xiàn)了從多源數(shù)據(jù)到互聯(lián)知識(shí)的轉(zhuǎn)化。

Zeb等[21]針對(duì)KG嵌入模型無(wú)法捕獲節(jié)點(diǎn)附近存在的有用信息,提出了一種新的KG嵌入學(xué)習(xí)框架。該框架由雙加權(quán)圖卷積網(wǎng)絡(luò)的編碼器和新型全表達(dá)張量分解模型的解碼器組成,以準(zhǔn)確建模三元組。試驗(yàn)結(jié)果表明,該框架在最近的標(biāo)準(zhǔn)鏈路預(yù)測(cè)數(shù)據(jù)集上的性能明顯增強(qiáng)。Adibelli等[22]提出一種基于圖表的知識(shí)圖譜,將實(shí)現(xiàn)各種信息來(lái)源之間的迅速集成,主要通過(guò)從各種異構(gòu)來(lái)源提取的信息邊緣連接它們,從而捕獲了各種不同實(shí)體之間的關(guān)系。Tiwari等[23]提出一種強(qiáng)化學(xué)習(xí)框架中的遠(yuǎn)程意識(shí)獎(jiǎng)勵(lì),為不同的職位分配不同的獎(jiǎng)勵(lì)。此方法集成了圖自關(guān)注(GSA)機(jī)制,從相鄰實(shí)體和關(guān)系中捕獲更全面的實(shí)體信息,結(jié)合GSA機(jī)制和GRU讓模型記住路徑。試驗(yàn)結(jié)果表明,此模型可以顯著降低問(wèn)題的復(fù)雜性,并且為每個(gè)關(guān)系挖掘更平衡的路徑。Kim等[24]提出了一種基于無(wú)監(jiān)督學(xué)習(xí)的開(kāi)放信息提?。∣penIE)系統(tǒng),該系統(tǒng)不需要預(yù)先構(gòu)建數(shù)據(jù)集,從大量的文本文檔中獲取知識(shí),并添加到現(xiàn)有的知識(shí)圖譜中。試驗(yàn)結(jié)果表明,Co-BERT模型的掩碼預(yù)測(cè)精度和顯式排序得分明顯優(yōu)于原始BERT模型。

2 數(shù)據(jù)庫(kù)的選取

目前,尚無(wú)針對(duì)作物栽培管理的知識(shí)圖譜,本文從種植者角度出發(fā),提出采用Neo4j構(gòu)建草莓種植管理知識(shí)圖譜,旨在為種植者提供一種高效快速查詢(xún)草莓栽培管理知識(shí)的方式。Neo4j數(shù)據(jù)庫(kù)是一種以圖形式來(lái)存儲(chǔ)信息的非關(guān)系存儲(chǔ)數(shù)據(jù)庫(kù)。相比于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),Neo4j數(shù)據(jù)庫(kù)為節(jié)點(diǎn)、節(jié)點(diǎn)屬性、邊以及邊屬性等設(shè)計(jì)了一種特殊的存儲(chǔ)方案,可以有效解決農(nóng)業(yè)特殊性、開(kāi)放數(shù)據(jù)共享、農(nóng)業(yè)數(shù)據(jù)繁雜和農(nóng)業(yè)知識(shí)獲取等問(wèn)題。相比傳統(tǒng)數(shù)據(jù)格式,Neo4j數(shù)據(jù)庫(kù)信息更加直觀(guān),而且使用Cypher語(yǔ)言查詢(xún)時(shí),不需要復(fù)雜的連接運(yùn)算。Cypher的查詢(xún)效率不會(huì)隨著數(shù)據(jù)的增加而降低。因此,本文將構(gòu)建一種基于Neo4j的草莓種植管理知識(shí)圖譜。

3 基于Neo4j的草莓種植管理知識(shí)圖譜構(gòu)建

本文中知識(shí)圖譜的構(gòu)建使用的是Mac 3.5.4版本的Neo4j,電腦為 MacBook Pro,處理器為2.6 GHz六核Intel Core i7,操作系統(tǒng)為macOS Big Sur,驗(yàn)證語(yǔ)言為Cypher語(yǔ)言。

本文利用實(shí)體、關(guān)系抽取進(jìn)行知識(shí)獲取,然后構(gòu)建知識(shí)模式層次,最后依次將實(shí)體、屬性和關(guān)系導(dǎo)入Neo4j圖數(shù)據(jù)庫(kù)中。構(gòu)建流程如圖1所示,包括知識(shí)獲取、構(gòu)建圖譜、知識(shí)更新及圖譜應(yīng)用等4個(gè)步驟。

3.1 知識(shí)獲取

關(guān)于草莓的知識(shí)信息數(shù)據(jù)來(lái)源廣泛,本文的草莓知識(shí)來(lái)源于文獻(xiàn)[25-27]、專(zhuān)家(北京市農(nóng)林科學(xué)院研究員、中國(guó)農(nóng)業(yè)科學(xué)院碩士)、網(wǎng)頁(yè)和書(shū)籍等,最終獲取了87個(gè)草莓品種、5種繁殖方式、6個(gè)生育時(shí)期以及22種常見(jiàn)病害等信息。第1步,對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行手動(dòng)篩選,以及文獻(xiàn)和專(zhuān)家所提供的信息進(jìn)行半自動(dòng)補(bǔ)充。但是,這些知識(shí)都以普通文本的方式表達(dá),難以滿(mǎn)足知識(shí)圖譜構(gòu)建的結(jié)構(gòu)需求。第2步,基于遠(yuǎn)程監(jiān)督方法[28]對(duì)篩選和補(bǔ)充的知識(shí)進(jìn)行半自動(dòng)實(shí)體識(shí)別和關(guān)系抽取。其中,得到實(shí)體和關(guān)系包括品種、產(chǎn)地、生育期、繁殖方式、描述、特點(diǎn)、一級(jí)序果重或畝產(chǎn)量、葉片常見(jiàn)病、常見(jiàn)病造成原因等。第3步,用第2步中的實(shí)體與關(guān)系構(gòu)建一個(gè)草莓知識(shí)結(jié)構(gòu)表。

3.2 知識(shí)結(jié)構(gòu)層次構(gòu)建

構(gòu)建知識(shí)圖譜首先需要確定其骨架,即知識(shí)圖譜的數(shù)據(jù)結(jié)構(gòu)層次。常見(jiàn)的構(gòu)建方法包括自頂向下和自底向上的構(gòu)建方法:當(dāng)涉及領(lǐng)域較為成熟、知識(shí)體系完備、涵蓋面廣時(shí),采用自頂向下構(gòu)建方法;自底向上是基于數(shù)據(jù)驅(qū)動(dòng)的構(gòu)建方法。知識(shí)圖譜很少與農(nóng)業(yè)領(lǐng)域相結(jié)合,所以本文利用的是自頂向下和自底向上相結(jié)合的構(gòu)建方法,如圖2所示。從獲取的草莓知識(shí)數(shù)據(jù)中抽取出實(shí)體、屬性及關(guān)系,構(gòu)建模式層。當(dāng)有草莓知識(shí)更新或者培育出新的草莓品種時(shí),采用自底向上的方法更新知識(shí)圖譜。

構(gòu)建模式層以草莓為一級(jí)實(shí)體,以品種、常見(jiàn)病害、生育期、繁殖方式等二級(jí)實(shí)體作為草莓的屬性值,再以豐香、紅顏等三級(jí)實(shí)體作為品種的屬性值,以概述、特點(diǎn)等四級(jí)實(shí)體作為豐香的屬性值。實(shí)體與屬性值之間以“屬性是”的關(guān)系相連(圖3)。

3.3 知識(shí)圖譜構(gòu)建

目前,常見(jiàn)的知識(shí)存儲(chǔ)方式包括基于關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方案[29]、面向RDF的三元組數(shù)據(jù)庫(kù)[30]和圖數(shù)據(jù)庫(kù)等。因?yàn)殛P(guān)系數(shù)據(jù)庫(kù)是利用知識(shí)之間的關(guān)系進(jìn)行存儲(chǔ),所以基于關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方式也是目前主要的一種知識(shí)存儲(chǔ)方法,包含三元組表[31]、水平表和屬性表。RDF被認(rèn)定為是語(yǔ)義數(shù)據(jù)關(guān)聯(lián)的標(biāo)準(zhǔn)格式,也是Web上知識(shí)圖譜的主要數(shù)據(jù)格式之一。

本文將草莓生產(chǎn)管理知識(shí)以RDF三元組的形式呈現(xiàn)給用戶(hù),使用戶(hù)清晰了解每個(gè)實(shí)體之間的相互關(guān)系。

3.3.1 知識(shí)的導(dǎo)入方法。目前,Neo4j數(shù)據(jù)庫(kù)知識(shí)導(dǎo)入方法有3種。第1種是Cypher語(yǔ)言中的CREATE語(yǔ)句??梢噪S時(shí)插入數(shù)據(jù)更新知識(shí),但當(dāng)遇到大規(guī)模數(shù)據(jù)時(shí),會(huì)偶爾出現(xiàn)數(shù)據(jù)重復(fù)、缺漏、錯(cuò)誤等問(wèn)題。第2種是Cypher語(yǔ)言的Load.csv文件的導(dǎo)入,需要將csv文件放入Neo4j的安裝目錄import下,可選擇本地或者遠(yuǎn)程導(dǎo)入,而且不支持即時(shí)更新。第3種是官方提供的Neo4j-admin import工具,這種方法占用資源少,但是需要脫機(jī)導(dǎo)入,且只適用于初始化導(dǎo)入。

本節(jié)基于2.1節(jié)知識(shí)獲取方法得到的數(shù)據(jù)規(guī)模及知識(shí)的更新?tīng)顩r,選用Cypher語(yǔ)言中的CREATE語(yǔ)句以模塊化的構(gòu)建方式構(gòu)建草莓種植管理知識(shí)圖譜,因?yàn)槟K化Cypher語(yǔ)言中的CREATE語(yǔ)句有很強(qiáng)的靈活性。最后可以通過(guò)知識(shí)問(wèn)答查詢(xún)方式為種植管理者提供有效知識(shí)。

3.3.2 模塊導(dǎo)入。第1步,構(gòu)建一級(jí)節(jié)點(diǎn)草莓;第2步,依據(jù)得到的知識(shí)數(shù)據(jù)分別構(gòu)建二級(jí)節(jié)點(diǎn)模塊,包括品種節(jié)點(diǎn)模塊、生育期節(jié)點(diǎn)模塊、繁殖方式節(jié)點(diǎn)模塊、常見(jiàn)病害節(jié)點(diǎn)模塊、灌溉節(jié)點(diǎn)模塊、施肥節(jié)點(diǎn)模塊、環(huán)境控制模塊以及常見(jiàn)病害的造成原因和防治方法模塊。Neo4j圖數(shù)據(jù)庫(kù)會(huì)為導(dǎo)入的每個(gè)節(jié)點(diǎn)自動(dòng)分配一個(gè)整數(shù)ID,而且ID是隨著節(jié)點(diǎn)的導(dǎo)入順序自動(dòng)遞增且唯一。現(xiàn)分別對(duì)每個(gè)模塊的構(gòu)建進(jìn)行詳細(xì)介紹。

(1)品種節(jié)點(diǎn)模塊。品種節(jié)點(diǎn)模塊包含若干個(gè)三級(jí)節(jié)點(diǎn),即不同品種草莓的名字,如豐香、章姬以及紅顏等。每個(gè)三級(jí)節(jié)點(diǎn)都包含節(jié)點(diǎn)的名字、產(chǎn)地、介紹以及特點(diǎn)等屬性。以豐香和紅顏節(jié)點(diǎn)導(dǎo)入為例,具體的CREATE語(yǔ)句如下:

CREATE(豐香:草莓{name:‘豐香’,nationality:‘日本’,introduce:‘休眠很淺,果實(shí)圓錐形,果肉淺紅色,硬度中等,鮮紅色、果面平整、有光澤,外觀(guān)艷麗,植株開(kāi)花早,屬早熟品種。果實(shí)風(fēng)味優(yōu),香甜適口,糖度高而穩(wěn)定,可溶性固形物含量11.25%,一級(jí)序果平均單果重達(dá) 25 g’,feature:‘抗旱、抗寒,果大,適應(yīng)性強(qiáng),花期較能抵抗晚霜危害,抗病性極強(qiáng),不耐長(zhǎng)途運(yùn)輸、不抗白粉病、授粉能力差、畸形果多、著色不良、長(zhǎng)勢(shì)弱、繁殖系數(shù)低’})

CREATE(紅顏:草莓{name:‘章姬’,nationality:‘日本’,introduce:‘紅顏又稱(chēng)紅頰,是日本靜岡縣用幸香與章姬雜交育成的早熟栽培品種良種,株態(tài)直立,葉片大,新莖分枝多,圓錐形,果面紅色、有光澤。果形、果色明顯優(yōu)于豐香,可溶性固形物含量11.8%,一級(jí)序果平均單果重26 g,最大單果重50 g以上’,feature:‘植株長(zhǎng)勢(shì)強(qiáng),易于栽培管理,連續(xù)結(jié)果能力強(qiáng),葉綠、花白、果紅、味佳,豐產(chǎn)、品質(zhì)好、果個(gè)大,色紅、味甜、味濃。硬度大于所有日本品種,根系生長(zhǎng)能力和吸收能力強(qiáng),休眠淺,可抽發(fā)4次花序,各花序可連續(xù)開(kāi)花結(jié)果,中間無(wú)斷檔,對(duì)炭疽病、灰霉病較敏感’})

構(gòu)建好模塊內(nèi)的節(jié)點(diǎn)后,需要建立節(jié)點(diǎn)之間的關(guān)系。本模塊中包括二級(jí)節(jié)點(diǎn)品種和豐香、章姬等三級(jí)節(jié)點(diǎn),所以建立的是上下位關(guān)系。同樣以豐香和紅顏節(jié)點(diǎn)為例,具體的構(gòu)建語(yǔ)句為:

CREATE

(草莓)-[:Include]->(豐香),

(草莓)-[:Include]->(紅顏)

構(gòu)建好品種節(jié)點(diǎn)模塊后,輸入“MATCH n:草莓RETURN n”來(lái)查詢(xún)導(dǎo)入的品種數(shù)目是否與知識(shí)結(jié)構(gòu)表中的品種數(shù)目相同,是否與之匹配。

(2)生育期節(jié)點(diǎn)模塊。生育期節(jié)點(diǎn)模塊包含二級(jí)節(jié)點(diǎn)生育期和萌芽期、營(yíng)養(yǎng)生長(zhǎng)期、現(xiàn)蕾期、旺盛生長(zhǎng)期、花芽分化期、休眠期等三級(jí)節(jié)點(diǎn)。每個(gè)三級(jí)節(jié)點(diǎn)中都有節(jié)點(diǎn)的名字和特點(diǎn)2個(gè)屬性。以旺盛生長(zhǎng)期為例,具體的CREATE語(yǔ)句如下:

CREATE(生長(zhǎng)旺盛期:生育期{name:‘生長(zhǎng)旺盛期’,feature:‘植株開(kāi)始旺盛營(yíng)養(yǎng)生長(zhǎng)時(shí),腋芽萌發(fā)產(chǎn)生大量的匍匐莖,并按一定順序向上長(zhǎng)葉、向下扎根,形成新的幼苗,少數(shù)腋芽形成新莖分枝,新莖基部相繼發(fā)根成苗’})

在導(dǎo)入節(jié)點(diǎn)后,下一步與(1)相同,建立節(jié)點(diǎn)之間的關(guān)系。同樣以生長(zhǎng)旺盛期為例,具體語(yǔ)句為:

CREATE

(草莓)-[:Include]->(生育期),

(生育期)-[:Include]->(生長(zhǎng)旺盛期)

(3)繁殖方式節(jié)點(diǎn)模塊。繁殖方式節(jié)點(diǎn)模塊包含二級(jí)節(jié)點(diǎn)繁殖方式和匍匐莖繁殖、母株分株繁殖、微繁殖、種子繁殖、脫毒組培苗繁殖等三級(jí)節(jié)點(diǎn)。每個(gè)三級(jí)節(jié)點(diǎn)中都有名字和介紹2個(gè)屬性。以匍匐莖繁殖為例,具體的CREATE語(yǔ)句如下:

CREATE(匍匐莖繁殖:繁殖方式{name:‘匍匐莖繁殖’,introduce:‘草莓在生長(zhǎng)旺盛時(shí)期會(huì)抽生大量的匍匐莖,在匍匐莖上產(chǎn)生幼苗。利用這些匍匐莖幼苗進(jìn)行繁殖,稱(chēng)為匍匐莖繁殖。匍匐莖繁殖是在專(zhuān)用苗圃中進(jìn)行的’,feature:‘繁殖系數(shù)高;秧苗質(zhì)量高;有利于輪作,克服重茬;有利于減少病蟲(chóng)害’})

導(dǎo)入此模塊所有三級(jí)節(jié)點(diǎn)后,下一步也需要構(gòu)建節(jié)點(diǎn)之間的關(guān)系。同樣以匍匐莖繁殖為例,具體語(yǔ)句為:

CREATE

(草莓)-[:Include]->(繁殖方式),

(繁殖方式)-[:Include]->(匍匐莖繁殖)

(4)常見(jiàn)病害節(jié)點(diǎn)模塊。常見(jiàn)病害節(jié)點(diǎn)模塊包含二級(jí)節(jié)點(diǎn)常見(jiàn)病害和紅蜘蛛、白粉病等三級(jí)節(jié)點(diǎn)。每個(gè)三級(jí)節(jié)點(diǎn)都有名字和發(fā)病特點(diǎn)2個(gè)屬性。以白粉病為例,具體的CREATE語(yǔ)句為:

CREATE(白粉病:常見(jiàn)病害{name:‘白粉病’,發(fā)病特點(diǎn):‘葉背面出現(xiàn)白色菌絲體;葉片向上卷曲呈湯匙狀;葉背面出現(xiàn)白色粉狀物;暗色污斑;多個(gè)病斑連接成片;病斑布滿(mǎn)葉片,葉緣萎縮,焦枯;花蕾不能開(kāi)放;花瓣呈粉紅色;幼果不能正常膨大,干枯;果實(shí)有大量白粉,失去商品價(jià)值’})

導(dǎo)入此模塊所有三級(jí)節(jié)點(diǎn)后,下一步也需構(gòu)建節(jié)點(diǎn)之間的關(guān)系。同樣以白粉病為例,具體語(yǔ)句為:

CREATE

(草莓)-[:Include]->(常見(jiàn)病害),

(常見(jiàn)病害)-[:Include]->(白粉?。?/p>

(5)常見(jiàn)病害的造成原因節(jié)點(diǎn)模塊。常見(jiàn)病害的造成原因節(jié)點(diǎn)模塊包含二級(jí)節(jié)點(diǎn)造成因素和因素1、2等三級(jí)節(jié)點(diǎn)。以因素1為例,具體的CREATE語(yǔ)句為:

CREATE(因素 1:造成因素{name:‘因素 1’,概述:‘土壤水分含量過(guò)低;土壤次生鹽漬化導(dǎo)致生理性缺水;根系發(fā)育不良’})

導(dǎo)入此模塊所有三級(jí)節(jié)點(diǎn)后,下一步也需構(gòu)建節(jié)點(diǎn)之間的關(guān)系。同樣以因素1為例,具體語(yǔ)句為:

CREATE

(造成因素)-[:Cause]->(常見(jiàn)病害),

(造成因素)-[:Include]->(因素 1)

(6)常見(jiàn)病害的防治方法節(jié)點(diǎn)模塊。此模塊包含二級(jí)節(jié)點(diǎn)解決辦法和方法1、2等三級(jí)節(jié)點(diǎn)。以方法1和方法2為例,具體的CREATE語(yǔ)句為:

CREATE(方法 1:解決方法 {name:‘方法 1’,概述:‘合理水分管理;增施有機(jī)肥,改良土壤結(jié)構(gòu);農(nóng)用灌水,淋洗土壤;合理輪作,生物除鹽;正確使用遮陽(yáng)網(wǎng);化學(xué)藥劑防治’})

CREATE(方法 2:解決方法{name:‘方法 2’,概述:‘農(nóng)業(yè)防治:選擇抗病品種;合理肥水管理;合理密植;加強(qiáng)日常管理。物理防治:調(diào)節(jié)棚室內(nèi)溫、濕度;增加透光性?;瘜W(xué)防治:藥劑熏蒸;合理噴施化學(xué)殺菌劑’})

其中,為了方便構(gòu)建節(jié)點(diǎn)之間的關(guān)系,將解決方法與常見(jiàn)病害按列表一一對(duì)應(yīng)。同樣以方法1和方法2為例,具體語(yǔ)句為:

CREATE

(解決方法)-[:Way]->(常見(jiàn)病害),

(解決方法)-[:Include]->(方法 1),

(解決方法)-[:Include]->(方法 2)

(7)灌溉節(jié)點(diǎn)模塊。此節(jié)點(diǎn)包括二級(jí)節(jié)點(diǎn)灌溉和萌芽期灌溉、營(yíng)養(yǎng)生長(zhǎng)期灌溉等三級(jí)節(jié)點(diǎn)。以營(yíng)養(yǎng)生長(zhǎng)期灌溉為例,具體的CREATE語(yǔ)句為:

CREATE(營(yíng)養(yǎng)生長(zhǎng)期灌溉:灌溉{name:‘營(yíng)養(yǎng)生長(zhǎng)期灌溉’,概述:‘營(yíng)養(yǎng)生長(zhǎng)及后面時(shí)間宜每天早上在日出時(shí)灌溉1次,之后輻射量每積累600 J/cm2,補(bǔ)充灌溉基準(zhǔn)灌溉量的20%。根據(jù)天氣狀況和植株吐水狀況進(jìn)行調(diào)整。進(jìn)行植株管理后的第2天,營(yíng)養(yǎng)生長(zhǎng)期以葉片是否吐水作為調(diào)整灌溉的依據(jù),果期可以適當(dāng)控水,不能完全以吐水為指標(biāo),基質(zhì)排液不要超過(guò)最大溢流量’})

導(dǎo)入此模塊的節(jié)點(diǎn)之后,下一步也需要構(gòu)建節(jié)點(diǎn)之間的關(guān)系,而此模塊的三級(jí)節(jié)點(diǎn)與生育期模塊的三級(jí)節(jié)點(diǎn)一一對(duì)應(yīng)。同樣以營(yíng)養(yǎng)生長(zhǎng)期灌溉為例,具體的語(yǔ)句為:

CREATE

(草莓)-[:Include]->(灌溉),

(灌溉)-[:Include]->(營(yíng)養(yǎng)生長(zhǎng)期灌溉),

(營(yíng)養(yǎng)生長(zhǎng)期)-[:灌溉]->(營(yíng)養(yǎng)生長(zhǎng)期灌溉)

(8)施肥節(jié)點(diǎn)模塊。此節(jié)點(diǎn)包括二級(jí)節(jié)點(diǎn)施肥和萌芽期施肥、營(yíng)養(yǎng)生長(zhǎng)期施肥等三級(jí)節(jié)點(diǎn)。以營(yíng)養(yǎng)生長(zhǎng)期施肥為例,具體的CREATE語(yǔ)句為:

CREATE(營(yíng)養(yǎng)生長(zhǎng)期施肥:施肥{name:‘營(yíng)養(yǎng)生長(zhǎng)期施肥’,概述:‘草莓營(yíng)養(yǎng)生長(zhǎng)時(shí)期,需要補(bǔ)充三大營(yíng)養(yǎng)元素(氮、磷、鉀)、中微量元素和生根、養(yǎng)根、護(hù)根類(lèi)產(chǎn)品,促進(jìn)花芽分化。開(kāi)花前10 d沖施植倍健高磷型水溶肥,以達(dá)到促進(jìn)花芽分化的目的。此階段要補(bǔ)充硼、鈣等中微量元素防止缺素癥的發(fā)生,配合施用氨基酸葉面肥以補(bǔ)充葉面營(yíng)養(yǎng)’})

導(dǎo)入此模塊的節(jié)點(diǎn)之后,下一步也需要構(gòu)建節(jié)點(diǎn)之間的關(guān)系,而此模塊的三級(jí)節(jié)點(diǎn)與生育期模塊的三級(jí)節(jié)點(diǎn)一一對(duì)應(yīng)。同樣以營(yíng)養(yǎng)生長(zhǎng)期施肥為例,具體的語(yǔ)句為:

CREATE

(草莓)-[:Include]->(施肥),

(施肥)-[:Include]->(營(yíng)養(yǎng)生長(zhǎng)期施肥),

(營(yíng)養(yǎng)生長(zhǎng)期)-[:施肥]->(營(yíng)養(yǎng)生長(zhǎng)期施肥)

(9)環(huán)境控制模塊。此節(jié)點(diǎn)包括二級(jí)節(jié)點(diǎn)環(huán)境控制和溫度環(huán)境控制、光照環(huán)境控制等三級(jí)節(jié)點(diǎn)。以溫度環(huán)境控制為例,具體的CREATE語(yǔ)句為:

CREATE(溫度環(huán)境控制:環(huán)境控制{name:‘溫度環(huán)境控制’,概述:‘草莓根系生長(zhǎng)溫度5~30℃,適溫15~22℃,莖葉生長(zhǎng)適溫為20~30℃,芽在-15~10℃發(fā)生凍害,花芽分化期溫度須保持5~15℃,開(kāi)花結(jié)果期4~40℃。草莓越夏時(shí),氣溫高于30℃并且日照強(qiáng)時(shí),需采取遮陰措施’})

導(dǎo)入此模塊的節(jié)點(diǎn)之后,下一步也需要構(gòu)建節(jié)點(diǎn)之間的關(guān)系。同樣以溫度環(huán)境控制為例,具體的語(yǔ)句為:

CREATE

(草莓)-[:Include]->(環(huán)境控制),

(環(huán)境控制)-[:Tempreture]->(溫度環(huán)境控制)

由以上模塊構(gòu)建后相結(jié)合組成初步構(gòu)建好的草莓種植管理知識(shí)圖譜,如圖4所示。

3.4 知識(shí)圖譜更新

構(gòu)建草莓種植管理知識(shí)圖譜的目的是讓更多學(xué)者方便、快速了解草莓知識(shí),但是本知識(shí)圖譜的內(nèi)容可能無(wú)法包含所有的草莓品種以及與草莓相關(guān)的知識(shí),而且隨著科技發(fā)展,會(huì)出現(xiàn)越來(lái)越多的草莓品種。本文所選用的知識(shí)導(dǎo)入方法的最大好處就是可以隨時(shí)更新知識(shí),可以實(shí)現(xiàn)更新的知識(shí)第一時(shí)間出現(xiàn)在知識(shí)圖譜中。

本文構(gòu)建的知識(shí)圖譜中刪減、更新內(nèi)容是利用從底到端的方式進(jìn)行的,一步一步逐層進(jìn)行,防止刪除正確的知識(shí)或者導(dǎo)入更新知識(shí)導(dǎo)致關(guān)系構(gòu)建錯(cuò)誤。

3.5 知識(shí)圖譜的試驗(yàn)驗(yàn)證

3.5.1 Cypher語(yǔ)言查詢(xún)驗(yàn)證。完成草莓知識(shí)圖譜構(gòu)建后,利用Cypher語(yǔ)言對(duì)知識(shí)圖譜進(jìn)行驗(yàn)證。因?yàn)楸疚氖顷P(guān)于草莓的知識(shí)圖譜,所以主要是草莓知識(shí)的查詢(xún)應(yīng)用,下面舉例介紹。

查詢(xún)草莓品種的名字以及哪些品種產(chǎn)地為中國(guó):

MATCH(n:草莓)

RETURN n.name

CASE n.nationality

WHEN′中國(guó)′

THEN 1

ELSE 2 END AS result

上述語(yǔ)句為查詢(xún)圖譜中所有草莓的品種名字,并且標(biāo)記出產(chǎn)地為中國(guó)的草莓,標(biāo)記為1,其他產(chǎn)地的標(biāo)記為2。查詢(xún)結(jié)果如圖5所示。查詢(xún)時(shí)間僅需32 ms,即可得到準(zhǔn)確的草莓產(chǎn)地信息。其中,圖中若result=1,說(shuō)明第一行草莓的產(chǎn)地是中國(guó);如果result=2,說(shuō)明第一行草莓的產(chǎn)地為其他國(guó)家。

查詢(xún)草莓白粉病以及白粉病的防治方法:

match(p:常見(jiàn)病害{name:"白粉病"})return p 或者 match(p:常見(jiàn)病害)where p1.name="白粉病" return p1;

match(p1)-[:WAY]->(缺鋅癥:常見(jiàn)病害{name:‘缺鋅癥’})return p1.概述

查詢(xún)結(jié)果如圖6所示,查詢(xún)時(shí)間僅需22 ms,要比其他查詢(xún)方法節(jié)省很多時(shí)間。

查詢(xún)營(yíng)養(yǎng)生長(zhǎng)期的特點(diǎn):

match(p:生育期{name:"營(yíng)養(yǎng)生長(zhǎng)期"})return p.feature 或者 match(p:生育期)where p1.name="營(yíng)養(yǎng)生長(zhǎng)期" return p1.feature

查詢(xún)結(jié)果如圖7所示,查詢(xún)時(shí)間僅需21 ms。

通過(guò)上述的一些舉例,本文構(gòu)建的知識(shí)圖譜可以利用Cypher語(yǔ)言查詢(xún)到使用者需要的草莓知識(shí),查詢(xún)效率高于網(wǎng)絡(luò)查詢(xún)和書(shū)籍查閱,而且想要查詢(xún)的內(nèi)容消息都是最新更新的,準(zhǔn)確率也較高。

3.5.2 對(duì)比驗(yàn)證。本節(jié)針對(duì)不同使用人群通過(guò)使用不同查詢(xún)途徑做了試驗(yàn)對(duì)比。具體使用人群為種植農(nóng)戶(hù)、農(nóng)學(xué)學(xué)者以及普通用戶(hù),本文從中各選擇了2位;傳統(tǒng)查詢(xún)途徑包括文獻(xiàn)、書(shū)籍以及網(wǎng)絡(luò);測(cè)評(píng)標(biāo)準(zhǔn)包括時(shí)間、準(zhǔn)確率以及全面性。其中,時(shí)間定義為用戶(hù)使用不同方法查詢(xún)到結(jié)果的使用時(shí)間;準(zhǔn)確度定義為由草莓種植專(zhuān)家對(duì)每個(gè)用戶(hù)查詢(xún)得到的知識(shí)進(jìn)行的準(zhǔn)確性評(píng)價(jià);全面性定義為某個(gè)查詢(xún)方法的知識(shí)庫(kù)的內(nèi)容是否全面,知識(shí)是否能滿(mǎn)足使用人群的需要?,F(xiàn)以草莓常見(jiàn)病害的查詢(xún)?yōu)槔瑢鹘y(tǒng)查詢(xún)方法與基于Neo4j知識(shí)圖譜查詢(xún)方法對(duì)比,結(jié)果見(jiàn)表1。

在調(diào)查過(guò)程中發(fā)現(xiàn),不同使用人群的查詢(xún)習(xí)慣不同。比如,種植用戶(hù)通過(guò)網(wǎng)絡(luò)去查詢(xún)或詢(xún)問(wèn)有經(jīng)驗(yàn)的種植者;而農(nóng)學(xué)學(xué)者通過(guò)知識(shí)圖譜查詢(xún)方式進(jìn)行文獻(xiàn)和書(shū)籍查詢(xún);普通用戶(hù)使用網(wǎng)絡(luò)和文獻(xiàn)相結(jié)合的方法查詢(xún)。

從表1可以看出,在查詢(xún)時(shí)間上,基于Neo4j知識(shí)圖譜查詢(xún)方式占據(jù)了絕對(duì)的優(yōu)勢(shì);在準(zhǔn)確率上,種植農(nóng)戶(hù)和農(nóng)學(xué)學(xué)者傳統(tǒng)查詢(xún)方式準(zhǔn)確率要高于知識(shí)圖譜查詢(xún)方式,但是知識(shí)圖譜查詢(xún)方式的平均準(zhǔn)確率要高于傳統(tǒng)查詢(xún)方式;從全面性來(lái)看,知識(shí)圖譜查詢(xún)方式處于劣勢(shì),因?yàn)镹eo4j知識(shí)庫(kù)初步構(gòu)建,需要經(jīng)過(guò)不斷完善。從總體考慮,Neo4j可以作為一個(gè)新型的知識(shí)庫(kù)逐漸代替?zhèn)鹘y(tǒng)的知識(shí)庫(kù)。

表1 草莓常見(jiàn)病害不同查詢(xún)方式對(duì)比

4 存在的問(wèn)題

本文在構(gòu)建知識(shí)圖譜過(guò)程中,遇到了一些不可避免的問(wèn)題。一是在構(gòu)建知識(shí)圖譜時(shí),利用csv文件將草莓知識(shí)進(jìn)行分類(lèi),用loadcsv方式將csv文件導(dǎo)入Neo4j中,但發(fā)現(xiàn)如何對(duì)知識(shí)結(jié)構(gòu)進(jìn)行整理是一大難題,因?yàn)橐患?jí)、二級(jí)、三級(jí)節(jié)點(diǎn)以及它們的屬性各自交叉,因而對(duì)草莓知識(shí)的整理不是那么理想。二是采用CREATE語(yǔ)句構(gòu)建時(shí),發(fā)現(xiàn)語(yǔ)句頗為繁瑣,而且當(dāng)導(dǎo)入大量語(yǔ)句時(shí),會(huì)出現(xiàn)導(dǎo)入速度緩慢問(wèn)題。

5 結(jié)語(yǔ)

本研究提出了一種基于Neo4j的草莓知識(shí)圖譜,該方法根據(jù)草莓知識(shí)的特征,在實(shí)體的基礎(chǔ)上對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化知識(shí)進(jìn)行半自動(dòng)抽取,并利用CREATE語(yǔ)句將知識(shí)圖譜存儲(chǔ)于Neo4j圖數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)實(shí)體交互關(guān)系的可視化展示和研究應(yīng)用。該知識(shí)圖譜在農(nóng)業(yè)智能問(wèn)答、草莓栽培決策和草莓栽培數(shù)據(jù)分析等方面得到應(yīng)用。

本文采用的是自頂而下與由下而上相結(jié)合的模塊化構(gòu)建方式,完成了知識(shí)的導(dǎo)入和關(guān)系的構(gòu)建,確定了清晰的邏輯層次,彌補(bǔ)了CREATE語(yǔ)句導(dǎo)入大數(shù)據(jù)速度慢的缺點(diǎn),精準(zhǔn)度較高。模塊化不僅提高了導(dǎo)入效率,還解決了速度緩慢的問(wèn)題。

本文初步構(gòu)建了草莓種植管理知識(shí)圖譜,但仍然有著很大的改進(jìn)空間,未來(lái)可以在導(dǎo)入方式、知識(shí)抽取、自動(dòng)更新甚至自動(dòng)推理新品種等方面進(jìn)行研究。隨著網(wǎng)絡(luò)數(shù)據(jù)不斷更新,需要對(duì)知識(shí)圖譜知識(shí)進(jìn)行及時(shí)更新和補(bǔ)充,通過(guò)知識(shí)融合、知識(shí)推理等技術(shù),實(shí)現(xiàn)知識(shí)圖譜的自動(dòng)更新。

猜你喜歡
語(yǔ)句圖譜草莓
基于圖對(duì)比注意力網(wǎng)絡(luò)的知識(shí)圖譜補(bǔ)全
圖表
草莓
主動(dòng)對(duì)接你思維的知識(shí)圖譜
我喜歡
冠詞缺失與中介語(yǔ)句法損傷研究
作文語(yǔ)句實(shí)錄
中國(guó)知名官方智庫(kù)圖譜