余宏杰,高 星
(安徽科技學院,安徽 滁州 233000)
近年來,隨著人工智能技術和大數(shù)據(jù)分析技術的不斷發(fā)展,水稻病害防控模型及知識圖譜建設逐漸成了解決這個問題的有效途徑。水稻病害防控模型可以通過對歷史數(shù)據(jù)、氣象數(shù)據(jù)等多項因素進行分析,預測出病害發(fā)生的可能性,并提供相應的防治措施和技術指導。而水稻病害防控知識圖譜則是通過對專家知識進行系統(tǒng)整理和分類,構建起一張全面的、結構化的、層次化的知識網(wǎng)絡,為農民提供科學合理的防治方案和技術指南。
1.1.1 侵染性病害
侵染性病害指的是那些通過感染植株并侵入其內部而引起病害的病原體,如真菌、細菌、病毒等。這些病原體可以通過水、土壤、氣體和其他宿主植物等途徑傳播[1]。
稻瘟病是一種由水稻赤霉菌引起的病害,它主要侵染水稻的葉片、莖稈和穗部。初期表現(xiàn)為葉片出現(xiàn)黃斑,后期則出現(xiàn)黑色霉層,嚴重時可導致植株死亡。稻紋枯病是由水稻紋枯病菌引起的,它主要侵染水稻的根部和莖稈,導致植株生長緩慢、倒伏甚至死亡。稻癭蚊病則是由稻癭蚊傳播的一種病毒,它會導致水稻穗部變形不良,產量大幅下降。
1.1.2 非侵染性病害
(1)水稻營養(yǎng)缺乏
水稻缺乏氮、磷、鉀等元素會導致植株生長不良、葉片黃化、凋萎等現(xiàn)象,從而使植株抗病能力降低,容易發(fā)生病害。例如,氮缺乏會使水稻發(fā)生“黃葉病”,磷缺乏會使水稻發(fā)生“倒伏病”。
(2)溫度和濕度變化
水稻生長需要適宜的溫度和濕度條件。若溫度過高或過低、濕度過大或過小,都會導致水稻生長不良,從而影響水稻的免疫力。例如,夏季高溫多雨容易引發(fā)“紋枯病”,而春季寒濕則容易引發(fā)“白葉枯病”。
(3)土壤酸堿度不平衡
土壤酸堿度不平衡也會影響水稻的生長發(fā)育和免疫力。如土壤過酸或過堿,會導致水稻營養(yǎng)吸收不良、根系發(fā)育不健全,從而影響水稻的抗病能力。例如,土壤酸化會使水稻發(fā)生“赤斑病”。
1.2.1 氣象因素
溫度:水稻生長需要適宜的溫度條件,過高或過低的溫度都會影響水稻的生長發(fā)育。通常情況下,25~35℃為水稻生長的最適溫度范圍。如溫度過高,水稻易受到“紋枯病”“白葉枯病”等真菌病害的侵襲。如果溫度過低,則容易發(fā)生“冷害”“倒伏病”等病害。此外,氣溫變化幅度較大也會影響水稻的生長發(fā)育和免疫力,如晝夜溫差過大會導致水稻產生“斑枯病”。
濕度:過高或過低的濕度都會對水稻產生不良影響,在干旱和缺水的情況下,水稻的免疫能力降低,易受到“白葉枯病”“赤斑病”等病害的侵襲。而在潮濕和多雨的環(huán)境下,水稻容易受到“紋枯病”“灰色稻瘟”“稈腐病”等病害的侵襲。
光照:光照不足會導致水稻生長緩慢、抗病能力下降,容易受到病害的侵襲。例如,在陰雨天氣下容易發(fā)生“苔蘚病”,因為光照不足導致水稻生長緩慢,從而使得苔蘚在水稻上生長繁殖。
風力: 風力會直接影響水稻的生長和發(fā)展,同時也會間接影響水稻的抗病能力。強風會引起水稻倒伏,容易受到“倒伏病”“紋枯病”等病害的侵襲[2]。此外,風力還會影響水稻生長環(huán)境中的溫度、濕度和氣壓等氣象因素,進而影響水稻的免疫能力。
1.2.2 非侵害性因素
本次研究中,相關工作人員以稻瘟病作為研究對象,分析非侵害性因素對水稻生長的影響。稻瘟病會在水稻的葉片、稈和穗上形成黑色或深棕色的斑點,進而導致葉片變黃、凋萎、枯死,嚴重的情況下導致整個水稻植株倒伏。其次,稻瘟病會破壞水稻的光合作用和營養(yǎng)吸收,導致水稻生長緩慢、畸形等現(xiàn)象。據(jù)統(tǒng)計,稻瘟病每年給全球范圍內的水稻生產帶來約30 億美元的經濟損失,其中包括直接損失和間接損失。直接損失主要表現(xiàn)為由于稻瘟病菌感染導致的水稻減產;間接損失則包括種子、農藥等成本增加、勞動力浪費等(詳見表1)。
表1 稻瘟病造成的損失
表2 水稻病害主要影響因子
此外,稻瘟病會降低水稻免疫能力,使水稻更容易受到其他病原體和環(huán)境因素的侵襲,從而增加水稻發(fā)生其他病害的風險。例如,稻瘟病和白葉枯病、紋枯病、褐飛虱等病害的發(fā)生有著密切的關系。研究人員將經過篩選的水稻病害影響因子繪制為表格,為構建知識圖譜以及水稻病害防控模型提供數(shù)據(jù)基礎。
針對稻瘟病這一典型的水稻病害,知識抽取的過程可以分為以下幾個步驟:
2.1.1 文本預處理
首先需要對水稻病害相關文本進行預處理,主要包括去除停用詞、分詞、詞性標注等。這一步驟目的是將原始文本轉化為計算機可讀的數(shù)據(jù)結構,方便后續(xù)的語義分析和知識抽取。
2.1.2 實體識別
接下來需要進行實體識別,即從文本中識別出與稻瘟病相關的實體,如“水稻”“病原菌”“抗病品種”等。實體識別可以采用基于規(guī)則或機器學習的方法,其中機器學習方法通常會使用已標注的訓練數(shù)據(jù)進行模型訓練,以提高實體識別的準確率和召回率。
2.1.3 關系抽取
在實體識別的基礎上,可以進行關系抽取,即從文本中提取出實體之間的關系。在稻瘟病的防治中,可能涉及多種關系類型,如“水稻-病原菌”“水稻-抗病品種”等。關系抽取也可以采用基于規(guī)則或機器學習的方法,其中機器學習方法通常會結合實體識別和語義角色標注等技術進行模型訓練。
2.1.4 知識表示
將從文本中抽取出來的知識信息轉化為結構化的語義表示形式。在稻瘟病的防治中,可以采用本體論語言OWL 進行知識表示,通過定義相關的類、屬性、實例等元素,構建稻瘟病害防治知識圖譜[3]。同時需要考慮如何與現(xiàn)有的知識庫進行融合,以便于更好地支持知識的查詢和應用。
首先,研究人員需要收集稻瘟病方面的相關資料和文獻,包括其發(fā)生原因、病害特征、病理機制、防治措施等方面的內容。這些資料可以從書籍、期刊、報紙、專業(yè)網(wǎng)站等多個渠道獲取。通過閱讀和篩選,研究人員可以找到最權威、最全面的資料,為后面的知識加工提供基礎。
其次,在收集到稻瘟病方面的知識后,研究人員需要進行分類整理??梢詫⑵浒凑詹≡?、病害特征、發(fā)生季節(jié)、防治措施等進行分類,方便知識的組織和表達。同時,還可以對重要的知識點進行標注和歸類,以便更好地呈現(xiàn)知識脈絡。
再次,針對稻瘟病的每一個知識點,研究人員需要進行進一步的分析和概括。例如,對于病原菌方面的知識點,研究人員可以將其分為病原菌的特征、生長條件、傳播方式等多個方面進行詳細解釋,并對其相關實驗數(shù)據(jù)進行統(tǒng)計和分析,從而提高知識的可信度和說服力。
最后,研究人員需要將整理好的知識點進行組合和排版,形成具有邏輯性和連貫性的知識圖譜。在組合時,研究人員需要注意各個知識點之間的關聯(lián)和銜接,以便形成一個完整的知識體系。同時,在排版時,還需要注意知識點之間的層次關系和重要性,使得讀者可以更加清晰地理解和掌握知識。
2.3.1 收集最新科研成果
稻瘟病的防治方法主要是通過化學藥劑噴灑或者生物防治來進行,而這些方法都需要有科學依據(jù)的支持。因此,在進行知識更新時,首先需要收集最新的稻瘟病研究成果,包括相關的文章、報告、論文等,以了解最新的病理機制、藥劑研發(fā)和生物防治方法等方面的進展。
2.3.2 進行數(shù)據(jù)整合和篩選
收集到的研究成果可能會比較零散和繁雜,因此需要進行數(shù)據(jù)整合和篩選。將已有的知識點和新發(fā)現(xiàn)的知識點進行對比和篩選,將其中最有價值的知識點加入知識圖譜中。
2.3.3 更新知識圖譜
在數(shù)據(jù)整合和篩選完畢后,就可以開始更新知識圖譜了。將新的知識點添加到已有的知識圖譜中,并將其與已有的知識點進行關聯(lián)和分類。通過不斷地更新和優(yōu)化,使得知識圖譜能夠更好地反映出稻瘟病的防治方法和技術進展。
2.3.4 驗證更新效果
為了保證更新后的知識圖譜的準確性和實用性,需要對其進行驗證??梢匝埾嚓P領域的專家或者實踐工作者對更新后的知識圖譜進行審核和評估,以確保其能夠滿足用戶需求和實際應用要求。
知識圖譜可視化是將知識圖譜中的數(shù)據(jù)信息以可視化形式展現(xiàn)出來,以便于用戶更加直觀地理解和使用。在水稻病害防治知識圖譜建設過程中,對于稻瘟病這一重要病害,進行可視化展示可以幫助用戶更好地了解該病害的特征、預防和治療方法等方面的知識[4]。
首先,需要對知識圖譜中關于稻瘟病的數(shù)據(jù)進行整合和清洗。這些數(shù)據(jù)包括稻瘟病的病因、癥狀、傳播途徑、防治措施等相關信息。在整合數(shù)據(jù)時,需要注意數(shù)據(jù)的準確性和完整性,保證數(shù)據(jù)的可靠性和有效性。
接下來,可以采用可視化工具對整合后的數(shù)據(jù)進行可視化展示。常見的可視化工具有Neo4j、Gephi、GraphViz 等。其中,Neo4j 是目前市場上較為成熟的高性能圖數(shù)據(jù)庫,自帶有展示界面,廣泛應用在市面上的知識圖譜中。
在利用Neo4j 進行可視化展示時,可以根據(jù)數(shù)據(jù)的特點進行節(jié)點和邊的選擇。例如,對于稻瘟病的病因節(jié)點,可以選擇標注其名稱、病原體類型、感染途徑等信息;對于防治措施節(jié)點,可以選擇標注其名稱、作用機理、使用方法等信息。同時,可以通過節(jié)點的大小和顏色來反映節(jié)點的重要程度和屬性特征(如圖1 所示)。
圖1 水稻病害稻瘟病知識圖譜可視化
此外,在進行可視化展示時,還可以將知識圖譜與其他相關數(shù)據(jù)進行聯(lián)合展示,例如圖片、視頻等。這些數(shù)據(jù)可以更加直觀地展現(xiàn)稻瘟病的癥狀和防治方法,進一步提高用戶的理解和應用能力。
最后,為了更好地實現(xiàn)知識圖譜的可視化效果,可以采取交互式展示方式,例如通過鼠標滾輪放大縮小圖形、拖動節(jié)點位置等操作。這樣可以讓用戶更加靈活地控制展示內容,從而更好地實現(xiàn)知識圖譜的可視化效果。
在構建水稻病害防控模型過程中,推理算法主要包括以下步驟:
3.1.1 數(shù)據(jù)采集
首先需要收集大量的水稻病害相關數(shù)據(jù),包括病害類型、發(fā)生時間、地點、氣候條件、土壤條件等信息。這些數(shù)據(jù)可以從各大農業(yè)科研機構、農場、農民等處獲得。
3.1.2 數(shù)據(jù)清洗
由于采集到的數(shù)據(jù)往往存在噪聲和異常值,需要進行數(shù)據(jù)清洗,剔除無效數(shù)據(jù)和異常數(shù)據(jù),確保數(shù)據(jù)的準確性和完整性。
3.1.3 特征提取
接下來需要對數(shù)據(jù)進行特征提取,從中提取出可以用于推理的特征。例如,可以從氣象數(shù)據(jù)中提取溫度、濕度、降雨量等特征,從土壤數(shù)據(jù)中提取pH 值、有機質含量等特征,從病害數(shù)據(jù)中提取病害類型、發(fā)生時間等特征。
3.1.4 規(guī)則定義
在推理算法中,需要定義一系列規(guī)則,用于判斷當前情況下是否存在水稻病害。例如,當氣溫高于30 度且濕度大于70%時,可能會出現(xiàn)白葉枯病的情況。
3.1.5 推理過程
根據(jù)已有的規(guī)則和特征,進行推理,得出新的結論或行動。例如,當某個地區(qū)的溫度、濕度、土壤pH 值等符合白葉枯病的條件時,系統(tǒng)可以給出相應的防治措施,如噴灑藥劑、改變灌溉方式等。
3.1.6 模型優(yōu)化
最后需要對模型進行優(yōu)化,不斷地調整規(guī)則和特征提取方法,以提高模型的準確性和魯棒性(如圖2 所示)。
圖2 水稻病害推理模型
病害相關性計算。將支持向量機的預測值和知識圖譜中的案例索引兩者進行檢索匹配,并通過相關性計算,將相關性按降序排序,得到最有可能發(fā)生的病害類型。其中,病害相關性計算公式如(1-1)所示:
其中,病害相關性用Ri表示,指匹配到病害類型的相似度; Vi表示匹配到的單個綜合指標權重; n 為匹配到的所有病害類型個數(shù)。
基于病害相關性計算公式,本文收集了2022年安慶市的樣本數(shù)據(jù),以旬為單位(表3),針對水稻發(fā)育全過程(十旬)中,各項主成分因素標定標簽等級。
表3 提取的主成分指標數(shù)據(jù)
分析表4 可以發(fā)現(xiàn),上述四種水稻病害類型中,稻瘟病的發(fā)病概率最高,剩余三種水稻病害發(fā)病概率持平。因此,研究人員初步確診水稻病害為稻瘟病[5]。
表4 病害相關性計算
水稻作為我國的主要糧食作物之一,其產量和質量對于糧食安全和農業(yè)經濟發(fā)展具有重要意義。然而,隨著氣候變化和種植技術的不斷提高,水稻病害問題也日益突出。為了有效地防控水稻病害,我們需要建立科學的防控模型和知識圖譜。本文通過梳理已有的相關文獻和案例,分析了水稻病害防控模型的構建方式和知識圖譜的實現(xiàn)方法。其中,基于機器學習的模型和基于專家系統(tǒng)的模型都具有一定優(yōu)勢,可以根據(jù)實際情況選擇最適合的模型進行構建。同時,通過構建知識圖譜將各類數(shù)據(jù)和知識按照語義和關系進行整合和組織,可以幫助我們更好地理解和利用相關信息,從而提高水稻病害的預測、診斷和防控能力。目前,知識圖譜的構建技術還在不斷發(fā)展和完善中,未來將會有更多的創(chuàng)新和應用。