劉 倩,張向飛,丁永生,2,郝礦榮,2
(1.東華大學(xué)信息科學(xué)與技術(shù)學(xué)院,上海 201620;2.數(shù)字化紡織服裝技術(shù)教育部工程研究中心,上海 201620)
物聯(lián)網(wǎng)是通過(guò)射頻識(shí)別、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,按約定協(xié)議,把任何物品與互聯(lián)網(wǎng)連接起來(lái),進(jìn)行信息交換和通信,以實(shí)現(xiàn)智能化識(shí)別、定位、跟蹤、監(jiān)控和管理的一種網(wǎng)絡(luò)[1-3]。物聯(lián)網(wǎng)為農(nóng)田信息獲取提供了嶄新的思路,將傳感器節(jié)點(diǎn)布設(shè)于農(nóng)田等目標(biāo)區(qū)域,網(wǎng)絡(luò)節(jié)點(diǎn)大量實(shí)時(shí)、精確地采集溫度、濕度、光照、氣體濃度等環(huán)境信息,這些信息在數(shù)據(jù)匯聚節(jié)點(diǎn)匯集,網(wǎng)絡(luò)對(duì)匯集的數(shù)據(jù)進(jìn)行分析,幫助生產(chǎn)者有針對(duì)性地投放農(nóng)業(yè)生產(chǎn)資料等,從而更好地實(shí)現(xiàn)耕地資源的合理高效利用和農(nóng)業(yè)現(xiàn)代化精準(zhǔn)管理,推進(jìn)農(nóng)業(yè)生產(chǎn)的高效管理,提升農(nóng)業(yè)生產(chǎn)效能[4-5]。面向農(nóng)業(yè)物聯(lián)網(wǎng)的多環(huán)境信息融合的監(jiān)測(cè)判別就是在此基礎(chǔ)上的一次實(shí)踐。
信息融合是利用已有的知識(shí)經(jīng)驗(yàn)來(lái)處理從未知世界得到的來(lái)自不同領(lǐng)域的數(shù)據(jù),強(qiáng)調(diào)通過(guò)分析來(lái)自多個(gè)傳感器或多個(gè)數(shù)據(jù)源的信息對(duì)目標(biāo)進(jìn)行識(shí)別估計(jì)或做出某種綜合判斷。數(shù)據(jù)挖掘主要是通過(guò)統(tǒng)計(jì)或人工智能的方法從大量原始數(shù)據(jù)集合中推測(cè)尋找數(shù)據(jù)間復(fù)雜的潛在關(guān)系或蘊(yùn)涵的模型。本文采用模糊推理方法對(duì)采集的環(huán)境信息進(jìn)行決策級(jí)的融合分類(lèi),并引入由關(guān)聯(lián)規(guī)則挖掘所得的知識(shí)庫(kù),定量地分析多種環(huán)境信息的協(xié)調(diào)關(guān)系,從而進(jìn)行多環(huán)境信息融合的監(jiān)測(cè)判別,這不僅是監(jiān)測(cè)農(nóng)業(yè)環(huán)境的有效手段,而且可為動(dòng)態(tài)地控制環(huán)境的各項(xiàng)指標(biāo)提供依據(jù)。
基于多環(huán)境信息融合的監(jiān)測(cè)判別關(guān)鍵是采用合適的分類(lèi)融合算法,將采集來(lái)的多種環(huán)境信息與知識(shí)庫(kù)中的典型關(guān)聯(lián)規(guī)則相結(jié)合,進(jìn)行決策級(jí)融合分類(lèi)以反映農(nóng)田環(huán)境的狀態(tài),同時(shí)建立和諧的人機(jī)交互環(huán)境,從而對(duì)農(nóng)田的環(huán)境狀況進(jìn)行監(jiān)測(cè)控制。
圖1為面向農(nóng)業(yè)物聯(lián)網(wǎng)的多環(huán)境信息融合的監(jiān)測(cè)判別模型框架,通過(guò)分布在農(nóng)田的環(huán)境信息傳感器采集各種環(huán)境信息,將之與從數(shù)據(jù)庫(kù)等媒介中挖掘出的典型關(guān)聯(lián)規(guī)則傳輸?shù)街醒胩幚砟K進(jìn)行信息融合,最后將監(jiān)測(cè)結(jié)果送到用戶交互界面。
圖1 多環(huán)境信息融合監(jiān)測(cè)判別模型框架
關(guān)聯(lián)規(guī)則的挖掘問(wèn)題可形式化地描述如下:設(shè)I= {i1,i2,…,im}是項(xiàng)集合,T= {t1,t2,…,tm}是事務(wù)集合,其中Ati∈I(1≤i≤n)。A?B稱(chēng)為T(mén)中的關(guān)聯(lián)規(guī)則,其中A?I,B?I,A∩B=C。在事務(wù)集合T中,包含A∪B的事務(wù)占全部事務(wù)的百分比稱(chēng)為T(mén)中關(guān)聯(lián)規(guī)則A?B的支持度記為support(A?B)=P(A∪B);包含A∪B事務(wù)占包含A事務(wù)的百分比稱(chēng)為T(mén)中關(guān)聯(lián)規(guī)則A?B的置信度,記為 confidence(A?B)=P(A|B)。設(shè)min_sup是最小支持度閾值,min_conf是最小置信度閾值。若事務(wù)集合T中的關(guān)聯(lián)規(guī)則A?B同時(shí)滿足support=(A?B)≥min_sup和confidence=(A?B)≥min_conf,則A?B稱(chēng)為T(mén)中的強(qiáng)關(guān)聯(lián)規(guī)則。包含k個(gè)項(xiàng)的集合稱(chēng)為k-項(xiàng)集,如果項(xiàng)集滿足最小支持度,則稱(chēng)其為頻繁項(xiàng)集,頻繁k-項(xiàng)集的集合通常記作Lk。
目前有多種產(chǎn)生頻繁項(xiàng)集的算法,最著名的是Agrawal等[6-8]提出的 Apriori算法。Apriori算法使用逐層搜索的迭代方法,k-項(xiàng)集用于搜索 (k+1)-項(xiàng)集,利用“任意頻繁項(xiàng)集的子集都是頻繁項(xiàng)集,任意弱項(xiàng)集的超集都是弱項(xiàng)集”這一性質(zhì)掃描事務(wù)集合。
Apriori算法由兩部分組成。首先使用候選項(xiàng)集找出頻繁項(xiàng)集,基于頻繁k-項(xiàng)集Lk,采用自連接方法產(chǎn)生所有可能頻繁的 (k+1)-項(xiàng)集,即候選 (k+1)-項(xiàng)集Ck+1,再掃描1次事務(wù)集合,統(tǒng)計(jì)Ck+1中每個(gè)候選的支持度,并與最小支持度閾值相比,形成頻繁 (k+1)-項(xiàng)集Lk+1;接著由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則,對(duì)于每個(gè)頻繁項(xiàng)集L,產(chǎn)生L的所有非空子集,對(duì)于L的每個(gè)非空真子集Lu,如果L的支持度除以Lu的支持度大于等于最小置信度閾值,則輸出規(guī)則Lu? (L-Lu)。
模糊推理是采用模糊邏輯并實(shí)現(xiàn)由給定的輸入到輸出的映射過(guò)程,具體表現(xiàn)為運(yùn)用模糊語(yǔ)言規(guī)則,對(duì)已知的模糊判斷或模糊命題進(jìn)行推導(dǎo)而得出新的近似模糊判斷結(jié)論的過(guò)程。模糊推理步驟主要包括:輸入變量模糊化;在模糊規(guī)則前件中應(yīng)用模糊算子;根據(jù)模糊蘊(yùn)含運(yùn)算由前提推斷結(jié)論;模糊合成;輸出變量反模糊化[9]。
利用模糊推理可針對(duì)復(fù)雜系統(tǒng)建立擁有輸入輸出數(shù)據(jù)的模糊推理系統(tǒng),同時(shí)還可與其他人工智能技術(shù)相結(jié)合形成智能融合型模糊推理系統(tǒng)。模糊推理信息融合過(guò)程為模擬人腦處理不確定性信息的過(guò)程,其基本思想可描述為:采用模糊集和隸屬函數(shù)描述多傳感器所獲信息;根據(jù)不同領(lǐng)域?qū)<抑R(shí)建立不同的模糊規(guī)則;利用各種模糊邏輯算子在進(jìn)行模糊推理過(guò)程中實(shí)現(xiàn)多傳感器信息的融合處理;推導(dǎo)出模糊推理信息融合的最終結(jié)果。
從農(nóng)業(yè)數(shù)據(jù)庫(kù)中獲取10組環(huán)境信息與專(zhuān)家監(jiān)測(cè)判別指標(biāo)的分析數(shù)據(jù) (表1)。由于所有的分析數(shù)據(jù)均為非離散的數(shù)值屬性,故應(yīng)先進(jìn)行離散化處理 (表2)。預(yù)處理后的數(shù)據(jù)如表3所示。
表1 歷史數(shù)據(jù)
表2 各因子離散化等級(jí)
表3 預(yù)處理后的數(shù)據(jù)
設(shè)min_sup=20%,min_conf=60%。根據(jù)Apriori算法編寫(xiě)程序,搜索原始數(shù)據(jù)表,得到滿足最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī)則(表4)。這些關(guān)聯(lián)規(guī)則的左邊為各種環(huán)境信息所對(duì)應(yīng)的等級(jí)值,右邊為監(jiān)測(cè)結(jié)果所對(duì)應(yīng)的等級(jí)值。
表4 關(guān)聯(lián)規(guī)則挖掘結(jié)果
根據(jù)表2的各因子離散化等級(jí),確定各種環(huán)境信息和監(jiān)測(cè)結(jié)果的隸屬函數(shù),為保證基于模糊推理的信息融合的實(shí)時(shí)性和快速性,采用三角形隸屬函數(shù)。接著,將表4的關(guān)聯(lián)規(guī)則挖掘結(jié)果轉(zhuǎn)換成相應(yīng)的模糊規(guī)則,如關(guān)聯(lián)規(guī)則A1C1?E3可解釋為當(dāng)溫度信息屬于等級(jí)1,CO2濃度屬于等級(jí)1時(shí),監(jiān)測(cè)結(jié)果屬于等級(jí)3,此時(shí)模糊規(guī)則可表示為If(A is A1)and(C is C1)then(E is E3)。
最后對(duì)基于模糊推理信息融合的多環(huán)境信息融合監(jiān)測(cè)判別進(jìn)行仿真研究,通過(guò)MATLAB語(yǔ)言編程來(lái)實(shí)現(xiàn)這一過(guò)程。用addvar函數(shù)定義基于模糊推理信息融合的各種環(huán)境信息的輸入變量和監(jiān)測(cè)結(jié)果的輸出變量,用addmf函數(shù)定義模糊推理系統(tǒng)輸入、輸出變量的隸屬函數(shù),用 rulelist函數(shù)和addrule函數(shù)來(lái)定義模糊規(guī)則,至此,基于多環(huán)境信息融合監(jiān)測(cè)判別的模糊系統(tǒng)已經(jīng)設(shè)計(jì)完成。此外,還可利用showrule函數(shù)查看模糊推理系統(tǒng)的模糊規(guī)則,利用fuzzy函數(shù)調(diào)用模糊推理系統(tǒng)的圖形用戶界面,進(jìn)行信息融合的控制決策仿真,在圖形用戶界面下,還可以查看模糊推理的過(guò)程示意圖。通過(guò)命令窗口,利用evalfis函數(shù)進(jìn)行實(shí)時(shí)仿真,將實(shí)際監(jiān)測(cè)結(jié)果與仿真所得信息融合結(jié)果比較 (表5),5組數(shù)據(jù)中僅1組結(jié)果有較大偏差,正確率達(dá)80%以上。
本研究探討了將模糊推理的方法運(yùn)用到基于多環(huán)境信息融合的監(jiān)測(cè)判別,并引入關(guān)聯(lián)規(guī)則挖掘,將基于典型數(shù)據(jù)挖掘出的關(guān)聯(lián)規(guī)則轉(zhuǎn)換成相應(yīng)的模糊規(guī)則后,監(jiān)測(cè)識(shí)別率有明顯的提高。從關(guān)聯(lián)規(guī)則挖掘到信息融合分類(lèi),再到最后的監(jiān)測(cè)判別,其中的Apriori算法在產(chǎn)生關(guān)聯(lián)規(guī)則的同時(shí),由于要多次掃描數(shù)據(jù)庫(kù)并產(chǎn)生大量的候選集,故在算法的計(jì)算復(fù)雜度方面還有待改進(jìn);其次,測(cè)試數(shù)據(jù)量有待進(jìn)一步增加,從而使得測(cè)試結(jié)果更具精確性和說(shuō)服力;最后,在多環(huán)境信息融合監(jiān)測(cè)判別模型框架中,關(guān)聯(lián)規(guī)則挖掘之前的異構(gòu)數(shù)據(jù)庫(kù)數(shù)據(jù)集成和信息抽取,以及模糊推理信息融合后的人機(jī)交互界面均有待進(jìn)一步設(shè)計(jì),從而完成整個(gè)系統(tǒng)的集成。
表5 實(shí)際監(jiān)測(cè)結(jié)果與信息融合結(jié)果的比較
[1] Teixeira L,Hachem S,Issarny V,et al.Service oriented middleware for the internet of things:A perspective[M] //Towards a Service-Based Internet.Springer Berlin Heidelberg,2011:220-229.
[2] Kulkarni R V, Forster A, Venayagamoorthy G K.Computational intelligence in wireless sensor networks:A survey[J].IEEE Communications Surveys & Tutorials,2011,13(1):68-96.
[3] Atzori L,Iera A,Morabito G.The internet of things:a survey [J].Computer Networks,2010,54:2787-2805.
[4] 張飛舟,楊東凱,陳智.物聯(lián)網(wǎng)技術(shù)導(dǎo)論 [M].北京:電子工業(yè)出版社,2010:6.
[5] 彭力.物聯(lián)網(wǎng)技術(shù)概論 [M].北京:北京航空航天大學(xué)出版社,2011:9.
[6] Agrawal R,Srikant R.Fast algorithm for mining association rules[C].Proceedings of the20th International Conference on Very Large Data Bases.Santiago Chile,1994:487-499.
[7] Srikant R,Agrawal R.Mining quantitative association rules in large relational tables[C].Proceedings of the ACM-SIGMOD Conference on Management of Data.Washington D C,1996:1-12.
[8] Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[A].Proceedings of the ACM SIGMOD International Conference on Management of Data,1993:207-216.
[9] 丁永生.計(jì)算智能:理論、技術(shù)與應(yīng)用[M].北京:科學(xué)出版社,2004.