呂竹青
(1. 中國科學院合肥物質(zhì)科學研究院 技術(shù)生物與農(nóng)業(yè)工程研究所, 合肥 230031; 2. 中國科學技術(shù)大學 研究生院科學島分院, 合肥 230026)
隨著人工智能和先進傳感器技術(shù)的發(fā)展,基于無線網(wǎng)絡(luò)(Wireless Sensor Network)的監(jiān)測技術(shù)廣泛應(yīng)用于各個行業(yè)和領(lǐng)域,包括對蜂群的監(jiān)測和監(jiān)控[1],可用于對蜂群狀況的實時在線監(jiān)測,為開展蜜蜂行為、生態(tài)等研究提供了重要的平臺,同時相關(guān)系統(tǒng)也被推廣應(yīng)用到養(yǎng)蜂實踐中,不僅可以節(jié)省養(yǎng)蜂勞力,也開辟了精準養(yǎng)蜂(Precision Apiculture)新業(yè)態(tài)。
分蜂是一種蜂群增殖的方式[2]。在分蜂過程中,蜂群中的老蜂王會帶領(lǐng)幾乎一半的工蜂離開舊巢,并在離舊巢數(shù)公里外的地方建立新巢[3]。這樣,原來蜂群從事采蜜的工蜂減少了,給蜂農(nóng)帶來較大損失。因此,科研人員和蜂農(nóng)希望找到一個方法,在不開箱檢查的情況下,就可以預(yù)判蜂群是否準備分蜂。研究發(fā)現(xiàn)分蜂與幼蜂、工蜂數(shù)量、蜂王信息素含量,以及蜂巢環(huán)境等因素有關(guān)[2],這些因素的變化會改變蜂巢內(nèi)相關(guān)信息參數(shù),如溫度、濕度和聲音等。研究人員根據(jù)這些信息參數(shù)開發(fā)出各種預(yù)測分蜂的監(jiān)控系統(tǒng)。例如,Meitalovs等設(shè)計了基于蜂箱內(nèi)溫度和濕度的自動監(jiān)控系統(tǒng)[4],Zacepins等針對蜂群分蜂設(shè)計了遠程溫度監(jiān)控系統(tǒng)[5]。
Ferrari等對分蜂過程中蜂箱內(nèi)溫度、相對濕度以及聲音變化進行了分析[2],Bencsik等對分蜂過程中巢脾的振動進行了分析[6],這些研究認為蜂群聲音可能是預(yù)測分蜂的關(guān)鍵參數(shù)。Mezquida等設(shè)計了基于蜂群聲音的監(jiān)控系統(tǒng)[7]。Ferrari對分蜂過程中的蜂群聲音信號的幅值和頻率進行了分析,Pérez獲取了分蜂現(xiàn)象的頻譜特征[8],但未發(fā)現(xiàn)特定的規(guī)律。考慮到實際蜂場中環(huán)境噪聲的影響,需要對蜂群聲音信號特征進行進一步的研究,提取蜂群聲音信號關(guān)鍵特征用于分蜂預(yù)測。
本文以中華蜜蜂為對象,通過人工制造分蜂過程,采集分蜂前后蜂群的聲音片段,根據(jù)不同類型聲音片段功率譜密度的差異,采用LabVIEW編寫程序提取蜂群聲音功率比特征參數(shù),并利用機器學習算法對蜂群分蜂聲音特征進行分析,以期得到一種能夠快速識別正常蜂群和分蜂蜂群聲音的識別器。
實驗在合肥市蜀山區(qū)蜀山湖路350號(117.17°E, 31.91°N)進行。實驗蜂群為兩群中華蜜蜂(ApisceranaceranaFabricius),用小型蜂箱(17 cm×27 cm×27 cm)飼養(yǎng),未發(fā)現(xiàn)螨蟲、蠟螟等病害,每個巢內(nèi)有一個蜂王和約8000只工蜂。實驗前蜂群主要依靠自己采集花蜜和花粉,同時適當補喂一些糖漿。
通過限制蜂王飛行實現(xiàn)“人工分蜂”是一種目前廣泛應(yīng)用的研究蜂群分蜂現(xiàn)象的實驗方法,基本實驗步驟由Morse提出[9],被Seeley標準化[10]。此方法在研究分蜂“piping”聲音[11-12]、分蜂時群體決策行為[13]、分蜂“buzz-run”[14]、蜂群搜尋行為[15]、分蜂時蜂王信息素變化[16]等方面一直被眾多研究者使用。
實驗集中在2017年的5—6月。參考Morse論文中介紹的方法[9],人為創(chuàng)造分蜂過程,具體做法是:將蜂王關(guān)在王籠中(3.7 cm×1.7 cm×5.4 cm),懸掛于兩側(cè)為細孔網(wǎng)密封的木箱中(15 cm×25 cm×35 cm),并將蜂群倒入該木箱。使用蔗糖溶液(蔗糖與水體積比為1∶1)喂養(yǎng)蜂群3~4 d,待蜂群出現(xiàn)準備分蜂的典型特征——產(chǎn)生大量蠟鱗[17]后,去掉小型蜂箱內(nèi)的巢脾,將王籠(含蜂王)放置到小型蜂箱中的隔板中心,并放置在蜂箱中部,木箱中的蜂群倒入蜂箱,30~60 min內(nèi)工蜂將聚集在蜂王周圍,與自然分蜂一樣,此時蜂群開始尋找新巢[10,18-20],并在幾小時或幾天后開始分蜂。由于蜂王仍囚禁在王籠中,飛離的蜂群會重新返回蜂箱,幾小時后或第2天蜂群會再次產(chǎn)生分蜂現(xiàn)象,這種方法可以觀察到多次分蜂現(xiàn)象。
采用全指向性麥克風ECM-3005(德國Monacor公司,響應(yīng)頻率為50~16 000 Hz)采集蜂群聲音,該麥克風放置在蜂群中部,此處是蜂王產(chǎn)卵較為集中的位置,蜂群為產(chǎn)卵提供較為穩(wěn)定的溫度,哺育行為較為集中,是蜂群較為活躍的場所[21],為了避免蜂群在麥克風涂抹蠟層影響采集效果,同時也避免蜜蜂在麥克風上爬行的聲音干擾,在放置麥克風前,在麥克風上放置海綿套。麥克風經(jīng)屏蔽線連接到電腦。錄音軟件采用 Adobe Audition CS6,采樣頻率為16 kHz,采樣精度為32bit,數(shù)據(jù)存儲為*.wav格式。
美國的科研設(shè)備通常位于聯(lián)邦資助研發(fā)中心(FFRDC),由政府資助或部分資助。作為當今世界上最發(fā)達的國家,美國擁有值得學習和借鑒的先進經(jīng)驗。
實驗共記錄到5組分蜂現(xiàn)象,利用Adobe Audition CS6將5組聲音信號剪切成長度為1 s的聲音片段,從每組聲音信號中隨機選取50個聲音片段,共獲取250個聲音片段;選取5次與分蜂時間對應(yīng)的正常蜂群聲音和2次與分蜂不對應(yīng)的正常蜂群聲音,用同樣方法隨機選取350個聲音片段。
蜂群聲音信號屬于隨機信號,可以用平均功率譜密度來區(qū)分,具體分析方法可詳見其他文獻[22-23]。本研究利用LabVIEW編寫的程序?qū)Ψ淙旱穆曇暨M行特征提取與分類識別。
1.4.1 預(yù)處理
蜂群聲音主要集中在2000 Hz以下[2],使用截止頻率為2000 Hz的巴特沃斯(Butterworth)低通濾波器濾波處理數(shù)據(jù)。為減少邊緣效應(yīng)和頻譜泄漏,采用漢明窗進行加窗分幀處理[24-25],漢明窗函數(shù)ω(n)表達式為:
(1)
式中:n為第n個采樣點,N為單位幀的采樣數(shù)。
1.4.2 信號特征提取
功率譜密度(PSD)可以反映信號的頻率特征,利用離散傅里葉變換(DFT)來計算。第m幀聲音信號Sm(k)的離散傅里葉變換為:
(2)
(3)
頻率范圍為n~m內(nèi)的功率W為
(4)
式中:fr為頻率分辨率。
將研究的頻率范圍劃分為若干區(qū)間,每個區(qū)間稱為一個子帶,子帶k的功率比Dk為
(5)
1.4.3 分類預(yù)測
利用分類回歸決策樹(classification and regression tree, CART)算法對蜂群聲音子帶功率比數(shù)據(jù)進行分類,已有數(shù)據(jù)中隨機選取70%的數(shù)據(jù)為訓練集,30%的數(shù)據(jù)為測試集。根據(jù)訓練集數(shù)據(jù)建立決策樹模型用于預(yù)測分蜂,并利用測試集對分蜂預(yù)測模式的準確性進行驗證[26]。分析都是利用R軟件完成。
預(yù)分蜂狀態(tài)下的蜂群聲音明顯強于正常狀態(tài)的蜂群聲音(圖1、2),這與分蜂前蜂群興奮狀態(tài)有關(guān)。因此,根據(jù)蜂群聲音信號幅度來預(yù)測分蜂狀態(tài)是可行的。但是,由于蜂群、采集設(shè)備、傳感器安裝位置的不同以及環(huán)境對蜂群聲音采集造成的潛在影響,不適合采用閾值法分析蜂群聲音特征,故本文采用功率密度對蜂群聲音進行處理分析。從圖1和圖2可以看到,正常狀態(tài)與預(yù)分蜂狀態(tài)明顯發(fā)生了頻移,正常狀態(tài)和預(yù)分蜂狀態(tài)的主要頻率分別集中于100~200 Hz和450~550 Hz,這個結(jié)果與Ferrari的研究結(jié)果[2]基本一致。
將頻率0~2000 Hz劃分為5個子帶,分別為D1(0~200 Hz)、D2(200~400 Hz)、D3(400~600 Hz)、D4(600~1000 Hz)、D5(1000~2000 Hz),計算預(yù)分蜂狀態(tài)和正常狀態(tài)下各個子帶的功率比,如表1 所示。
預(yù)分蜂狀態(tài)下200~400 Hz的功率比為(57.99±0.74)%,遠大于此區(qū)間正常狀態(tài)下的功率比;正常狀態(tài)下0~200 Hz與600~800 Hz的功率比大于預(yù)分蜂狀態(tài)在此區(qū)間的功率比。子帶功率比可以很好的區(qū)分預(yù)分蜂狀態(tài)與正常狀態(tài),預(yù)測分蜂。
圖 1 預(yù)分蜂狀態(tài)下蜂群聲音信號時域圖(A)與功率譜密度(B)
圖 2 正常狀態(tài)下蜂群聲音信號時域圖(A)與功率譜密度(B)
表1 分蜂與正常狀態(tài)下蜂群聲音子帶功率比(平均值±標準誤)
根據(jù)子帶功率比數(shù)據(jù),利用CART決策樹算法建立分蜂預(yù)測模型(見圖3)。以最左側(cè)分支(分蜂/0.01/40%)為例簡單介紹此決策樹,自上而下從根節(jié)點開始,一個信號進入決策樹后,首先對其屬性特征D2與決策樹自動生成的閾值T=29進行比較,若大于等于29,則進入內(nèi)部節(jié)點繼續(xù)取其屬性特征D4與閾值2.9比較,若小于2.9,則進入葉節(jié)點(分蜂/0.01/40%)。其中“分蜂”表示進入此葉節(jié)點的信號為分蜂聲音信號;“0.01”表示此葉節(jié)點中含有1%的“正常蜂群”信號;“40%”表示訓練集中有40%的數(shù)據(jù)通過決策樹達到此葉節(jié)點。
根據(jù)測試集,構(gòu)建的決策樹的測試結(jié)果如表2所示。此決策樹判斷某一數(shù)據(jù)為分蜂數(shù)據(jù)的先驗概率為99.04%。
在決策樹模型中,未使用子帶D3和D5數(shù)據(jù)。由表3可知,子帶D3的基尼指數(shù)最大,區(qū)分能力最弱。子帶D5的基尼指數(shù)僅大于子帶D2,但決策樹中未存在D5,說明200~400 Hz與1000~2000 Hz的功率比變化趨勢類似。
表2 決策樹模型的混淆矩陣
圖 3 CART 算法所構(gòu)建決策樹
表3 決策樹根節(jié)點基尼指數(shù)
本文主要探討了蜂群分蜂時的聲音特征參數(shù)以及基于聲音特征的分蜂模式識別的機器學習算法。結(jié)果表明,利用蜂群聲音的子帶功率比可以有效區(qū)分蜂群是否處于預(yù)分蜂狀態(tài),利用子帶功率比構(gòu)建的決策樹模型預(yù)測分蜂的先驗概率可達99.04%。本研究認為蜂群聲音的子帶功率比是一種重要的特征參數(shù),可用于分蜂判別。
近年來,有關(guān)聲音特征提取和模式識別技術(shù)發(fā)展較快。由于聲信號精確和穩(wěn)定等特點, 運用信號處理的方法,借助計算機技術(shù)對生物體發(fā)出的聲音進行分析,提取其特征量,可幫助精準預(yù)測生物現(xiàn)狀。因此,聲音模式識別在無人值守、故障檢測、災(zāi)害預(yù)防等方面具有很廣闊的應(yīng)用前景。
本研究在子帶劃分方面比較粗略,而且子帶選取的時段主要依靠經(jīng)驗來確定的。因此,計算得到的子帶功率比可能存在人為造成的誤差。另外,各子帶中可能隱含許多未挖掘的信息,需要今后進行相關(guān)實驗,通過分析子帶所包含的信息,以提高識別準確性。
本研究只針對預(yù)分蜂狀態(tài)識別進行了蜂群聲音的子帶功率比和基于子帶功率比的機器學習算法的研究。實際上,蜂群中存在多種異常狀態(tài),如病蟲害、外來蜂入侵等,有關(guān)這些異常狀態(tài)的蜂群聲音子帶功率比需要進一步深入研究。比較不同蜂群異常狀態(tài)下蜂群聲音子帶功率比,確定一個通用的蜂群聲音子帶劃分和基于蜂群聲音子帶功率比的機器學習算法,如支持向量機、隨機森林等,這將為研發(fā)蜂群監(jiān)測系統(tǒng)提供強有力的技術(shù)支持。
致謝:本研究得到中科院合肥研究院劉方鄰研究員的指導與論文撰寫的幫助,以及方黎研究員、儲焰南研究員、丁蕾副研究員等給予的支持和幫助。另外,課題組蔣雪利、尹小紅為本研究提供了幫助。在此,對各位老師和同學的支持和幫助表示感謝。