王建華 李碩
摘 要:質(zhì)量興農(nóng)是保障糧食安全的基礎(chǔ),也是推進(jìn)農(nóng)業(yè)供給側(cè)結(jié)構(gòu)性改革的邏輯起點(diǎn)和內(nèi)在要求,文章基于山東、河南、江蘇、浙江、黑龍江等五個(gè)典型農(nóng)業(yè)生產(chǎn)省份的100個(gè)行政村986個(gè)農(nóng)戶的調(diào)研數(shù)據(jù),運(yùn)用樸素貝葉斯模型對影響農(nóng)戶農(nóng)產(chǎn)品安全生產(chǎn)行為的各要素進(jìn)行了系統(tǒng)的分析。通過研究發(fā)現(xiàn),樸素貝葉斯模型能夠較好地反應(yīng)不同因素對農(nóng)戶安全生產(chǎn)行為的影響,是預(yù)測、評價(jià)農(nóng)戶安全生產(chǎn)行為的有效工具,此模型具有良好的農(nóng)戶安全生產(chǎn)行為預(yù)測精度與應(yīng)用前景。此外,應(yīng)發(fā)揮政府的引導(dǎo)作用,加大對社會(huì)組織的扶持力度,不斷提高農(nóng)戶整體素質(zhì)水平,從而規(guī)范農(nóng)戶的安全生產(chǎn)行為,實(shí)現(xiàn)對農(nóng)產(chǎn)品質(zhì)量安全源頭治理的目標(biāo)。
關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);樸素貝葉斯;農(nóng)戶安全生產(chǎn)行為;影響因素
一、引言
2018年中央1號文件指出,必須堅(jiān)持質(zhì)量興農(nóng)、綠色興農(nóng),以農(nóng)業(yè)供給側(cè)結(jié)構(gòu)性改革為主線,加快構(gòu)建現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)體系、生產(chǎn)體系、經(jīng)營體系,提高農(nóng)業(yè)創(chuàng)新力、競爭力和全要素生產(chǎn)率,加快實(shí)現(xiàn)由農(nóng)業(yè)大國向農(nóng)業(yè)強(qiáng)國轉(zhuǎn)變。全國農(nóng)業(yè)工作會(huì)議提出了“唱響質(zhì)量興農(nóng)、綠色興農(nóng)、品牌強(qiáng)農(nóng)主旋律”的重要工作思路,將2018年確定為“農(nóng)業(yè)質(zhì)量年”,這表明著中國農(nóng)業(yè)進(jìn)入了高質(zhì)量發(fā)展的新階段。同時(shí),隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展和人們收入水平的逐步提高,人們對食品安全的訴求日益提高。農(nóng)產(chǎn)品安全生產(chǎn)作為食品安全的源頭和保障食品安全的根本之一,受到人們的廣泛關(guān)注。目前在中國,農(nóng)產(chǎn)品安全風(fēng)險(xiǎn)已由傳統(tǒng)自然因素引致的風(fēng)險(xiǎn)轉(zhuǎn)變?yōu)槿藶橐蛩卣T發(fā)的社會(huì)風(fēng)險(xiǎn)。
近年來,由于農(nóng)戶不規(guī)范施用農(nóng)藥所誘發(fā)的農(nóng)產(chǎn)品安全事件頻頻發(fā)生,引起社會(huì)各界的高度關(guān)注與普遍擔(dān)憂。由此,采取科學(xué)方式分析農(nóng)戶不當(dāng)施藥行為的關(guān)鍵影響因素,有效預(yù)測并規(guī)范農(nóng)戶施藥行為,減少農(nóng)產(chǎn)品安全生產(chǎn)風(fēng)險(xiǎn)對解決食品安全問題具有深遠(yuǎn)的研究意義和重要的實(shí)用價(jià)值。
二、相關(guān)研究的文獻(xiàn)梳理
已有研究表明,農(nóng)戶施藥行為極具復(fù)雜性,且受諸多因素的綜合影響,但主要分為以下三個(gè)方面的原因:
(一)復(fù)雜的農(nóng)戶個(gè)體特征影響農(nóng)戶的安全生產(chǎn)行為。農(nóng)戶個(gè)體特征是指戶主性別、年齡、受教育程度、婚姻狀況、打工經(jīng)歷等。Michael and Cheryl(2001)的研究認(rèn)為,農(nóng)戶性別的不同影響著農(nóng)戶對農(nóng)用化學(xué)品的施用行為,女性文化水平相對較低,具有更高的施藥風(fēng)險(xiǎn)。Nicol(2003)等的研究也發(fā)現(xiàn),男性比女性更致力于了解農(nóng)藥基礎(chǔ)知識以確保農(nóng)藥施用的預(yù)期效果,施藥行為更加規(guī)范。Ntow(2006)等和周潔紅(2009)等的研究表明,年齡是影響農(nóng)戶農(nóng)藥施用量、施用頻率等的重要因素。周潔紅(2009)等對浙江省農(nóng)戶調(diào)查后,發(fā)現(xiàn)年齡較大的菜農(nóng)更可能使用高毒殺蟲劑,以及采取不正確的施藥行為。顧俊(2007)等在江蘇通過調(diào)查分析了農(nóng)戶特征對水稻新技術(shù)采用的影響,發(fā)現(xiàn)戶主年齡與水稻技術(shù)采用率呈負(fù)相關(guān),而受教育年限與之呈正相關(guān)。高啟杰(2000)、石瑜敏(2004)、張?jiān)迫A(2004)等和蒙秀鋒(2005)等的研究表明,受教育程度是影響農(nóng)戶認(rèn)知的關(guān)鍵因素,受教育程度越高,農(nóng)戶選擇低濃度或標(biāo)準(zhǔn)濃度配藥的概率越大,因此提高受教育程度能夠從源頭上減少農(nóng)藥配比過大等問題。Stephanie(2008)認(rèn)為,文化程度低的農(nóng)戶由于缺乏農(nóng)藥專業(yè)知識,往往忽略農(nóng)藥安全性等隱性因素,僅僅以農(nóng)藥效果作為評判農(nóng)藥好壞的唯一標(biāo)準(zhǔn)。與Stephanie(2008)的研究結(jié)論類似,Abhilash(2009)在印度調(diào)查時(shí)也發(fā)現(xiàn),由于農(nóng)戶文化水平和認(rèn)知水平不高,過量使用相同的農(nóng)藥、不合理配比的混合農(nóng)藥等現(xiàn)象時(shí)常出現(xiàn)。此外,王建華與吳林海(2013)通過對河南、山東、江蘇、浙江、黑龍江等五個(gè)典型農(nóng)業(yè)生產(chǎn)省份的調(diào)查分析,發(fā)現(xiàn)打工經(jīng)歷與婚姻狀況也顯著影響著農(nóng)戶的農(nóng)藥施用行為,已婚和有過打工經(jīng)歷的農(nóng)戶相對更能做出安全的農(nóng)業(yè)生產(chǎn)行為選擇。
(二)農(nóng)戶的經(jīng)濟(jì)特征限制農(nóng)戶的安全生產(chǎn)行為。農(nóng)戶施藥行為不僅受個(gè)體基本特征的影響,還受家庭土地規(guī)模、農(nóng)業(yè)收入比例、生產(chǎn)經(jīng)營類型、農(nóng)產(chǎn)品主要用途等經(jīng)濟(jì)特征的影響。高啟杰(2000)、陸彩明(2004)和孔祥智(2005)等研究認(rèn)為,經(jīng)濟(jì)狀況影響和改變農(nóng)戶對農(nóng)藥新技術(shù)的采用。陽檢(2010)、吳林海(2011)等的研究表明,農(nóng)戶家庭年收入、家庭人口數(shù)、種植人口數(shù)等因素對不同階段的施藥行為有著不同程度的影響。Dariush(2009)以伊朗為研究對象,發(fā)現(xiàn)農(nóng)戶收入高低是決定其農(nóng)業(yè)安全生產(chǎn)意愿的主要因素。胡豹(2005)等研究發(fā)現(xiàn)非農(nóng)收入占總收入的比重影響了農(nóng)戶結(jié)構(gòu)調(diào)整決策行為。姜培紅(2005)探究了福建省農(nóng)戶農(nóng)藥使用的經(jīng)濟(jì)影響因素,發(fā)現(xiàn)種植結(jié)構(gòu)的調(diào)整也能顯著減少農(nóng)藥使用。目前,許多學(xué)者雖認(rèn)為家庭勞動(dòng)力數(shù)量對農(nóng)藥新技術(shù)采用有不顯著的正面作用,但普遍贊同家庭種植面積大小與農(nóng)戶對農(nóng)藥新技術(shù)采用的可能性呈正相關(guān)的觀點(diǎn),如趙建欣(2008)等研究了河北、山東兩省菜農(nóng)的生產(chǎn)行為,發(fā)現(xiàn)生產(chǎn)規(guī)模及其模式顯著影響農(nóng)戶安全蔬菜的生產(chǎn)行為。
(三)外部環(huán)境特征制約農(nóng)戶的安全生產(chǎn)行為。外部市場環(huán)境與政策因素也在不同程度上影響著農(nóng)戶的生產(chǎn)行為。FAO(2005)和Dasgupta et al(2007)認(rèn)為由于殺蟲劑等化學(xué)農(nóng)藥的低成本和廣譜殺蟲性,加上收入水平、地理位置等方面的差異因素,亞洲的發(fā)展中國家農(nóng)戶使用最為普及。Christiaans et al.(2007)研究發(fā)現(xiàn)農(nóng)產(chǎn)品價(jià)格下降,農(nóng)戶收入減少,直接導(dǎo)致農(nóng)戶農(nóng)藥施用量的減少。Ngow et al.(2007)認(rèn)為,市場服務(wù)狀況對農(nóng)戶施用農(nóng)藥的行為會(huì)產(chǎn)生重要的影響,農(nóng)藥商販對農(nóng)戶的農(nóng)藥品種選擇和農(nóng)藥施用量具有較強(qiáng)的影響。Hruska et al.(2002)研究表明,政府的傾向性政策會(huì)影響農(nóng)戶農(nóng)產(chǎn)品生產(chǎn)結(jié)構(gòu)和農(nóng)藥施用行為。朱劍橋(2004)研究認(rèn)為,農(nóng)戶專業(yè)合作組織的建立,可以起到規(guī)范農(nóng)戶施藥行為和提高出口效率的雙重效果。黃祖輝(2005)等則認(rèn)為相關(guān)企業(yè)及行業(yè)協(xié)會(huì)可以幫助茶農(nóng)有效減少高毒化學(xué)農(nóng)藥施用和采用安全農(nóng)藥施用行為。農(nóng)戶施藥行為受到農(nóng)戶個(gè)體基本特征、認(rèn)知現(xiàn)狀、心理態(tài)度、外部環(huán)境和經(jīng)濟(jì)條件等方面的綜合影響?;诖?,文章在現(xiàn)有研究的基礎(chǔ)上,依據(jù)我國五個(gè)典型農(nóng)業(yè)生產(chǎn)省份986個(gè)樣本農(nóng)戶的微觀調(diào)研數(shù)據(jù),采用樸素貝葉斯模型為主要分析工具,從數(shù)據(jù)分類的角度研究不同因素對農(nóng)戶安全生產(chǎn)行為的影響以及各因素間的關(guān)系,為有效規(guī)范農(nóng)戶農(nóng)藥施用行為、降低農(nóng)產(chǎn)品安全生產(chǎn)風(fēng)險(xiǎn)提供有力的理論支持和實(shí)踐依據(jù)。
三、方法選擇及其模型設(shè)計(jì)
(一)方法選擇及其相關(guān)內(nèi)容介紹
貝葉斯準(zhǔn)則最早是由英國科學(xué)家Reverend Thomas Bayes在17世紀(jì)首先提出的,并在1812年由數(shù)學(xué)家Laplace以貝葉斯定理的方式展示出來,從而得到新的研究和應(yīng)用。從本質(zhì)上講,貝葉斯準(zhǔn)則提供了一種表示因果關(guān)系的模型,它利用統(tǒng)計(jì)知識進(jìn)行數(shù)據(jù)的相關(guān)分類,通過計(jì)算未知類別的數(shù)據(jù)樣本類歸屬各類別的概率來判定其最終歸屬;其貝葉斯公式(Bayesian Equation)為:
P(A│B)=P(A│B)P(A)P(B)(1)
其中,P(A)代表事件A發(fā)生的概率,被稱為A的先驗(yàn)概率;P(B)代表事件B發(fā)生的概率,是式(1)的歸一化因子;P(B│A)是已知事件A發(fā)生的情況下,B發(fā)生的概率,被稱為已知事件A發(fā)生后事件B的發(fā)生的條件概率。而P(A│B)是已知事件B發(fā)生的情況下,A發(fā)生的概率,也被稱為A的后驗(yàn)概率。
在數(shù)據(jù)分類的應(yīng)用中,B代表未分類的樣本數(shù)據(jù),A是可能的一個(gè)類別。P(B│A)是數(shù)據(jù)B的似然函數(shù)。換句話說,貝葉斯公式綜合了未知分類參數(shù)的先驗(yàn)信息和特征數(shù)據(jù)的似然函數(shù),通過計(jì)算未知分類參數(shù)的后驗(yàn)概率分布來實(shí)現(xiàn)對其的貝葉斯統(tǒng)計(jì)推斷。上述貝葉斯數(shù)據(jù)分類原則已成功用于自然語言的理解、垃圾郵件的自動(dòng)識別、醫(yī)療診斷、統(tǒng)計(jì)決策、專家系統(tǒng)等不同的領(lǐng)域中。
對于農(nóng)戶安全生產(chǎn)行為分析研究而言,利用式(1)的貝葉斯準(zhǔn)則,可通過構(gòu)建貝葉斯分類器,在已知農(nóng)戶施藥行為影響因素的條件下,實(shí)現(xiàn)對農(nóng)戶安全生產(chǎn)行為的有效預(yù)測;另外,也可在已知農(nóng)戶生產(chǎn)行為是否安全的條件下,通過研究影響因素的似然函數(shù),分析、比較不同影響因素對農(nóng)戶生產(chǎn)行為的影響程度。
(二)相關(guān)方法的具體描述
貝葉斯分類器(Bayesian Classifier)利用訓(xùn)練數(shù)據(jù)集(即已分類好的數(shù)據(jù)集)進(jìn)行訓(xùn)練形成分類器,然后利用分類器對未分類的數(shù)據(jù)進(jìn)行歸類,驗(yàn)證分類器的正確性和有效性。貝葉斯分類器有如下幾個(gè)特點(diǎn):在計(jì)算過程中,通過比較樣本數(shù)據(jù)歸屬各類別的概率,判定概率最大的類別為該數(shù)據(jù)的最終歸屬;在貝葉斯分類中,所有的屬性都直接或間接地影響分類結(jié)果。
圖1是貝葉斯分類器的結(jié)構(gòu)示意圖。由圖可知,貝葉斯分類器實(shí)質(zhì)上是一個(gè)數(shù)據(jù)生成模型。它的數(shù)據(jù)處理過程繁瑣,主要有三點(diǎn)原因:一是若屬性之間具有相關(guān)性,分類器結(jié)構(gòu)繁雜將造成似然函數(shù)P(Xj│Ci )本身復(fù)雜度的提升;二是準(zhǔn)確的貝葉斯分類器的獲得需要訓(xùn)練大量的數(shù)據(jù);三是具有后驗(yàn)概率的類標(biāo)簽也需進(jìn)行大量復(fù)雜的計(jì)算才有可能獲取。
為了降低問題的復(fù)雜度,可假設(shè)在給定類別Ci的條件下,其所有屬性Xj是相互統(tǒng)計(jì)獨(dú)立的;采用上述統(tǒng)計(jì)獨(dú)立假設(shè)的貝葉斯分類器被稱為樸素貝葉斯分類器。該假設(shè)極大的簡化了貝葉斯分類器的訓(xùn)練過程,降低了訓(xùn)練所需要的總數(shù)據(jù)量;也降低了貝葉斯分類器實(shí)際應(yīng)用時(shí)后驗(yàn)概率的計(jì)算復(fù)雜性。大量實(shí)際應(yīng)用表明,屬性統(tǒng)計(jì)獨(dú)立假設(shè)的引入不會(huì)顯著降低樸素貝葉斯分類器的性能;因而,樸素貝葉斯分類器是一種簡單有效的分類和數(shù)據(jù)建模方法,其結(jié)構(gòu)示意圖由圖2所示。
四、樸素貝葉斯在農(nóng)戶安全生產(chǎn)中的應(yīng)用
(一)分析評價(jià)指標(biāo)
2013年2-3月深入河南、山東、江蘇、浙江、黑龍江等五個(gè)典型農(nóng)業(yè)生產(chǎn)省份,選取了其中100個(gè)行政村的986位農(nóng)戶,利用分層抽樣與隨機(jī)抽樣相結(jié)合的方式,進(jìn)行了農(nóng)戶農(nóng)產(chǎn)品安全生產(chǎn)行為的專項(xiàng)調(diào)研。調(diào)研結(jié)果表明,影響我國農(nóng)戶農(nóng)產(chǎn)品安全生產(chǎn)行為的因素眾多,但主要分為主觀層次和客觀層次兩大方面的原因。主觀層面的因素主要指農(nóng)戶的個(gè)體特征、打工經(jīng)歷、婚姻狀況、家庭收入、家庭土地規(guī)模以及家庭農(nóng)業(yè)收入在家庭總收入的比例等;客觀層面的因素主要指農(nóng)藥的價(jià)格、家庭農(nóng)產(chǎn)品的主要用途、預(yù)期售價(jià)以及家庭農(nóng)業(yè)生產(chǎn)經(jīng)營類型等,如圖3所示。
對農(nóng)戶的安全生產(chǎn)行為的評估主要從以下4個(gè)方面考慮,農(nóng)戶在生產(chǎn)過程中是否會(huì)施用農(nóng)藥,農(nóng)戶在實(shí)際生產(chǎn)過程中是否會(huì)考慮施用農(nóng)藥的安全間隔期(下文中簡寫為“安全間隔期”,表格中用SI(Safety Interval)表示),農(nóng)戶對農(nóng)藥殘留所引發(fā)農(nóng)產(chǎn)品安全風(fēng)險(xiǎn)的態(tài)度以及農(nóng)戶是否會(huì)過量施用農(nóng)藥防病蟲害。表1和表2分別給出了農(nóng)戶安全生產(chǎn)行為的影響因子及其評估參數(shù)以及農(nóng)戶施藥行為及其評估參數(shù)。
(二)訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集
在已知的986份數(shù)據(jù)中隨機(jī)選取850份調(diào)查數(shù)據(jù)作為訓(xùn)練樣本用于樸素貝葉斯分類器的訓(xùn)練,剩下的數(shù)據(jù)作為測試數(shù)據(jù)集。對缺失數(shù)據(jù),采用單元格均值插補(bǔ)和熱卡插補(bǔ)等方法對數(shù)據(jù)缺失值進(jìn)行補(bǔ)齊。
(三)樸素貝葉斯分類器的訓(xùn)練和測試
限于篇幅,這里僅給出利用訓(xùn)練數(shù)據(jù)集生成針對“農(nóng)戶在實(shí)際生產(chǎn)過程中是否會(huì)考慮施用農(nóng)藥的安全間隔期”的樸素貝葉斯分類器的訓(xùn)練、測試過程以及相應(yīng)的中間結(jié)果。
作為示例,該分類器將用來預(yù)測年齡在26-45歲之間、已婚、大專教育水平并曾有過打工經(jīng)歷的純農(nóng)戶經(jīng)營類型的農(nóng)戶行為,預(yù)測其在農(nóng)業(yè)收入占比31-40%,土地規(guī)模在3-6畝之間,當(dāng)農(nóng)產(chǎn)品主要用來滿足家庭需要,面對適中的農(nóng)藥價(jià)格,在農(nóng)產(chǎn)品預(yù)售價(jià)上漲的情況下,在生產(chǎn)過程中是否會(huì)施用農(nóng)藥。
可以看出,大部分農(nóng)戶會(huì)考慮施用農(nóng)藥的安全間隔期。其次,計(jì)算各條件概率P(Xj│Ci ),其結(jié)果如表4所示。在本例中,利用表3的分類先驗(yàn)概率所得到的結(jié)果和表4的條件概率所得到的結(jié)果,根據(jù)式(4)計(jì)算其后驗(yàn)概率,得到的最大后驗(yàn)概率的類標(biāo)簽為農(nóng)戶在實(shí)際生產(chǎn)過程中經(jīng)常會(huì)考慮施用農(nóng)藥的安全間隔期。最后,通過測試數(shù)據(jù)集檢驗(yàn)通過訓(xùn)練數(shù)據(jù)集生成的樸素貝葉斯分類器對現(xiàn)有數(shù)據(jù)建模的準(zhǔn)確程度。對測試數(shù)據(jù)分類正確率的測度結(jié)果如表5所示。
在數(shù)據(jù)的具體分析上,由表4可知,年齡在26-45歲的農(nóng)戶在“很少考慮”安全間隔期的條件下概率最高,為47.62%;在“完全不考慮”安全間隔期的條件下概率最低,為32.08%。在“完全不考慮”安全間隔期的條件下,農(nóng)戶已婚的概率最高為18.87%;而在“經(jīng)??紤]”安全間隔期的條件下,概率最低僅為3.98%。具有打工經(jīng)歷的農(nóng)戶“偶爾考慮”安全間隔期的概率最高,為70.59%;“完全不考慮”安全間隔期的概率最低,為54.72%。純農(nóng)戶在“考慮很少”安全間隔期的條件下概率最高,為61.90%;在“經(jīng)??紤]”安全間隔期的條件下概率最低,為40.69%。農(nóng)業(yè)收入比例介于31%-40%的農(nóng)戶“偶爾考慮”安全間隔期的條件概率最高,為41.18%;“完全不考慮”安全間隔期的概率最低,為5.66%。土地規(guī)模介于3-6畝的農(nóng)戶“總是會(huì)考慮”安全間隔期的概率最高,為32.84%;“完全不考慮”安全間隔期的概率最低,為15.09%。