褚 旭,汪金玲,李春順,趙 陽,楊雪彪,邵長營,王 飛,楊 康*
1.江蘇中煙工業(yè)有限責(zé)任公司,南京市夢都大街30號 210019 2.云南省煙草農(nóng)業(yè)科學(xué)研究院,昆明市圓通街33號 650021
土壤肥力是土壤諸多基本特性的綜合反映[1],科學(xué)、實用的土壤肥力評價方法可為指導(dǎo)農(nóng)業(yè)生產(chǎn)和土地利用提供依據(jù)[2-3]。土壤肥力評價是一個無決策屬性的多屬性決策過程,各屬性權(quán)重分配的合理性對肥力評價將產(chǎn)生直接影響[4],綜合主客觀賦權(quán)方法,通過權(quán)重組合[5-6]探索更加合理的賦權(quán)過程也是目前的研究重點之一。
粗糙集是一種處理模糊和不確定知識的數(shù)學(xué)工具[7],基于粗糙集的權(quán)重確定方法目前被廣泛應(yīng)用于管理決策、專家系統(tǒng)和模式識別等領(lǐng)域[8]。作為一種客觀賦權(quán)法,粗糙集權(quán)重的確定無需預(yù)先給定某些屬性的數(shù)量描述,直接從給定問題的描述集合出發(fā),通過確定給定指標的屬性重要性,找出問題的內(nèi)在規(guī)律[9-11]。鮑新中等[12]研究表明,基于粗糙條件信息熵的權(quán)重確定方法可提高指標權(quán)重的可解釋性。丁守禎等[13]研究發(fā)現(xiàn),基于粗糙集的權(quán)重確定過程可去除冗余信息,冗余信息的去除不僅不會改變方法本身的決策能力,反而會提高整個系統(tǒng)的清晰度。目前,將粗糙集中用于去除冗余信息的知識約簡理論運用于植煙土壤肥力評價的指標賦權(quán)過程還鮮見報道。為此,以層次分析法[5]獲取初始權(quán)重,并進一步構(gòu)建決策表,通過計算最小近似約簡對土壤肥力的不同指標進行屬性約簡和賦權(quán),將粗糙集理論應(yīng)用于植煙土壤肥力的綜合評價過程,以期為土壤肥力的準確評價提供參考。
土壤樣品來自2018年江蘇中煙工業(yè)有限責(zé)任公司云南某原料基地的15個植煙土壤采樣點,采樣點的選取遵循均勻性、代表性原則[14]。土壤取樣于烤煙移栽前進行,每個采樣點取12份樣品,取樣深度5~20 cm,按四分法取1 kg土壤進行檢測,共計取樣180份。不同植煙田塊的地貌類型、農(nóng)田水利設(shè)施和土地利用方式基本一致,所有采樣點種植的烤煙品種均為云煙87,株行距為120 cm×50 cm,化肥施用量:N 100 kg/hm2、P2O5100 kg/hm2、K2O 250 kg/hm2,供試肥料為煙草專用肥和硫酸鉀,其中,煙草專用肥和硫酸鉀的70%作為基肥,剩余肥料在栽后30 d內(nèi)追施,其他農(nóng)事操作按照當?shù)貎?yōu)質(zhì)煙葉生產(chǎn)技術(shù)規(guī)范進行[15]。采樣田塊煙葉在正常成熟后采收烘烤并計算產(chǎn)量。
選取對煙葉生長發(fā)育影響大的14項常規(guī)參數(shù)[有機質(zhì)、堿解氮、全氮、水溶性氯、速效磷、速效鉀、全磷、全鉀、有效硼、有效鉬、有效硫、有效鈣和有效鎂含量(質(zhì)量分數(shù))以及土壤pH]作為植煙土壤綜合肥力的評價指標,鑒于不同采樣點地貌類型、農(nóng)田水利設(shè)施和土地的利用方式基本一致,對選取的14項指標采用多重比較方法[14]進行初篩。不同土壤肥力指標的具體測定方法見文獻[16]。
1.3.1 離散化處理
由于粗糙集僅能處理離散化的數(shù)據(jù),根據(jù)不同土壤指標的含量水平,并參考葉回春等[1]研究中土壤養(yǎng)分指標的區(qū)間劃分標準,將各指標含量劃分為“高”“中”和“低”3個等級。指標權(quán)重的初定采用層次分析法[5,17],以模糊評判中的加乘法原則[18]計算土壤綜合肥力指數(shù),各指標的等級劃分和權(quán)重見表1。
表1 土壤肥力指標的等級劃分閾值與權(quán)重Tab.1 Classification thresholds and weight coefficients of soil fertility indices
1.3.2 構(gòu)建決策表
以土壤肥力指標為條件屬性(C),綜合肥力指數(shù)的等級為決策屬性(D)構(gòu)建決策表(表2)。條件屬性集C={C1,C2,C3,…,C6},決策屬性集D={d}。其中,C1為有機質(zhì)含量,C2為堿解氮含量,C3為速效磷含量,C4為速效鉀含量,C5有效鎂含量,C6為水溶性氯含量,d為采用層次分析法初評得到的土壤肥力等級。
表2 土壤肥力評價決策表Tab.2 Decision table of soil fertility evaluation
1.4.1 屬性重要性
定義S=(U,A,V,f)為一個信息系統(tǒng),其中U表示對象的非空有限集合,稱為論域;A是屬性的非空有限集合,C∪D=A,C為條件屬性集,D為決策屬性集,集合V為屬性集A的值域,f是U和A的關(guān)系集,也稱信息函數(shù)集[1]。當D為非空集合時,信息系統(tǒng)S稱為決策信息系統(tǒng)或決策表,否則稱為數(shù)據(jù)表[19]。
對于信息系統(tǒng)S若有B?A,則定義屬性集B上的不可分辨關(guān)系IND(B)為:
IND(B)={(Ux,Uy)∈U2|?b∈B,f(Ux,b)=f(Uy,b)}
U/IND(B)稱為對象集U在屬性集B上的劃分結(jié)果,其中的任意元素稱為等價類[1]。
在決策表S中,若有U/IND(C)={C1,C2,C3,…,Cm},U/IND(D)={D1,D2,D3,…,Dk},則定義決策屬性集D相對于條件屬性集C的條件信息熵[12]為:
對于?Cx∈C,屬性Cx的重要性定義為:
Sig(Cx)=I(D|C)-I(D|C-Cx)
1.4.2 最小近似約簡對于決策表S,定義條件屬性集C的核為Core:
Core(C)={?Cx∈C|Sig(Cx)≠0}
條件屬性集C的初始核為空集。對于?Cx∈C,當Sig(Cx)不為0,使CoreII=Core∪{Cx},最終得到的CoreII為條件屬性集C的核[7]。
計 算I(D|CoreII),當I(D|CoreII)=I(D|C)時,CoreII稱為條件屬性集C的最小近似約簡[7]。當I(D|CoreII)≠I(D|C),對指標?Cy∈C-CoreII,計算其屬性重要性Sig(Cy),按該值的大小順序排列Cy,并依次并入核CoreII,即CoreIII=CoreII∪{Cy},直到I(D|CoreIII)=I(D|C),此時的CoreIII為條件屬性集C的最小近似約簡。
對于最小近似約簡中的任意元素Cn,重要性Sig(Cn)越大,指標越重要,該屬性的權(quán)重也越大[20]。由此,屬性Cn的權(quán)重為:
作物產(chǎn)量作為土壤生產(chǎn)力的重要指標,通常視為土壤肥力的外部表征[21-22]。依據(jù)于寒青等[21]的研究,為驗證賦權(quán)結(jié)果和評價結(jié)論的合理性和準確性,通過計算土壤綜合肥力指數(shù)與采樣田塊當年煙葉產(chǎn)量的相關(guān)系數(shù)(r)、決定系數(shù)(R2)和均方根誤差(RMSE)的大小,判斷不同方法指標賦權(quán)的合理性和評判評價結(jié)論的準確性。
利用式(3)進行標準化處理。式(3)中,D為土壤肥力指標的歸一化值,D0為指標的原始值,Dmin為最小值,Dmax為最大值。
使用Matlab 2009b和SPSS 18.0軟件進行數(shù)據(jù)分析,Excel軟件進行統(tǒng)計并制表。不同采樣點土壤樣品的各指標得分為所有樣品得分的平均值。
由表3可見,不同采樣點土壤肥力狀況差異較大。其中,采樣點7的土壤樣品pH和有效硼含量最高;采樣點5的有機質(zhì)、全氮和全鉀含量最高;采樣點6的堿解氮、速效鉀和有效鉬含量最高;采樣點8的水溶性氯和速效磷的含量最高;采樣點13的全磷含量最高;采樣點4的有效硫含量最高;采樣點1的有效鈣含量最高;有效鎂含量最高的為采樣點10的土壤樣品。與李衛(wèi)等[23]的研究結(jié)果相比,不同采樣點酸堿適中,堿解氮、全氮、全磷和有效鎂含量豐富。多重比較分析的結(jié)果顯示,不同采樣點屬同一原料基地,雖然其地貌類型、農(nóng)田水利設(shè)施和土地的利用方式基本一致,但土壤肥力狀況指標仍有差異。其中,不同采樣點的全氮和全磷含量差異不顯著,全鉀、有效硼、有效鉬和有效鈣含量和土壤pH值5項指標差異較小,有機質(zhì)、堿解氮、水溶性氯、速效磷、速效鉀、有效硫和有效鎂含量7項指標差異較大。各指標中,過量的硫素營養(yǎng)會降低煙葉的可用性[24]。所有采樣點有效硫的指標含量均值范圍為25.30~76.19 mg/kg,處于植煙土壤養(yǎng)分指標的最優(yōu)范圍內(nèi)。
表3 不同采樣點植煙土壤肥力情況①Tab.3 Fertility of tobacco-growing soil from different sampling sites
對表2中的數(shù)據(jù)論域分別按條件屬性和決策屬性進行等價類劃分,并計算依次去掉一個條件屬性后的論域等價類劃分結(jié)果,并根據(jù)式(1)計算各條件屬性的信息熵為:I(D|C)=0.000 0,I(D|C-C1)=0.000 0,I(D|C-C2)=0.000 0,I(D|C-C3)=0.066 7,I(D|C-C4)=0.066 7,I(D|C-C5)=0.000 0,I(D|C-C6)=0.066 7。
依據(jù)上述條件屬性集核的算法定義,條件屬性集C的核CoreII={C3,C4,C6},由于I(D|CoreII)≠I(D|C),依次計算指標?Cy∈C-CoreII的屬性重要性Sig,按重要性大小順序并入CoreII,直到得到的CoreIII的I(D|CoreIII)=I(D|C),最后得到最小近似約簡為{C1,C3,C4,C6}。屬性指標經(jīng)約簡后,原有的6項土壤肥力指標縮減為4項(表4),分別為有機質(zhì)(C1)、速效磷(C3)、速效鉀(C4)和水溶性氯含量(C6)。堿解氮(C2)和有效鎂含量(C5)2項指標被確定為冗余屬性[1]。
表4 約簡后的土壤肥力評價決策表Tab.4 Decision table of soil fertility evaluation after reduction
約簡后各土壤肥力指標的屬性重要性依次為:Sig(C1)'=0.133 3,Sig(C3)' 0.133 3,Sig(C4)'=-0.200 0,Sig(C6)' 0.155 6。
依據(jù)式(2)計算屬性權(quán)重w(Cn),歸一化后可得:w(C1)=0.214,w(C3)=0.214,w(C4)=0.321,w(C6)=0.251。
基于粗糙集的屬性約簡法在約簡屬性后剩余的4項指標及其權(quán)重分別為有機質(zhì)含量(0.214)、速效磷含量(0.214)、速效鉀含量(0.321)和水溶性氯含量(0.251)。與初評中層次分析方法確定的初始權(quán)重相比(表5),基于粗糙集的屬性約簡法提高了速效磷、速效鉀和水溶性氯含量的權(quán)重系數(shù),降低了有機質(zhì)、堿解氮和有效鎂含量的指標權(quán)重。其中,堿解氮和有效鎂含量2項指標被約簡,未分配權(quán)重,堿解氮和有效鎂含量作為冗余信息被消除。由多重比較的分析結(jié)果可見,選取的有機質(zhì)、堿解氮、速效磷、速效鉀、有效鎂和水溶性氯含量6項指標差異較大。此外,基于粗糙集的決策信息系統(tǒng)中每個條件屬性的重要程度不同,該系統(tǒng)先去掉一個屬性,再考慮沒有該屬性后等價類劃分的變化情況[9]。堿解氮和有效鎂含量2項指標的有無對后續(xù)試驗田塊等價類劃分的結(jié)果不產(chǎn)生影響,而有機質(zhì)、速效磷、速效鉀和水溶性氯含量4項指標的影響較大,其中,又以速效鉀和水溶性氯含量的重要性更高。
表5 不同決策方案的權(quán)重結(jié)果Tab.5 Weights obtained through different decision schemes
如表6所示,根據(jù)層次分析法得到的植煙土壤綜合肥力指數(shù)最高的是采樣點6的土壤樣品,為9.49分;最低的是采樣點9的土壤樣品,為4.82分;采樣點1~15的排名分別為8、5、7、4、6、1、3、11、15、9、10、2、13、14和12?;诖植诩膶傩约s簡法得到的綜合肥力指數(shù)中得分最高的是采樣點7的土壤樣品,為9.36分,最低的是采樣點9的土壤樣品,為6.14分;其中采樣點2和采樣點11的兩個采樣點得分相同;采樣點1~15的綜合排名分別為14、4、9、10、8、2、1、7、15、11、4、3、12、6和13。
表6 不同評價方法的得分結(jié)果Tab.6 Scores obtained through different evaluation methods
綜合比較不同評價方法計算得到的最高、最低以及排名情況發(fā)現(xiàn),層次分析法和基于粗糙集的屬性約簡法計算得到的評價結(jié)果不盡相同,2種評價方法計算得到的綜合肥力指數(shù)的最低分均為采樣點9的土壤樣品,利用層次分析法計算得到的最高分為采樣點6的土壤樣品,基于粗糙集的屬性約簡法中分值最高的為采樣點7的土壤樣品。2種評價方法差異較大的分別為采樣點1、4、8、11和14的5份土壤樣品,其中采樣點14的土壤樣品得分排名差異最大。
為進一步比較不同評價方法的合理性,以當年不同采樣田塊的煙葉產(chǎn)量作為檢驗2種評價方法的直接依據(jù)。分析采樣點當年的煙葉產(chǎn)量數(shù)據(jù)與不同評價方法計算得到的土壤綜合肥力指數(shù)的相關(guān)性,并采用決定系數(shù)(R2)和均方根誤差(RMSE)判斷不同方法賦權(quán)的合理性與評價的準確性[21],不同評價方法計算得到的土壤綜合肥力指數(shù)與當年煙葉產(chǎn)量的關(guān)系見圖1。相關(guān)分析結(jié)果表明,層次分析法(圖1a)和基于粗糙集的屬性約簡法(圖1b)的評價結(jié)論與煙葉產(chǎn)量之間的相關(guān)系數(shù)檢驗均達到顯著水平,r分別為0.65和0.92。其中,層次分析法的R2為0.42,RMSE為5.92(圖1a),基于粗糙集的屬性約簡法的R2為0.86,RMSE為5.89(圖1b)。相比層次分析法,基于粗糙集的屬性約簡法確定的各指標的權(quán)重系數(shù)更準確,賦權(quán)結(jié)果更合理,根據(jù)其計算得到的評價結(jié)果與當年煙葉產(chǎn)量的相關(guān)性更好、精度更高。
圖1 不同評價方法計算的土壤綜合肥力指數(shù)與當年煙葉產(chǎn)量的關(guān)系Fig.1 Relationships between tobacco leaf yields and comprehensive soil fertility index calculated by different evaluation methods
云南煙區(qū)植煙土壤主要的化學(xué)特征是酸堿適中,全氮含量豐富,鉀含量較低[25],這與本試驗結(jié)果類似。此外,不同采樣點雖為同一原料基地,但土壤肥力指標有差異,不同指標屬性權(quán)重的分配將直接影響土壤肥力綜合評價的準確性。本研究中將權(quán)重的確定問題轉(zhuǎn)化為粗糙集中屬性重要性的評價問題[26]。利用粗糙集在知識約簡方面的理論優(yōu)勢,對指標集合進一步優(yōu)化,得到?jīng)Q定評價對象狀況的關(guān)鍵性因素。與葉回春等[1,9]的研究相比,該算法的指標個數(shù)得以約簡,評價的計算量也相應(yīng)減少,并避免了線性或非線性極值問題的數(shù)值計算。就賦權(quán)結(jié)果而言,初評過程中采用的層次分析法作為一種多目標決策分析方法,是一種結(jié)合專家經(jīng)驗對復(fù)雜系統(tǒng)數(shù)量化的過程[17],較少考慮評價指標間的關(guān)系[5],而基于粗糙集的屬性約簡法的賦權(quán)結(jié)果相較層次分析法提高了對劃分結(jié)果影響較大的屬性的指標權(quán)重,降低了影響較小的屬性的指標權(quán)重,充分考慮了各屬性指標間的相關(guān)關(guān)系,克服了層次分析法在賦權(quán)過程中存在的主觀性。此外,過去的土壤肥力評價研究往往通過計算評價結(jié)果的收斂性[18]和等級相關(guān)性[5]比較不同評價方法的優(yōu)劣程度,而作物產(chǎn)量作為土壤實際生產(chǎn)力的外在表現(xiàn),可用作土壤肥力評價結(jié)果的直接檢驗依據(jù)[21]。本研究中以取樣煙田當年的煙葉產(chǎn)量為依據(jù),對層次分析法和基于粗糙集的屬性約簡法確定的權(quán)重結(jié)果和評價結(jié)論分別進行檢驗,計算得出的土壤綜合肥力指數(shù)與對應(yīng)的煙葉產(chǎn)量間顯著相關(guān),表明評價結(jié)果較真實地反映了土壤肥力的實際狀況。其中又以基于粗糙集的屬性約簡法的相關(guān)性更好,權(quán)重結(jié)果更加合理,評價結(jié)論的準確性更高。
值得注意的是,基于粗糙集的屬性約簡法依賴取樣數(shù)據(jù)本身的差異,對于如何處理連續(xù)屬性離散化問題,還需在更廣泛的范圍內(nèi)對算法進行研究。此外,除煙葉產(chǎn)量外,還可考慮使用煙葉產(chǎn)值或煙葉質(zhì)量等指標作為對評價結(jié)果驗證的依據(jù),進一步驗證不同評價方法的合理性。
借助粗糙集在知識約簡方面的優(yōu)勢,利用層次分析法構(gòu)建決策表,通過計算最小近似約簡對土壤肥力指標進行屬性約簡,最終確定不同指標屬性的重要性和權(quán)重系數(shù),各指標按權(quán)重從大到小依次為速效鉀含量(0.321)、水溶性氯含量(0.251)、有機質(zhì)含量(0.214)和速效磷含量(0.214),得出各采樣點土壤肥力綜合評價結(jié)果。與層次分析法相比,基于粗糙集的屬性約簡法提高了速效磷和速效鉀含量的權(quán)重系數(shù),降低了有機質(zhì)、堿解氮、有效鎂和水溶性氯含量的指標權(quán)重,將堿解氮和有效鎂含量2項指標作為冗余信息進行約簡。不同評價方法計算得到的評價結(jié)果與當年煙葉產(chǎn)量均顯著相關(guān),其中又以基于粗糙集的屬性約簡法的相關(guān)性更好,精度更高,可更準確地評價不同植煙土壤的肥力水平。