熊智新 胡慕伊 陳朝霞 胡 明
(南京林業(yè)大學(xué)江蘇省制漿造紙科學(xué)與技術(shù)重點實驗室,江蘇南京,210037)
紙漿質(zhì)量綜合評價就是根據(jù)造紙工業(yè)產(chǎn)品標準等級評價指標,對從不同側(cè)面獲得的紙漿性能數(shù)據(jù)進行總的評價,從而全面地分析被評對象的質(zhì)量狀況,為開發(fā)利用新的紙漿纖維原料,改進制漿工藝,或是定向培育紙漿材林提供科學(xué)的決策依據(jù)。但是目前國內(nèi)外尚無統(tǒng)一的紙漿質(zhì)量評價模型。不同工藝條件下得到的紙漿指標值不同,而且分級范圍比較廣,紙漿分級界限具有一定模糊性,因此文獻[1-2]提出了評估紙漿質(zhì)量的模糊數(shù)學(xué)模型,實現(xiàn)了紙漿質(zhì)量的綜合評估。但是用模糊數(shù)學(xué)進行綜合評價,需要根據(jù)評價等級標準設(shè)計若干個隸屬函數(shù),而這種設(shè)計還沒有系統(tǒng)的方法,其結(jié)果的可靠性和準確性依賴于合理選取指標、指標的權(quán)重分配和綜合評價的合成算子等。因此,總的來講,模糊綜合評判是一種基于主觀信息的綜合評價方法[3]。
紙漿質(zhì)量評價實際是一個多屬性決策問題,這些屬性之間存在著復(fù)雜的關(guān)系,在統(tǒng)計學(xué)中稱之為高維問題,從而增加了評價的難度。投影尋蹤(Projection Pursuit,簡稱PP)是由美國科學(xué)家Kruskal提出的一種用以分析和處理高維觀測數(shù)據(jù),尤其是非線性、非正態(tài)高維數(shù)據(jù)的新興統(tǒng)計方法,是統(tǒng)計學(xué)、應(yīng)用數(shù)學(xué)和計算機技術(shù)的交叉學(xué)科,已被用于洪水災(zāi)情、環(huán)境質(zhì)量、農(nóng)業(yè)資源等領(lǐng)域進行分級綜合評價[4-6]。本研究將利用基于遺傳算法[7](Genetic Algorithm,簡稱GA)尋優(yōu)的投影尋蹤方法,把紙漿質(zhì)量多指標評價問題轉(zhuǎn)化為單一的投影指標問題,根據(jù)最佳投影值與其對應(yīng)等級之間所呈現(xiàn)的關(guān)系建立數(shù)學(xué)模型——遺傳投影尋蹤插值模型(Genetic Projection Pursuit Interpolation Model,簡稱GPPIM),并對不同樹種在相同工藝條件下的高得率漿的質(zhì)量進行綜合評價。
影響紙漿質(zhì)量的因素有很多,人工評價制漿性能和紙漿質(zhì)量涉及的考核指標通常有紙漿得率、電耗、打漿度、松厚度、平滑度、粗糙度、抗張指數(shù)、撕裂指數(shù)、耐折度、白度和不透明度等。為了使綜合評價體系具有針對性和實用性,一般應(yīng)該按漿種生產(chǎn)的目標紙產(chǎn)品來確定各項評價指標。本研究以薄頁文化用紙類對漿的質(zhì)量要求為例討論,相應(yīng)的主要質(zhì)量指標有:松厚度、抗張指數(shù)、撕裂指數(shù)、耐破指數(shù)及白度。由于不同制漿工藝條件所得紙漿性能不同,因此往往考慮在相同工藝條件下進行紙漿指標等級標準劃分。本研究確定的紙漿性能評價分級標準采用文獻[2]的結(jié)果,具體數(shù)據(jù)見表1。
投影尋蹤是一種直接由樣本數(shù)據(jù)驅(qū)動的探索性數(shù)據(jù)分析方法,其建模基本思想是采用投影指標函數(shù)(目標函數(shù))來衡量投影暴露某種結(jié)構(gòu)特征可能性的大小,尋找出使投影指標函數(shù)達到最優(yōu)(即最能反映高維數(shù)據(jù)結(jié)構(gòu)或特征)的投影方向,把高維數(shù)據(jù)投影到低維子空間,然后根據(jù)樣本數(shù)據(jù)在該方向投影值對樣本集進行相應(yīng)的分析[8],達到研究分析高維數(shù)據(jù)的目的。其中,投影指標函數(shù)的構(gòu)造及其優(yōu)化問題是應(yīng)用投影尋蹤解決實際問題的關(guān)鍵。本研究采用現(xiàn)代優(yōu)化算法中廣泛使用的具有全局尋優(yōu)和并行計算能力的遺傳算法處理該問題,建立紙漿質(zhì)量的綜合評價插值型投影尋蹤模型GPPIM,其主要計算包括:
表1 紙漿質(zhì)量單指標等級劃分表
(1)建立投影數(shù)據(jù) 根據(jù)紙漿質(zhì)量等級評價標準產(chǎn)生用于紙漿質(zhì)量等級評價的原始數(shù)據(jù),它包括紙漿指標及對應(yīng)質(zhì)量等級y(i),其中,i=1,2…,n;j=i=1,2…,p;n,p分別為樣本的個數(shù)和紙漿質(zhì)量評價指標數(shù),則為第i個紙漿樣本的第j個指標值。紙漿質(zhì)量越好,對應(yīng)等級就越高,設(shè)紙漿質(zhì)量最高評價等級為1級(很高),最低評價等級為N級(很差),則y(i)∈[1,N]。為消除各評價指標的量綱效應(yīng),使模型具有一般性,對進行歸一化處理為:
(2)計算投影值 設(shè)投影方向為a=(a1,a2,…,ap),PP方法就是把p維數(shù)據(jù){xi,j|j=1,2,…,p}綜合成以a為投影方向的一維投影值z(i):
(3)構(gòu)造投影指標函數(shù)在綜合投影值時,要求投影值z(i)應(yīng)盡可能大地提取xi,j中的變異信息,并且能保證投影值對評價對象具有很好的解釋性。即z(i)的標準差Sz盡可能大,同時要求z(i)與y(i)的相關(guān)系數(shù)Rzy的絕對值|Rzy|也盡可能大[6]。因此,投影指標函數(shù)Q(a)可構(gòu)造為:
其中:
式中:E(z)和E(y)分別為序列{z(i)|i=1,2,…,n}和{y(i)|i=1,2…,n}的平均值。
(4)用遺傳算法優(yōu)化投影方向 當設(shè)定經(jīng)驗等級及其評價指標的樣本數(shù)據(jù)后,投影指標函數(shù)Q(a)只與投影方向a有關(guān),不同的投影方向反映不同的數(shù)據(jù)結(jié)構(gòu)特征??赏ㄟ^求解投影指標函數(shù)最大值問題來估計最佳投影方向,即:
這是一個以a=(a1,a2,…ap)為優(yōu)化變量的非線性優(yōu)化問題,采用傳統(tǒng)投影尋蹤技術(shù)計算復(fù)雜、編程實現(xiàn)困難,在一定程度上限制了其應(yīng)用[6]。模擬生物優(yōu)勝劣汰規(guī)則與群體內(nèi)部染色體信息交換機制的遺傳算法是一種通用的全局優(yōu)化方法,用它來求解上述問題則較為簡便。遺傳算法的具體算法可參見文獻[6-7]。
(5)建立紙漿質(zhì)量評價的數(shù)學(xué)模型 把由步驟(4)求得的最佳投影方向a*代入式(2),可求得各樣本點的最佳投影值z*(i),反映各樣本的綜合質(zhì)量特征。根據(jù)z*(i)與y(i)的散點圖即可建立紙漿質(zhì)量評價的投影尋蹤插值模型。
為了說明GPPIM用于紙漿質(zhì)量綜合評價的可行性,本研究直接采用文獻[2]的制漿實驗數(shù)據(jù),其中5個樹種紙漿均在相同工藝條件下采用P-RC APMP方法制得,其性能指標見表2。在表1所示的紙漿質(zhì)量5個評價等級取值范圍內(nèi)分別均勻隨機產(chǎn)生共5×100個指標樣本,與對應(yīng)的5個等級y(i)一起組成樣本數(shù)據(jù),并對按式(1)進行歸一化處理為:
xi,j(i=1,2,…,500;j=1,2,…,5),
表2 5種原料P-RC APMP性能
用GPPIM算法中的步驟(1)~(4)計算,其中GA算法采用格雷碼編碼[6],選定父代初始種群規(guī)模為n=100,最大進化代數(shù)eranum=300,交叉概率pc=0.80,變異概率pm=0.50,求得最佳投影方向a*(0.3630,0.4878,0.4835,0.4278,0.4621)最大投影目標函數(shù)值Q(a*)=0.6184。根據(jù)得到的a*,按式(2)計算各樣本最佳投影值與對應(yīng)等級的散點圖見圖1。從圖1可以看出,z*(i)與y(i)的圖形為階梯形下降曲線,即投影值越大,級別值越小,質(zhì)量越好。各階梯左右兩端點A~J的坐標分別為(0.0368,5),(0.2764,5),(0.4503,4),(0.6875,4),(0.8642,3),(1.1184,3),(1.2760,2),(1.5248,2),(1.7398,1),(2.1203,1)?,F(xiàn)用這10個點進行分段線性插值,可作為紙漿質(zhì)量綜合評價的數(shù)學(xué)模型。為描述方便,現(xiàn)把A~J這10個點構(gòu)成的5條線段AB,CD,EF,GH,IJ按如下集合表示:
{c1(k),c2(k),d(k)},k=1,2…,N
其中,c1(k)、c2(k)分別對應(yīng)圖1中各線段左、右端點橫坐標值,d(k)為各線段對應(yīng)評價等級值(縱坐標),本例中,d(k)=N-k+1,N=5,則GPPIM的紙漿質(zhì)量評價模型為圖1中折線所對應(yīng)的函數(shù),可用式(8)表示。
表2各待評價樣品數(shù)據(jù)按式(1)進行歸一化處理后,再和a*一起代入式(2),計算各樣品最佳投影值,最后用式(8)就可求出各樹種紙漿質(zhì)量的等級值,結(jié)果見表3。為便于對比,表3列出了文獻[2]中模糊評價結(jié)果,其中模糊評價計算等級和排序根據(jù)各樣本綜合評價結(jié)果向量平方和加權(quán)平均[9]求得。
圖1 最佳投影值z*(i)與經(jīng)驗等級y(i)的散點圖
從表3的GPPIM等級計算值可以得出結(jié)論:楊木漿質(zhì)量較高(Ⅱ級),馬占相思木漿質(zhì)量中等(Ⅲ級),厚莢相思木漿質(zhì)量較差(Ⅳ級),尾巨桉和卷莢相思木漿在中等(Ⅲ級)和較差(Ⅳ級)之間,其中尾巨桉木漿偏向中等(Ⅳ級),卷莢相思木漿偏向較差(Ⅳ級)。由于最佳投影值與等級值的圖形為階梯形下降曲線,可以得出最佳投影值越大的樹種生產(chǎn)的紙漿質(zhì)量越好的結(jié)論,所以從表3各樹種的最佳投影值可以看出,5個樹種生產(chǎn)的紙漿質(zhì)量從好到壞的順序為:楊木>馬占相思>尾巨桉>卷莢相思>厚莢相思。GPPIM評價結(jié)果與模糊綜合評價方法基本一致,僅在尾巨桉和卷莢相思排序上有差異,由于兩者處于中等(Ⅲ級)和較差((Ⅳ級)之間的模糊地帶,存在這種差異也是可以理解的。本例中由于尾巨桉木漿白度是5個樣本中最高的,且比卷莢相思木漿白度高17.5個百分點,而其他指標和卷莢相思木漿比雖各有高低,但相差不大,因此GPPIM方法判斷尾巨桉漿比卷莢相思木漿綜合質(zhì)量稍好應(yīng)更為合理。此外,最佳投影方向各分量絕對值的大小實質(zhì)上反映了各指標各樹種紙漿質(zhì)量評價的影響程度,各分量絕對值越大,則對質(zhì)量評價影響就越大,據(jù)此可以進一步檢驗分級標準的合理性。
表3 5種原料P-RC APMP質(zhì)量評價結(jié)果
4.1 采用遺傳投影尋蹤插值模型(GPPIM)方法直接從紙漿質(zhì)量評價等級標準出發(fā),由樣本數(shù)據(jù)驅(qū)動,把紙漿質(zhì)量多維評價指標綜合成一維投影指標,建立紙漿質(zhì)量評價的數(shù)學(xué)模型,較好地實現(xiàn)了對速生材制高得率漿的綜合評價。方法不需要設(shè)計隸屬函數(shù),簡便直觀,并可適用于其他類似紙漿的評價。模型建立和評價中無需人為干擾,結(jié)果具有較好的客觀性。
4.2 由于最佳投影值與等級值的圖形為階梯形下降曲線,可以得出最佳投影值越大的紙漿,其對應(yīng)質(zhì)量越好的結(jié)論。對于多個紙漿樣本混合評價問題,GPPIM方法既可以利用等級值從整體上來判別紙漿所屬等級,又可以利用最佳投影值對處于同一等級或模糊區(qū)域的樣品進行細致評價,兼具較強的分類功能和較好的排序功能,提高了紙漿質(zhì)量評價問題各層次的分辯力。
4.3 采用的紙漿等級評價標準是在相同工藝條件下劃分的,相對來講并非是最佳選擇。因為不同原料最佳制漿工藝不相同,即使是相同原料,不同的產(chǎn)地也可能會導(dǎo)致制漿工藝的不同。因此,在今后的進一步研究中,將考慮建立不同原料最佳制漿條件下的紙漿性能分級標準,由此建立的GPPIM模型得到的評價結(jié)果應(yīng)更具有實際意義。
[1]唐孝華,房桂干.速生樹種制漿造紙適應(yīng)性能評估模型的研究[J].林產(chǎn)化學(xué)與工業(yè),1996,9(16):60.
[2]璩愛玉,房桂干.模糊數(shù)學(xué)方法在高得率漿評價中的應(yīng)用[J].中國造紙學(xué)報,2008,23(2):105.
[3]杜 棟,龐慶華.現(xiàn)代綜合評價方法與案例精選[M].2版.北京:清華大學(xué)出版社,2008.
[4]金菊良,張欣莉,丁 晶.評估洪水災(zāi)情等級的投影尋蹤模型[J].系統(tǒng)工程理論與實踐,2002,22(2):140.
[5]王順久,李躍清.投影尋蹤模型在區(qū)域生態(tài)環(huán)境質(zhì)量評價中的應(yīng)用[J].生態(tài)學(xué)雜志,2006,25(7):869.
[6]楊曉華,沈珍瑤.智能算法及其在資源環(huán)境系統(tǒng)建模中的應(yīng)用[M].北京:北京師范大學(xué)出版社,2005.
[7]雷英杰,張善文,李續(xù)武,等.Matlab遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2005.
[8]項靜恬,史久恩.非線性系統(tǒng)中數(shù)據(jù)處理的統(tǒng)計方法[M].北京:科學(xué)出版社,2000.
[9]胡永宏,賀思輝.綜合評價方法[M].北京:科學(xué)出版社,2000.