岳立柱,許 可,施光磊
(遼寧工程技術(shù)大學(xué) 工商管理學(xué)院,遼寧 葫蘆島 125105)
指標(biāo)數(shù)據(jù)無量綱化是數(shù)據(jù)分析的基礎(chǔ),如多準(zhǔn)則決策(MCDM)、神經(jīng)網(wǎng)絡(luò)(NN)、線性判別法分析(LDA)和主成分分析(PCA)等模型,應(yīng)用前均需要對原始數(shù)據(jù)進(jìn)行無量綱化處理。采用不同的無量綱化方法,模型結(jié)果往往并不相同。選擇哪種無量綱方法更適合模型,至今仍充滿爭議。
學(xué)者們對無量綱化問題進(jìn)行了深入研究,但觀點(diǎn)并不一致。張衛(wèi)華和趙銘軍根據(jù)序數(shù)特征,在逐步探尋合理等級排序依據(jù)的前提下,認(rèn)為均值化(數(shù)據(jù)除以其均值)是一種較好方法[1]。樊紅艷和劉學(xué)錄認(rèn)為均值化和比重化(數(shù)據(jù)除以其向量模)來進(jìn)行數(shù)據(jù)的無量綱化的方法更加科學(xué)合理[2]。與此不同,郭亞軍和易平濤根據(jù)理想線性無量綱化6條性質(zhì),認(rèn)為標(biāo)準(zhǔn)化處理法、極差正規(guī)化法和功效系數(shù)法滿足的性質(zhì)最多,因而相對于其他方法來說更為優(yōu)良[3]。胡永宏的結(jié)論更具一般性,認(rèn)為選擇線性無量綱方法應(yīng)遵循的基本原則: 一般情況下宜采取不帶截距項(xiàng)的線性無量綱化方法,如均值化、初值化、比重法等[4]。均值化方法易受樣本值,特別是極端值的影響,李偉偉等提出了中位數(shù)方法改進(jìn)了均值化方法[5]。不過,在樣本沒有極端值的情況下,中位數(shù)方法的效果不一定強(qiáng)于均值法。爭論拓展了對指標(biāo)無量綱化的認(rèn)識,但也給實(shí)踐應(yīng)用帶來了困擾。
上述爭論可以歸結(jié)為兩種觀點(diǎn),一種是無截距的觀點(diǎn),另一種是有截距的觀點(diǎn)。前者有實(shí)證分析結(jié)論為依據(jù),后者有6條性質(zhì)為依托,各自都有有效“證據(jù)”。郭亞軍和易平濤提出了理想線性無量綱化性質(zhì)應(yīng)滿足6個(gè)性質(zhì),胡永宏認(rèn)為其缺少非常重要的一條,即變異信息的不變性,該性質(zhì)是支持無截距觀點(diǎn)的關(guān)鍵。實(shí)際上,由6條性質(zhì)中的差異比不變性能夠推導(dǎo)出變異系數(shù)不變性。因此,變異系數(shù)不變性不是判定是否采用截距的判定條件。從數(shù)學(xué)角度講,無量綱化是一種映射,也就是將各指標(biāo)的實(shí)際數(shù)據(jù)映射到一個(gè)共同的合適的區(qū)間,確定無量綱化方法就是確定一個(gè)函數(shù)關(guān)系式[4]。上述爭議的產(chǎn)生,本質(zhì)上是雙方忽略了指標(biāo)的等值域性,即數(shù)據(jù)映射到一個(gè)共同的合適區(qū)間。
無量綱化要保證不同單位的指標(biāo)數(shù)據(jù)具有可比性。無量綱化對各指標(biāo)均取相同區(qū)間值,如果映射后的區(qū)間不同(例如均值化方法),即使權(quán)重相同,區(qū)間值的作用并不相同。同值域性不僅是指標(biāo)聚合的前提,也是賦予模型意義、增強(qiáng)可解釋的必要步驟。不同類型的指標(biāo)一般是不可以直接綜合的,比如收入水平和人均壽命。從統(tǒng)計(jì)學(xué)角度來看,可以通過指標(biāo)共同遵循的結(jié)構(gòu)特征進(jìn)行綜合分析,例如變動的百分比。無量綱化過程要保持易理解性和可解釋性。結(jié)合權(quán)重視角來看,在線性模型中,Choo等認(rèn)為權(quán)重表示指標(biāo)每變換一個(gè)抽象單位,對目標(biāo)值增長“貢獻(xiàn)”一個(gè)權(quán)重量[6]。盡管作者沒有明確抽象單位為何物,但默認(rèn)指標(biāo)取值是同值域的。如果無量綱不滿足同值域性,從統(tǒng)計(jì)和權(quán)重角度均很難或無法解釋。
目前研究多集中于線性無量綱化方法,非線性無量綱化方法鮮有關(guān)注。Rezaei研究了折線型無量綱化方法,若采用非線性規(guī)范方式,建議采用折線型方法,因?yàn)槟M發(fā)現(xiàn)二者效果差異并不明顯[7]。但該研究存在一個(gè)明顯缺陷,不能總是滿足指標(biāo)同值域性。盡管該文中所有指標(biāo)的值域?yàn)閇0,1],但很多原始指標(biāo)屬于適度型指標(biāo)而非單調(diào)指標(biāo)。對適度型指標(biāo)需要拆分為若干的單調(diào)指標(biāo)。對于適度指標(biāo)可以適度值為界限,將指標(biāo)取值區(qū)間分為兩部分,在不同的部分適度指標(biāo)就轉(zhuǎn)化為正向指標(biāo)和逆向指標(biāo),因?yàn)槊總€(gè)單調(diào)指標(biāo)區(qū)間映射為[0,1],多個(gè)單調(diào)區(qū)間實(shí)際上會出現(xiàn)多個(gè)[0,1]區(qū)間[4]。不進(jìn)行拆分的話,會失去可理解性和解釋性。對于非線性轉(zhuǎn)換方式,認(rèn)為很多時(shí)候會改變原始數(shù)據(jù)的比例關(guān)系。實(shí)際上,原始數(shù)據(jù)比例關(guān)系表現(xiàn)方式與所研究的問題性質(zhì)有關(guān),例如收入水平與效用關(guān)系,一般來說隨著收入的增加,邊際效用遞減,同樣增加一元錢,不同收入水平條件下,增加的效用不同。因此,保持?jǐn)?shù)據(jù)比例關(guān)系是一個(gè)理想追求,但不是規(guī)范化的必要條件。
逆向指標(biāo)轉(zhuǎn)化在實(shí)際中最常見的就是取倒數(shù),其好處之一是取倒數(shù)后的指標(biāo)可能有實(shí)際的意義,比如“萬元產(chǎn)值能耗”取倒后可變?yōu)椤懊繂挝荒芎膶?shí)現(xiàn)的產(chǎn)值”[4]。葉宗裕認(rèn)為“這種取倒數(shù)的變換方法完全改變了原指標(biāo)的分布規(guī)律,所得綜合評價(jià)結(jié)果肯定是不準(zhǔn)確的,因而是不可取的”[8]。取倒數(shù)法的確不是一個(gè)可選方法,其關(guān)鍵是指標(biāo)取值不滿足同值域性。單純從數(shù)據(jù)角度考慮要保持指標(biāo)數(shù)據(jù)分布,該標(biāo)準(zhǔn)不必刻意遵循,因?yàn)橹笜?biāo)和研究對象之間的函數(shù)關(guān)系才是問題的核心。
當(dāng)前,國外直接研究無量綱化的文獻(xiàn)非常少見,因其更多地集中于指標(biāo)函數(shù)和指標(biāo)集結(jié)問題的研究,相對而言,無量綱化是一個(gè)“小”問題。Bell從效用函數(shù)的視角,證明了當(dāng)效用函數(shù)的自變量相互獨(dú)立時(shí),各指標(biāo)的綜合函數(shù)為線性函數(shù)[9]。由偏好強(qiáng)度可以衡量和顯示價(jià)值函數(shù)[10]。Bleichrodt等提出不確定條件下,決策者常使用期望函數(shù)構(gòu)造價(jià)值函數(shù)[11]。無論是效用函數(shù)還是價(jià)值函數(shù),在最終的指標(biāo)集結(jié)環(huán)節(jié),均需要對指標(biāo)進(jìn)行無量綱化處理。
綜上,本文以指標(biāo)無量綱化應(yīng)滿足同值域性為出發(fā)點(diǎn),遵循簡單實(shí)用的原則,對無量綱化所具備的特征進(jìn)行分析,給出一種更一般性的無量綱化方法,不僅適用于線性而且還能適用于非線性無量綱化處理方式。
無量綱化函數(shù)要滿足同值域性。為了遵從習(xí)慣和分析方便將值域規(guī)定為[0,1]區(qū)間,設(shè)指標(biāo)初始取值區(qū)間為[a,b],a,b∈R。適度性指標(biāo)的評價(jià)需要拆分成單調(diào)型指標(biāo),對適度指標(biāo)可以適度值為界限,將指標(biāo)取值區(qū)間分為兩部分,在不同的部分適度指標(biāo)就轉(zhuǎn)化為正向指標(biāo)和逆向指標(biāo)。首先對郭亞軍和易平濤(文獻(xiàn)[3])提出的理想無量綱化的性質(zhì)進(jìn)行分析,重點(diǎn)分析性質(zhì)2(差異比不變性),在此基礎(chǔ)上再對其它性質(zhì)進(jìn)行簡要討論。
文獻(xiàn)[3]提出6條性質(zhì)中,差異比不變性是一個(gè)最為重要的性質(zhì),一定條件下,根據(jù)該性質(zhì)可以推導(dǎo)出其它性質(zhì)。所謂差異比不變性,即要求無量綱化后的數(shù)據(jù)保留原有數(shù)據(jù)之間對于某個(gè)標(biāo)準(zhǔn)量的比較關(guān)系,即有:
(1)
(x1,x2為極大型指標(biāo)x的任意兩個(gè)觀測值,x′為一特定的標(biāo)準(zhǔn)值)成立。
函數(shù)f(x)若滿足性質(zhì)2,則其一定為線性函數(shù)。由性質(zhì)2題設(shè)可令x′=a,x2=b,帶入式(1)有:
(2)
整理式(2)得:
(3)
根據(jù)式(3)可知,滿足差異比不變性的無量綱化函數(shù)一定為線性函數(shù)。由于線性函數(shù)一定是單調(diào)函數(shù),自然滿足文獻(xiàn)[3]的性質(zhì)1即保序性;由于線性函數(shù)滿足變異不變性,即變異系數(shù)σ/μ于無量綱化前后保持不變,由性質(zhì)2可得胡永宏強(qiáng)調(diào)的變異系數(shù)不變性[4]。文獻(xiàn)[3]的性質(zhì)6為總量恒定性,縮放后總量保持不變,即縮放平移后原始數(shù)據(jù)之和保持不變。性質(zhì)2則表明無量綱函數(shù)為線性函數(shù),保持?jǐn)?shù)據(jù)總和不變,易知f(x)=x。因此,性質(zhì)6與性質(zhì)2是不能同時(shí)存在的。實(shí)際上總量恒定性不是一個(gè)好的性質(zhì)。無量綱化的目的是使量綱指標(biāo)數(shù)據(jù)具有可比性,各指標(biāo)應(yīng)映射到一個(gè)恒定的區(qū)間,與數(shù)據(jù)總和是否變動沒有必然關(guān)系。
另外,式(1)的表達(dá)不便理解,需要將其轉(zhuǎn)為更為直觀的表達(dá)方式。對?x1,x2,x3∈[a,b],根據(jù)式(1)可知:
(4)
(5)
整理式(4)和(5)可得:
(6)
定義若函數(shù)f:[a,b]→[0,1]在定義域上連續(xù)且單調(diào),則稱f(x)為0-1規(guī)范函數(shù)。
為了與習(xí)慣相符,0-1規(guī)范函數(shù)也可稱為0-1無量綱化函數(shù)。下面定理表明,任意形式的線性無量綱函數(shù),轉(zhuǎn)換至0-1規(guī)范函數(shù)均有相同的函數(shù)形式。
定理1設(shè)f(x)為[a,b]上的線性函數(shù),若將其轉(zhuǎn)換成0-1線性規(guī)范函數(shù)g(x),則:
①當(dāng)f(x)單調(diào)增,則有g(shù)(x)=(x-a)/(b-a);
②當(dāng)f(x)單調(diào)減,則有g(shù)(x)=(b-x)/(b-a)。
證明:函數(shù)f(x)為[a,b]上的線性函數(shù),于是設(shè)f(x)=px+q。當(dāng)其為單調(diào)增時(shí)有f(a)≤f(x)≤f(b),于是0≤f(x)-f(a)≤f(b)-f(a),進(jìn)一步有:
(7)
將f(x)=px+q帶入上式,整理得[f(x)-f(a)]/[f(b)-f(a)]=[x-a]/[b-a],顯然g(x)=[x-a]/[b-a]為0-1規(guī)范函數(shù)。
再證唯一性。若存在兩個(gè)不同的0-1規(guī)范函數(shù),即設(shè)gi(x)=pix+qi,i=1,2。由0-1規(guī)范函數(shù)可知:
g1(a)=p1a+q1=0,g2(a)=p2a+q2=0
g1(b)=p1b+q1=1,g2(b)=p2b+q2=1
整理得g1(b)-g1(a)=p1(b-a)=1,g2(b)-g2(a)=p2(b-a)=1,顯然p1=p2,同理可知q1=q2。故唯一性成立。
綜上,可知定理1①成立。定理1②證明類似,證略。
推論任意線性函數(shù)轉(zhuǎn)換成0-1線性規(guī)范函數(shù),均受區(qū)間端點(diǎn)值的影響。
在線性規(guī)范背景下,由定理1可知,0-1規(guī)范函數(shù)滿足文獻(xiàn)[3]的性質(zhì)3、性質(zhì)4和性質(zhì)5。性質(zhì)3為平移無關(guān)性,即對原始數(shù)據(jù)進(jìn)行“平移” 變換不會影響無量綱化后的結(jié)果。性質(zhì)4為縮放無關(guān)性,即對原始數(shù)據(jù)進(jìn)行“縮小” 或“放大”變換不會影響無量綱化后的結(jié)果。性質(zhì)5為區(qū)間穩(wěn)定性,即對任意一指標(biāo)原始數(shù)據(jù)的無量綱化處理結(jié)果都處在一個(gè)確定的取值范圍內(nèi)。
無量綱函數(shù)可分為單調(diào)型和適度型兩類,單調(diào)型可細(xì)分為線性單調(diào)和非線性單調(diào),適度型函數(shù)又可細(xì)分為折線型和非折線型兩種。適度型指標(biāo)需要拆分,對拆分后的指標(biāo)取值區(qū)間分別進(jìn)行同值域化處理。因此,對無量綱函數(shù)的研究轉(zhuǎn)換為對單調(diào)型函數(shù)的研究。
無量綱函數(shù)f(x)單調(diào)增或減,可分別采用如下公式進(jìn)行0-1規(guī)范化處理:
[f(x)-f(a)]/[f(b)-f(a)]
(8)
[f(b)-f(x)]/[f(b)-f(a)]
(9)
對非線性0-1規(guī)范函數(shù),函數(shù)形式有時(shí)比較復(fù)雜,需要借助下面定理進(jìn)行研究。
定理2若f(x)為0-1規(guī)范函數(shù)且單調(diào)增,則存在唯一連續(xù)且單調(diào)增函數(shù)φ(x),使得f(x)=φ(g(x)),其中g(shù)(x)=(x-a)/(b-a)。
證明:由于g(x)為線性函數(shù),故其存在逆函數(shù)g-1,于是x=g-1(g(x))=(g-1°g)(x)。將其代入f(x)得:
f(x)=f(g-1(g(x)))=(f°g-1)(g(x))
令φ=f°g-1,由于f,g-1連續(xù)單調(diào)增且給定的,故φ(x)連續(xù)單調(diào)增且唯一的。證畢。
為了方便,稱定理2中的φ(x)為生成函數(shù),由證明過程可知φ(x)=f(g-1(x)),于是單調(diào)非線性0-1規(guī)范函數(shù)f(x)均可轉(zhuǎn)換成對φ(x)的研究。顯然,函數(shù)φ(x)與f(x)同序;f(x)為非線性函數(shù),則φ(x)為非線性函數(shù)。不難驗(yàn)證,若函數(shù)φ(x)連續(xù),且滿足φ(0)=0,φ(1)=1,則φ(g(x))是0-1規(guī)范函數(shù)。
在應(yīng)用中,對單調(diào)增的非線性0-1規(guī)范函數(shù),對原始數(shù)據(jù)先應(yīng)用g(x)=(x-a)/(b-a)進(jìn)行線性化處理,之后再根據(jù)實(shí)際情況,采用特定的φ(x)構(gòu)造出規(guī)范函數(shù)。
Rezaei(文獻(xiàn)[7])介紹了一種應(yīng)用較靈活的非線性無量綱函數(shù),即:
(10)
不過式(10)函數(shù)形式相對復(fù)雜,調(diào)節(jié)參數(shù)ρ時(shí),要考慮邊界值a,b。同樣的ρ值,由于邊界值的不同,表示的含義不同。在模擬仿真分析中,文獻(xiàn)[7]要不斷變換指標(biāo)邊界值。根據(jù)定理2,能得到式(10)的一般表示形式。函數(shù)g(x)的逆函數(shù)為g-1(x)=(b-a)x+a,根據(jù)φ=f°g-1,得到:
(11)
令(b-a)/ρ=θ,代入式(11)右端上式,整理得:
(12)
進(jìn)而,根據(jù)式(12)和式(11)整理有:
(13)
根據(jù)式(13)中參數(shù)θ的取值變化,分別繪制了其大于零和小于零時(shí)的若干曲線圖。
從圖1和圖2可以看出,參數(shù)θ取值決定著函數(shù)形狀。當(dāng)θ>0時(shí)函數(shù)φ(x)為上凹函數(shù);當(dāng)θ<0時(shí)函數(shù)φ(x)為下凸函數(shù);當(dāng)θ=0時(shí)函數(shù)φ(x)為線性函數(shù)。根據(jù)實(shí)際情況,可以選擇相應(yīng)的函數(shù)形式。例如,研究收入對效用的影響,根據(jù)邊際效用遞減規(guī)律可采用上凹函數(shù),即θ>0;令Δ表示空氣污染物So2的濃度增量,當(dāng)濃度很小時(shí),一個(gè)小的濃度增量變化對人體危害不大,當(dāng)濃度很大時(shí),特別是接近于人體承受臨界,一個(gè)小的增量Δ便起到了“壓死駱駝的最后一根稻草”的作用,此時(shí)應(yīng)選擇上凸函數(shù)。
如何根據(jù)實(shí)際情況確定參數(shù)θ的凹凸形狀,即參數(shù)θ具體取值呢?實(shí)際上,在一些情況下,過于“精確”反而起到反作用,因?yàn)檫@些細(xì)節(jié)會給我們帶來困惑與苦惱,會給我們一個(gè)精準(zhǔn)的假象。然而,輸出結(jié)果并不會因廣泛的近似而貶值。但對式(13)的函數(shù)特征可以給出輔助性的判定方法。對φ(x)進(jìn)行求導(dǎo):
(14)
對?x1,x2∈[0,1],二者導(dǎo)數(shù)的比值整理得:
(15)
令exp[θ(x2-x1)]=k,兩端取對數(shù)整理得:
(16)
在模糊語義隸屬函數(shù)構(gòu)造過程中,特別是五級劃分中,圍繞0.2為軸構(gòu)造的隸屬函數(shù)表示較低水平、0.8為軸對應(yīng)較高水平。假如在空氣質(zhì)量污染較高水平下一個(gè)小的增量效果是較低水平下的2倍,于是根據(jù)公式(16)可得到θ=ln2/(0.8-0.2)=1.155。
圖1 參數(shù)θ為正值對應(yīng)的曲線圖
圖2 參數(shù)θ為負(fù)值對應(yīng)的曲線圖
指標(biāo)同向化處理過程中,學(xué)者們注意到了將逆向指標(biāo)轉(zhuǎn)換為正向指標(biāo)存在的問題。當(dāng)前常取倒數(shù)進(jìn)行正向化處理。葉宗裕認(rèn)為取倒數(shù)的變換方法完全改變了原指標(biāo)的分布規(guī)律,該方法不可取,提出了對逆向指標(biāo)正向化方法通過端點(diǎn)值簡單變換即可,即給定逆向指標(biāo)原始數(shù)據(jù)x,通過b-x變換即滿足要求。取倒數(shù)本質(zhì)上是采用了非線性變換,不滿足差異比不變性,更不滿足指標(biāo)同值域化基本要求。
逆向指標(biāo)的選擇還應(yīng)滿足同向不變性。所謂同向不變性是指,無論將所有指標(biāo)轉(zhuǎn)換為正向指標(biāo),還是將其轉(zhuǎn)換成逆向指標(biāo),二者的排序應(yīng)該是互反的,即優(yōu)劣關(guān)系保持不變。容易驗(yàn)證,倒數(shù)法的同向化處理方法,不滿足同向不變性。
對于0-1規(guī)范函數(shù)f(x),遵循簡單易行的原則,對逆向指標(biāo)采用如下正向化方法:
f(b)-f(x)=1-f(x)
(17)
式(17)遵循了葉宗裕的思路,但適用范圍更廣。當(dāng)f(x)為0-1非線性函數(shù)時(shí),1-f(x)也為0-1非線性函數(shù)。該變換方法保證了同向不變性。設(shè)有n個(gè)指標(biāo),x=(x1,x2,…,xn)正向化向量記(f(x1),f(x2),…,f(xn)),根據(jù)式(17)逆向化向量為(1-f(x1),1-f(x2),…,1-f(xn))。正向化線性綜合值如下:
F1(x)=ω1f(x1)+ω2f(x2)+…+ωnf(xn)
逆向化線性綜合值為:
F2(x)=ω1[1-f(x1)]+ω2[1-f(x2)]+…+ωn[1-f(xn)]=1-F(x)
于是,可知對任意兩個(gè)x,y∈Rn,若F1(x)>F1(y),則有F2(x) 應(yīng)用0-1規(guī)范函數(shù)對指標(biāo)進(jìn)行無量綱化處理。首先明確指標(biāo)邊界。結(jié)合定理1和定理2可知,任何0-1規(guī)范函數(shù)都受邊界值影響,因此邊界值的確定是規(guī)范化重要的基礎(chǔ)性步驟。確定邊界值更多需要借助專業(yè)人士來完成。同樣的數(shù)據(jù)在不同的情境下意義可能并不相同,其可能的邊界也會變動。其次,根據(jù)各指標(biāo)反映的研究對象,通過模型與實(shí)踐背景相結(jié)合的原則,估計(jì)無量綱函數(shù)的θ。最后對指標(biāo)進(jìn)行同向化處理。具體操作步驟如下: 第一步:確定指標(biāo)邊界值; 第二步:根據(jù)定理1中的①,將指標(biāo)取值變換至[0,1]區(qū)間; 第三步:確定參數(shù)θ,根據(jù)式(13)對指標(biāo)進(jìn)行無量綱化處理; 第四步:根據(jù)式(17)將逆向指標(biāo)調(diào)整為正向指標(biāo)。 盡管文獻(xiàn)[7]研究多個(gè)適度型指標(biāo),出于簡單方便的原則認(rèn)為折線型適度指標(biāo)很大程度可以代替非折線適度型指標(biāo)。由于適度型指標(biāo)需要拆分成單調(diào)指標(biāo),因此只需討論線性與非線性指標(biāo)的無量綱化問題。選擇實(shí)例目的在于,驗(yàn)證線性與非線性無量綱化方法兩種結(jié)果多大程度能保持一致。 例子選自鄒志紅等的文獻(xiàn),該例對三峽庫區(qū)重慶、長壽等城市江段13個(gè)監(jiān)測斷面,運(yùn)用線性綜合方法進(jìn)行水質(zhì)評價(jià)[12]。水質(zhì)評價(jià)采用了溶解氧(DO)、高錳酸鹽(CODmu)、化學(xué)耗氧量(CODCr)、五日生化耗氧量(BOD5)、總磷(TP)等5項(xiàng)非生物代表性指標(biāo)作為指標(biāo)集,原始數(shù)據(jù)見表1。 表1 原始數(shù)據(jù) 出于簡便的原則,采用各指標(biāo)的最大與最小值作為各指標(biāo)的取值邊界(實(shí)踐中可能需要專家經(jīng)驗(yàn)確定取值邊界)。根據(jù)定理1中的①,將指標(biāo)取值變換至[0,1]區(qū)間(見表2),注意逆向指標(biāo)溶解氧(DO)也采用同樣的變換方式。 表2 正向0-1線性歸一化數(shù)據(jù) 由于污染物隨著濃度的增加,其對環(huán)境的影響程度隨著邊際濃度增加而增大,因此參數(shù)θ的取值應(yīng)小于零,分別選擇0、-0.5、-1、-2、-3、-4、-5、-10和-20等9個(gè)參數(shù)。分別根據(jù)式(13)對指標(biāo)進(jìn)行無量綱化處理(對逆向指標(biāo)溶解氧(DO)根據(jù)式(17)進(jìn)行正向變換)。根據(jù)各指標(biāo)權(quán)重(見表3),采用線性函數(shù)對5個(gè)標(biāo)準(zhǔn)化后的指標(biāo)進(jìn)行集結(jié)。 表3 準(zhǔn)則權(quán)重 對集結(jié)結(jié)果進(jìn)行排序,序值越小表示污染程度越大。各參數(shù)值對應(yīng)的排序結(jié)果見表4。 表4 對應(yīng)不同參數(shù)值下的方案排序 采用k-means算法進(jìn)行聚類分析。對排序結(jié)果進(jìn)行聚類分析,得到圖3。由圖3可以看出,θ取值排序結(jié)果可以分成三個(gè)大類:A={0,-0.5,-1,-2}、B={-3,-4,-5}和C={-10,-20}。 聚類結(jié)果表明,線性規(guī)范排序結(jié)果與非線性排序結(jié)果存在差異;多個(gè)非線性規(guī)范也存在差異,例如B類和C類。因此,直接用線性函數(shù)來替代非線性規(guī)范函數(shù)有時(shí)是不可取的。在本例中,根據(jù)經(jīng)驗(yàn)判定,假若θ值小于0,但不會小于-2,此時(shí)可以選擇線性0-1規(guī)范函數(shù)進(jìn)行無量綱化處理;但是,若θ取值為C類,這時(shí)用線性規(guī)范函數(shù)會發(fā)生較明顯偏差。 該例顯示,不同的無量綱函數(shù)的確可能有不同排序結(jié)果。在實(shí)踐應(yīng)用中,評估θ取值是選擇線性函數(shù)和非線性函數(shù)的關(guān)鍵。另外,差異程度不僅與評價(jià)模型類型有關(guān),與模型中具體參數(shù)設(shè)置也有關(guān),例如權(quán)重取值。因此,需要理論與實(shí)踐經(jīng)驗(yàn)相結(jié)合來估計(jì)參數(shù)θ,并評估包含該參數(shù)值的穩(wěn)定區(qū)間。 圖3 k-means聚類圖 研究發(fā)現(xiàn),同值域性是實(shí)施指標(biāo)無量綱化過程的關(guān)鍵性必要條件。遵循同值域性指標(biāo)的無量綱化方法可以歸結(jié)為統(tǒng)一形式,即首先通過極差無量綱化公式將指標(biāo)數(shù)據(jù)映射至[0,1]區(qū)間;根據(jù)實(shí)際意義選擇線性或者非線性函數(shù),再次進(jìn)行數(shù)值轉(zhuǎn)換;之后,對逆向指標(biāo)根據(jù)式(17)同向變換。極差無量綱化方法不僅是最佳的線性規(guī)范方法,更是非線性規(guī)范的基礎(chǔ)。通過生成函數(shù),有助于選擇非線性無量綱化函數(shù),降低對其進(jìn)行分析的難度,有效規(guī)避指標(biāo)區(qū)間端點(diǎn)不斷變動而導(dǎo)致的分析困難。對無量綱化的分析表明,無論采用何種0-1規(guī)范函數(shù),均不可避免受到區(qū)間端點(diǎn)的影響,確定區(qū)間端點(diǎn)是有效避免逆序發(fā)生的關(guān)鍵。需要注意的是,本文應(yīng)用的0-1非線性規(guī)范函數(shù),即式(13)僅是非線性函數(shù)中的一類,對于有拐點(diǎn)的呈“S”型單調(diào)規(guī)范函數(shù)(如文獻(xiàn)[13])也是一種常用類型。對該類函數(shù)的分析,將在今后的研究過程中有所體現(xiàn)。五、實(shí)施步驟
六、實(shí)例分析
七、結(jié)論