韓波,郭梅修
(北海市環(huán)境監(jiān)測中心站,廣西北海536000)
遺傳投影尋蹤回歸在城市環(huán)境質(zhì)量評價中的應用
韓波,郭梅修
(北海市環(huán)境監(jiān)測中心站,廣西北海536000)
引入投影降維的思想,將遺傳投影尋蹤與回歸分析技術(shù)運用到城市環(huán)境質(zhì)量評價中。將此技術(shù)與神經(jīng)網(wǎng)絡方法進行實例比較,投影尋蹤回歸方法不但可以合理地作出環(huán)境質(zhì)量的綜合評價,而且消除了神經(jīng)網(wǎng)絡方法中類別判斷不夠精確的影響。
投影尋蹤;遺傳算法;城市環(huán)境質(zhì)量;評價;回歸分析
城市環(huán)境質(zhì)量評價,就是根據(jù)城市各組成要素及其特征污染指標進行全環(huán)境的綜合質(zhì)量評價。城市環(huán)境的復雜性使得人們難以用數(shù)學的方法為其建立精確的模型。近年來城市環(huán)境質(zhì)量評價方法的研究進展迅速,尤其是運用層次分析、模糊數(shù)學和神經(jīng)網(wǎng)絡的方法進行城市環(huán)境質(zhì)量評價已成為一種時尚,并取得了很多成果[1~3]。然而,這些方法也存在一些缺陷,如層次分析和模糊數(shù)學很難擺脫評價過程中的隨機性和參評人員主觀上的不確定性及其認知水平上的模糊性,不同的人采用同一案例,常常會得出不一致的評價結(jié)果。如何科學、客觀地將一個復雜高維空間數(shù)據(jù)的分布綜合成簡單指數(shù)的形式,已成為城市環(huán)境質(zhì)量評價研究的焦點。該研究嘗試應用遺傳投影尋蹤回歸方法對城市環(huán)境質(zhì)量進行評價,以期為城市環(huán)境質(zhì)量評價開辟新的途徑。
投影尋蹤是一種處理多因素復雜問題的統(tǒng)計方法,即利用計算機技術(shù),首先根據(jù)經(jīng)驗給定一個初始模型,把數(shù)據(jù)投影到低維空間上,找出數(shù)據(jù)與現(xiàn)有模型相差最大的投影,然后把投影中所包含的結(jié)構(gòu)并在現(xiàn)有模型上,得到改進的新模型,再從這個新模型出發(fā),重復以上步驟,直到數(shù)據(jù)與模型在任何投影空間都沒有明顯的差別為止。若將投影尋蹤與回歸分析結(jié)合,則形成城市環(huán)境質(zhì)量評價投影尋蹤回歸模型[4]。具體步驟如下:
步聚1:構(gòu)造投影指標函數(shù)。設依據(jù)城市環(huán)境各指標評價標準表產(chǎn)生評價等級及其環(huán)境指標分別為y(i)及{x*(j,i)|j=1-p},i=1-n。其中,n,p分別為樣本個數(shù)和指標個數(shù)。污染越重,評價等級就越高,最低等級設為1,最高等級設為N。建立評價模型就是建立{x*(j,i)|j=1-p}與y(i)之間的數(shù)學關(guān)系。投影尋蹤方法就是p維數(shù)據(jù){x*(j,i)|j=1-p}綜合成以a=(a(1),a(2),…,a(p))為投影方向一維投值Z(i):
然后根據(jù)Z(i)-y(i)的散點圖建立數(shù)學關(guān)系。為了消除各污染指標值的量綱和統(tǒng)一各指標值的變化范圍,式(1)中a為單位長度向量,a(j)為指標投影方向單位向量,{x(j,i)=|j=1p,為(x*(j,i)=|j=1-p)的標準化值,即:
式(2)中,xmax(j)為根據(jù)評價標準表確定的第j個指標的最大值。
在綜合投影值時,要求投影值構(gòu)造一個投影指標函數(shù)Z(i),Z(i)應盡可能大地提取{x(j,i)}中的變異信息,即z(i)的標準差Sz達到盡可能大;同時要求z(i)與y(i)的相關(guān)系數(shù)的絕對值|Rzy|達到盡可能大:
式中,Sz為投影值z(i)的標準差:
Rzy為z(i)與y(i)的相關(guān)系數(shù):
步驟2:優(yōu)化投影指標函數(shù)。當給定評價等級及評價指標的樣本數(shù)據(jù){y(i)=|i=1-n}和{x*(j,i)=|j=1-p,i=1-n}時,投影指標函數(shù)Q(a)只隨著投影方向a的變化而變化??赏ㄟ^求解投影指標函數(shù)最大化問題來估計最佳投影方向,即:
這是一個以為優(yōu)化變量的非線性優(yōu)化問題,用常規(guī)方法很難處理,而用遺傳算法來求解就顯得十分簡便和有效。
步驟3:建立投影尋蹤回歸質(zhì)量評價模型。把由步聚2求得的最佳投影方向的估計值a代入(1)式后即得第i個評價等級投影值的計算值z(i),根據(jù)z(i)-y(i)的繪制散點圖進行回歸分析,尋找較好評價等級值y(i)與投影值z(i)的非線性方程。研究表明z(i)-y(i)關(guān)系為非線性對數(shù)函數(shù)類型:
遺傳算法是Holland教授于1969年提出,后經(jīng)DeJong等人歸納總結(jié)所形成的一類模擬進化算法。遺傳算法與傳統(tǒng)搜索算法不同,它以適應度函數(shù)為依據(jù),通過對種群中的所有個體實施遺傳操作,實現(xiàn)群體內(nèi)個體結(jié)構(gòu)重組的迭代過程隨機搜索算法。選擇、雜交、變異構(gòu)成遺傳算法的三個主要遺傳操作因子,其主要計算步驟如下:[5]
(1)選擇一定數(shù)目的個體構(gòu)成初始種群,并求出種群內(nèi)各個個體的函數(shù)值。
(2)設置迭代代數(shù),開始循環(huán)。
(3)計算選擇函數(shù)的值,選擇即通過概率的形式從種群中選擇若干個體的方式。
(4)通過染色體個體基因的復制、交叉、變異等創(chuàng)造新個體,構(gòu)成新的種群。
(5)進行循環(huán),若終止條件不滿足,則轉(zhuǎn)到步驟(3)繼續(xù)進化。
劉曉莉等人[6]采用神經(jīng)網(wǎng)絡方法對1997-2002年廣州市城市環(huán)境質(zhì)量進行了評價,評價選取指標體系為:大氣環(huán)境為二氧化硫(SO2)、二氧化氮(NO2)、氮氧化物(NOx)、總懸浮顆粒物(TSP);水環(huán)境為總磷(TP)、生化需氧量(BOD5)、石油類(OIL);聲環(huán)境為交通噪聲(Leq交)和區(qū)域噪聲(Leq區(qū))3個要素9個評價指標。城市環(huán)境質(zhì)量評價標準見表1。在應用投影尋蹤回歸法之前,需要把表1處理成足夠的、有效的樣本數(shù)據(jù),才有利于模擬環(huán)境系統(tǒng)的復雜性和精度。這里采用線性等隔內(nèi)插法在表1各級評價等級取值范圍內(nèi)均勻生成10個指標值,與對應的評價級別線性等隔內(nèi)插值(等級值)一起組成樣本數(shù)據(jù),如表2所示。
表1 城市環(huán)境質(zhì)量評價標準
表2 城市環(huán)境質(zhì)量標準內(nèi)插值和尋蹤投影回歸的計算值的對比結(jié)果
續(xù)表2
從表2所構(gòu)建的評價標準樣本數(shù)據(jù)出發(fā),首先根據(jù)式(2),把表2中各數(shù)據(jù)進行標準化,然后通過編制目標函數(shù)和約束函數(shù)兩個文件后調(diào)用gatool,在Matlab7.8版圖形用戶界面(GUI)完成相關(guān)參數(shù)設置,進行計算,種群數(shù)為20,變異采用自適應方法,其他采用工具箱默認設置,程序運行后,得到最佳投影方向a=(0.0360.1580.2240.6160.0760.5380.0890.4910.015)。把a代入(1)式后可求得城市環(huán)境質(zhì)量評價等級的投影值z(i),見表2。將y(i)與z(i)經(jīng)非線性曲線擬合后,得到評價等級y(i)與z(i)的關(guān)系式(圖1)和等級計算值結(jié)果(表2)。
圖1 投影值與評價等級的關(guān)系
將文獻[6]1997-2002年廣州市環(huán)境指標監(jiān)測值(實際數(shù)據(jù))和按上述建立的城市環(huán)境質(zhì)量評價模型計算各個評價指標的投影值、等級計算值結(jié)果列于表3,文獻[6]神經(jīng)網(wǎng)絡法計算的特征值和評價結(jié)果列于表4。
表3 1997-2002年廣州市環(huán)境指標監(jiān)測值與投影尋蹤回歸評價結(jié)果
表4 1997-2002年廣州市環(huán)境質(zhì)量神經(jīng)網(wǎng)絡法計算的特征值和評價結(jié)果
由表3、表4兩種評價結(jié)果可知:2000-2002年神經(jīng)網(wǎng)絡法與尋蹤投影回歸法不盡相同,從原始數(shù)據(jù)分析:2000年TSP、NOx、TP、BOD5、交通噪聲,2001年SO2、NOx、TP、BOD5、交通噪聲,2002年SO2、TSP、TP、BOD5、交通噪聲,都超過了較好等級,按經(jīng)驗判別神經(jīng)網(wǎng)絡法評價是有誤的,其原因一方面是神經(jīng)網(wǎng)絡訓練樣本數(shù)太少(僅用了5個訓練樣本),另一方面是神經(jīng)網(wǎng)絡結(jié)構(gòu)不合理,在設置網(wǎng)絡結(jié)構(gòu)時應該將希望輸出為一維輸出,這樣不僅網(wǎng)絡收斂快,輸出誤差小,而且還可以消除輸出結(jié)果離散化的影響。對比投影尋蹤回歸法,輸出結(jié)果分別是人們便于識別的一維投影值和等級計算值。將等級計算值對照表1,證明評價結(jié)果合理,并且對照原始數(shù)據(jù),不會產(chǎn)生不可信的誤判。
采用遺傳算法對尋蹤投影模型的投影方向進行優(yōu)化,將評價等級對應的投影值與回歸分析技術(shù)相結(jié)合,構(gòu)建了投影尋蹤法用于環(huán)境質(zhì)量等級類別的判定,精確量化了評價結(jié)果。通過實例分析比較,驗證了投影尋蹤回歸法應用于城市環(huán)境質(zhì)量評價較之神經(jīng)網(wǎng)絡更具可行性與合理性,避免了在權(quán)重給定中的人為任意性。遺傳投影尋蹤指標的權(quán)重,是通過尋找最佳投影向量獲取,采用計算機技術(shù)完成,并具有嚴謹而科學的數(shù)學方法。最佳投影向量獲得的投影值為評價污染程度提供了依據(jù),能直觀地比較出各樣本間污染的輕重程度。另外,投影尋蹤與回歸技術(shù)結(jié)合,將量化城市環(huán)境質(zhì)量評價污染等級的分類,它為涉及城市環(huán)境多因素的綜合評價提供了一條新思路。
[1]徐福留,周家貴,李本綱,等.城市環(huán)境質(zhì)量多級模糊綜合評價[J].城市環(huán)境與生態(tài)環(huán)境,2001,14(2):13-15.
[2]劉殿偉,周云軒,付哲.吉林西部環(huán)境質(zhì)量空間模糊綜合評價[J].干旱區(qū)研究,2006,23(1):155-159.
[3]韓波.L-M神經(jīng)網(wǎng)絡在北海市城市環(huán)境質(zhì)量評價中的應用[J].三峽環(huán)境與生態(tài),2011,33(6):42-45.
[4]金菊良,魏一鳴,丁晶.水質(zhì)綜合評價的投影尋蹤模型[J].環(huán)境科學學報,2001,21(4):431-434.
[5]陳廣洲,解華明,魯祥友.Matlab遺傳算法工具箱在非線性優(yōu)化中的應用[J].計算機技術(shù)與發(fā)展,2008,18(3):246-248,252.
[6]劉曉莉,李夢婷.基于Matlab的神經(jīng)網(wǎng)絡在城市環(huán)境質(zhì)量評價中的應用[J].佛山科學技術(shù)學院學報:自然科學版,2005,23(1):41-44.
Application of Genetic Projection Pursuit Regression in the Evaluation of Urban Environmental Quality
Han Bo,Guo Meixiu
(Beihai Environmental Monitoring Center,Beihai Guangxi 536000,China)
The paper introduced the projection dimension reduction ideas and applied the genetic projection pursuit regression technique to the evaluation of urban environmental quality and compared this technique with the neural network method.It is found that projection pursuit regression method is not only reasonable to make a comprehensive evaluation of the environmental quality,but also eliminate the effect of category judgment’s inaccuracy in the neural network method.
projection pursuit;genetic algorithm;urban environmental quality;evaluation;regression analysis
X820.2
A
1008-813X(2012)04-0011-05
10.3969/j.issn.1008-813X.2012.04.004
2012-04-28
韓波(1956-),男,河北省巨鹿縣人,畢業(yè)于湖北理工學院環(huán)境監(jiān)測專業(yè),高級工程師,主要從事環(huán)境監(jiān)測與科研工作。