国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機森林-投影尋蹤法的生物滯留系統(tǒng)多目標(biāo)評價方法

2022-08-30 06:21:02程麒銘唐穎輝袁紹春
水資源與水工程學(xué)報 2022年4期
關(guān)鍵詞:投影介質(zhì)生物

程麒銘, 陳 垚, 2, 劉 臻,2, 唐穎輝, 袁紹春,2

(1.重慶交通大學(xué) 河海學(xué)院, 重慶 400074; 2.重慶交通大學(xué) 環(huán)境水利工程重慶市工程實驗室, 重慶 400074)

1 研究背景

生物滯留系統(tǒng)是海綿城市建設(shè)的主要技術(shù)措施之一,其可通過植物吸收、填料過濾和微生物降解等多種作用實現(xiàn)對徑流量的削減和污染物的控制[1-2],植物與介質(zhì)土均是組成生物滯留系統(tǒng)的重要部分[3],可直接影響生物滯留系統(tǒng)的運行性能。因此,植物和介質(zhì)土的篩選是生物滯留系統(tǒng)設(shè)計和運行的重要考量部分[4]。由于不同植物和介質(zhì)土對生物滯留系統(tǒng)除污能力和水力性能的改善效果不盡相同,使得評價指標(biāo)數(shù)據(jù)樣本之間存在高度非線性關(guān)系,且原始實驗數(shù)據(jù)通常具有較高的維度。研究結(jié)果表明[5],高維度、非線性數(shù)據(jù)樣本的數(shù)值分析容易造成維數(shù)災(zāi)難,導(dǎo)致計算工作量成倍增加。目前,國內(nèi)外均未形成統(tǒng)一的評價方法,通常采用層次分析法、模糊綜合評價法等[6],但此類方法存在評價結(jié)果主觀性較強,且模型假設(shè)和概化對評價結(jié)果影響較大的問題[7]。

為尋求更客觀、高效的多目標(biāo)綜合評價方法,研究者們嘗試采用神經(jīng)網(wǎng)絡(luò)模型(如Elman神經(jīng)網(wǎng)絡(luò)[8]、模糊神經(jīng)網(wǎng)絡(luò)[9]和BP神經(jīng)網(wǎng)絡(luò)[10])的機器學(xué)習(xí)功能實現(xiàn)對水體水質(zhì)的多目標(biāo)評價,但結(jié)果顯示評價具有偶然性而導(dǎo)致結(jié)果可信度不高。而采用貝葉斯模型[11]、基于改進螢火蟲算法的投影尋蹤模型[12-13]等統(tǒng)計學(xué)模型,則易發(fā)生“棄真”和“取偽”的錯誤[14]。同時,上述方法還存在典型的維數(shù)災(zāi)害問題,導(dǎo)致計算量呈指數(shù)增長,甚至造成計算機無法運行。閆佰忠等[15]采用隨機森林模型的機器學(xué)習(xí)功能對安陽市8個地下水監(jiān)測點的水質(zhì)檢測數(shù)據(jù)進行處理,證實基于隨機森林模型的水質(zhì)評價模型能夠準(zhǔn)確評價水質(zhì)的同時,擁有更高訓(xùn)練效率與穩(wěn)定性。但該方法主要基于模型的分類原理,并未達到降低數(shù)據(jù)維度的目的,導(dǎo)致計算工作量較大。而基于特征選擇功能的隨機森林模型可達到數(shù)據(jù)降維的目的,在保證數(shù)據(jù)分析結(jié)果準(zhǔn)確性的同時大幅提高計算速度。為此,本文采用隨機森林(random forest,RF)模型對不同植物、介質(zhì)土下的水力性能和污染物去除率等原始數(shù)據(jù)進行特征篩選以降低數(shù)據(jù)維度,構(gòu)建基于投影尋蹤(projection pursuit,PP)模型的多目標(biāo)綜合評價模型(RF-PP),并通過遺傳算法(genetic algorithm,GA)和粒子群算法(particle swarm optimization,PSO)對RF-PP模型進行求解,最后將評價結(jié)果與傳統(tǒng)評價方法進行對比分析,以驗證本文方法的準(zhǔn)確性,從而提出一種適合生物滯留系統(tǒng)多目標(biāo)評價的方法。

2 數(shù)據(jù)來源與研究方法

2.1 數(shù)據(jù)來源

表1 本研究所采用的原始數(shù)據(jù)情況

2.2 模型原理

(1)隨機森林特征選擇。隨機森林(RF)算法屬于機器學(xué)習(xí)算法的一種,最早由美國統(tǒng)計學(xué)家Leo Breiman提出,其可通過袋外數(shù)據(jù)誤差估計(out of bag error estimation)衡量每個數(shù)據(jù)特征對模型擬合效果的重要性,從而實現(xiàn)研究數(shù)據(jù)的特征選擇[18],具體步驟詳見文獻[19]、[20]。

(2)投影尋蹤模型。投影尋蹤(PP)法是對采集到的樣本數(shù)據(jù)進行高維處理和分析的新型統(tǒng)計學(xué)方法[21],該方法采用計算機對低維空間進行分析,以描述高維空間的數(shù)據(jù)信息,通過對高維空間的數(shù)據(jù)再整合,并將數(shù)據(jù)引入低維子空間進行降維處理,得到指標(biāo)量遠(yuǎn)小于樣本數(shù)據(jù)量的投影指標(biāo),從而尋找出高維樣本數(shù)據(jù)的整體特征[22-23]。在投影尋蹤模型中,投影方向代表不同的高維數(shù)據(jù)結(jié)構(gòu)或特征,其中最佳投影方向最能體現(xiàn)高維數(shù)據(jù)的結(jié)構(gòu)特征,而求解最佳投影方向就是對投影指標(biāo)函數(shù)進行最大化尋優(yōu),具體方法詳見文獻[24]。本研究首先利用RF算法對原始數(shù)據(jù)進行降維后利用PP方法進行模型構(gòu)建,最終建立生物滯留系統(tǒng)多目標(biāo)評價RF-PP模型。

2.3 模型求解

由于不同評價指標(biāo)具有不同的量綱和取值范圍,為消除奇異樣本數(shù)據(jù)導(dǎo)致的不良影響,通常需要采用歸一化方法(如最大最小歸一化、Z-score歸一化、非線性歸一化等)對原始數(shù)據(jù)樣本進行處理。根據(jù)生物滯留系統(tǒng)運行性能越大越優(yōu)的目標(biāo),應(yīng)采用最大最小歸一化法:

(1)

由于投影尋蹤模型屬于非線性優(yōu)化問題,通常可采用魚群算法、粒子群算法、螢火蟲算法、遺傳算法等群體智能算法求解這類多極值點的復(fù)雜優(yōu)化問題[25-26]。其中,遺傳算法(GA)是受生物界進化規(guī)律啟發(fā),從初始群體中隨機選擇個體,將該個體作為父級生成下一代子級,通過一系列的交叉、變異等重復(fù)步驟后,對獲得的樣本進行適應(yīng)性驗證,最終演化為模型最優(yōu)解,已廣泛應(yīng)用于各領(lǐng)域中求解有約束或無約束的非線性優(yōu)化問題[27-28]。粒子群算法(PSO)是受鳥群捕食行為的啟發(fā),將鳥群作為一個粒子群,將每只鳥作為一個粒子,根據(jù)各粒子自身所處的位置,將尋找食物的路徑分享給群體,通過比較路徑距離而不斷改變路徑,最終獲得最優(yōu)路徑即模型最優(yōu)解[29-31]。為了避免單一算法造成的偶然性結(jié)果,本研究采用GA和PSO兩類算法求解構(gòu)建的生物滯留系統(tǒng)多目標(biāo)評價RF-PP模型,并對多目標(biāo)評價結(jié)果進行優(yōu)劣排序。

3 結(jié)果分析與討論

3.1 隨機森林法結(jié)果分析

根據(jù)隨機森林原理編寫Python程序,運行后得到A、B兩組數(shù)據(jù)中相關(guān)指標(biāo)重要性程度的得分情況如圖1所示,兩組數(shù)據(jù)指標(biāo)各自的相關(guān)系數(shù)如圖2所示。

圖1 A、B兩組數(shù)據(jù)相關(guān)指標(biāo)的重要程度得分值

圖2 A、B兩組數(shù)據(jù)指標(biāo)各自的相關(guān)系數(shù)

3.2 投影尋蹤法結(jié)果分析

利用MATLAB遺傳算法工具箱函數(shù),并改寫PSO工具箱函數(shù)分別運行GA算法和PSO算法以求解本研究構(gòu)建的RF-PP模型的優(yōu)化問題[32],從而得到各指標(biāo)的最優(yōu)投影系數(shù)a=a(a1,a2,…,am),如圖3所示。投影系數(shù)a越大,則表明該系數(shù)對應(yīng)指標(biāo)對評價結(jié)果的權(quán)重越大。

圖3 A、B兩組數(shù)據(jù)指標(biāo)的最優(yōu)投影系數(shù)

表2 A、B兩組數(shù)據(jù)指標(biāo)的方差

將GA和PSO兩種方法求得的最優(yōu)投影系數(shù)分別代入投影尋蹤模型中,可分別得到A組和B組不同實驗對象的投影值,如圖4所示。A、B兩組數(shù)據(jù)不同評價方法的評價結(jié)果分別見表3、4。

圖4 A、B兩組實驗數(shù)據(jù)投影尋蹤模型結(jié)果

表3 A組數(shù)據(jù)不同評價方法的評價結(jié)果

表4 B組數(shù)據(jù)不同評價方法的評價結(jié)果

根據(jù)本研究算法得到的結(jié)果,植物與介質(zhì)土單獨實驗時,可以采用風(fēng)車草作為生物滯留系統(tǒng)的植物,采用RST2作為生物滯留系統(tǒng)的介質(zhì)土;但由于植物與介質(zhì)土可能存在耦合效應(yīng),因此,對于生物滯留系統(tǒng)中植物與介質(zhì)土的最優(yōu)組合仍需進一步通過實驗進行驗證。

4 結(jié) 論

(1)針對生物滯留系統(tǒng)多目標(biāo)評價問題的復(fù)雜性,提出了RF-PP模型,且通過對原始數(shù)據(jù)采用隨機森林進行特征篩選降維后,在一定程度上提升了模型求解速度;但受實驗數(shù)據(jù)樣本數(shù)所限,RF-PP模型尚不能體現(xiàn)出在避免維數(shù)災(zāi)難上的優(yōu)勢。同時利用魯棒性高、求解速度快、參數(shù)不敏感的GA與PSO算法確定的權(quán)重指標(biāo),可有效避免傳統(tǒng)求解方法參數(shù)難以確定、易陷入局部最優(yōu)解等問題,進而得到更加合理的指標(biāo)權(quán)重,實現(xiàn)方案優(yōu)劣排序。

(2)植物評價結(jié)果表明,風(fēng)車草為生物滯留系統(tǒng)的最佳植物,且評價結(jié)果與層次分析模型和BP神經(jīng)網(wǎng)絡(luò)模型方法相似;介質(zhì)土評價結(jié)果表明,RST2(9.8%壤砂土+88.2%細(xì)砂+2.0%蛭石)為生物滯留系統(tǒng)的最佳介質(zhì)土配置方案,且評價結(jié)果與傳統(tǒng)投影尋蹤法相似。本研究利用GA和PSO算法求解RF-PP模型具有一定的可行性和適用性,可為生物滯留系統(tǒng)多目標(biāo)評價研究提供一定的參考和借鑒。

(3)本研究得出的最佳植物與最佳介質(zhì)土組合后可能存在耦合效應(yīng),未來可進一步通過植物與介質(zhì)土組合實驗研究,選取更佳的組合方式。

猜你喜歡
投影介質(zhì)生物
生物多樣性
信息交流介質(zhì)的演化與選擇偏好
生物多樣性
上上生物
解變分不等式的一種二次投影算法
基于最大相關(guān)熵的簇稀疏仿射投影算法
淬火冷卻介質(zhì)在航空工業(yè)的應(yīng)用
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
找投影
找投影
白水县| 中方县| 安塞县| 陈巴尔虎旗| 东莞市| 恩施市| 商都县| 南澳县| 苏尼特右旗| 清涧县| 晋城| 南昌市| 吉隆县| 巍山| 黄浦区| 定安县| 麦盖提县| 宣武区| 抚松县| 兴安县| 惠东县| 阳春市| 西峡县| 大石桥市| 河北省| 陆良县| 陆丰市| 阜南县| 吉木乃县| 西华县| 新平| 乌拉特前旗| 历史| 鄂托克旗| 南阳市| 剑阁县| 泾阳县| 额济纳旗| 迁西县| 阿克| 达孜县|