胡文博,李春青,任淑霞
(天津工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與軟件學(xué)院,天津 300387)
Adaboost-BP在MBR膜污染中的應(yīng)用研究
胡文博1,李春青2,任淑霞2
(天津工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與軟件學(xué)院,天津 300387)
研究MBR膜通量進(jìn)行膜污染預(yù)測是當(dāng)今污水處理研究領(lǐng)域的重要課題之一,膜污染直接導(dǎo)致的結(jié)果是膜通量的下降。由于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測MBR膜通量存在局部極小值及模型的泛化能力較差的缺點(diǎn),本文利用AdaBoost算法優(yōu)化傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),建立了AdaBoost-BP預(yù)測模型,并將該模型運(yùn)用到MBR膜通量的預(yù)測中。通過預(yù)測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)的對比,得出該模型的可行性,同時將其對比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型,說明AdaBoost-BP預(yù)測模型具有更高的預(yù)測精度。
MBR;膜通量;AdaBoost-BP;BP神經(jīng)網(wǎng)絡(luò)
本文著錄格式:胡文博,李春青,任淑霞. Adaboost-BP在MBR膜污染中的應(yīng)用研究[J]. 軟件,2016,37(12):21-25
膜生物反應(yīng)器(MBR)是將膜分離技術(shù)和生物處理單元相結(jié)合的一種新型污水處理工藝,它是利用微生物對反應(yīng)基質(zhì)進(jìn)行生物轉(zhuǎn)化,同時利用膜組件分離反應(yīng)產(chǎn)物并截留生物體[1]。目前研究MBR模擬仿真系統(tǒng)模型的熱點(diǎn)之一是通過利用膜通量影響因素,結(jié)合智能仿真模型來預(yù)測膜通量。現(xiàn)階段,對MBR膜通量仿真預(yù)測的方法有很多種,例如:數(shù)學(xué)模型、自回歸、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。然而,這些傳統(tǒng)的方法預(yù)測效果并不是很理想。AdaBoost-BP模型是將BP神經(jīng)網(wǎng)絡(luò)作為弱分類器,通過AdaBoost算法將其升級,使之成為強(qiáng)分類器模型,進(jìn)而更好對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)測[2]。
目前,傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)應(yīng)用已非常廣泛,它能學(xué)習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。它采用最速下降法來學(xué)習(xí),按誤差逆?zhèn)鞑ニ惴▉碛?xùn)練,在開始訓(xùn)練前,初始化各層的連接權(quán)值及閾值為[0,1]之間的隨機(jī)數(shù)。為使網(wǎng)絡(luò)的誤差平方和最小,它會不斷的調(diào)整權(quán)值和閾值。然而這種隨機(jī)設(shè)定的初值,很難把控算法的收斂速度,且訓(xùn)練出來的最終結(jié)果可能為局部最優(yōu)解,而非全局最優(yōu)解。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 BP neural network structure
2.1 基本思路
AdaBoost算法是一種迭代算法,它訓(xùn)練同一個基本分類器(本文采用的是傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)),但每次的訓(xùn)練集卻不相同,而不同的訓(xùn)練集是通過改變樣本的權(quán)重得到的[3],最終得出的強(qiáng)分類器是通過一定的方式加權(quán)基分類器而來的。理論可以證明,只要弱分類器的分類能力大于二分之一時,強(qiáng)分類器的錯誤率會隨著弱分類器個數(shù)的無窮增大而趨于零。起初,每個訓(xùn)練樣本的權(quán)重為樣本總數(shù)的倒數(shù),即均勻分布。在此基礎(chǔ)上訓(xùn)練出一個基分類器,然后計(jì)算出G1(x)錯分的樣本和正確的樣本,并按照一定的規(guī)則增加錯分樣本的權(quán)重值而減小其正確樣本的權(quán)重值。同時,給基分類器G1(x)一個權(quán)重,這樣不僅重新改變了訓(xùn)練樣本的重要程度,也給基分類器確定了一個重要程度指標(biāo)。然后,根據(jù)新的樣本分布訓(xùn)練得到基分類器G2(x)和其權(quán)重。依次類推,可以得到M個基分類器和M個相應(yīng)的權(quán)重。最后得到的強(qiáng)分類器就是按權(quán)重累加求和這M個基分類器[4]。
2.2 AdaBoost-BP預(yù)測模型算法
AdaBoost-BP預(yù)測模型算法流程如圖2所示,算法過程如下:
輸出:最終分類器G(x)。
過程:
(2)對于m=1,2,…,M,
a. 使用具有權(quán)值分布Dm的訓(xùn)練數(shù)據(jù)集進(jìn)行學(xué)習(xí)(任意選一種模型都可以,這里選用BP神經(jīng)網(wǎng)絡(luò),并且每一輪迭代都可以用不同的模型),得到一個弱分類器;
d. 更新訓(xùn)練數(shù)據(jù)的權(quán)值分布;
這里,Zm是規(guī)范化因子
將M個基本分類器進(jìn)行線性組合
得到最終分類器
訓(xùn)練誤差分析:
圖2 AdaBoost-BP預(yù)測模型算法流程Fig.2 AdaBoost-BP prediction model algorithm flow
即訓(xùn)練誤差的上界會隨M的增加而指數(shù)減小。
MBR膜污染主要是指在泥水分離過程中,活性污泥混合液中的細(xì)小微粒、膠體顆粒、溶質(zhì)大分子等物質(zhì)與膜存在物理的、化學(xué)的和機(jī)械的作用,從而引起膜面或膜孔內(nèi)吸附、沉積,最終造成膜孔徑變小甚至膜孔堵塞[5]。膜通量的大小受多種因素的綜合影響,歸納起來主要有MLSS、溫度、操作壓力、總阻力、COD等。采用主成分分析法(PCA)可得,對MBR膜通量起決定作用的因素有:生物動力學(xué)參數(shù)(混合液懸浮固體MLSS)、操作條件參數(shù)(總阻力和操作壓力)[6]。本文將以上三個主要影響因子作為預(yù)測模型的輸入條件,膜通量作為輸出。其AdaBoost-BP模型示意圖與MBR膜通量預(yù)測模型如3和圖4。
圖3 AdaBoost-BP模型示意圖Fig.3 AdaBoost-BP model diagram
圖4 MBR膜通量預(yù)測模型Fig.4 MBR membrane flux prediction model
我們通過實(shí)驗(yàn)得到70組數(shù)據(jù),將MLSS、總阻力、操作壓力作為預(yù)測模型的輸入,MBR膜通量作為預(yù)測模型的輸出。為了更好的驗(yàn)證該預(yù)測模型的有效性,將前60組數(shù)據(jù)作為訓(xùn)練樣本,后10組樣本作為測試樣本,建立AdaBoost-BP的MBR膜通量預(yù)測模型,通過訓(xùn)練樣本確定MBR膜通量與其影響因子之間的非線性關(guān)系。本文實(shí)驗(yàn)通過Matlab來實(shí)現(xiàn)。
4.1 實(shí)驗(yàn)條件
本文采用Matlab語言編寫程序,先將樣本數(shù)據(jù)按(式12)做歸一化處理,使其值分布在[-1,1]之間,然后調(diào)用Matlab神經(jīng)網(wǎng)絡(luò)工具箱建立起傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型和AdaBoost-BP預(yù)測模型。其中,BP神經(jīng)網(wǎng)絡(luò)采用3-8-1的結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)的其它參數(shù)采用默認(rèn)值,而AdaBoost-BP模型采用10個BP神經(jīng)網(wǎng)絡(luò)作為弱預(yù)測器。
4.2 實(shí)驗(yàn)結(jié)果與分析
首先,將10組測試數(shù)據(jù)作為傳統(tǒng)BP預(yù)測模型的輸入值,得出10個樣本數(shù)據(jù)的BP預(yù)測結(jié)果,并算出每個樣本的預(yù)測相對誤差,然后,再將這10組測試數(shù)據(jù)帶入到AdaBoost-BP預(yù)測模型中,得到10個樣本的AdaBoost-BP預(yù)測值,同時也算出每個測試樣本在AdaBoost-BP預(yù)測模型下的相對誤差。其結(jié)果見圖5,數(shù)據(jù)分析結(jié)果見表1,每個弱分類器的權(quán)重見表2。最后,根據(jù)表一的結(jié)果計(jì)算出傳統(tǒng)BP模型預(yù)測的平均絕對誤差為0.9488,平均相對誤差為3.35%,同理,計(jì)算得到AdaBoost-BP預(yù)測模型平均絕對誤差為0.4556,平均相對誤差為1.19%,其中,兩個預(yù)測模型的誤差比較圖如圖6??梢钥闯觯瑢?shí)驗(yàn)取得了良好的預(yù)測效果,且本文采用的AdaBoost-BP預(yù)測模型比傳統(tǒng)的BP預(yù)測模型具有更好的預(yù)測能力。
圖5 模型預(yù)測結(jié)果對比Fig.5 comparison of prediction results
表1 預(yù)測模型測試結(jié)果Tab.1 test results of prediction model
表2 預(yù)測模型測試結(jié)果Tab.2 weak classifier weights
圖6 絕對誤差結(jié)果對比Fig.6 comparison of absolute error results
從表1的數(shù)據(jù)可以發(fā)現(xiàn),整體上,傳統(tǒng)BP預(yù)測模型預(yù)測的結(jié)果誤差較大,而采用AdaBoost算法改進(jìn)后,建立的AdaBoost-BP預(yù)測模型能將預(yù)測精度優(yōu)化許多。另外,從圖5和圖6的對比中也可以發(fā)現(xiàn),對于10組測試樣本,其中有9組預(yù)測數(shù)據(jù)都是AdaBoost-BP模型更精確些,這也充分體現(xiàn)了該模型的正確性和精準(zhǔn)性。從而可以得出本文提出的AdaBoost-BP預(yù)測模型具有很好的適用性。此外,AdaBoost算法本身就具備很好的泛化能力[7],且無參數(shù)調(diào)整,編碼也很簡單,它排除一些不必要的訓(xùn)練數(shù)據(jù)特征[8],將其引入到MBR膜污染模擬仿真中,對MBR膜通量的預(yù)測提供了一種全新的方法和思路。
[1] Zuthi, M. F. R. Ngo, H. H.; Guo, W. S. Modelling bioprocesses and membrane fouling in membrane bioreactor (MBR): A review towards finding an integrated model framework. BIORESOURCE TECHNOLOGY[J]. 2012, 10(122): 119-129.
[2] YU Jiayuan. The application of BP-AdaBoost strong class-ifier to acquire knowledge of student creativity. Computer Science and Service System (CSSS), 2011International Conference on. 2011.
[3] Gaber T, Tharwat A, Hassanien A E, et al. Biometric cattle identification approach based on Weber’s Local Descriptor and AdaBoost classifier[J]. Computers & Electronics in Agriculture, 2016, 122(12): 55-66.
[4] 劉沖, 張均東, 曾鴻, 等. 基于支持向量機(jī)的無窮維Ada-Boost算法及其應(yīng)用[J]. 儀器儀表學(xué)報(bào), 2010, 04: 764-769. Liu Chong, Zhang Jundong, Zeng Hong, Ren Guang, Ji Yulong. Advanced AdaBoost Algorithm Based on Support Vector Machine and Its Application[J]. Journal of Instrumentation, 2010, 04: 764-769.
[5] 閆宏英, 李春青. MBR膜污染的智能模擬預(yù)測方法研究[J].計(jì)算機(jī)測量與控制, 2013, 08期(08). YAN Hong-ying, LI Chun-qing. Study on intelligent simulation and prediction of MBR membrane fouling[J]. Computer Measurement & Control, 2013, 08(08).
[6] 孟凡剛. 膜生物反應(yīng)器膜污染行為的識別與表征[D]. 大連理工大學(xué), 2007. Meng FANG. Membrane bioreactor membrane fouling behavior identification and characterization[D]. Dalian University of Technology, 2007.
[7] 胡德華, 鄭東健, 付浩雁. AdaBoost-BP模型在大壩變形預(yù)測中的應(yīng)用[J]. 三峽大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 05: 5-8. Hu Dehua, Zheng Dongjian, Fu Haoyan. Application of AdaBoost-BP model in dam deformation prediction[J]. Journal of Three Gorges University (Natural Sciences), 2015, 05: 5-8.
[8] 高靜. Adaboost-BP方法在企業(yè)信用評級中的應(yīng)用研究蘭州商學(xué)院, 2012. Gao Jing. Adaboost-BP method in the application of enterprise credit rating[D]. Lanzhou Business School, 2012.
The Research of Prediction Model Based on AdaBoost-BP in MBR Membrane Fouling
HU Wen-bo1, LI Chun-qing2, REN Shu-xia2
(School of Computer Science and Software Technology, Tianjin Polytechnic University, Tianjin, China, 300387)
Membrane flux prediction is one of the most important topics in wastewater treatment research. Membrane fouling is a direct result of membrane flux decline. Because traditional BP neural network has its own local minimum in predicting the MBR membrane flux and the generalization ability of the model is poor, in this paper, we use AdaBoost algorithm to optimize the traditional BP neural network and establish the AdaBoost-BP prediction model, then apply this model to predict the MBR membrane flux. By comparing the predicted results and experimental results, we can obtain that the model is feasible .At the same time, it is compared with the ordinary BP model, and the results show that the AdaBoost-BP prediction model has higher prediction accuracy.
MBR; Membrane flux; AdaBoost-BP; BP neural network
TP389.1
A
10.3969/j.issn.1003-6970.2016.12.005
受國家自然科學(xué)基金項(xiàng)目(51378350);國家自然科學(xué)基金項(xiàng)目(50808130)資助
胡文博(1992-),男,碩士生,主要研究方向:MBR計(jì)算機(jī)模擬仿真,大數(shù)據(jù)與云計(jì)算。
李春青,博士,教授,主要研究方向:MBR計(jì)算機(jī)模擬仿真,大數(shù)據(jù)與云計(jì)算;任淑霞,女,博士,副教授,主要研究方向:3D片網(wǎng),大數(shù)據(jù)分析,大數(shù)據(jù)可視化數(shù)據(jù)挖掘。