陳汪洋
(中國水務(wù)投資有限公司,北京 100053)
絮凝是凈水工藝中的重要環(huán)節(jié),絮凝過程中準(zhǔn)確控制絮凝劑的投加量是關(guān)鍵[1]。絮凝劑投加調(diào)控面臨著幾個(gè)主要問題。首先是非線性關(guān)系[2],投加量和效果之間并非簡單線性關(guān)系,存在飽和效應(yīng)或非線性響應(yīng)。其次,絮凝過程具有較大的遲滯效應(yīng)[3],投加量的變化不會(huì)立即反映在效果上。最后,絮凝過程受到多個(gè)變量因素的影響[4],需要考慮這些因素的相互作用和影響關(guān)系。為解決這些問題,需要采用系統(tǒng)辨識(shí)和模型預(yù)測控制等技術(shù),建立準(zhǔn)確的非線性模型,并考慮遲滯效應(yīng)和多變量影響,通過優(yōu)化算法和控制策略實(shí)現(xiàn)準(zhǔn)確的投加量控制,以達(dá)到最佳效果。
近年來,基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的礬花圖像識(shí)別技術(shù)逐漸應(yīng)用于絮凝優(yōu)化控制過程[5-6]。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的應(yīng)用可以實(shí)現(xiàn)礬花圖像的特征提取、分類和目標(biāo)檢測,幫助運(yùn)營人員發(fā)現(xiàn)異常情況,優(yōu)化投加量,提高絮凝效果和水質(zhì)穩(wěn)定性,進(jìn)一步提升水處理系統(tǒng)的運(yùn)行效率和可靠性[7]。
然而,基于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的礬花圖像識(shí)別研究仍面臨挑戰(zhàn)。主要問題包括維數(shù)災(zāi)難、遷移性差和魯棒性差。為了解決這些問題,本文提出了基于深度模糊非參數(shù)映射(DFM)模型的礬花圖像識(shí)別增強(qiáng)算法,具有較高的計(jì)算效率、識(shí)別準(zhǔn)確率和魯棒性,提高了礬花識(shí)別的準(zhǔn)確性和穩(wěn)定性。
礬花采集實(shí)驗(yàn)平臺(tái)是由水下攝像機(jī)、固定支架、通訊線纜、圖像處理器組成。其中,水下攝像機(jī)搭載500萬像素、工業(yè)級(jí)、定焦、自動(dòng)補(bǔ)光的攝像頭,具有防水和自動(dòng)清洗的功能。通過調(diào)整鏡頭焦距,確保礬花圖像清晰,并將此焦距作為統(tǒng)一的拍攝標(biāo)準(zhǔn)。水下攝像機(jī)的安裝位置取決于礬花生成位置和絮凝工藝結(jié)構(gòu)。礬花是由絮凝藥劑投加后逐步形成的絮體。因此,礬花圖像的拍攝主要集中在礬花成熟狀態(tài),即位于絮凝反應(yīng)池末端,尚未進(jìn)入沉淀池的過渡區(qū)域,如圖1所示。水下攝像機(jī)應(yīng)安裝在水深為0.5~1.0 m的位置。
圖1 絮凝沉淀池中水下攝像機(jī)的安裝位置
將礬花主體從背景中分離出來是礬花識(shí)別的第一步,分離效果會(huì)對后續(xù)礬花識(shí)別的精度有較大影響。本研究測試并比較了目前常見的圖像分割算法,包括直方圖分割[8]、Log算子分割[9]、Canny算子分割[9]、Otsu算子分割[10]等,結(jié)果如圖2(a)~圖2(f)所示。其中Otsu算法在性能和精度上相較其他算法在本研究試驗(yàn)數(shù)據(jù)集中取得了最優(yōu)的效果,如圖2(f)所示。Otsu算子能夠提取礬花圖像中高對比度的線條,這些線條在描繪礬花的輪廓同時(shí)還包含間隙,有利于分離形態(tài)復(fù)雜的礬花。因此,Otsu算子作為本次研究的圖像分割算法。
圖2 礬花原圖與各種圖像分割算法對比
在礬花圖像分割的基礎(chǔ)上,本研究進(jìn)一步提取礬花圖像特有的統(tǒng)計(jì)特征,作為訓(xùn)練模型的輸入,以提高礬花分類的準(zhǔn)確率,包括礬花的平均絮凝體尺寸(基于平均費(fèi)雷特直徑)、礬花絮凝體面積、礬花絮凝體面積方差、整體占比、最大片占比、礬花數(shù)量、面積中位數(shù)、花絮凝體周長、礬花圓形度以及礬花分形維數(shù)等。傳統(tǒng)對礬花形態(tài)的研究主要集中在面積和周長等指標(biāo),本研究引入分形維數(shù),分形維數(shù)有助于描述歐幾里得幾何沒有很好定義的大型、不規(guī)則、多孔聚集體的粗糙表面特征。在分形幾何中,面積和體積不是以標(biāo)準(zhǔn)特征長度來表征,而是以整數(shù)冪來表征。具有不規(guī)則邊界的非均勻形態(tài)可以通過非線性關(guān)系來定義,其中物體的特性隨著特征長度維度的增加而縮放,其冪被稱為分維。分形維數(shù)的計(jì)算方法如式(1)[10]。
lnA=DflnL+lna
(1)
其中:A——絮體顆粒的投影面積,m2;
L——投影的最大長度,m;
a——比例常數(shù);
Df——絮體在二維空間的分形維數(shù)。
絮體分型維數(shù)能夠反映混凝階段,可以將其作為混凝投藥量控制的反饋參數(shù)。
本研究基于舟山某水廠絮凝池圖像采集系統(tǒng)構(gòu)建了一個(gè)包含不同種類的礬花圖像數(shù)據(jù)集。該數(shù)據(jù)集的構(gòu)建經(jīng)過精心設(shè)計(jì)和標(biāo)注,涵蓋了典型的礬花形態(tài)和顏色變化(表1)。數(shù)據(jù)集中包含了各種光照條件下的礬花圖像,以及不同絮凝劑投加量和池水渾濁度的情況。該數(shù)據(jù)集的構(gòu)建為礬花圖像識(shí)別算法的研究提供了寶貴的資源和平臺(tái)。研究者們可以利用這個(gè)數(shù)據(jù)集進(jìn)行算法的訓(xùn)練和評估,提出新的方法和技術(shù)來改進(jìn)礬花圖像的識(shí)別準(zhǔn)確性和穩(wěn)定性。此外,該數(shù)據(jù)集還可以用于驗(yàn)證不同算法的泛化能力和實(shí)際應(yīng)用效果。
表1 礬花圖像標(biāo)簽及說明
本研究礬花圖像數(shù)據(jù)采集覆蓋24 h,同時(shí)結(jié)合舟山某水廠智慧加藥系統(tǒng)接入水質(zhì)參數(shù),包括進(jìn)水渾濁度、電導(dǎo)率、COD、pH等。研究階段共采集圖像10萬余張,對采集圖像進(jìn)行各種特征值的均值,同時(shí)剔除異常數(shù)據(jù),特征屬性如表2所示。
表2 礬花提取特征屬性值
本文使用DFM對礬花圖像進(jìn)行識(shí)別,DFM由若干個(gè)DFM單元組成,如圖3所示[11]。
圖3 多輸入多輸出DFM
圖3為一個(gè)典型的多輸入多輸出DFM模型,其中mx=[mx1,mx2,…,mxn]T∈Rn表示n維無噪音輸入向量;x=[x1,x2,…,xn]T∈Rn表示n維有噪音輸入向量(觀測值);υx=[υx1,υx2,…,υxn]T∈Rn表示n維輸入噪音向量,xi=mxi+υxi(i∈1,2,…,n);y=[y1,y2,…,yp]T∈Rp表示p維包含噪音的輸出向量;ν=[ν1,ν2,…,νp]T∈Rp表示p維輸出噪音向量,yj=Fj(x)+νj(j∈1,2,…,p);Fj(·)表示y第j個(gè)輸出對應(yīng)的輸入向量x的模糊映射。本文中輸入向量x和輸出向量y分別對應(yīng)礬花圖像和圖像標(biāo)簽,mx、υx和ν參數(shù)未知,其特征通常使用模糊隸屬函數(shù)(例如:高斯隸屬函數(shù)或伽馬隸屬函數(shù))來描述。
(2)
(3)
其中:ζ——實(shí)數(shù),取值為0~2;
mj——平均向量;
Kxx——N×N協(xié)方差矩陣。
Kxx第i行第j列元素如式(4)。
(4)
其中:σ——方差;
wk——權(quán)重。
本文所提出的模糊映射是一個(gè)非參數(shù)模型,因?yàn)樗鼪]有參數(shù)形式的特征,而是通過選擇核函數(shù)k(xi,xj)來定義其特征。將有限個(gè)圖3所示的DFM單元組合在一起,形成了深度DFM模型(圖4)。
圖4 深度DFM模型(L層)
(5)
(6)
(7)
(8)
hl-1,i——第l-1層樣本i輸入向量;
Λ∈Rp×p——基于奇異值分解(SVD)算法得到的特征值對角矩陣(由大到小排序);
U∈Rp×p——Λ對應(yīng)的特征向量矩陣;
Al-1——U前nl行組成的矩陣;
為了驗(yàn)證深度DFM模型在礬花圖像識(shí)別中的性能,本文選用支持向量機(jī)(support vector machine,SVM)模型[12]、反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型[13]、ResNet模型[14]和AlexNet模型[15]與DFM模型進(jìn)行對比。
4.2.1 SVM模型
SVM是一種廣泛應(yīng)用于分類和回歸分析的機(jī)器學(xué)習(xí)方法[12]。SVM的核心思想是通過將數(shù)據(jù)映射到高維特征空間,使得數(shù)據(jù)在該空間中線性可分,該映射基于核函數(shù)來實(shí)現(xiàn),常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)和高斯徑向基函數(shù)。在高維特征空間中,SVM通過最大化支持向量到超平面的間隔來確定最優(yōu)決策邊界。
4.2.2 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)是一種基于反向傳播算法的人工神經(jīng)網(wǎng)絡(luò)模型[13]。它是一種多層前饋神經(jīng)網(wǎng)絡(luò),具有強(qiáng)大的非線性擬合能力和適應(yīng)性。BP神經(jīng)網(wǎng)絡(luò)的原理是通過訓(xùn)練數(shù)據(jù)來調(diào)整網(wǎng)絡(luò)的權(quán)值和偏置,從而實(shí)現(xiàn)對輸入數(shù)據(jù)的映射和分類。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成,通過反向傳播算法實(shí)現(xiàn)參數(shù)訓(xùn)練,并計(jì)算梯度和調(diào)整權(quán)值,逐步減小誤差,直到BP神經(jīng)網(wǎng)絡(luò)的輸出與真實(shí)值之間的誤差達(dá)到預(yù)定的精度要求。
4.2.3 ResNet模型
ResNet是一種深度殘差網(wǎng)絡(luò)模型,被廣泛應(yīng)用于圖像識(shí)別和計(jì)算機(jī)視覺任務(wù)中[14]。ResNet通過引入殘差連接來解決深層網(wǎng)絡(luò)中的梯度消失和網(wǎng)絡(luò)退化問題,實(shí)現(xiàn)了深度網(wǎng)絡(luò)結(jié)構(gòu)的有效訓(xùn)練。深度殘差神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)由殘差塊組成,使用隨機(jī)梯度下降(SGD)算法進(jìn)行優(yōu)化。在訓(xùn)練過程中,通過最小化損失函數(shù)來調(diào)整網(wǎng)絡(luò)的權(quán)值,使得網(wǎng)絡(luò)能夠更好地?cái)M合訓(xùn)練數(shù)據(jù)。
4.2.4 AlexNet模型
AlexNet是第一個(gè)將深度卷積神經(jīng)網(wǎng)絡(luò)成功應(yīng)用于大規(guī)模圖像分類任務(wù)的模型[15]。它采用了卷積層和池化層的交替結(jié)構(gòu),通過卷積操作提取圖像的特征,并通過池化操作減小特征圖的尺寸。卷積層使用較小的卷積核對輸入圖像進(jìn)行滑動(dòng)窗口操作,提取出不同的特征。池化層則用于降低特征圖的尺寸和參數(shù)數(shù)量,減少計(jì)算復(fù)雜度。為了進(jìn)一步提高模型的性能,AlexNet采用了數(shù)據(jù)增強(qiáng)和Dropout技術(shù)。數(shù)據(jù)增強(qiáng)通過對訓(xùn)練數(shù)據(jù)進(jìn)行平移、旋轉(zhuǎn)、翻轉(zhuǎn)等操作,擴(kuò)充了訓(xùn)練集的規(guī)模,減少了過擬合風(fēng)險(xiǎn)。Dropout技術(shù)則在訓(xùn)練過程中隨機(jī)關(guān)閉一部分神經(jīng)元,以減少神經(jīng)元之間的依賴關(guān)系,提高模型的泛化能力。
本文采用2種方案對上述圖像識(shí)別方法的性能進(jìn)行對比:(1)方案1,礬花圖像數(shù)據(jù)集不經(jīng)過處理,直接將原始礬花圖像與標(biāo)簽分別作為模型的輸入和輸出;(2)方案2,使用本文提出的方法首先提取礬花圖像特征值,將特征值作與標(biāo)簽分別作為模型的輸入和輸出。
SVM模型、BP神經(jīng)網(wǎng)絡(luò)、ResNet模型、AlexNet模型和DFM模型的相關(guān)參數(shù)設(shè)置如表3所示。
表3 相關(guān)模型參數(shù)設(shè)置
針對上述模型,數(shù)據(jù)集按7∶3比例隨機(jī)分為訓(xùn)練集和測試集,訓(xùn)練集用于訓(xùn)練模型參數(shù),測試集用于驗(yàn)證模型的識(shí)別精度,礬花圖像識(shí)別性能對比如表4所示。
表4 不同方法礬花圖像識(shí)別準(zhǔn)確率
由表4可知,在圖像未經(jīng)過任何處理的情況下,DFM模型仍然具有80%以上的分類準(zhǔn)確率。對圖像進(jìn)行預(yù)處理,并將特征作為輸入,DFM模型能夠達(dá)到95%以上的識(shí)別準(zhǔn)確率,表明本文提出的基于DFM模型的礬花圖像識(shí)別方法具有更高的準(zhǔn)確率和穩(wěn)定性,能夠應(yīng)用于實(shí)際工程中。
目前,基于DFM模型的礬花圖像識(shí)別技術(shù)已經(jīng)成功應(yīng)用在舟山某水廠凈水工藝過程中(圖5)。本項(xiàng)目加藥系統(tǒng)使用前饋+反饋復(fù)合加藥控制算法(圖6)。前饋專家控制器可根據(jù)原水的渾濁度、溫度、COD等推算出大致的加藥量。反饋比例控制器根據(jù)礬花識(shí)別的狀態(tài)對沉淀池后水渾濁度反饋?zhàn)魑⒄{(diào),最后,結(jié)合實(shí)時(shí)流量算出最佳加藥量。
圖5 水廠智慧加藥系統(tǒng)
圖6 絮凝加礬系統(tǒng)優(yōu)化控制過程:前饋+反饋流程
前饋控制:首先將水廠現(xiàn)狀及該水廠的水質(zhì)因素進(jìn)行分析研究,然后以影響出水水質(zhì)主要因素為輸入,如原水流量、原水池度、原水溫度及原水值為輸入,混凝劑投加量為輸出,建立混凝投藥量通用寄存器(general purpose register,GPR)前饋控制系統(tǒng)。
反饋控制:被控量實(shí)際輸出與設(shè)定值存在偏差,控制器通過檢測到的差值,有針對性地進(jìn)行調(diào)節(jié)的過程。本方案反饋控制以礬花圖像算法為基礎(chǔ),水下圖像采集裝置以500萬~1 000萬像素工業(yè)相機(jī)為傳感器,以PC為主控器,連續(xù)采集水廠處理池中礬花圖像。根據(jù)本文描述的圖像分割-特征提取-算法識(shí)別過程實(shí)時(shí)分析礬花形態(tài)(圖7),評判水質(zhì)參數(shù),用于自動(dòng)監(jiān)測水廠凈水處理過程中的絮凝狀態(tài),反饋調(diào)節(jié)加礬量,同時(shí)減少絮凝過程中檢測絮凝效果的時(shí)滯。采用反饋校正和在線滾動(dòng)優(yōu)化指標(biāo)的策略,能夠有效克服受控對象的時(shí)延、時(shí)變和不確定性等因素的動(dòng)態(tài)影響,并使系統(tǒng)具有良好的穩(wěn)定性和魯棒性。
圖7 礬花識(shí)別系統(tǒng):圖像采集+分割+特征提取+識(shí)別算法
圖8為出水渾濁度達(dá)標(biāo)率的對比,系統(tǒng)12月1日開始測試,數(shù)據(jù)取自2022年7月——2023年5月,間隔周期為10 min。如圖8所示,使用前后,沉后水渾濁度波動(dòng)明顯降低,水質(zhì)更加穩(wěn)定,系統(tǒng)投用后沉后水渾濁度達(dá)標(biāo)率(小于1 NTU)占比由82.2%上升為95.6%,具體數(shù)據(jù)如表5所示。
表5 不同方法礬花圖像識(shí)別準(zhǔn)確率
圖8 出水渾濁度達(dá)標(biāo)率對比
圖9為出水渾濁度穩(wěn)定性的對比,2023年1月18日目標(biāo)值由0.7 NTU調(diào)到0.25 NTU,1月29日調(diào)到0.7 NTU,2月10日調(diào)到0.6 NTU,3月3日調(diào)到0.35 NTU,伴隨著沉后渾濁度真實(shí)值隨目標(biāo)值變化。數(shù)據(jù)做目標(biāo)值與真實(shí)值的差值對比,引入偏差值。偏差值在±0.2 NTU的數(shù)據(jù),占數(shù)據(jù)總量的91.5%,沉后渾濁度控制精度保持在90%以上時(shí)間達(dá)到±0.2 NTU以內(nèi)。
圖9 2022年12月—2023年5月出水渾濁度穩(wěn)定性對比
表6為系統(tǒng)藥耗使用量對比分析,加藥量對比需要在相同的進(jìn)水水質(zhì)下作藥劑對比分析,因此,選用相同的時(shí)間段和進(jìn)水水質(zhì),采用原有的控制方式和智慧加藥對比。2022年11月,采用了智慧加礬控制的4#和原有的控制的1#~3#進(jìn)行對比,1#~4#沉淀池出水渾濁度均值分別為0.67、0.72、0.64、0.69 NTU,1#~3#藥耗均值為30.48 mg/L,4#為23.84 mg/L。在1#~3#與4#出水渾濁度均值在0.6~0.7 NTU的情況下,4#的藥劑消耗較1#~3#的藥劑消耗降低21.78%。
表6 系統(tǒng)藥耗使用量分析
(1)分割算法方面分別對直方圖分割、Log算子分割、Canny算子分割、Otsu算子分割加線性變化等算法并進(jìn)行比較,結(jié)果表明Otsu算法結(jié)合線性變化在性能和精度上相較其他算法在本研究試驗(yàn)數(shù)據(jù)集中取得了最優(yōu)的效果。
(2)特征提取方面:計(jì)算了礬花的平均絮凝體尺寸(基于平均費(fèi)雷特直徑)、礬花絮凝體面積、整體占比、最大片占比、礬花絮凝體周長,礬花圓形度以及礬花分形維數(shù)。結(jié)果表明,從礬花圖像中提取密度特征和尺寸特征作為模型輸入,能夠達(dá)到最好的識(shí)別效果。
(3)識(shí)別算法方面:將上述特征作為識(shí)別模型輸入?yún)?shù),將礬花狀態(tài)細(xì)分為密實(shí)、中片、大片、不均和稀疏5種類型,采用SVM、BP神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)方法(ResNet和AlexNet模型)和研究團(tuán)隊(duì)自主開發(fā)的深度DFM算法。結(jié)果表明,DFM模型在多次試驗(yàn)中能夠達(dá)到95%以上的識(shí)別準(zhǔn)確率,明顯優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法。
(4)基于DFM模型的礬花圖像識(shí)別技術(shù)已在舟山某水廠應(yīng)用,采用礬花狀態(tài)進(jìn)行絮凝加藥量的反饋調(diào)教,應(yīng)用前后絮凝劑平均投加量由原來的11 mg/L降低為8.5 mg/L,沉淀池平均出水渾濁度由原來的0.9 NTU降低為0.4 NTU。
(5)本項(xiàng)目使用數(shù)據(jù)來自單一地區(qū)原水水質(zhì),后續(xù)工作將采集更多不同水質(zhì)條件下數(shù)據(jù),進(jìn)一步研究礬花圖像與水質(zhì)參數(shù)相關(guān)性的通用性特征量。