馮燕茹
(防災(zāi)科技學院 信息工程學院,河北 三河065201)
受空氣中懸浮顆粒(如霧,霾)的影響,捕獲的戶外圖像會出現(xiàn)對比度低,色彩飽和度差,顏色偏移等圖像退化問題,嚴重了影響了戶外計算機視覺技術(shù),如目標檢測、目標識別、目標跟蹤的發(fā)揮,進而增大了戶外機器視覺任務(wù)的難度。因此,對霧天場景下獲取的退化圖像實施去霧處理具有重要的現(xiàn)實意義和應(yīng)用場景[1-2]。
目前常用的圖像去霧方法主要分為兩類:一類為基于先驗的去霧算法,一類為基于神經(jīng)網(wǎng)絡(luò)的去霧算法。基于先驗的去霧算法利用先驗信息估計大氣散射物理模型中的透射率和大氣光,從而求得清晰的去霧圖像[3-4]。如He及韓昊男等人利用暗通道先驗(Dark Channel Prior,DCP)在局部區(qū)域內(nèi)計算透射率值[1,5]。Berman等人發(fā)現(xiàn)圖像中的像素點在RGB空間中可聚集成數(shù)百個顏色線,利用此非局部先驗(Non Local Prior,NLP)估計透射率[6]。Meng等人利用邊緣及紋理的約束先驗(Boundary Constraint and Contex?tual Regularization,BCCR)來計算透射率[7]。然而統(tǒng)計獲取的先驗信息無法適用于所有的霧天場景,導致算法魯棒性差,透射率估計存在誤差。
隨著深度學習的快速發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的圖像去霧算法廣受關(guān)注[8]。如Cai等人提出了Dehazenet網(wǎng)絡(luò)模型,學習霧圖與透射率之間的映射關(guān)系[9]。Li等人提出了端到端的All-in-One Dehazing Network(AODN)網(wǎng)絡(luò)模型直接從霧圖中估計清晰圖[10]。Qu等人提出了Enhanced Pix2pix Dehazing Network(EPDN)網(wǎng)絡(luò)模型,利用生成器估計去霧結(jié)果,使用辨別器監(jiān)督EPDN模型的中間過程[11]。Liu等人提出了GridDeha?zeNet(Grid DN),它模仿傳統(tǒng)圖像處理算法,在網(wǎng)絡(luò)模型中加入預(yù)處理模塊及后期處理模塊來實施圖像去霧[12]。雖然上述網(wǎng)絡(luò)模型較基于先驗的去霧算法具有更好的魯棒性,但網(wǎng)絡(luò)的構(gòu)建缺乏物理約束,未將大氣散射物理模型融入到網(wǎng)絡(luò)的構(gòu)建中,限制了網(wǎng)絡(luò)的性能。Zhang等人提出了Densely Connected Pyramid Dehazing Net?work(DCPDN)模型,它利用生成器生成透射率和大氣光,再利用辨別器細化大氣散射模型估計的去霧結(jié)果[13]。隨后,Zhang等人提出的Joint Transmission Map Estimation and Dehazing Net?work(JTED)聯(lián)合網(wǎng)絡(luò)模型,將U型網(wǎng)絡(luò)估計的透射率視為霧濃度先驗,以引導后續(xù)網(wǎng)絡(luò)注意濃霧區(qū)域,有效實施去霧[14]。
雖然上述網(wǎng)絡(luò)模型的構(gòu)建嵌入了大氣散射物理模型,但透射率估計與圖像去霧的相互關(guān)系并未深入探索。實際上,透射率的估計過程和圖像的去霧過程相互依賴,從透射率估計過程中獲得的霧濃度信息可用于圖像去霧。反之,去霧過程中獲得的無霧場景信息又可以進一步指導與場景深度相關(guān)的透射率估計。受注意機制的啟發(fā),本文提出了雙視覺注意網(wǎng)絡(luò)模型,它包含兩個結(jié)構(gòu)相同的單循環(huán)注意網(wǎng)絡(luò)層,分別為圖像去霧層及透射率估計層。對于每個單循環(huán)注意網(wǎng)絡(luò)又包含循環(huán)注意網(wǎng)絡(luò)和編碼解碼網(wǎng)絡(luò)。考慮到霧氣可以看成不同深度的霧層累積而成,對于圖像去霧層,可在真實透射率圖的監(jiān)督下,利用循環(huán)注意網(wǎng)絡(luò)估計霧濃度注意圖,將其注入到后續(xù)的編碼解碼網(wǎng)絡(luò)以引導網(wǎng)絡(luò)感知霧的信息,準確實施去霧。同樣,對于透射率估計層,在真實無霧圖像的監(jiān)督下,可利用循環(huán)注意網(wǎng)絡(luò)估計場景注意圖,注入到編碼解碼網(wǎng)絡(luò),以引導網(wǎng)絡(luò)感知場景信息,準確估計透射率。其中,為了更深入地探索和挖掘透射率估計與圖像去霧過程中捕獲信息的相關(guān)性,在圖像去霧層及透射率估計層的循環(huán)注意網(wǎng)絡(luò)間實施信息交互,使得霧濃度注意圖和場景注意圖在信息互補的方式下生成。
綜上,本文的主要貢獻如下:(1)提出了雙視覺注意網(wǎng)絡(luò)模型,它包含圖像去霧層及透射率估計層。(2)在圖像去霧層中,循環(huán)注意網(wǎng)絡(luò)生成的霧濃度注意圖被注入到編碼解碼網(wǎng)絡(luò)中,引導該網(wǎng)絡(luò)感知霧濃度,實現(xiàn)去霧。在透射率估計層中,循環(huán)注意網(wǎng)絡(luò)生成的場景注意圖被注入到編碼解碼網(wǎng)絡(luò)中,引導該網(wǎng)絡(luò)感知場景,更好地估計透射率。(3)圖像去霧層的循環(huán)注意網(wǎng)絡(luò)及透射率估計層的循環(huán)注意網(wǎng)絡(luò)通過循環(huán)單元實現(xiàn)信息交互,在信息互補的方式下生成霧濃度注意圖和場景注意圖。實驗結(jié)果表明,本文算法較已有去霧算法具有更高的效率和精度。
如圖1所示,雙視覺注意網(wǎng)絡(luò)包含兩層:用于估計透射率的lt層和用于預(yù)測去霧結(jié)果的ld層。lt層和ld層具有相同的網(wǎng)絡(luò)結(jié)構(gòu),即均包含循環(huán)注意網(wǎng)絡(luò)和編碼解碼網(wǎng)絡(luò)。其中,紅色和黑色的虛線均為省略循環(huán)操作中的連接(彩圖見期刊電子版)。循環(huán)注意網(wǎng)絡(luò)用于生成視覺注意圖,以引導后續(xù)的編碼解碼網(wǎng)絡(luò)預(yù)測相應(yīng)的結(jié)果。這里,為了讓ld層能感知霧的濃度,采用透射率來監(jiān)督ld層的循環(huán)注意網(wǎng)絡(luò)生成霧濃度注意圖,并引導后續(xù)的編碼解碼網(wǎng)絡(luò)實現(xiàn)去霧。相關(guān)操作如下:
圖1 雙視覺注意網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Architecture of dual vision attention network
其中:H d和Ed分別為ld層的循環(huán)注意網(wǎng)絡(luò)函數(shù)和編碼解碼網(wǎng)絡(luò)函數(shù);[]為級聯(lián)操作;I為初始霧圖;I′為去霧結(jié)果;t n與t n-1為第n及第n-1次循環(huán)時H d輸出;t為H d最終輸出的霧濃度注意圖。
另一方面,考慮到透射率與場景的深度相關(guān),清晰的場景能為透射率的估計提供更準確的深度信息,利用清晰無霧圖像監(jiān)督lt層的循環(huán)注意網(wǎng)絡(luò)產(chǎn)生場景注意圖,并將其注入后續(xù)的編碼解碼網(wǎng)絡(luò),使其感知場景信息,估計透射率。操作如下:
其中:H t和Et分別為lt層的循環(huán)注意網(wǎng)絡(luò)函數(shù)和編碼解碼網(wǎng)絡(luò)函數(shù);T′為透射率估計結(jié)果;b n與b n-1為第n次及第n-1次循環(huán)時H t的輸出;b為H t最終輸出的場景注意圖。
值得一提的是,公式(3)不同于公式(1),H t不但輸入了上次循環(huán)輸出的b n-1及初始霧圖I,還輸入了H d在第n次循環(huán)時輸出的t n。此設(shè)計充分挖掘了t n與b n的關(guān)聯(lián)性,利用霧濃度注意圖t n引導H t感知霧層的濃度,以有效估計背景注意圖b n。此外,更利用lt層及l(fā)d層中LSTM循環(huán)單元實現(xiàn)H t及H d的信息交互(見圖1中紅線),使得在估計場景注意圖的過程中能利用到霧濃度信息,在預(yù)測霧濃度注意圖的過程中能學習場景信息,從而形成高效的雙循環(huán)注意網(wǎng)絡(luò)。
霧氣可以看成不同深度的霧層累積而成,因此采用循環(huán)網(wǎng)絡(luò)結(jié)構(gòu)逐層提取霧的信息生產(chǎn)霧濃度注意圖及場景注意圖,不但符合物理假設(shè),還能不斷校正上次循環(huán)時的估計誤差。
如圖2所示,lt和ld層中的H t和H d均有相同的網(wǎng)絡(luò)結(jié)構(gòu),并由以下模塊組成:2個稠密殘差模塊Resblock[15],1個LSTM循環(huán)單元[16]及1個映射層Map,每個Resblock包含2個核為3×3的卷積層。為了使H t和H d能利用彼此捕獲的信息幫助對方的循環(huán)網(wǎng)絡(luò)生成準確的注意圖,這里采用LSTM循環(huán)單元來實現(xiàn)雙循環(huán)注意網(wǎng)絡(luò)的隱藏信息交互。故公式(3)lt層中的循環(huán)注意網(wǎng)絡(luò)H t可進一步表示為:
圖2 雙循環(huán)注意網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.2 Architecture of dual recurrent attentive network
其中:Frest,F(xiàn)lstmt和Fmapt分別為H t中稠密殘差模塊函數(shù),LSTM函數(shù)及映射層函數(shù);s nt為第n次循環(huán)時,F(xiàn)rest函數(shù)的輸出;h nt和c nt為第n次循環(huán)時,H t中LSTM的隱藏狀態(tài)及記憶單元信息;t n第n次循環(huán)時Fmapt的輸出。從公式(6)可見,第n次循環(huán)時H d的隱藏狀態(tài)h hd與H t產(chǎn)生的h n-1t,s nt級聯(lián),共同作為Flstmt的輸入。
與此類似,公式(1)ld層中的循環(huán)注意網(wǎng)絡(luò)H d可進一步表示為:
其中:Fresd,F(xiàn)lstmd和Fmapt分別為H d中稠密殘差模塊函數(shù),LSTM函數(shù)及映射層函數(shù);s nd為第n次循環(huán)時,F(xiàn)resd函數(shù)的輸出;h nd和c nd為第n次循環(huán)時,H d中LSTM的隱藏狀態(tài)及記憶單元信息;b n第n次循環(huán)時Fmapd的輸出。同樣,采用第n次循環(huán)時H t的隱藏狀態(tài)h nt與H d產(chǎn)生的h n-1d,s nd級聯(lián),共同作為Flstmd的輸入。
由此,H t和H d進行了信息交互,H t通過LSTM引入h d來補充學習估計背景注意圖b時所需的霧濃度信息,而H d通過LSTM引入h t來補充學習估計霧濃度注意圖t時所需的場景信息,從而形成信息充分挖掘和利用的雙循環(huán)注意網(wǎng)絡(luò)。
這里選用卷積LSTM循環(huán)單元來實現(xiàn)Flstmt及Flstmd。以Flstmt為例,其卷積LSTM如圖3所示,包含輸入門P,輸入門控制單元G,遺忘門控制單元R,輸出門控制單元O和記憶單元C,且P,O,G,R均利用3個卷積層來處理接收的特征。其中,輸入門P和輸入門控制單元G共同控制進入記憶單元的信息C;遺忘門控制單元R控制著記憶單元C中的信息被保留或被刪除;輸出門控制單元O控制從卷積LSTM中輸出信息。Flstmt可進一步表示為:
圖3 LSTM循環(huán)單元結(jié)構(gòu)示意圖Fig.3 Architecture of LSTM recurrent unit.
與此類似,F(xiàn)lstmd可進一步表示為:
在訓練的過程中,使用真實無霧圖監(jiān)督H t產(chǎn)生場景注意圖b,使用真實透射率監(jiān)督H d產(chǎn)生霧濃度注意圖t。H t和H d均使用標準的L2損失函數(shù),故雙循環(huán)網(wǎng)絡(luò)的損失函數(shù)L r定義如下:
其中:t n及b n為第n次循環(huán)時雙循環(huán)網(wǎng)絡(luò)輸出的霧濃度注意圖和場景注意圖;J為對應(yīng)的真實無霧圖;T為真實透射率。如公式(23),實驗中設(shè)置雙循環(huán)注意網(wǎng)絡(luò)循環(huán)次數(shù)n為3。
由雙循環(huán)注意網(wǎng)絡(luò)生成的霧濃度注意圖t及場景注意圖b被視為視覺注意先驗,分別注入后續(xù)的編碼解碼網(wǎng)絡(luò),以便網(wǎng)絡(luò)感知霧的濃度及場景信息,更準確地預(yù)測去霧圖像及透射率。如圖1所示,ld層的編碼解碼網(wǎng)絡(luò)Ed及l(fā)t層的編碼解碼網(wǎng)絡(luò)E t具有相同的網(wǎng)絡(luò)結(jié)構(gòu),即編碼器包含4個核為3×3,步長分別為5,2,2,2的卷積層Conv,解碼器包含3個核為1×1,步長為2的反卷積層Deconv,以及1個核為3×3,步長為1的卷積層。故公式(2)中Ed函數(shù)可進一步表示為:
式 中:Fconvdx,x=1,2,...,4分 別 為ld層 編 碼 器 中4個 卷積函數(shù);Fconvd5代表ld層解碼器中最后的卷積函數(shù);Fconvdx,x=1,2,3代 表ld層 解 碼 器 中3個 反 卷 積 層函數(shù);e d為ld層編碼器的輸出;I′為最終的去霧結(jié)果。
同理,公式(4)中Et函數(shù)可進一步表示為:
其 中:Fconvdx,x=1,2,...,4分 別 為lt層 編 碼 器 中4個 卷積函數(shù);Fconvd5代表lt層解碼器中最后的卷積函數(shù);Fconvdx,x=1,2,3代 表lt層 解 碼 器 中3個 反 卷 積 層函數(shù);e t為lt層編碼器的輸出;T′為透射率估計結(jié)果。
模型的訓練通過最小化L2函數(shù)來計算網(wǎng)絡(luò)估計結(jié)果與真實結(jié)果間的差異。假設(shè)I′i和J i,i=1,2,...,m為一組合成霧圖和真實無霧圖。T′i和T i,i=1,2,...,m為一組合成圖像的透射率和真實透射率,則對應(yīng)的損失函數(shù)為L e可表示為:
結(jié)合雙循環(huán)注意網(wǎng)絡(luò)的損失函數(shù)L r,雙視覺注意網(wǎng)絡(luò)的總損失函數(shù)L定義如下:
其中:a和b為L r和L e兩項的平衡系數(shù),默認設(shè)置a=1,b=1。
本文算法在NVIDIA RTX 2080 Ti GPU的硬件環(huán)境下,應(yīng)用Pytorch深度學習框架搭建網(wǎng)絡(luò)實現(xiàn)。優(yōu)化算法選用β1=0.999,ε=10-8的隨機梯度下降算法。為驗證本文算法的有效性,在合成霧圖及真實霧圖上對算法的性能進行驗證,并將本文算法與基于先驗的去霧算法和基于神經(jīng)網(wǎng)絡(luò)的去霧算法相對比。
不同于已有的去霧網(wǎng)絡(luò)[17],本網(wǎng)絡(luò)模型的訓練集需要包含霧圖,清晰圖及透射率,故利用RESIDE數(shù)據(jù)集[18]和NYU-depth2數(shù)據(jù)集[19]創(chuàng)建包含室內(nèi)和室外圖像的數(shù)據(jù)集。對于室內(nèi)霧圖,從NYU-depth2中選取5000張圖,并在大氣光A∈[0.5,1],散射系數(shù)β={0.4,1.6}的范圍內(nèi)合成數(shù)據(jù)集。對于室外圖像,從RESIDE數(shù)據(jù)集中選取5000張圖,并在A∈[0.8,1.0],β∈{0.04,0.06,0.08,0.1,0.12,0.16,0.2}范圍內(nèi)合成相應(yīng)的霧圖及透射率。其中,5000張室內(nèi)圖像對和5000張室外圖像對構(gòu)成訓練集。1000張室內(nèi)圖像對和1000張室外圖像對構(gòu)成測試集A。另一方面,包含500張室內(nèi)圖像及500張室外圖像的公共測試集SOTS[17]也用來測試算法魯棒性。
模型中雙循環(huán)注意網(wǎng)絡(luò)的循環(huán)次數(shù)n,總損失函數(shù)中平衡系數(shù)a和b的選取尤為重要,它將直接影響模型去霧的精度及收斂效率。此小節(jié)將討論n,a和b取值的合理性。首先,在保持a和b值為1的基礎(chǔ)上,設(shè)置循環(huán)次數(shù)n分別為2,3,4,5,對應(yīng)模型在SOTS測試集上測得去霧結(jié)果的SSIM值如表1所示。從中可見,隨著n的增長,SSIM值逐漸提高,但在n為3時,模型的性能趨于穩(wěn)定。為了平衡模型的去霧精度及計算成本,本文中循環(huán)次數(shù)n設(shè)置為3。在此基礎(chǔ)上,進一步分別設(shè)置a和b值為0.5,1和1,0.5,從表3可見,這兩種參數(shù)設(shè)置下的SSIM值均小于n為3,a和b均為1時模型的SSIM值0.974。圖4為a和b不同設(shè)置下對應(yīng)的模型,在訓練0到180時期時,SOTS測試集上測得的SSIM曲線,從中可見當a=1,b=1,網(wǎng)絡(luò)模型在40時期時開始收斂,而當a=0.5,b=1和a=1,b=0.5時,模型分別在75時期和94時期開始收斂,故a=1,b=1時模型收斂更快。因此本文設(shè)置n為3,a和b均為1。
表1 不同參數(shù)設(shè)置的SSIM值對比Tab.1 Comparison of parameters setting with different values in terms of SSIM
圖4 不同參數(shù)設(shè)置時SSIM值對比Fig.4 Comparison of SSIM values with different settings of parameters.
為驗證雙視覺注意網(wǎng)絡(luò)估計透射率的有效性,本文不但選用了DCP[5],BCCR[7],JTED[14],DCPDN[13]算法進行結(jié)果對比,還將雙視覺注意網(wǎng)絡(luò)的ld層去除,獲得僅有l(wèi)t層的單視覺注意網(wǎng)絡(luò)模型進行性能對比。不同算法在測試集A的室內(nèi)和室外圖像上估計透射率的平均SSIM值如表2所示,從中可見本文算法無論在室內(nèi)圖像還是室外圖像上均具有最高的SSIM值,透射率估計的準確度較高。
表2 不同算法的透射率SSIM值對比Tab.2 Comparison of transmission map by different al?gorithms in terms of SSIM
為驗證本文算法去霧的有效性,選用JT?ED[14],EPDN[11],GridDN[12],DCPDN[13]算法及l(fā)d層的單視覺注意網(wǎng)絡(luò)模型進行對比。視覺結(jié)果如圖5所示,從中可見,JTED的結(jié)果仍存在霧殘余,如圖5(b)的第2行中,桌椅區(qū)域仍存在去霧不徹底的現(xiàn)象。EPDN及Grid DN算法雖能有效去除霧氣,但部分區(qū)域存在顏色失真,如圖5(c)第2行的墻面及圖5(d)第1行的天空區(qū)域均出現(xiàn)了顏色較深的色塊。DCPDN算法的去霧結(jié)果亮度較高,導致圖5(e)第1行的天空區(qū)域顏色過白,與真實結(jié)果(圖5(h))的色調(diào)差異明顯。本文算法與ld層的單視覺注意網(wǎng)絡(luò)較其他去霧算法具有更好的去霧效果,但仔細觀察仍可發(fā)現(xiàn),本文算法的去霧結(jié)果圖5(g)較ld層的單視覺注意網(wǎng)絡(luò)(圖5(f))更接近真實圖像(圖5(h)),例如圖5(f)第2行的椅背顏色略黑,而圖5(g)第2行的椅背顏色更接近真實圖像。表3進一步展示了各算法在不同測試集上的量化結(jié)果。從中可見,本文算法除在室外圖像測試集A及測試集SOTS上的平均SSIM值略低于Grid DN以外,其余情況均優(yōu)于對比算法,由此證明,本文算法借助于信息交互的雙視覺注意網(wǎng)絡(luò)能有效實現(xiàn)去霧。
表3 不同算法去霧結(jié)果的SSIM值和PSNR值對比Tab.3 Comparison of dehazing methods by different al?gorithms in terms of SSIM and PSNR
圖5 合成圖去霧結(jié)果對比Fig.5 Comparison of dehazing results on synthetic images
圖6給出了不同算法的真實圖像去霧結(jié)果。為更好地觀察色調(diào)及細節(jié)信息,圖6的第2行和第4行放大了圖6第1行和第3行的局部區(qū)域。從中可以看出,JTED[14]及EPDN[110]算法的去霧結(jié)果偏暗,如圖6(b)(c)的第2行細節(jié)放大圖的色調(diào)明顯暗于初始霧圖(圖6(a))的色調(diào)。Grid?DN[11]算法的去霧結(jié)果在部分區(qū)域出現(xiàn)了明顯的色彩失真,如圖6(d)第4行圖像中深色的水面和陸面。DCPDN算法[13]結(jié)果(圖6(e))存在亮度過大的問題,如圖6(e)第3行圖像的天空區(qū)域因亮度過大而轉(zhuǎn)變?yōu)榘咨?。相比而言,ld層網(wǎng)絡(luò)和本文算法的去霧結(jié)果均能較好地去除真實圖像中的霧氣,但仔細觀察發(fā)現(xiàn),ld層網(wǎng)絡(luò)的去霧結(jié)果(圖6(f))仍有霧殘余,如圖6(f)的第4行圖像,而本文算法的去霧結(jié)果(圖6(g))不但無霧殘余,還能最大程度上保留圖像原有的色調(diào)及細節(jié)信息。
本節(jié)進一步采用用戶視覺信息作為評價指標對各算法的去霧結(jié)果進行判斷。選取不同年齡,不同性別,不同領(lǐng)域的用戶100人,對100張圖像的去霧結(jié)果進行評分,其中包含50張合成霧圖,50張真實霧圖。評價采用5分制,5分為去霧質(zhì)量優(yōu),無失真;4分為去霧質(zhì)量良好,有些許失真;3分為去霧質(zhì)量一般,失真明顯;2分為去霧質(zhì)量差,失真嚴重;1分為去霧質(zhì)量很差,無法接受。
表4為用戶對各算法評價分數(shù)的平均值。從中可見,本文算法分值最高為4.4分,而在合成霧圖的去霧結(jié)果量化評價表3中,不占優(yōu)勢的EP?DN算法,分值位于第二,4.3分。Grid DN,DCP?DN和JTED算法則位于第三,第四和第五。這主要是由于EPDN算法結(jié)果雖有失真,但具有較強的對比度,用戶視覺感受下霧殘余較少,主觀判斷失真不明顯,去霧質(zhì)量好。而本文算法結(jié)果雖失真少,但去霧結(jié)果的色彩對比度不強,部分用戶給予的評分較EPDN算法低,因此綜合評分與EPDN算法結(jié)果差距不大。為此,在未來的研究中,可在本文算法中添加后期處理模塊,以進一步提高去霧結(jié)果的色彩對比度。
表4 用戶視覺評分Tab.4 User visual evaluation
本節(jié)在SOTS數(shù)據(jù)集上比較本文算法與基于 深 度 學 習 去 霧 算 法JTED[14],EPDN[11],Grid?DN[12],DCPDN[13]和基于先驗去霧算法DCP[5]的平均運行時間。從表5可見,本文算法對單張霧天的平均處理時間僅為0.043 s,不但明顯優(yōu)于DCP算法,還優(yōu)于其他深度學習的算法,具有較高的運行效率。
表5 不同算法的平均運行時間對比Tab.5 Average running time of different methods(s)
為充分探索和挖掘透射率的估計過程和圖像的去霧過程中捕獲信息的相關(guān)性,提高網(wǎng)絡(luò)的性能。本文提出了雙視覺注意網(wǎng)絡(luò)的聯(lián)合圖像去霧和透射率估計模型。模型包含圖像去霧層和透射率估計層,且每層網(wǎng)絡(luò)均包含注意循環(huán)網(wǎng)絡(luò)和編碼解碼網(wǎng)絡(luò)。在圖像去霧層,循環(huán)注意網(wǎng)絡(luò)在透射率的監(jiān)督下生成霧濃度注意圖,以引導后續(xù)的編碼解碼網(wǎng)絡(luò)感知霧的濃度,實現(xiàn)圖像去霧。同樣,在透射率估計層,循環(huán)注意網(wǎng)絡(luò)在真實無霧圖的引導下生成場景注意圖,以引導編碼解碼網(wǎng)絡(luò)感知場景信息,生成透射率。值得一提的是,為了更準確,高效地生成霧濃度注意圖和場景注意圖,圖像去霧層及透射率估計層更利用其循環(huán)注意網(wǎng)絡(luò)的循環(huán)單元實現(xiàn)信息交互,從而形成相互協(xié)作的雙循環(huán)注意網(wǎng)絡(luò),在信息互補的方式下生成注意圖。在合成圖及真實圖上的測試表明,本文算法采用的圖像去霧層與透射率估計層的信息交互方式能有效地提高網(wǎng)絡(luò)性能,在公共合成數(shù)據(jù)集上測得的算法精度及運行效率明顯優(yōu)于已有算法,單張霧圖的平均處理時間僅為0.043 s,可用于圖像去霧的工程實踐中。