国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的超分辨率圖像重建研究綜述*

2021-10-09 08:33:52王保云張祝鴻張玲莉
計算機與數(shù)字工程 2021年4期
關(guān)鍵詞:低分辨率高分辨率網(wǎng)絡(luò)結(jié)構(gòu)

鄭 璐 王保云 楊 昆 孔 艷 張祝鴻 張玲莉

(1.云南師范大學(xué)信息學(xué)院 昆明 650500)(2.云南師范大學(xué)信息學(xué)院數(shù)據(jù)科學(xué)實驗室 昆明 650500)

1 引言

在這個信息大爆炸的時代,人類通過各種各樣的信息感知世界,其中圖像是人類獲取信息、表達信息和傳遞信息的重要手段[1]。近年來,利用某些技術(shù)手段對低質(zhì)量圖像進行超分辨率重建引起了研究者的廣泛關(guān)注。超分辨率圖像重建(Super Resolution,SR)是指利用相關(guān)的圖像處理和算法模型,從觀測到的低分辨率圖像中重建高分辨率圖像的技術(shù)[2]。高分辨率圖像包含了更多的紋理特征和細節(jié)信息,因此在監(jiān)控設(shè)備、衛(wèi)星圖像和醫(yī)學(xué)影像領(lǐng)域都有重要的應(yīng)用價值。

傳統(tǒng)的超分辨率重建算法通常分為基于重建的方法和基于學(xué)習(xí)的(非深度學(xué)習(xí))方法。Stark等人提出的凸集投影[3]使用迭代投影得到高分辨率圖像的估計;隨后,Irani和Peleg提出了迭代反投影的方法,成為超分辨率圖像重建中非常有代表性的方法[4];最大后驗概率法是Schultz和Stevenson提出的一種典型的概率方法[5],最終保持圖像的局部特征平滑和邊緣信息,獲得了比較好的效果;Nguyen等提出的正則化方法[6],利用恒定正則化算子和最優(yōu)正則化參數(shù)構(gòu)造圖像模糊參數(shù)、正則化參數(shù)以及高分辨率圖像的最小能量函數(shù),從而形成規(guī)則的超分辨率重建模型。傳統(tǒng)的基于學(xué)習(xí)的方法主要涉及機器學(xué)習(xí)領(lǐng)域,通常采用機器學(xué)習(xí)技術(shù)來局部估計輸出圖像的高分辨率細節(jié)信息?;趯嵗姆椒ㄊ且环N早期的基于學(xué)習(xí)的超分辨率圖像重建方法[7],在4倍放大因子的條件下,獲得了較高的圖像質(zhì)量;Chang等首次提出了一種基于鄰域嵌入的超分辨率圖像重建方法;Karl和Nguyen等利用支持向量回歸實現(xiàn)了超分辨率圖像重建[8];Yang等提出了利用稀疏表示來實現(xiàn)超分辨率[9],對每一個測試補丁,用線性規(guī)劃的方法得到這個超完整字典下測試補丁的稀疏表示。最后,通過加權(quán)系數(shù)對高分辨率圖像進行重建。

隨著深度學(xué)習(xí)的迅速發(fā)展,一些研究者將注意力轉(zhuǎn)移到了深度學(xué)習(xí)領(lǐng)域,嘗試構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)模型來處理超分辨率圖像重建問題。本文通過卷積神經(jīng)網(wǎng)絡(luò)、殘差網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、密集卷積網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)五種不同的深度網(wǎng)絡(luò)模型,對基于深度學(xué)習(xí)的超分辨率方法進行分析概括,并對不同方法獲得的超分辨率圖像質(zhì)量的評價結(jié)果進行闡述。最后比較各個模型方法的實驗結(jié)果和定量評價指標(biāo),提出超分辨率研究領(lǐng)域問題和進一步的研究方向。

2 基于深度學(xué)習(xí)的超分辨率圖像重建

深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,在過去十年左右的時間里發(fā)展飛速,引起了國內(nèi)外研究者的廣泛關(guān)注。目前,深度學(xué)習(xí)已成功應(yīng)用于計算機視覺、語音識別、記憶網(wǎng)絡(luò)、自然語言處理等研究領(lǐng)域[10]。

2.1 SRCNN

超分辨率卷積神經(jīng)網(wǎng)絡(luò)(Super-Resolution Convolutional Neural Network,SRCNN)是深度學(xué)習(xí)用在超分辨率重建領(lǐng)域的一項前沿性研究。它的網(wǎng)絡(luò)結(jié)構(gòu)非常簡單,首先,利用雙三次插值對圖像進行預(yù)處理,將低分辨率圖像放大到目標(biāo)尺寸。然后輸入低分辨率圖像,通過三層卷積網(wǎng)絡(luò)擬合非線性映射,輸出高分辨率圖像結(jié)果。SRCNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,第一層,圖像塊提取和特征表示;第二層,是特征的非線性映射;第三層,最終的重建[11]。

圖1 SRCNN網(wǎng)絡(luò)模型

SRCNN在ILR和IHR之間建立了端到端(end-to-end)映射的SR模型,相較于傳統(tǒng)的超分辨率算法在相同的數(shù)據(jù)結(jié)構(gòu)上以及放大相同倍數(shù)的情況下,在峰值信噪比(PSNR)和運算速度上都有了一定程度的提升。

2.2 VDSR

VDSR(Very Deep Convolutional Networks)是基于SRCNN的改進網(wǎng)絡(luò)。其最大特點是具有多層性,最終效果精度高,訓(xùn)練速度比較快。究其原因是因為作者發(fā)現(xiàn)輸入的低分辨率圖像和輸出的高分辨率圖像非常相似,即低分辨率圖像攜帶的低頻信息和高分辨率信息具有很強的相似性[12],所以只需要學(xué)習(xí)高分辨率圖像和低分辨率圖像之間的高頻殘差部分即可。因此,在提高網(wǎng)絡(luò)深度的基礎(chǔ)上,將殘差網(wǎng)絡(luò)引入到重建模型中,可以提高網(wǎng)絡(luò)性能和最終重建結(jié)果的準(zhǔn)確性。

如圖2所示,插值后得到的目標(biāo)尺寸的低分辨率圖像作為VDSR網(wǎng)絡(luò)的輸入,再將圖像和網(wǎng)絡(luò)學(xué)習(xí)到的殘差相加,得到最終的網(wǎng)絡(luò)輸出[13]。VDSR具有以下優(yōu)點:深化了網(wǎng)絡(luò)結(jié)構(gòu),擴大了感受野,充分利用分布在超大圖像區(qū)域的上下文信息,避免圖像信息的丟失,重建圖像細節(jié);對殘差圖像進行建模,學(xué)習(xí)高分辨率和低分辨率圖像之間的差異,提高學(xué)習(xí)速度,同時采用極高的學(xué)習(xí)速率,加快收斂速度;VDSR還應(yīng)用了自適應(yīng)梯度裁剪,使用可調(diào)節(jié)的梯度來最大限度地提高速度,同時抑制梯度爆炸[14]。VDSR將不同倍數(shù)的圖像混合在一起訓(xùn)練,解決了不同倍數(shù)的超分辨率問題[15]。

圖2 VDSR網(wǎng)絡(luò)模型

2.3 DRCN

DRCN(Deeply-Recursive Convolutional Network for Image Super-Resolution)第一次將已有的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)用在超分辨率問題上,同時利用殘差網(wǎng)絡(luò)的思想,加深了網(wǎng)絡(luò)結(jié)構(gòu),增加了網(wǎng)絡(luò)感受野,提升了性能。其網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示分為三個模塊:第一個相當(dāng)于特征提取的嵌入網(wǎng)絡(luò),第二個相當(dāng)于特征非線性映射的推斷網(wǎng)絡(luò),第三個相當(dāng)于重建網(wǎng)絡(luò),即從特征圖像恢復(fù)最后的重建結(jié)果[16]。其中,Inferencenet work網(wǎng)絡(luò)是一種遞歸神經(jīng)網(wǎng)絡(luò),通過它可以使數(shù)據(jù)反復(fù)循環(huán)。其中,H1到Hd是D個共享參數(shù)的卷積層,通過同一重構(gòu)網(wǎng)絡(luò)對D個卷積層的每一層結(jié)果進行處理,并在重構(gòu)網(wǎng)絡(luò)中添加輸入圖像,獲得D個重建結(jié)果輸出。

圖3 DRCN網(wǎng)絡(luò)模型

DRCN最大的特點在于多次應(yīng)用相同的卷積層,重復(fù)執(zhí)行多次遞歸而不會增加參數(shù)數(shù)量。在這個過程中,該方法加入了遞歸監(jiān)督,為了解決梯度和最優(yōu)遞歸的問題,監(jiān)督所有遞歸,減輕了梯度消失或爆炸的影響。

2.4 SRDenseNet

DenseNet是一個具有密集連接的卷積神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)各層的輸入是所有前一層的輸出,該層學(xué)習(xí)到的圖像特征作為輸入直接傳輸?shù)皆搶雍竺娴乃袑?。如圖4是DenseNet的一個密連接塊,塊體結(jié)構(gòu)如下:BN-RELU-Conv。

圖4 DenseNet網(wǎng)絡(luò)結(jié)構(gòu)

DenseNet在密連接塊后將每個層的特性輸入到所有層中,這樣所有層都是串聯(lián)的,而不是像殘差網(wǎng)絡(luò)一樣簡單相加。這種結(jié)構(gòu)可以緩解整個網(wǎng)絡(luò)中梯度消失的問題,具有增強特征傳播、支持特征重用、減少參數(shù)個數(shù)等優(yōu)點。SRDenseNet結(jié)構(gòu)分為四部分,首先用一個卷積層學(xué)習(xí)低階圖像特征,然后用幾個密連接塊學(xué)習(xí)高階圖像特征,接著用幾個反卷積層學(xué)習(xí)上采樣的濾波參數(shù),最后用一個卷積層生成高分辨率圖像輸出。SRDenseNet在超分辨率的深層網(wǎng)絡(luò)中引入密集跳躍連接,通過密集跳躍連接在不同級別上的特征融合,進一步提高圖像超分辨率的重建性能。

2.5 SRGAN

生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)由Goodfellow等提出,它啟發(fā)自博弈論中的二人零和博弈[20]。GAN具有強大的圖片生成能力,使其在圖片合成、圖像修補、超分辨率、草稿圖復(fù)原等方面都有廣泛的應(yīng)用[17]。Ledig等首次將生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)應(yīng)用到超分辨率圖像重建中,提出了基于生成對抗網(wǎng)絡(luò)的超分辨率(Super-Resolution using a Generative Adversarial Network,SRGAN)算法[18],該算法將低分辨率圖片樣本輸入到生成器網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí),來生成高分辨率圖片,再用判別器網(wǎng)絡(luò)辨別其輸入的高分辨率圖片是來自原始真實的高分辨率圖片還是生成的高分辨率圖片,當(dāng)判別器無法辨別出圖片的真?zhèn)螘r,說明生成器網(wǎng)絡(luò)生成了高質(zhì)量的高分辨率圖片。實驗結(jié)果表明相比以往的深度學(xué)習(xí)方法生成的圖片效果在視覺上更逼真。之前的基于深度學(xué)習(xí)的超分辨率方法雖然能夠獲得很高的峰值信噪比,但恢復(fù)出來的圖像通常會丟失高頻細節(jié),使人難以有好的主觀感受效果。SRGAN主要利用感知損失和對抗損失來改善圖像恢復(fù)的真實性。感知損失是利用卷積神經(jīng)網(wǎng)絡(luò)提取出來的特征,通過比較卷積后的生成圖像與卷積后原始圖像的特征,使生成的圖像盡可能地接近原始目標(biāo)圖像。SRGAN的生成網(wǎng)絡(luò)使用了SRResNet作為網(wǎng)絡(luò)模型[19],并通過均方誤差來優(yōu)化。通過計算訓(xùn)練后的VGG模型的高級特征上的感知損失,對SRGAN進行了優(yōu)化。結(jié)合SRGAN的判別網(wǎng)絡(luò),可以得到峰值信噪比不是最高,但具有真實視覺效果的超分辨重建結(jié)果。其網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。

圖5 SRGAN網(wǎng)絡(luò)模型

3 實驗結(jié)果與分析

表1列出了文中所述的五種基于深度學(xué)習(xí)網(wǎng)絡(luò)模型的超分辨率圖像重建方法的PSNR和SSIM值。這些方法在set5、set14、B100、Urban100數(shù)據(jù)集下 完 成 測 試,對 比SRCNN、VDSR、DRCN、SRDenseNet、SRGAN方法,由作者所公布的實驗結(jié)果整理得到表中數(shù)據(jù)。通過觀察實驗數(shù)據(jù)發(fā)現(xiàn)SRDenseNet在四個數(shù)據(jù)集下的測試結(jié)果中,4倍放大因子下,得到的PSNR和SSIM值最高。通過對比整體的結(jié)果,VDSR和DRCN都獲得了比較好的PSNR和SSIM值,這兩種方法在SRCNN的基礎(chǔ)上,都加深了網(wǎng)絡(luò)層次,擴大了感受野范圍,并運用了殘差網(wǎng)絡(luò)的思想提高了運行速度。

表1 五種SR算法重建效果對比

4 結(jié)語

超分辨率圖像重建旨在提高圖像質(zhì)量,便于獲取更多關(guān)于圖像的細節(jié)信息,是計算機視覺領(lǐng)域一項重要的研究工作。本節(jié)對五種典型的基于深度學(xué)習(xí)的超分辨率重建方法進行討論總結(jié),從中可以得出以下問題。

1)深度網(wǎng)絡(luò)類型和結(jié)構(gòu)構(gòu)建。通過對五種不同深度學(xué)習(xí)網(wǎng)絡(luò)模型分析發(fā)現(xiàn),網(wǎng)絡(luò)結(jié)構(gòu)層次越深,感受野越大,越能夠充分利用圖像的上下文信息,減少圖像細節(jié)丟失的可能性。但同時越深的網(wǎng)絡(luò)模型,意味著難以收斂的訓(xùn)練過程,因此,在加深網(wǎng)絡(luò)模型層次的同時,結(jié)合殘差網(wǎng)絡(luò)、自適應(yīng)梯度裁剪等能夠避免深層網(wǎng)絡(luò)梯度爆炸/消失的優(yōu)化算法訓(xùn)練是非常必要的。

2)算法優(yōu)化。文中所列的五種超分辨率圖像重建方法都得到了較好質(zhì)量的重建圖像,與傳統(tǒng)方法相比,也提升了PSNR和SSIM值。但是其訓(xùn)練速度和可視化效果并未達到人們的預(yù)期,還具有較大的改進空間。

3)評價機制。經(jīng)過30多年的研究和開發(fā),超分辨率圖像重建技術(shù)取得了長足的進步。如何構(gòu)建合理的評價機制,評價超分辨率圖像的質(zhì)量,進而評價不同超分辨率算法的優(yōu)劣,也一直是超分辨率研究領(lǐng)域十分熱門的問題。猶如SRGAN,在視覺效果上SRGAN很好地重建了圖像的細節(jié)信息,主觀感受最好。但是由于其不高的PSNR和SSIM值,自然讓我們想到另一個問題,建立能夠反映主觀感受效果的評價機制。通過量化主觀人眼評價效果,結(jié)合客觀評價指標(biāo),構(gòu)建有效的評價機制也是值得研究的問題。

4)GAN模型。生成對抗網(wǎng)絡(luò)因其具有很好的圖像生成功能,在超分辨率圖像重建方法中嶄露頭角,獲得了最好的視覺效果。因此在未來工作中,著重考慮在當(dāng)前SRGAN網(wǎng)絡(luò)模型的基礎(chǔ)上結(jié)合當(dāng)下各類優(yōu)化算法和成熟的網(wǎng)絡(luò)結(jié)構(gòu),進一步提高重建圖像的質(zhì)量和訓(xùn)練結(jié)果的定量評價指標(biāo)。

深度學(xué)習(xí)在超分辨率圖像重建中具有廣闊的應(yīng)用前景。本文總結(jié)了現(xiàn)有的超分辨率圖像重建的深度網(wǎng)絡(luò)模型,對比不同網(wǎng)絡(luò)模型的特點和訓(xùn)練方法,總結(jié)分析了現(xiàn)有模型存在的問題以及模型構(gòu)建的新思路,提出生成對抗網(wǎng)絡(luò)在超分辨率問題中的優(yōu)化策略和應(yīng)用方法,并將在下一階段詳細展開研究與討論。文末簡述了超分辨率重建問題的其他相關(guān)研究方向——對于圖像質(zhì)量的評價機制,提出圖像質(zhì)量評價機制的不足和現(xiàn)存問題,對以后建立反映主觀感受效果的評價機制提出具有實際參考價值的建議。

猜你喜歡
低分辨率高分辨率網(wǎng)絡(luò)結(jié)構(gòu)
基于全局和局部特征集成的低分辨率人臉識別方法
紅外熱成像中低分辨率行人小目標(biāo)檢測方法
基于偏移學(xué)習(xí)的低分辨率人體姿態(tài)估計
高分辨率合成孔徑雷達圖像解譯系統(tǒng)
樹木的低分辨率三維模型資源創(chuàng)建實踐
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機制——遠程創(chuàng)新搜尋的中介作用
滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實證分析
復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對算法研究進展
高分辨率對地觀測系統(tǒng)
太空探索(2015年8期)2015-07-18 11:04:44
行唐县| 临西县| 龙游县| 礼泉县| 英德市| 新巴尔虎右旗| 永善县| 资溪县| 密云县| 健康| 丹阳市| 镇远县| 洞头县| 福清市| 莱州市| 天柱县| 贡觉县| 军事| 布尔津县| 正蓝旗| 澎湖县| 保亭| 韩城市| 荥经县| 沂南县| 顺昌县| 峨山| 柘城县| 静海县| 崇州市| 遂川县| 凤山县| 桐乡市| 黔西县| 赣榆县| 广水市| 江门市| 横峰县| 贵溪市| 营口市| 台北市|