摘要:深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)通常包括許多隱藏層,其向后傳播算法需要大量的計(jì)算。介紹了一種對(duì)圖像進(jìn)行預(yù)處理,從其傅里葉編碼圖案中重建原始圖像的方法代替深度學(xué)習(xí)。該方法利用透鏡陣列引入渦旋相位進(jìn)行編碼,并結(jié)合淺層的全連接神經(jīng)網(wǎng)絡(luò),一旦訓(xùn)練好該淺層神經(jīng)網(wǎng)絡(luò),就可以從只有強(qiáng)度的數(shù)據(jù)中重建物體。利用Mnist與Arabic-Mnist數(shù)據(jù)集進(jìn)行了仿真實(shí)驗(yàn),結(jié)果表明該方法能夠重建原始物體,并且具有強(qiáng)大的泛化能力。
關(guān)鍵詞:傅里葉變換 渦旋相位 深度學(xué)習(xí) 相位恢復(fù)
Abstract: Deep learning convolutional neural networks usually include many hidden layers, and its backward propagation algorithm requires a lot of calculations. An alternative to convolutional neural networks, which preprocesses the image and reconstructs the original image from its Fourier coded patternisintroduced. This method requires only a small amount of calculation. The method uses the lens array to introduce the vortex phase for encoding, combined with a shallow fully connected neural network. Once the shallow neural network is trained, it can reconstruct objects from data with only intensity, and it can solve the inverse mapping problem without iterating or deep learning for each picture. Simulation experiments were carried out using the Mnist and Arabic-Mnist data sets, and the results show that the method can reconstruct the original objects, and has strong generalization ability.
Key word: Fourier transform; vortex phase; deep learning; phase recovery
1 引言
解決逆映射以及從不完整或是混合的信號(hào)中重建物體特征在很多領(lǐng)域都有重要應(yīng)用,例如X光成像或是遙感。從傳感器探測(cè)的信號(hào)對(duì)目標(biāo)圖案重構(gòu)或者解卷積往往是充滿挑戰(zhàn)性的,因?yàn)樵O(shè)計(jì)的算法必須解決傳感器只記錄光子復(fù)振幅或是光強(qiáng),卻丟失相位信息這一問題。目前解決這類問題用的最多的是迭代算法,例如利用GS相位恢復(fù)算法或是SPGD算法,它的缺點(diǎn)是非常耗時(shí),這個(gè)過程可能需要多次的對(duì)初始參數(shù)的嘗試以達(dá)到收斂性。迭代算法提供了通過混濁和散射介質(zhì)成像的能力,并通過編碼孔徑獲得深度信息和全聚焦圖像[1][2]。
近年來,利用計(jì)算成像來解決圖像重建中的相位問題變成可能。其中,利用神經(jīng)網(wǎng)絡(luò),尤其是深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò),成為一種新的趨勢(shì)。利用卷積神經(jīng)網(wǎng)絡(luò),傳感器記錄的干涉圖案,例如全息圖,或是幾個(gè)重疊的快照如疊層成像,可以被用來重建物體特征[3]。
深度學(xué)習(xí)利用一組訓(xùn)練集和測(cè)試集完成對(duì)模型的訓(xùn)練以及測(cè)試,通過受控的光斑圖案(通常為光強(qiáng)信息)編碼的相位信息可以用來預(yù)測(cè)模型從未見過卻類似的光斑圖案對(duì)應(yīng)的相位信息[4]。常見的用來解決這類問題的深層卷積神經(jīng)網(wǎng)絡(luò)包括AlexNet、VGG、ResNet等等。然而,深度學(xué)習(xí)也面臨許多挑戰(zhàn),例如需要龐大的訓(xùn)練集,很長的訓(xùn)練時(shí)間,同時(shí)網(wǎng)絡(luò)結(jié)構(gòu)以及超參數(shù)的調(diào)節(jié)也需要耗費(fèi)大量時(shí)間。
本文聚焦在淺層的密集神經(jīng)網(wǎng)絡(luò),并提出:不使用深度學(xué)習(xí),不使用迭代方案,實(shí)現(xiàn)圖像重構(gòu)功能。這種淺層神經(jīng)網(wǎng)絡(luò)基于回歸問題,沒有不斷獲取相位信息的迭代過程,并且采用光學(xué)預(yù)處理的方式代替深度學(xué)習(xí),以完成圖像重建。這種方式類似于將衍射光學(xué)和神經(jīng)網(wǎng)絡(luò)結(jié)合,將數(shù)學(xué)計(jì)算轉(zhuǎn)移到光的傳播上。這種方式獨(dú)特之處在于,一個(gè)簡單的神經(jīng)網(wǎng)絡(luò)可以通過在傅里葉頻域進(jìn)行空間渦旋編碼來解決逆映射問題。利用渦旋編碼比利用隨機(jī)編碼的圖案有著更少的計(jì)算復(fù)雜程度,這表明光學(xué)渦旋在傅里葉表示中提供了一定程度的特征提取。
2傅里葉與渦旋相位預(yù)處理理論
如圖1為成像方案。對(duì)真實(shí)圖片X的信息采取映射的方式:
4結(jié)論
本文介紹了一種利用傅里葉以及渦旋相位預(yù)處理來代替深度學(xué)習(xí)復(fù)原相位的方法,利用僅有兩層隱藏層的淺層全連接神經(jīng)網(wǎng)絡(luò)解決相位恢復(fù)問題,并且僅僅使用了2400張圖片作為訓(xùn)練集,訓(xùn)練的迭代次數(shù)也僅為15次。此外,沒有對(duì)超參數(shù)進(jìn)行過多的調(diào)節(jié)。從結(jié)果來看,利用傅里葉與渦旋預(yù)處理能夠復(fù)原信號(hào)的相位信息。這種方法突破之處在于,避免了深度學(xué)習(xí)需要搭建多層網(wǎng)絡(luò)、訓(xùn)練時(shí)間冗長、調(diào)參困難、對(duì)GPU需求高等弊端,僅使用兩層隱藏層就實(shí)現(xiàn)相位信息復(fù)原,并且沒有進(jìn)行較多的超參數(shù)調(diào)節(jié),如果繼續(xù)調(diào)節(jié)網(wǎng)絡(luò)參數(shù),可以實(shí)現(xiàn)更精確的相位復(fù)原。另一個(gè)突破之處在于,在利用渦旋相位調(diào)制了X之后,神經(jīng)網(wǎng)絡(luò)可以復(fù)原未曾學(xué)習(xí)的數(shù)據(jù),這里的未學(xué)習(xí)過的數(shù)據(jù)是指完全沒有見過的類別,在本次仿真實(shí)驗(yàn)中,神經(jīng)網(wǎng)絡(luò)僅僅見過0-9這10個(gè)阿拉伯?dāng)?shù)字,即Mnist一種數(shù)據(jù)集,但是測(cè)試它的包括阿拉伯文字,即Arabic-Mnist數(shù)據(jù)集。而從沒有被渦旋相位調(diào)制的結(jié)果來看,神經(jīng)網(wǎng)絡(luò)完全無法復(fù)原從未學(xué)習(xí)過的數(shù)據(jù)。這表明渦旋相位調(diào)制提高了神經(jīng)網(wǎng)絡(luò)的泛化識(shí)別能力。所提出的方法在相位恢復(fù)、渦旋光超大容量通信、量子密鑰分發(fā)、旋轉(zhuǎn)多普勒探測(cè)等領(lǐng)域均有廣闊的應(yīng)用前景。
參考文獻(xiàn)
[1]J. A. Davis, I. Moreno, and D. M. Cottrell, "Vortex sensing diffraction gratings," Opt. InfoBase Conf. Pap. 8–9 (2011).
[2]牛化恒. 渦旋光束的產(chǎn)生與傳輸特性分析[D]. 西安:西安電子科技大學(xué), 2017.
[3]H. L. Zhou, D. Z. Fu, J. J. Dong, P. Zhang, D. X. Chen, X. L. Cai, F. L. Li, and X. L. Zhang, "Orbital angular momentum complex spectrum analyzer for vortex light based on the rotational Doppler effect," Light Sci. Appl. 6(4), (2017).
[4]W.Zhang,Q.Qi,J.Zhou,and L. Chen, "Mimicking faraday rotation to sort the orbital angular momentum of light," Phys. Rev. Lett. 112(15), 1–5 (2014).
[5]周長建, 司震宇, 邢金閣, 等. 基于Deep Learning網(wǎng)絡(luò)態(tài)勢(shì)感知建模方法研究[J]. 東北農(nóng)業(yè)大學(xué)學(xué)報(bào), 2013,44(05): 144-149.
[6]M.Mirhosseini,M.Malik,Z.Shi,and R. W.Boyd,"Efficient separation of the orbital angular momentum eigenstates of light," Nat. Commun.4,1–6 (2013).
作者簡介 :王瑋(1965-),男,漢族,廣東深圳人,高級(jí)講師,碩士研究生,主要從事自動(dòng)控制與人工智能等方面的工作。