尹霄麗,崔小舟,常 歡,張兆元,蘇元直,鄭 桐
基于機(jī)器學(xué)習(xí)的軌道角動(dòng)量光束模式探測(cè)技術(shù)研究進(jìn)展
尹霄麗*,崔小舟,常 歡,張兆元,蘇元直,鄭 桐
北京郵電大學(xué)電子工程學(xué)院天地互聯(lián)與融合北京市重點(diǎn)實(shí)驗(yàn)室,北京 100876
軌道角動(dòng)量(OAM)復(fù)用和編碼技術(shù)可有效提高光通信系統(tǒng)信道容量。近些年研究者提出將機(jī)器學(xué)習(xí)(ML)技術(shù)用于OAM模式探測(cè)以提高OAM光通信系統(tǒng)性能。本文對(duì)基于機(jī)器學(xué)習(xí)的OAM模式探測(cè)方案進(jìn)行了綜述,包括誤差反向傳播(BP)神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò)(SOM)、支持向量機(jī)(SVM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、光束變換輔助的識(shí)別技術(shù)以及全光衍射深度神經(jīng)網(wǎng)絡(luò)(D2NN),分析了各類機(jī)器學(xué)習(xí)OAM探測(cè)器在對(duì)抗大氣、水下信道帶來(lái)的干擾時(shí)展現(xiàn)出的性能差異以及各自優(yōu)勢(shì)。
軌道角動(dòng)量;機(jī)器學(xué)習(xí);神經(jīng)網(wǎng)絡(luò)
然而,大氣是一種不穩(wěn)定的隨機(jī)介質(zhì),光波在大氣中傳播時(shí),會(huì)受到分子吸收、大氣氣體和氣溶膠散射、湍流擾動(dòng)等影響。大氣中湍流會(huì)對(duì)光束的復(fù)振幅造成破壞,干擾OAM態(tài)的正交性,進(jìn)而降低空間光通信系統(tǒng)的誤碼率性能[20-21]。因此,如何提高OAM通信系統(tǒng)的抗干擾能力成為了迫切需要解決的問(wèn)題。
OAM光束用于復(fù)用或者編碼時(shí),由于不同疊加態(tài)的OAM光束有著不同的物理表現(xiàn)(如強(qiáng)度圖樣),故可將OAM模式識(shí)別問(wèn)題轉(zhuǎn)換為圖像分類的問(wèn)題。此類問(wèn)題通常使用識(shí)別率(即對(duì)圖像正確分類的比例)和誤碼率(即傳輸信息比特的錯(cuò)誤率)來(lái)表示。2014年,維也納大學(xué)Krenn等人首次使用人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)作為OAM模式分類器。該研究在3 km的城市環(huán)境大氣中對(duì)16個(gè)OAM模式進(jìn)行識(shí)別,平均誤碼率接近1%[22]。2016年,Krenn等在143 km的海面上空(海洋性大氣信道)進(jìn)行了類似的實(shí)驗(yàn)。該實(shí)驗(yàn)利用4種OAM模式對(duì)文字進(jìn)行編碼,誤碼率為8.33%。盡管誤碼率偏高,但該研究驗(yàn)證了機(jī)器學(xué)習(xí)作為OAM識(shí)別器可以在長(zhǎng)達(dá)數(shù)百公里的傳輸距離中使用的可能性[23]。但ANN在圖像分類上存在無(wú)法學(xué)習(xí)相鄰像素點(diǎn)關(guān)聯(lián)性等問(wèn)題,并且部分ANN需要人工設(shè)置特征函數(shù),故基于ANN的OAM模式識(shí)別器在系統(tǒng)實(shí)現(xiàn)上具有一定的局限性。2017年,基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)在處理圖像分類問(wèn)題上的優(yōu)勢(shì),美國(guó)海軍實(shí)驗(yàn)室和北京郵電大學(xué)等先后提出使用AlexNet、LeNet等框架的CNN對(duì)受大氣湍流影響的OAM光束強(qiáng)度圖樣進(jìn)行分類識(shí)別,在實(shí)驗(yàn)室通過(guò)實(shí)驗(yàn)和仿真的方式取得了大于99%的識(shí)別率,從此開(kāi)啟了CNN-OAM模式分類器的研究熱潮[24-25]。
本文將對(duì)基于機(jī)器學(xué)習(xí)的OAM模式分類研究進(jìn)行綜述,分類器包括常見(jiàn)的ANN、支持向量機(jī)(support vector machine, SVM)、CNN以及近一年受到廣泛關(guān)注的全光神經(jīng)網(wǎng)絡(luò)——衍射深度神經(jīng)網(wǎng)絡(luò)(diffractive deep neural networks,D2NN)等。
對(duì)于=0,
在溫度梯度的作用下,大氣的湍流運(yùn)動(dòng)會(huì)導(dǎo)致大氣折射率紊亂,稱為大氣的光學(xué)湍流。Kolmogorov早期的研究表明,所有光學(xué)湍流的一個(gè)亞類具有一定程度的統(tǒng)計(jì)一致性,便于進(jìn)行有意義的理論分析和建模處理。折射率在時(shí)空上隨機(jī)地重新分布會(huì)造成與其相關(guān)的光束閃爍現(xiàn)象和相位波動(dòng)等各種影響[27]。
對(duì)于光波傳播,折射率的變化幾乎都是因溫度微弱變化引起的,濕度變化、壓力變化通??梢院雎圆挥?jì)。因此,折射率的空間功率譜函數(shù)形式與溫度空間功率譜函數(shù)類似,溫度起伏功率譜也類似于風(fēng)速起伏功率譜,符合相同的次方規(guī)律。大氣湍流的折射率功率譜模型已有Kolmogorov譜,Tatarskii譜,修正型von Karman譜,以及修正型Kolmogorov大氣譜等[28]。其中表述最簡(jiǎn)潔并且運(yùn)用十分廣泛的是Kolmogorov功率譜:
圖1 拓?fù)浜蓴?shù)為±l0的疊加態(tài)光束在發(fā)送端的光場(chǎng)強(qiáng)度分布圖。(a)~(h) 對(duì)應(yīng)的拓?fù)浜蒷0分別對(duì)應(yīng)1 至8
由Tatarskii譜可以得到如下的修正型von Karman譜:
在Kolmogorov譜基礎(chǔ)上可以得到修正型Kolmogorov大氣譜:
OAM光束經(jīng)湍流信道的傳輸可以利用分步傳輸法進(jìn)行數(shù)值仿真,也可以通過(guò)空間光調(diào)制器產(chǎn)生滿足Kolmogrov湍流理論的隨機(jī)相位屏進(jìn)行模擬[29]。OAM光束經(jīng)海洋信道的仿真?zhèn)鬏斉c大氣信道類似,需要采用相應(yīng)的折光率譜模型。
機(jī)器學(xué)習(xí)通常是指計(jì)算機(jī)根據(jù)“學(xué)習(xí)算法”從經(jīng)驗(yàn)數(shù)據(jù)中產(chǎn)生模型,再利用模型對(duì)新的情況提供相應(yīng)的判斷[30]。早期的神經(jīng)網(wǎng)絡(luò)需要人類設(shè)計(jì)特征函數(shù),特征設(shè)計(jì)的好壞直接決定了神經(jīng)網(wǎng)絡(luò)的性能,因此又被稱作“特征工程”。但對(duì)于圖像識(shí)別而言,僅僅圖像角度的變化就會(huì)導(dǎo)致原有特征發(fā)生改變,識(shí)別率無(wú)法得到提升。到了二十一世紀(jì),“深度學(xué)習(xí)”的提出讓連接主義再次成為熱潮。狹義地說(shuō),深度學(xué)習(xí)就是使用很多層的神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器學(xué)習(xí)。使用深度學(xué)習(xí)進(jìn)行圖像分類處理,無(wú)需人工設(shè)計(jì)特征,網(wǎng)絡(luò)通過(guò)多層學(xué)習(xí)可以自動(dòng)提取特征。隨著計(jì)算機(jī)技術(shù)的發(fā)展,可以使用的數(shù)據(jù)樣本越來(lái)越大,避免了“過(guò)擬合”的局限;計(jì)算能力越來(lái)越強(qiáng),能夠使用更復(fù)雜的神經(jīng)網(wǎng)絡(luò)和更多數(shù)據(jù),這兩個(gè)原因讓深度學(xué)習(xí)走向了工程實(shí)踐,在各個(gè)領(lǐng)域獲得了廣泛應(yīng)用[31]。
誤差反向傳播(Back propagation, BP)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較為簡(jiǎn)單,一般是具有三層或三層以上的多層神經(jīng)網(wǎng)絡(luò)。其按功能可分為輸入層、隱含層和輸出層。其各層神經(jīng)元之間實(shí)現(xiàn)全連接,但上下各神經(jīng)元之間無(wú)連接,其結(jié)構(gòu)如圖2所示[32]。在進(jìn)行有導(dǎo)師訓(xùn)練時(shí),神經(jīng)元的激活值從輸入層經(jīng)過(guò)各隱含層傳遞至輸出層,輸出信號(hào)的誤差經(jīng)各隱含層回傳到輸入層修正各節(jié)點(diǎn)權(quán)值,因此稱為“誤差反向傳播”。經(jīng)過(guò)多次迭代更新后,神經(jīng)網(wǎng)絡(luò)的輸出最大值點(diǎn)即為分類的結(jié)果。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖[32]
由于BP神經(jīng)網(wǎng)絡(luò)在處理圖像分類問(wèn)題時(shí)效果不好,故在OAM模式探測(cè)相關(guān)文章中多作為比較組,在此不單獨(dú)進(jìn)行BP-OAM探測(cè)器的綜述。
BP神經(jīng)網(wǎng)絡(luò)這一類有導(dǎo)師的神經(jīng)網(wǎng)絡(luò)需要提前已知大量數(shù)據(jù)并進(jìn)行標(biāo)記,然而在對(duì)外界未知環(huán)境進(jìn)行學(xué)習(xí)時(shí),則需要無(wú)導(dǎo)師的學(xué)習(xí)模型。自組織競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)(self-organizing feature map,SOM)便是無(wú)導(dǎo)師學(xué)習(xí)的一種典型模型,其本質(zhì)為劃分聚類。該神經(jīng)網(wǎng)絡(luò)模仿生物學(xué)中的“側(cè)抑制”現(xiàn)象(即一個(gè)神經(jīng)細(xì)胞興奮后會(huì)對(duì)周圍神經(jīng)細(xì)胞產(chǎn)生抑制作用),競(jìng)爭(zhēng)層中各神經(jīng)元競(jìng)爭(zhēng)對(duì)輸入模式的相應(yīng)機(jī)會(huì),最終產(chǎn)生一個(gè)獲勝者;與獲勝者相連的各個(gè)連接權(quán)值會(huì)朝向有利于競(jìng)爭(zhēng)的方向調(diào)整。再經(jīng)多次迭代后,獲勝的結(jié)點(diǎn)對(duì)將來(lái)出現(xiàn)的相似向量更加容易贏得該結(jié)點(diǎn)的勝利,從而歸為一類。其網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示[32]。
2014年起,維也納大學(xué)Krenn等人提出使用SOM對(duì)單OAM態(tài)和疊加OAM態(tài)進(jìn)行分類[22]。該團(tuán)隊(duì)在維也納市區(qū)進(jìn)行了大氣信道的OAM光束傳輸實(shí)驗(yàn)。其實(shí)驗(yàn)架構(gòu)與場(chǎng)景圖如圖4(a)所示。由于長(zhǎng)距離傳輸光束尺寸發(fā)生展寬,實(shí)驗(yàn)采用面板對(duì)接收光束進(jìn)行漫反射并用CCD記錄。在經(jīng)過(guò)3 km的大氣信道傳輸后,OAM光斑受到了城市環(huán)境中大氣湍流及大氣顆粒物的干擾并發(fā)生畸變,但OAM強(qiáng)度圖樣仍然可以辨別。接收端使用自組織神經(jīng)網(wǎng)絡(luò)識(shí)別16個(gè)OAM疊加態(tài),錯(cuò)誤率約為1.7%。實(shí)驗(yàn)還利用OAM編碼傳輸了兩幅圖片,如圖4(b)、4(c)所示,可以看出,相較于小OAM態(tài)而言,較大的OAM態(tài)出現(xiàn)了較大的串?dāng)_。該實(shí)驗(yàn)首次證明了機(jī)器學(xué)習(xí)作為非相干解碼器在FSO-OAM系統(tǒng)中的可行性。
圖3 SOM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖[32]
2016年,Krenn團(tuán)隊(duì)在Canary島嶼間的海面上進(jìn)行了海洋性大氣信道OAM光束傳輸研究[23]。圖5(a)為實(shí)驗(yàn)的示意圖與外場(chǎng)照片。海洋性大氣信道存在大氣湍流、海霧、云層等因素,信道質(zhì)量較差。圖5(b)顯示光束受到了較為嚴(yán)重的湍流干擾。實(shí)驗(yàn)使用60 mW、波長(zhǎng)為532 nm的綠光激光器作為光源。OAM疊加光束在經(jīng)過(guò)143 km的傳輸后光束尺寸擴(kuò)展較為嚴(yán)重,實(shí)驗(yàn)中將光束打在一個(gè)燈塔墻面上再拍照。圖6展示了CCD采集的燈塔漫反射出來(lái)的光斑??梢钥闯?,即使經(jīng)過(guò)了長(zhǎng)距離傳輸,光束“花瓣”仍清晰可見(jiàn)。該實(shí)驗(yàn)為目前通信距離最長(zhǎng)的OAM外場(chǎng)實(shí)驗(yàn),在較強(qiáng)的海洋性大氣干擾下,識(shí)別錯(cuò)誤率為8.33%。
總體而言,使用ANN對(duì)OAM強(qiáng)度圖樣進(jìn)行識(shí)別可以得到一定的準(zhǔn)確率,但由于ANN網(wǎng)絡(luò)架構(gòu)不擅長(zhǎng)處理多維圖像問(wèn)題,無(wú)法取得較高的識(shí)別率與較低的誤碼率。
圖4 (a) 維也納市區(qū)OAM光束傳輸外場(chǎng)實(shí)驗(yàn)圖[22];(b) OAM模式串?dāng)_矩陣;(c) 傳輸及接收的兩幅圖片
圖5 Canary島嶼間海洋性大氣信道OAM光束傳輸實(shí)驗(yàn)示意圖與外場(chǎng)照片[23]
圖6 燈塔上的接收光斑[23]
作為解決分類問(wèn)題的又一代表,SVM早在1995年便在文本分類任務(wù)中顯示了卓越的性能。SVM分類的核心思想為尋找具有樣本“最大間隔”的超平面。其理論基礎(chǔ)為:如果原始空間是有限維的,那么一定存在一個(gè)高維特征空間使樣本可分,其求解通?;谕箖?yōu)化技術(shù)。分類過(guò)程可由圖7形象表示[32]。
圖7 SVM分類的輸入空間和特征空間原理圖[32]
將SVM思想應(yīng)用于OAM模式分類問(wèn)題是一個(gè)嶄新的思路。在擁有出色分類能力的同時(shí),該方案也存在一定的弊端,例如需要人工設(shè)計(jì)特征。2019年,西安電子科技大學(xué)的Sun等人將OAM光束受到大氣湍流干擾的程度與其模式數(shù)的關(guān)系作為OAM光束的人工特征,提出了基于SVM的單態(tài)OAM模式識(shí)別方案,其系統(tǒng)結(jié)構(gòu)如圖8所示[33]。該方案使用OAM光束作為信號(hào)光,同時(shí)使用一束高斯光束作為探針光。由于SVM在處理小樣本數(shù)、非線性等方面性能優(yōu)異,該方案使用SVM去識(shí)別光束的閃爍指數(shù)、光束展寬、光束漂移等參數(shù),使用遺傳算法來(lái)優(yōu)化SVM參數(shù)設(shè)置,通過(guò)探針光來(lái)判斷信道條件,并根據(jù)信號(hào)光各個(gè)參數(shù)的受干擾程度反推出OAM模式。如圖8所示,即使在較強(qiáng)湍流長(zhǎng)距離傳輸信道中,該方案也可達(dá)到較高的識(shí)別準(zhǔn)確率。
利用ANN對(duì)圖像進(jìn)行識(shí)別、分類的研究在十年前較為緩慢。傳統(tǒng)的機(jī)器學(xué)習(xí)需要通過(guò)人類“經(jīng)驗(yàn)”為神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)“特征”?!疤卣鳌痹O(shè)計(jì)的好壞直接影響了整體的性能。而深度學(xué)習(xí)則是將原始數(shù)據(jù)作為輸入,由機(jī)器逐層抽象生成最終的“特征”。近些年來(lái),隨著硬件層面圖形處理單元(graphics processing unit, GPU)的迅速發(fā)展以及CNN的研究熱潮,圖像識(shí)別的準(zhǔn)確率和訓(xùn)練速度有了極大的提升。1998年,Yann等人發(fā)明的LeNet型CNN在當(dāng)時(shí)的計(jì)算條件下就能取得低于1%的手寫(xiě)數(shù)字識(shí)別錯(cuò)誤率,成為了第一個(gè)產(chǎn)生商業(yè)價(jià)值的CNN[34]。2012年,Geoffrey等人憑借AlexNet型CNN以超過(guò)第二名12%的準(zhǔn)確率奪得了ImageNet圖像分類競(jìng)賽的冠軍,奠定了CNN在圖像領(lǐng)域的霸主地位[35]。2015年,CNN在ImageNet數(shù)據(jù)集上的識(shí)別錯(cuò)誤率(4.94%)首次低于了人類判斷錯(cuò)誤率(5.1%)。此后,深度CNN成為了計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等領(lǐng)域的主要研究技術(shù),并獲得了大量的商用價(jià)值。
由于具有共享卷積核、局部感受野等特點(diǎn),CNN在處理網(wǎng)格結(jié)構(gòu)數(shù)據(jù)(時(shí)間序列、圖像等)時(shí)具有顯著的優(yōu)勢(shì),并且對(duì)一定程度的數(shù)據(jù)扭曲、平移等具有較強(qiáng)魯棒性。該網(wǎng)絡(luò)模型采用梯度下降法(stochastic gradient descent, SGD)最小化損失函數(shù),對(duì)網(wǎng)絡(luò)中的權(quán)重參數(shù)逐層反向調(diào)節(jié),通過(guò)頻繁的迭代訓(xùn)練提高網(wǎng)絡(luò)的精度。在CNN中多采用批處理隨機(jī)梯度下降法(mini-batch SGD),訓(xùn)練階段選取若干個(gè)小樣本作為一“批”(batch)訓(xùn)練,并進(jìn)行多次重復(fù);當(dāng)遍歷完全部訓(xùn)練樣本后便成為一“輪”(epoch)。這樣的方法可以兼顧訓(xùn)練集過(guò)大和處理器硬件資源有限的問(wèn)題。
圖9(a)為CNN的工作流程,即前饋運(yùn)算(feed- forward)過(guò)程。典型的CNN主要包含輸入層、卷積層、池化層和全連接層。圖像作為網(wǎng)絡(luò)輸入依次經(jīng)過(guò)每一層操作。輸入層與原始數(shù)據(jù)相連接,一般為輸入圖片的像素矩陣。若輸入為黑白圖片則為一維矩陣,若輸入為彩色圖片則為三維矩陣。通過(guò)卷積層時(shí),圖像與卷積核做卷積。圖9(b)為典型的二維卷積操作示意圖。卷積是一種局部操作,通過(guò)一定大小的卷積核(convolution kernel)作用于局部圖像區(qū)域可獲得圖像的局部信息。卷積核一般為3′3或5′5的矩陣,其通過(guò)一定的步長(zhǎng)(stride)從輸入數(shù)據(jù)的左上角移至右下角并計(jì)算相對(duì)應(yīng)的矩陣;通過(guò)一系列簡(jiǎn)單的卷積核(濾波器)將輸入信息抽象為具有高層寓意的概念表示。這樣學(xué)習(xí)到的權(quán)重對(duì)于不同位置的所有輸入都是相同的,成為“權(quán)值共享(weight sharing)”特性。圖9(c)為兩種典型池化(pooling)方式的示意圖,其典型方式為最大值池化(max-pooling)和平均值池化(average-pooling)。平均值(最大值)池化操作將池化核覆蓋的區(qū)域內(nèi)所有值的平均值(最大值)作為匯合結(jié)果。池化操作可以描述為通過(guò)一定的方式將高分辨率圖片降為低分辨率,相當(dāng)于進(jìn)行“降采樣”(down-sampling)操作。該操作不僅可以使計(jì)算維度大大減少,還會(huì)使神經(jīng)網(wǎng)絡(luò)對(duì)一定范圍內(nèi)的偏移有所容忍,同時(shí)可以抽取更廣范圍的特征。舉例而言,對(duì)于最大值池化方法,可以理解為是在詢問(wèn)某一范圍內(nèi)是否存在這樣一個(gè)特征而不關(guān)心特征具體出現(xiàn)的位置。在經(jīng)過(guò)多個(gè)卷積層和池化層后,數(shù)據(jù)進(jìn)入全連接層(fully connected layers)。全連接層可視為分類器,將前面學(xué)習(xí)到的特征表示映射到樣本的標(biāo)記空間上。該層采用柔性最大值傳輸函數(shù)(softmax)全連接,得到的激活值即卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征。
圖9 (a) CNN的工作流程(前饋運(yùn)算)過(guò)程;(b) 卷積操作示意圖;(c) 池化操作示意圖
2017年,美國(guó)海軍研究實(shí)驗(yàn)室Doster等人使用疊加貝塞爾高斯光束進(jìn)行OAM編碼,他們?cè)贑CD前加一面傅里葉透鏡以得到貝塞爾高斯光束在焦點(diǎn)的強(qiáng)度分布[24]。該實(shí)驗(yàn)結(jié)構(gòu)示意圖如圖12所示。實(shí)驗(yàn)使用空間光調(diào)制器同時(shí)產(chǎn)生OAM的叉形光柵和模擬大氣湍流的相位擾動(dòng)。解碼器選用的神經(jīng)網(wǎng)絡(luò)為層數(shù)較深的AlexNet形式并在GPU上進(jìn)行訓(xùn)練,其中包含5個(gè)卷積層大約兩千萬(wàn)個(gè)訓(xùn)練權(quán)重。由于采用了較深的神經(jīng)網(wǎng)絡(luò),在很強(qiáng)的大氣湍流下5 bit OAM編碼得到了大于99%的識(shí)別率。實(shí)驗(yàn)同時(shí)證明了在大氣湍流信道中使用CNN識(shí)別OAM模式的正確率要遠(yuǎn)高于傳統(tǒng)的共軛解法。該工作證明了使用深度神經(jīng)網(wǎng)絡(luò)和高分辨率圖片,在以計(jì)算復(fù)雜度和時(shí)間復(fù)雜度為代價(jià)的情況下,在強(qiáng)湍流信道下也可得到極高(大于99%)的識(shí)別率。
圖10 不同網(wǎng)絡(luò)結(jié)構(gòu)的OAM模式識(shí)別效果圖[25]
圖11 CNN-OAM解碼和大氣湍流識(shí)別系統(tǒng)結(jié)構(gòu)示意圖[36]
圖12 CNN-OAM模式識(shí)別系統(tǒng)方案圖[24]
圖13 View-pooling層CNN系統(tǒng)示意圖[37]
圖14 m取不同值時(shí)±l疊加光束光斑圖樣的銳利度曲線[40]
上述研究工作均是對(duì)CCD采集的OAM強(qiáng)度圖樣直接進(jìn)行訓(xùn)練和識(shí)別,其大多是基于OAM疊加態(tài)強(qiáng)度圖樣會(huì)呈現(xiàn)不同的“花瓣”圖樣特征的。當(dāng)OAM態(tài)較大時(shí),“花瓣”特征細(xì)節(jié)較多,低像素、層數(shù)較少的神經(jīng)網(wǎng)絡(luò)難以收斂。因此,一些研究工作提出在進(jìn)行訓(xùn)練前對(duì)光束進(jìn)行某些變換以突出其OAM模式特點(diǎn)。
2018年,美國(guó)海軍研究實(shí)驗(yàn)室Park等人利用Radon累積分布變換(Radon-cumulative distribution transform, R-CDT)對(duì)OAM強(qiáng)度圖樣進(jìn)行預(yù)處理以提高其特征區(qū)分度[43]。R-CDT在特定條件下,可以將非線性不易區(qū)分的分類轉(zhuǎn)換成線性可分的,其示意圖如圖16(a)所示。圖16(b)為CCD采集到的貝塞爾高斯疊加光束的強(qiáng)度圖,圖16(c)為經(jīng)過(guò)R-CDT變換后的對(duì)應(yīng)輸出圖片??梢钥吹?,R-CDT變換將集中在圓環(huán)上的“花瓣”變化轉(zhuǎn)換成分布更廣的“魚(yú)鱗”狀特征,但其變化細(xì)節(jié)較多,需要更高的分辨率才能提供足夠的信息(使用的R-CDT分辨率高達(dá)217′90)。對(duì)比研究表明,經(jīng)過(guò)R-CDT變換后在獲得相同的識(shí)別率情況下耗費(fèi)的計(jì)算代價(jià)約為原來(lái)的1/90。
圖15 (a) 水下信道傳輸CNN-OAM系統(tǒng)示意圖;(b) 水下信道傳輸CNN-OAM系統(tǒng)實(shí)驗(yàn)裝置圖[42]
2019年,浙江大學(xué)Jiang等人,將相干光干涉探測(cè)方法引入CNN-OAM探測(cè)系統(tǒng),其系統(tǒng)結(jié)構(gòu)如圖17(a)所示[44]。其特點(diǎn)為在接收端加入相干光源,使得CCD探測(cè)OAM疊加光束的干涉條紋,結(jié)果如圖17(b),17(c)所示??梢钥闯?,相較于OAM強(qiáng)度圖樣,干涉條紋特征更為明顯。研究結(jié)果表明,在傳輸距離為1500 m的仿真強(qiáng)湍流大氣信道中,對(duì)16個(gè)OAM編碼的識(shí)別率可以大于99%。本方案可以較大地提高識(shí)別率,但對(duì)光束與接收光束對(duì)準(zhǔn)要求較高。
根據(jù)上述研究可知,光束在經(jīng)過(guò)一些特定變換后,擁有不同OAM模式的特征差異會(huì)更加明顯,因此更有利于神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別。
由于使用神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別需要CCD采集圖片并送入計(jì)算機(jī)進(jìn)行運(yùn)算,硬件的刷新速率和神經(jīng)網(wǎng)絡(luò)的計(jì)算時(shí)間均會(huì)對(duì)高速通信產(chǎn)生較大影響。
2018年,加利福尼亞大學(xué)的Lin等人在上發(fā)表論文介紹了一種新型的全光神經(jīng)網(wǎng)絡(luò),稱為D2NN,其系統(tǒng)結(jié)構(gòu)圖如圖18所示[45]。該網(wǎng)絡(luò)結(jié)構(gòu)與傳統(tǒng)CNN類似,輸入為攜帶圖像的光波或太赫茲波,經(jīng)多層相位調(diào)制板衍射后,在對(duì)應(yīng)的不同位置出現(xiàn)相應(yīng)的光點(diǎn),所出現(xiàn)的位置即為分類結(jié)果。其訓(xùn)練過(guò)程與CNN類似,采用BP算法;訓(xùn)練成功的模型可由3D打印制作。全光神經(jīng)網(wǎng)絡(luò)中信號(hào)以光速進(jìn)行傳播,可視為以光速進(jìn)行并行計(jì)算,有望解決使用電域神經(jīng)網(wǎng)絡(luò)的計(jì)算復(fù)雜度和時(shí)間復(fù)雜度問(wèn)題。
圖16 (a) 將非線性不易區(qū)分分類轉(zhuǎn)換成線性可分分類示意圖;(b) CCD采集到的貝塞爾高斯疊加光束在焦點(diǎn)處的強(qiáng)度圖;(c) 經(jīng)過(guò)R-CDT變換后的輸出圖片[43]
圖17 (a) 基于相干光干涉探測(cè)的CNN-OAM模式識(shí)別系統(tǒng)結(jié)構(gòu)圖;(b) OAM疊加光束的干涉條紋; (c) 受到大氣湍流干擾的OAM疊加光束的干涉條紋[44]
圖18 (a) D2NN結(jié)構(gòu)示意圖;(b) 識(shí)別數(shù)字示例[45]
圖19 D2NN-OAM模式識(shí)別系統(tǒng)示意圖[46]
本文對(duì)近年基于機(jī)器學(xué)習(xí)的OAM模式分類器的研究進(jìn)行了綜述。ANN網(wǎng)絡(luò)最早提供了機(jī)器學(xué)習(xí)進(jìn)行OAM模式分類識(shí)別的可能,CNN將識(shí)別率進(jìn)行了有效提高。隨著適應(yīng)于圖像分類的神經(jīng)網(wǎng)絡(luò)架構(gòu)的不斷改進(jìn)以及計(jì)算硬件(如GPU)性能不斷提升,神經(jīng)網(wǎng)絡(luò)OAM分類器的識(shí)別率穩(wěn)步提升,并表現(xiàn)出了對(duì)抗復(fù)雜信道(如強(qiáng)大氣湍流、海洋湍流等)的高魯棒性。然而,類似方案還存在著許多的問(wèn)題有待攻克。例如,CCD只能探測(cè)到光強(qiáng)信息而忽略了相位信息,因此用作OAM復(fù)用時(shí)該系統(tǒng)只可對(duì)各信道的OOK編碼格式進(jìn)行探測(cè),而不能探測(cè)MPSK、MQAM等高階相位調(diào)制格式。其次,空間光調(diào)制器調(diào)制速率低(大多數(shù)僅為幾十Hz)以及CCD采集圖像速率過(guò)低(僅為數(shù)十到幾百?gòu)埫棵?等硬件缺陷,導(dǎo)致通信速率還不夠理想。全光D2NN具有傳輸快的特點(diǎn),有望克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)時(shí)延大的問(wèn)題從而顯著提高OAM模式解碼系統(tǒng)的速率。
[1] Zhai X H, Zhang H T, Jiang W Y. The development of space laser link communications technique[J]., 2004, 28(1): 42–45.
翟旭華, 張洪濤, 姜威遠(yuǎn). 國(guó)外空間激光鏈路通信技術(shù)進(jìn)展[J]. 無(wú)線光通信, 2004, 28(1): 42–45.
[2] Chan V. Space coherent optical communication systems--An introduction[J]., 1987, 5(4): 633–637.
[3] Chan V W S. Free-space optical communications[J]., 2006, 24(12): 4750–4762.
[4] Allen L, Beijersbergen M W, Spreeuw R J C,. Orbital angular momentum of light and the transformation of Laguerre-Gaussian Laser modes[J]., 1992, 45(11): 8185–8189.
[5] Gibson G, Courtial J, Padgett M J,. Free-space information transfer using light beams carrying orbital angular momentum[J]., 2004, 12(22): 5448–5456.
[6] Mandel L, Wolf E, Shapiro J H. Optical coherence and quantum optics[J]., 1996, 49(5): 172.
[7] Xi R, Zhu B. Experimental study on short-distance free-space transmission characteristics of OAM beam[J]., 2019, 46(6): 180386.
席瑞, 朱冰. OAM光束短距離自由空間傳輸特性的實(shí)驗(yàn)研究[J]. 光電工程, 2019, 46(6): 180386.
[8] Wang J, Yang J Y, Fazal I M,. 25.6-bit/s/Hz spectral efficiency using 16-QAM signals over pol-muxed multiple orbital-angular-momentum modes[C]//, 2011: 587–588.
[9] Bozinovic N, Yue Y, Ren Y X,. Terabit-scale orbital angular momentum mode division multiplexing in fibers[J]., 2013, 340(6140): 1545–1548.
[10] Fazal I M, Ahmed N, Wang J,. 2 Tbit/s free-space data transmission on two orthogonal orbital-angular-momentum beams each carrying 25 WDM channels[J]., 2012, 37(22): 4753–4755.
[11] Huang H, Xie G D, Yan Y,. 100 Tbit/s free-space data link using orbital angular momentum mode division multiplexing combined with wavelength division multiplexing[C]//, 2013: 1–3.
[12] Wei S B, Wang D P, Lin J,. Demonstration of orbital angular momentum channel healing using a Fabry-Pérot cavity[J]., 2018, 1(5): 180006.
[13] Awaji Y, Wada N, Toda Y. Demonstration of Spatial Mode Division Multiplexing using Laguerre-Gaussian Mode Beam in telecom-wavelength[C]//, 2010: 551–552.
[14] Wang J, Yang J Y, Fazal I M,. Terabit free-space data transmission employing orbital angular momentum multiplexing[J]., 2012, 6(7): 488–496.
[15] Huang H, Ren Y X, Yan Y,. Performance analysis of spectrally efficient free-space data link using spatially multiplexed orbital angular momentum beams[J]., 2013, 8647: 864706.
[16] Huang H, Xie G D, Yan Y,. 100 Tbit/s free-space data link enabled by three-dimensional multiplexing of orbital angular momentum, polarization, and wavelength[J]., 2014, 39(2): 197–200.
[17] Wang J, Li S H, Luo M,. N-dimentional multiplexing link with 1.036-Pbit/s transmission capacity and 112.6-bit/s/Hz spectral efficiency using OFDM-8QAM signals over 368 WDM pol-muxed 26 OAM modes[C]//, 2014: 1–3.
[18] Ren Y X, Wang Z, Liao P C,. Experimental characterization of a 400??Gbit/s orbital angular momentum multiplexed free-space optical link over 120 m[J]., 2016, 41(3): 622–625.
[19] Li L, Zhang R Z, Liao P C,. Limited-size aperture effects in an orbital-angular-momentum-multiplexed free-space optical data link between a ground station and a retro-reflecting UAV[J]., 2019, 450: 241–245.
[20] Jiang H L, Tong S F, Zhang L Z,.[M]. Beijing: National Defense Industry Press, 2010.
姜會(huì)林, 佟首峰, 張立中, 等. 空間激光通信技術(shù)與系統(tǒng)[M]. 北京: 國(guó)防工業(yè)出版社, 2010.
[21] Wang D F, Chu Z F, Ren Z L,. Influence of atmospheric turbulence on BER of laser communication system[J]., 2011, 41(4): 390–393.
王德飛, 楚振峰, 任正雷, 等. 大氣湍流對(duì)激光通信系統(tǒng)誤碼率影響的研究[J]. 激光與紅外, 2011, 41(4): 390–393.
[22] Krenn M, Fickler R, Fink M,. Communication with spatially modulated light through turbulent air across Vienna[J]., 2014, 16(11): 113028.
[23] Krenn M, Handsteiner J, Fink M,. Twisted light transmission over 143 km[J]., 2016, doi: 10.1073/pnas.1612023113.
[24] Doster T, Watnik A T. Machine learning approach to OAM beam demultiplexing via convolutional neural networks[J]., 2017, 56(12): 3386–3396.
[25] Li J, Zhang M, Wang D S. Adaptive demodulator using machine learning for orbital angular momentum shift keying[J]., 2017, 29(17): 1455–1458.
[26] Yao A M, Padgett M J. Orbital angular momentum: Origins, behavior and applications[J]., 2011, 3(2): 161–204.
[27] Rao R Z, Wang H Y.[M]. Shanghai: Shanghai Jiaotong University Press, 2013.
饒瑞中, 王海燕. 光學(xué)渦旋在湍流大氣中的傳播[M]. 上海: 上海交通大學(xué)出版社, 2013.
[28] Andrews L C, Phillips R L.[M]. 2nd ed. Bellingham: SPIE Press, 2005.
[29] Lane R G, Glindemann A, Dainty J C. Simulation of a Kolmogorov phase screen[J]., 1992, 2(3): 209–224.
[30] Zhou Z H.[M]. Beijing: Tsinghua University Press, 2016.
周志華. 機(jī)器學(xué)習(xí)[M]. 北京: 清華大學(xué)出版社, 2016.
[31] Sun Z J, Xue L, Xu M Y,. Overview of deep learning[J]., 2012, 29(8): 2806–2810.
孫志軍, 薛磊, 許陽(yáng)明, 等. 深度學(xué)習(xí)研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2012, 29(8): 2806–2810.
[32] 楊杰, 占君, 張繼傳. MATLAB神經(jīng)網(wǎng)絡(luò)30例[M]. 北京: 電子工業(yè)出版社, 2014.
[33] Sun R D, Guo L X, Cheng M J,. Identifying orbital angular momentum modes in turbulence with high accuracy via machine learning[J]., 2019, 21(7): 075703.
[34] Lecun Y, Bottou L, Bengio Y,. Gradient-based learning applied to document recognition[J]., 1998, 86(11): 2278–2324.
[35] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]//, 2012: 1097–1105.
[36] Jin L, Min Z, Wang D S,. Joint atmospheric turbulence detection and adaptive demodulation technique using the CNN for the OAM-FSO communication[J]., 2018, 26(8): 10494–10508.
[37] Zhao Q S, Hao S Q, Wang Y,. Mode detection of misaligned orbital angular momentum beams based on convolutional neural network[J]., 2018, 57(35): 10152–10158.
[38] Tian Q H, Li Z, Hu K,. Turbo-coded 16-ary OAM shift keying FSO communication system combining the CNN-based adaptive demodulator[J]., 2018, 26(21): 27849–27864.
[39] Wang Z K, Dedo M I, Guo K,. Efficient Recognition of the Propagated Orbital Angular Momentum Modes in Turbulences With the Convolutional Neural Network[J]., 2019, 11(3): 7903614.
[40] Yin X L, Guo Y L, Cui X Z,Method of mode recognition for multi-OAM multiplexing based on convolutional neural network[J]., 2019, 42(1): 47–52.
尹霄麗, 郭翊麟, 崔小舟, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的多OAM態(tài)識(shí)別方法[J]. 北京郵電大學(xué)學(xué)報(bào), 2019, 42(1): 47–52.
[41] Cui X Z, Yin X L, Chang H,. Analysis of an adaptive orbital angular momentum shift keying decoder based on machine learning under oceanic turbulence channels[J]., 2018, 429: 138–143.
[42] Cui X Z, Yin X L, Chang H,. Experimental study of machine-learning-based orbital angular momentum shift keying decoders in optical underwater channels[J]., 2019, 452: 116–123.
[43] Park S R, Cattell L, Nichols J M,. De-multiplexing vortex modes in optical communications using transport-based pattern recognition[J]., 2018, 26(4): 4004–4022.
[44] Jiang S Q, Chi H, Yu X B,. Coherently demodulated orbital angular momentum shift keying system using a CNN-based image identifier as demodulator[J]., 2019, 435: 367–373.
[45] Lin X, Rivenson Y, Yardimci N T,. All-optical machine learning using diffractive deep neural networks[J]., 2018, 361(6406): 1004–1008.
[46] Zhao Q S, Hao S Q, Wang Y,. Orbital angular momentum detection based on diffractive deep neural network[J]., 2019, 443: 245–249.
Research progress of orbital angular momentum modes detecting technology based on machine learning
Yin Xiaoli*, Cui Xiaozhou, Chang Huan, Zhang Zhaoyuan, Su Yuanzhi, Zheng Tong
Beijing Key Laboratory of Space-Ground Interconnection and Convergence, School of Electronic Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China
Schematic of underwater CNN-OAM systems and the experimental setup of the underwater CNN-OAM detection system
Overview:The orbital angular momentum (OAM) modes have orthogonality in theory, thus using OAM multiplexing and encoding technologies can effectively increase the channel capacity of the optical communication systems. However, the phase distributions of OAM modes are sensitive to the channel distribution. The particles and turbulence in atmospheric and underwater channels would lead to the absorptions, scatterings and phase distortions of the beams and decrease the performance of the OAM optical communication system. In recent years, some researchers focus on using machine learning (ML) technology to detect OAM modes to improve the performance of OAM optical communication system. ML technologies have advantages in self-studying and are more tolerant to noise compared to the traditional image recognition technology. In this paper, the OAM modes detecting schemes based on ML technology are reviewed, including error back-propagating (BP) neural networks, self-organizing feature map (SOM), support vector machine (SVM), convolutional neural network (CNN), mode recognition techniques base on beam transformations and diffractive deep neural networks (D2NN). In general, artificial neural networks (ANN), such as BP-ANN, are the earliest ML methods to detecting OAM modes although the detecting accuracies are not high (with 8.33% error ratio in 143 km transmissions); while researches using SVM are not identifying the intensity distributions of OAM beams but the parameters of the beams. The CNN is mainly designed for image classifications thus it has natural advantages in detecting intensity images of OAM beams. The convolutional and pooling operating can make CNNs not sensitive to small offset and extract features by themselves. The research results show that with OAM intensity as the input images, decoding accuracies of LeNet and AlexNet structures can reach more than 99% in even strong atmospheric turbulence no matter with simulations and in lab environments, which are higher than the ANNs. Some improvements of the CNN structures are also made to increase the accuracies. Some researches focus on image transformation of the input pictures, such as angular spectrum transforming, R-CDT transforming, which can efficiently raise the accuracies. While one of the disadvantages of the all-electrical neural networks is the high time delay. In 2018, researchers proposed a kind of all-optical neural network called D2NN and used it as OAM detector, which can realize relative high accuracies without time delay. All in all, the OAM detectors using ML can achieve high detecting accuracies compared to traditional OAM sorting methods.
Citation: Yin X L, Cui X Z, Chang H,Research progress of orbital angular momentum modes detecting technology based on machine learning[J]., 2020, 47(3): 190584
Research progress of orbital angular momentum modes detecting technology based on machine learning
Yin Xiaoli*, Cui Xiaozhou, Chang Huan, Zhang Zhaoyuan, Su Yuanzhi, Zheng Tong
Beijing Key Laboratory of Space-Ground Interconnection and Convergence, School of Electronic Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China
The orbital angular momentum (OAM) multiplexing and encoding technologies can effectively increase the channel capacity of the optical communication systems. In recent years, some researchers focus on using machine learning (ML) technology to detect OAM modes to improve the performance of OAM optical communication system. In this paper, the OAM modes detecting schemes based on ML technology are reviewed, including error back-propagating (BP) neural networks, self-organizing feature map (SOM), support vector machine (SVM), convolutional neural network (CNN), mode recognition techniques base on beam transformations and all-optics diffractive deep neural networks (D2NN). The performance, advantages and obstacles of each kind of the neural networks in atmosphere and underwater channels are analyzed.
orbital angular momentum; machine learning; neural network
TN929.1
A
10.12086/oee.2020.190584
: Yin X L, Cui X Z, Chang H,. Research progress of orbital angular momentum modes detecting technology based on machine learning[J]., 2020,47(3): 190584
2019-09-27;
2019-11-04
國(guó)家自然科學(xué)基金資助項(xiàng)目(61575027);北京市自然科學(xué)基金資助項(xiàng)目(4192041)
尹霄麗(1970-),女,博士,教授,主要從事光通信與信號(hào)處理技術(shù)的研究。E-mail: yinxl@bupt.edu.cn
尹霄麗,崔小舟,常歡,等. 基于機(jī)器學(xué)習(xí)的軌道角動(dòng)量光束模式探測(cè)技術(shù)研究進(jìn)展[J]. 光電工程,2020,47(3): 190584
Supported by National Natural Science Foundation of China (61575027) and the Natural Science Foundation of Beijing Municipality(4192041)
* E-mail: yinxl@bupt.edu.cn