熊永程,賈文紅,張麗敏,鄭麗芳
(1.中國科學院 上海應(yīng)用物理研究所,上海 201800;2.中國科學院大學,北京 100049;3.中國科學院 上海高等研究院,上海 201210)
在同步輻射裝置中,從儲存環(huán)引出的同步光經(jīng)單色器真空腔內(nèi)兩塊晶體衍射后成為用戶實驗單色光。單色器第二晶體俯仰角是調(diào)節(jié)兩塊晶體保持平行、獲得優(yōu)質(zhì)光斑的關(guān)鍵部件,要求其運動機構(gòu)具有響應(yīng)快,精度高及噪聲小等特點,同時由于單色器內(nèi)部空間狹小,故而其必須體積小,運動靈活,為此常應(yīng)用壓電陶瓷驅(qū)動器來實現(xiàn),運動精度為微米量級。為了獲得實驗要求的優(yōu)質(zhì)同步光斑,在光束線調(diào)束優(yōu)化過程中,線站人員根據(jù)電離室讀數(shù)和電荷耦合器件(CCD)探測出光斑形狀,不斷地調(diào)節(jié)俯仰角和其他運動機構(gòu),整個過程需要大量時間[1]。
每年運行近5 000 h的上海同步輻射光源具有海量的數(shù)據(jù)資源,數(shù)據(jù)的高可用性為人工智能技術(shù)在同步輻射領(lǐng)域的應(yīng)用帶來巨大機遇。近年來,上海同步輻射光源開展了基于差分進化算法的智能光束線的探索并取得初步成功[2]。然而在智能調(diào)束過程中,研究人員發(fā)現(xiàn)引入單色器第二晶體俯仰軸后,由于其運動重復性差,優(yōu)秀個體遺傳到下一代失效,導致智能算法不收斂。影響俯仰軸運動重復性的因素有壓電陶瓷固有的遲滯非線性、蠕變屬性等。在不考慮振動引起的誤差下,遲滯引入的不確定性一般為15%~20%,蠕變誤差為1%~5%[3]。
壓電陶瓷遲滯非線性特性及補償技術(shù)一直是國內(nèi)外學者的研究熱點[4-6]。早期的經(jīng)典前饋控制技術(shù)是應(yīng)用數(shù)學方法建立遲滯回線的擬合模型,通過求解其逆模型,得到激勵電壓與實際輸出位移的關(guān)系[7-9]。由于遲滯回線非線性特性復雜,盡管學者們提出了如Preisach模型、Bouc-Wen模型、Maxwell模型、多項式模型等數(shù)學模型,但其對遲滯回線的描述均存在一定局限性,因而一直是未被廣泛認可的通用模型。
神經(jīng)網(wǎng)絡(luò)可用于擬合任意非線性曲線[10],且具有泛化能力,理論上用神經(jīng)網(wǎng)絡(luò)擬合遲滯曲線是可行的。本文將壓電陶瓷主遲滯回線和次遲滯回線作為深度學習的訓練數(shù)據(jù)集,在PyTorch框架下經(jīng)100 000輪訓練,將得到的深度神經(jīng)網(wǎng)絡(luò)遲滯模型應(yīng)用于壓電陶瓷驅(qū)動器的前饋補償。測試結(jié)果表明,應(yīng)用前饋補償后,被控滑臺的運動位移精度從開環(huán)狀態(tài)下的約8.91 μm提高到近80 nm,系統(tǒng)響應(yīng)帶寬100 Hz,可以應(yīng)用到智能調(diào)束系統(tǒng)單色器俯仰角的前饋控制中。
壓電陶瓷遲滯非線性主要表現(xiàn)在輸入電壓與輸出位移的對應(yīng)曲線上。電壓上升與電壓下降時的曲線不重合,影響這一特性的因素不僅與當前的輸入電壓有關(guān),還與輸入歷史和輸入信號頻率等有關(guān)[11]。
本實驗采用Physik Instrumente(PI)公司的E-709.CRG壓電陶瓷控制器及P-621.1CD壓電陶瓷微位移臺,控制器中集成了信號放大器,位移臺內(nèi)集成了電容傳感器??刂破鹘邮彰詈?,通過信號放大器將電壓發(fā)送給位移臺,并從電容傳感器回讀壓電陶瓷當前位置,向上通過USB與計算機通信,如圖1所示。
圖1 實驗平臺通信圖
輸入信號頻率為10 Hz,步長0.1 V。升程曲線測試范圍為-5~107 V,回程曲線測試范圍為107~-6 V。以輸入電壓(V)為水平軸,輸出位移(x)為垂直軸,得到位移臺的主遲滯環(huán)。
對主遲滯環(huán)進行線性擬合,得到x與V的線性關(guān)系為
x=0.976 579 417 023 688 6V+
0.274 239 524 880 049 05
(1)
圖2為升程曲線和回程曲線與擬合直線的偏差,升程曲線的最大偏差出現(xiàn)在107 V處,為-4.97 μm;回程曲線的最大偏差出現(xiàn)在40 V處,為8.91 μm。
圖2 主遲滯環(huán)線性分析結(jié)果圖
當輸入電壓為減幅正弦信號或增幅正弦信號時,壓電陶瓷的輸入電壓與輸出位移曲線呈現(xiàn)類似螺旋線的不相交遲滯環(huán)狀態(tài),即次遲滯環(huán)。圖3、4分別為減、增幅正弦輸入信號時次遲滯線性分析結(jié)果圖。微位移臺對減、增幅正弦信號具有一定跟蹤能力,但是誤差比簡單運動模式(步進運動)更大,對這兩種信號跟蹤的最大誤差均在6 μm左右。
圖4 增幅正弦輸入信號的次遲滯環(huán)線性分析結(jié)果圖
從圖2~4可發(fā)現(xiàn),滑臺當前位置與當前輸出電壓、上一次位移和上一次輸出電壓有關(guān),即假定:
xt=f(Vt,xt-1,Vt-1)
(2)
式中:xt為當前t時刻的位移;Vt為當前t時刻的輸入電壓;Vt-1為上一位移的輸入電壓;xt-1為上一位移。
經(jīng)變換后可得:
Vt=f′(xt,xt-1,Vt-1)
(3)
將參數(shù)修改后可得:
VR=f′(xT,xt-1,Vt-1)
(4)
式中:VR為所需輸入的電壓;xT為給定的目標位移;f′為由神經(jīng)網(wǎng)絡(luò)需要構(gòu)建的函數(shù)關(guān)系。
對于壓電陶瓷位移臺,由給定目標位置、上一位置輸入電壓、上一位置位移,通過函數(shù)f′計算得到施加到壓電陶瓷的電壓值。
本文設(shè)計了一個基于深度神經(jīng)網(wǎng)絡(luò)的前饋控制模型,對預(yù)先設(shè)定的目標位置進行補償計算,將結(jié)果經(jīng)控制器輸出并施加給壓電陶瓷,實現(xiàn)微位移臺運動至目標位置,圖5為整個系統(tǒng)的原理結(jié)構(gòu)圖。
圖5 深度神經(jīng)網(wǎng)絡(luò)前饋控制示意圖
一個或若干個神經(jīng)元組成一層神經(jīng)網(wǎng)絡(luò),將若干層神經(jīng)網(wǎng)絡(luò)依次連接,得到一個深度神經(jīng)網(wǎng)絡(luò)(DNN)[12-13],如圖6所示。
圖6 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
深度神經(jīng)網(wǎng)絡(luò)層與層之間是全連接的,即第i層的任意一個神經(jīng)元與第i+1層的任意一個神經(jīng)元相連,其計算關(guān)系如圖7所示。一個線性關(guān)系z=
∑(wixi)+b加上一個激活函數(shù)σ(z),激活函數(shù)能夠增加神經(jīng)網(wǎng)絡(luò)的非線性表達能力,也對應(yīng)了壓電陶瓷的遲滯非線性。
圖7 深度神經(jīng)網(wǎng)絡(luò)計算關(guān)系
假設(shè)第i層具有n個神經(jīng)元,第i+1層具有d個神經(jīng)元,第i+1層中每個神經(jīng)元包含一個偏置量,從第i層到第i+1層的關(guān)系為
(5)
將式(5)簡化可得:
(6)
式中o為O矩陣中的元素。可將式(6)寫成矩陣形式:
O=σ(WX+b)
(7)
式中:O∈d×1為第i+1層的輸出,為空間,d×1為維度;W∈d×n為第i層到i+1層的隱藏層權(quán)重;X∈n×1為第i層的輸出;b∈d×1為第i+1層的偏置。
為了構(gòu)建更通用的多層網(wǎng)絡(luò)結(jié)構(gòu),可以繼續(xù)堆疊這樣的隱藏層,如O(1)=σ1(W(1)X+b(1))和O(2)=σ2(W(2)O(1)+b(2)),一層疊一層,從而產(chǎn)生更有表達能力的模型[14]。
深度神經(jīng)網(wǎng)絡(luò)不僅有強大的非線性擬合能力、特征提取能力和容錯能力,而且在面對海量、高維度的數(shù)據(jù)時,表現(xiàn)優(yōu)于機器學習[10]。
設(shè)計的深度神經(jīng)網(wǎng)絡(luò)層數(shù)為9層,輸入層包含3維(當前實際位移、上一次輸入電壓和上一次位移),輸出層1維(壓電陶瓷輸入電壓)。訓練數(shù)據(jù)集由第1節(jié)得到的3種遲滯回線的數(shù)據(jù)拼接而成,共有5 860組數(shù)據(jù)。表1為全連接層神經(jīng)元個數(shù)。
表1 全連接層神經(jīng)元個數(shù)
2.2.1 訓練過程
神經(jīng)網(wǎng)絡(luò)訓練過程(見圖8):
1) 初始化權(quán)重值參數(shù),將每一組訓練數(shù)據(jù)中的xt、Vt-1和xt-1作為神經(jīng)網(wǎng)絡(luò)的輸入,通過前向傳播算法逐層計算,得到輸入電壓預(yù)測值后,與Vt進行對比,計算損失值。
2) 在反向傳播算法中,根據(jù)選擇的優(yōu)化器更新神經(jīng)網(wǎng)絡(luò)權(quán)重參數(shù)。經(jīng)過一輪一輪訓練,得到最小損失值,此時神經(jīng)網(wǎng)絡(luò)模型為f′函數(shù),見式(4)。經(jīng)過100 000輪訓練后,得到了符合精度要求的模型,損失值如表2所示。
圖8 神經(jīng)網(wǎng)絡(luò)訓練過程流程圖
表2 損失值表
2.2.2 損失函數(shù)
(8)
式中N為樣本大小。
2.2.3 優(yōu)化器與學習速率
在反向傳播算法中,選用目前最常用Adam優(yōu)化器作為參數(shù)更新方式,它能自適應(yīng)地調(diào)節(jié)學習速率αt,使訓練能更快地收斂[15]。參數(shù)更新式為
(9)
在圖1實驗平臺上對模型有效性進行了驗證。在PC端設(shè)置目標位置分別以頻率為10 Hz的三角波、正弦信號、增幅正弦信號、減幅正弦信號變化,經(jīng)神經(jīng)網(wǎng)絡(luò)模型前饋補償后到控制器產(chǎn)生壓電陶瓷輸入電壓,測試微位移臺實際位置,結(jié)果如圖9~12所示。當設(shè)置為三角波信號時,目標位置與實際位置成良好線性關(guān)系,最大誤差值-0.088 μm,出現(xiàn)在初始點0處,穩(wěn)態(tài)誤差基本在±0.02 μm內(nèi)。當目標位置設(shè)置為正弦信號、減幅正弦信號和增幅正弦信號時,最大誤差都有不同程度的增加,分別為-0.67 μm,-0.66 μm和-0.27 μm,但仍出現(xiàn)在初始點處,系統(tǒng)穩(wěn)態(tài)誤差控制在±0.1 μm內(nèi)。由圖11、12可知,隨著振幅增大,誤差也相應(yīng)增大。
圖9 步進運動控制效果圖
圖10 跟隨正弦輸入信號運動控制效果圖
圖11 跟隨減幅正弦輸入信號運動控制效果圖
圖12 跟隨增幅正弦輸入信號運動控制效果圖
當目標位置依次按20 Hz、50 Hz和100 Hz三角波變化時,測試了微位移臺的實際位置,驗證了神經(jīng)網(wǎng)絡(luò)模型的頻率泛化能力。
為了獲得較好的對比效果,應(yīng)用均方根誤差(ERMSE)反映誤差分布的離散程度,其表達式為
(10)
圖13 20 Hz輸入頻率控制效果圖
圖13~15分別為20 Hz、50 Hz和100 Hz時的控制效果圖。表3為不同輸入頻率下的控制效果對比。
圖14 50 Hz輸入頻率控制效果圖
圖15 100 Hz輸入頻率控制效果圖
表3 不同輸入頻率下控制效果對比
由圖13~15可知 ,隨著目標位置輸入頻率的升高,最大誤差和均方根誤差呈現(xiàn)增大的趨勢,說明提高目標位置輸入頻率會增加壓電陶瓷的遲滯非線性。當輸入頻率為100 Hz時,最大誤差為-0.097 μm,仍在可接受的工程應(yīng)用范圍內(nèi),表明構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型在10~100 Hz具有良好的頻率泛化能力,整體上能以較高的精度擬合壓電陶瓷遲滯非線性特性。
本文基于PyTorch深度學習框架構(gòu)建了一個包含9層網(wǎng)絡(luò)結(jié)構(gòu)和ReLU激活函數(shù)的深度神經(jīng)網(wǎng)絡(luò)模型,給出了模型的設(shè)計原理和訓練過程,并將訓練得到的模型應(yīng)用于壓電陶瓷微位移臺的前饋補償。測試結(jié)果表明,在10 Hz的輸入信號下,位移最大誤差在-0.08 ~-0.67 μm,系統(tǒng)穩(wěn)態(tài)誤差為20~100 nm。隨著頻率的提高,誤差增加,100 Hz時最大誤差為-0.097 μm,仍在可接受的工程應(yīng)用范圍。結(jié)果說明,本文構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)能夠準確地描述壓電陶瓷的動態(tài)遲滯非線性,具有較好的頻率泛化能力,可以應(yīng)用在同步輻射光束線單色器第二晶體俯仰角前饋補償中,為優(yōu)化光束線實時智能調(diào)束系統(tǒng)提供參考和幫助。
本文應(yīng)用的深度神經(jīng)網(wǎng)絡(luò)模型的設(shè)計方法不僅適用于壓電陶瓷驅(qū)動器前饋控制,對其他非線性系統(tǒng)建模也具有一定參考價值。用于深度神經(jīng)網(wǎng)絡(luò)建模的PyTorch框架,易于編程、參數(shù)調(diào)整和模型的實現(xiàn)只要對系統(tǒng)測量得到足夠多、覆蓋全的工作狀態(tài)作為構(gòu)建模型的訓練數(shù)據(jù)集,然后構(gòu)建合理的神經(jīng)網(wǎng)絡(luò),經(jīng)過足夠多的訓練,最后就能得到與系統(tǒng)對應(yīng)的深度神經(jīng)網(wǎng)絡(luò)模型。