朱引行
(江蘇省漣水中等專業(yè)學校,江蘇 漣水223400)
近年來,隨著機器視覺技術(shù)的不斷創(chuàng)新與發(fā)展,相關(guān)領(lǐng)域的研究也得到了進一步深入,最具代表性的便是移動機械臂的控制與應用。在智能化與伺服控制技術(shù)的輔助下,移動機械臂的應用范圍逐漸擴大,應用效果明顯提高。但是,由于人們對于自動化標準的提升,傳統(tǒng)的控制技術(shù)已經(jīng)無法滿足需求和標準,部分移動機械臂在高強度的工作環(huán)境下,末端的滑模逐漸顯現(xiàn)出一定的問題與缺陷,對于日常的工作會形成不定性的消極影響。移動機械臂的末端滑模是一項十分關(guān)鍵且重要的控制元件[1],應用中起到“承上啟下”的作用,不僅能夠加強機械臂對于指令的接收速度,同時,進一步拓展了機械臂的移動空間,逐步營造穩(wěn)定的工作環(huán)境[2]。但是過度移動導致滑模出現(xiàn)裂縫、破損等問題,對于日常的移動、振動控制會形成一定的阻礙[3]。因此,本次結(jié)合深度強化學習原理,設計優(yōu)化移動機械臂末端滑模控制技術(shù),以此為進一步完善整體的應用效果??紤]到最終測試結(jié)果的可靠性,選擇較為真實的目標作為測試的對象,根據(jù)移動機械臂的應用需求、標準,對滑模的控制形式以及范圍作出對應的調(diào)整。當處于復雜環(huán)境下時,滑模的控制壓力也會得到緩解,從整體上降低對機械臂的阻礙,更加快速、穩(wěn)定地完成伺服任務,同時也具有自主定位和跟蹤的能力,具有關(guān)鍵的現(xiàn)實應用意義。
在對深度強化學習下移動機械臂末端滑模控制技術(shù)進行優(yōu)化設計之前,需要先結(jié)合移動機械臂的作用區(qū)域,進行自適應預處理[4]。所謂自適應預處理,主要是針對于機械臂滑模的控制環(huán)境,設定的一種動態(tài)的控制協(xié)議。結(jié)合深度強化學習原理,增設辨識機制、非線性動力模型以及異常定位裝置,加強對移動機械臂末端滑模的自適應控制程度[5]。利用關(guān)聯(lián)設備,先獲取部分基礎(chǔ)控制數(shù)據(jù),完成匯總整合之后,為確保自適應控制環(huán)境的穩(wěn)定,需要先計算出滑模預設移位率,具體如公式(1)所示:
式中:H 表示滑模預設移位率,φ 表示收斂系數(shù),i 表示定向辨識時限,表示自適應滑動比,c1便是預設移位距離,c2表示實測移位距離。通過上述計算,最終可以得出實際的滑模預設移位率。將其預設為滑模的移位標準,同時,關(guān)聯(lián)機械臂內(nèi)部的非線性控制系統(tǒng),結(jié)構(gòu)中需要安裝自適應感知設備,同時,增加提高軸孔裝配、目標捕獲等裝置,從整體上增加機械臂的自適應控制速度與安全程度,確保自適應控制系統(tǒng)的穩(wěn)定性,完成自適應處理,為后續(xù)的控制處理奠定基礎(chǔ)條件。
結(jié)合實際的控制標準,布設一定數(shù)量的多模態(tài)感知控制節(jié)點。提取機械臂滑模的移動特征,加工控制系統(tǒng)與核心感知節(jié)點相關(guān)聯(lián),但需要注意的是,整個過程必須要結(jié)合機械臂視覺伺服的控制律。為避免感知失敗問題的出現(xiàn),需要在特定的環(huán)境之中,設定一個限制控制區(qū)域,導入控制特征,具體的原理,見圖1。
圖1 多模態(tài)感知原理圖
根據(jù)圖1,可以完成對多模態(tài)感知原理的設計與調(diào)整,針對于移動機械臂的應用范圍,調(diào)整末端滑模的偏移方向,同時需要設定兩側(cè)的偏移指標數(shù)值。完成基礎(chǔ)調(diào)整之后,可以先測定此時節(jié)點收集的末端滑??刂茢?shù)據(jù)是否發(fā)生較大變化,如果與基礎(chǔ)數(shù)值對比,出現(xiàn)的差值較大,則需要重新設定個偏移指標,確??刂瞥绦虻姆€(wěn)定執(zhí)行,一定程度上也有利于多模態(tài)感知控制節(jié)點對機械臂末端滑模的控制。
在完成對多模態(tài)感知控制節(jié)點的布設之后,接下來,需要設計多協(xié)調(diào)控制軌跡。通常情況下,多指令機械臂日常工作效率要比單指令機械臂更高,主要是由于其內(nèi)部的程序可以同時針對多個目標處理,實現(xiàn)多維度的同步控制,還可以適應較多的應用場景,以此應用效果更佳??梢圆捎每刂浦噶顏泶?zhèn)鹘y(tǒng)的數(shù)字化軌跡控制目標,形成穩(wěn)定的指令集群,構(gòu)建多協(xié)調(diào)的控制程序,將多個目標控制軌跡作為約束條件,增設在不同的主從控制和約束環(huán)境之中,結(jié)合混合控制算法,計算出機械臂間的同步誤差,具體如下所示:
式中:F 表示機械臂間的同步誤差,? 表示同步響應時間,? 表示協(xié)調(diào)范圍,μ1表示約束軌跡距離,μ2表示無向圖放松約束軌跡距離,n 表示控制次數(shù)。通過上述計算,最終可以得出機械臂間的實際同步誤差。在標定的誤差范圍之內(nèi),可以合理調(diào)整移動機械臂的覆蓋區(qū)域和控制范圍,結(jié)合預設的控制約束條件,實現(xiàn)軌跡的定向同步。但是需要注意的是,針對于移動機械臂的控制軌跡,通過多協(xié)調(diào)的模式,營造拓撲軌跡測定約束框架,并形成一種定向的阻抗,加強末端滑模的移動速度,與末端的執(zhí)行器響應接觸,提升工作精度,降低控制誤差。
在完成對多協(xié)調(diào)控制軌跡的設計之后,接下來,需要結(jié)合深度強化學習原理,構(gòu)建末端滑??刂颇P?。首先,需要先將機械臂中的軸孔與軸入孔接觸,形成對應的操作空間,控制處理過程中,沖擊碰撞是難以避免的,為降低對末端滑模的影響以及損壞,可以引入Hogen 提出阻抗機制,在交互環(huán)境之中,結(jié)合所獲取的數(shù)據(jù)信息,計算出此時滑模的阻尼系數(shù)。隨著機械臂的移動與應用,測定分析滑模阻尼系數(shù)的變化狀態(tài),調(diào)整滑??刂颇P偷闹笜藬?shù)值,具體見表1。
表1 滑??刂颇P椭笜藬?shù)值設定表
根據(jù)表1,可以完成對滑??刂颇P椭笜藬?shù)值的設定。隨后,根據(jù)調(diào)整的狀態(tài),防止工件損壞,將滑模與接觸設備形成一種定向的動態(tài)聯(lián)系,設計末端滑模的阻抗控制結(jié)構(gòu)。擴大實際的控制范圍,并對標定的控制程序和結(jié)構(gòu)作出調(diào)整。通過改變慣性、阻尼系數(shù)以及剛度參數(shù)來調(diào)整動態(tài)控制聯(lián)系,實現(xiàn)多維度的深度強化學習處理。此時,采用深度強化技術(shù),計算出標定的控制修正量,具體如下所示:
式中:T 表示控制修正量,τ 表示滑模深度強化距離,d表示單向移位時間,b 表示目標位置,w 表示測定位移,l 表示深度接觸力。通過上述計算,最終可以得出實際的控制修正量,設定模型的控制范圍,并與設定的控制節(jié)點相互關(guān)聯(lián)。
結(jié)合PD 控制技術(shù),根據(jù)末端滑模的控制需求、標準,設計對應的雙向控制矩陣。首先,利用控制模型,先獲取移動機械臂的實時數(shù)據(jù)及信息,并在標定的轉(zhuǎn)換范圍之內(nèi),測定出機械臂在移動過程中的穩(wěn)態(tài)誤差,具體見表2。
表2 機械臂移動穩(wěn)態(tài)誤差測定表
根據(jù)表2,可以完成對機械臂移動穩(wěn)態(tài)誤差的測定與分析。由于滑模在不同的環(huán)境下出現(xiàn)的偏差不同,因此,針對于滑模變動的剛度系數(shù),測定出機械臂滑模的實際力位控制效果。但是需要注意的是,為了保證控制程序的穩(wěn)態(tài),好需要加強對滑模接觸狀態(tài)的控制,此時可以結(jié)合上述測定出的數(shù)值,設計PD 雙向控制矩陣,設定穩(wěn)態(tài)誤差等于0 時,滑模的剛度系數(shù)為1.25 以下,控制程序的接觸力誤差為5.25;而當穩(wěn)態(tài)誤差小于或者大于0 時,滑模的剛度系數(shù)為1.25 以上,控制程序的接觸力誤差為10.45~20.35 之間,此時末端滑模的控制軌跡為呈現(xiàn)出側(cè)向的曲線,利用阻抗模型關(guān)聯(lián)二階控制平臺,設定雙向控制環(huán)節(jié),結(jié)合深強化學習技術(shù),結(jié)合動態(tài)響應模式,構(gòu)建矩陣的對應控制原理,具體見圖2。
圖2 深度強化學習下PD 雙向控制矩陣原理圖示
根據(jù)圖2,可以完成對深度強化學習下PD 雙向控制矩陣原理的設計,結(jié)合上述環(huán)節(jié),劃定末端滑模具體的控制矩陣,同時結(jié)合強化學習技術(shù),建立ke 與xe 的誤差控制極限點,盡量控制減少穩(wěn)態(tài)誤差,并在合理的范圍之內(nèi),對滑模的移位情況作出調(diào)節(jié),增強末端控制的動態(tài)與靜態(tài)控制效果。
選擇G 企業(yè)的機械臂作為測試的主要目標對象,并設定傳統(tǒng)伺服定位控制技術(shù)(方法1)測試組、傳統(tǒng)改進分數(shù)控制技術(shù)(方法2)測試組以及本文所設計的深度強化學習控制技術(shù)測試組。結(jié)合自抗擾控制與深度強化學習技術(shù),構(gòu)建改進ESO 的滑??刂瞥绦?,并設定機械臂末端滑模的基礎(chǔ)指標參數(shù):單元抖振次數(shù)5 次,有效控制距離15.35 m,末端變動誤差2.03。
在標定的測試環(huán)境之中,設定三個擾動節(jié)點,布設在機械臂的控制節(jié)點之中,在控制程序之中,設計滑模面的動態(tài)控制環(huán)節(jié),確保達測定標準即可。設定標準的抖振比為1∶3.5,測定機械臂在移動的過程中控制系統(tǒng)的魯棒性,并測算末端滑模的轉(zhuǎn)動慣量,一般需要控制在1.75~6.45 之間,確保滑??梢皂樌苿?,降低整體的移位偏差概率。結(jié)合深度強化學習技術(shù),在周期之內(nèi),定位滑模的移動位置,并對其出現(xiàn)的穩(wěn)態(tài)誤差進行分析,具體見圖3。
圖3 末端滑模穩(wěn)態(tài)誤差局部變化圖示
根據(jù)圖3,可以完成對末端滑模穩(wěn)態(tài)誤差局部變化的分析與研究。經(jīng)過觀測可以的差值,經(jīng)過控制調(diào)整和處理,末端滑模的穩(wěn)態(tài)誤差得到了明顯的控制,逐漸趨于平穩(wěn),這表明誤差逐漸減少。此時,啟動設定的三個擾動節(jié)點,設定處理目標,確保在相同的環(huán)境之下,計算出單元控制時間,具體如下所示:
式中:R 表示單元控制時間,η1表示預設擾動范圍,η2表示實測擾動范圍,? 表示實時轉(zhuǎn)動慣量差值,V 表示等效控制距離。通過上述計算,最終可以得出實際的單元控制時間。結(jié)合上述的測試結(jié)果,采用對比的形式展開分析,具體見表3。
表3 單元控制時間測試結(jié)果對比分析表(s)
根據(jù)表3,本研究方法將單元控制時間均控制在了1.5 s 以下,控制的速度與效率表現(xiàn)較好,具有實際的應用價值。
結(jié)合深度強化學習設計移動機械臂末端滑??刂萍夹g(shù)。利用深度強化學習原理,逐步構(gòu)建統(tǒng)一的滑??刂茦藴?,從根源上降低整體的控制誤差,增強度滑??刂频姆聪蜃饔媚芰Γ偌由袭惓6ㄎ患夹g(shù)與末端監(jiān)測技術(shù)的輔助,可以營造更加細化的控制模式,為后續(xù)的技術(shù)創(chuàng)新奠定參考依據(jù)。