国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能技術(shù)在船舶領(lǐng)域中的應(yīng)用綜述?

2021-11-11 14:22虎曹
艦船電子工程 2021年10期
關(guān)鍵詞:航行控制器神經(jīng)網(wǎng)絡(luò)

殷 虎曹 旭

(1.海裝駐武漢地區(qū)第三軍事代表室 武漢 430205)(2.武漢第二船舶設(shè)計(jì)研究所 武漢 430205)

1 引言

船舶在航行過程中會(huì)面臨多元場(chǎng)景下的決策與控制,航行過程中電力系統(tǒng)、動(dòng)力系統(tǒng)、導(dǎo)航系統(tǒng)、通信系統(tǒng)等產(chǎn)生的海量數(shù)據(jù)包含著船舶很多的特征信息,對(duì)于船員來說人工提取這些特征信息難度過大,人工智能技術(shù)可以實(shí)現(xiàn)船舶的智能化決策與控制。人工智能算法通過對(duì)這些數(shù)據(jù)中包含的信息進(jìn)行挖掘和分析,從而優(yōu)化決策過程。從保證船舶運(yùn)行安全性的角度來說,人工智能技術(shù)可以優(yōu)化船舶結(jié)構(gòu)設(shè)計(jì)提高船舶的抗風(fēng)浪等級(jí),在航行過程中可以依靠人工智能技術(shù)和自動(dòng)識(shí)別系統(tǒng)(AIS)數(shù)據(jù)檢測(cè)出行為異常的船只并對(duì)其路徑進(jìn)行預(yù)測(cè),同時(shí)結(jié)合自身船舶的運(yùn)動(dòng)特性規(guī)劃出避障路線。從航行經(jīng)濟(jì)性的角度來說,人工智能技術(shù)既可以對(duì)時(shí)變的船舶動(dòng)力系統(tǒng)建模以優(yōu)化能源消耗,也可以根據(jù)當(dāng)前的海況、吃水等情況優(yōu)化船舶操作以降低船舶的航行成本。

2 人工智能技術(shù)在船舶路徑規(guī)劃中的應(yīng)用

船舶的運(yùn)動(dòng)規(guī)劃問題可以形式化為多約束下的多目標(biāo)優(yōu)化問題,且動(dòng)態(tài)環(huán)境下的路徑搜索是典型的NP難問題,船舶運(yùn)動(dòng)規(guī)劃的多約束性質(zhì)主要表現(xiàn)是進(jìn)行規(guī)劃時(shí),需要同時(shí)考慮船舶自身的機(jī)動(dòng)約束(最小轉(zhuǎn)彎半徑、最大/小加速度、最大爬升角度等)、環(huán)境約束(動(dòng)/靜態(tài)障礙物)、任務(wù)約束(如必經(jīng)航點(diǎn)、時(shí)間約束等)、海洋水文環(huán)境(內(nèi)波、躍層、透明度等)等約束條件,需要根據(jù)應(yīng)用場(chǎng)景分析必要約束將其進(jìn)一步以等式/不等式約束或懲罰項(xiàng)等數(shù)學(xué)形式進(jìn)行表達(dá)。多目標(biāo)性質(zhì)主要體現(xiàn)是進(jìn)行規(guī)劃時(shí)需要根據(jù)任務(wù)需求等選擇多種合理的優(yōu)化目標(biāo),如路徑最短、時(shí)間成本最小、隱蔽性最高、路徑平滑度最好、轉(zhuǎn)彎次數(shù)最少、深度變化頻率最低等,然后將選擇好的優(yōu)化目標(biāo)用合適的變量進(jìn)行衡量,設(shè)計(jì)出抽象化的優(yōu)化目標(biāo)函數(shù)。通過約束條件和優(yōu)化目標(biāo)的數(shù)學(xué)化,將路徑規(guī)劃問題抽象成了一個(gè)多約束條件下的多目標(biāo)優(yōu)化問題。目前,解決此類問題的人工智能算法包括智能優(yōu)化算法、深度學(xué)習(xí)算法、強(qiáng)化學(xué)習(xí)算法、遷移學(xué)習(xí)算法以及其他智能算法。

2.1 智能優(yōu)化算法

船舶路徑規(guī)劃這類多約束條件下的多目標(biāo)優(yōu)化問題的求解是建立在規(guī)劃空間柵格化的基礎(chǔ)上的,即對(duì)規(guī)劃可行區(qū)間進(jìn)行等柵格劃分,以柵格離散點(diǎn)作為路徑點(diǎn)集的可選集合。求解時(shí)主要包括兩種思路,一種是直接求解多目標(biāo)優(yōu)化問題,最終的可行路徑以Pareto解集的形式給出,然后根據(jù)一定的規(guī)則選取最適合當(dāng)前場(chǎng)景的路徑。另一種思路是將多目標(biāo)優(yōu)化問題根據(jù)各種優(yōu)化目標(biāo)的重要程度給以不同的權(quán)重,然后對(duì)各目標(biāo)數(shù)值歸一化后結(jié)合權(quán)值轉(zhuǎn)化為單目標(biāo)優(yōu)化問題進(jìn)行求解,加權(quán)方式一般有乘和形式和指積形式兩種。對(duì)于后者中的加權(quán)系數(shù)的設(shè)置可以選擇事先利用仿真手段針對(duì)不同場(chǎng)景進(jìn)行離線設(shè)置在線選擇的策略,也可以根據(jù)專家知識(shí)設(shè)計(jì)相應(yīng)的推理系統(tǒng)結(jié)合環(huán)境態(tài)勢(shì)與任務(wù)需求等先決條件推理出相應(yīng)的系數(shù)組合。

傳統(tǒng)的優(yōu)化算法難以應(yīng)對(duì)這種時(shí)空復(fù)雜度高、不確定性大、約束性強(qiáng)、優(yōu)化目標(biāo)多的問題,而基于生物啟發(fā)的智能優(yōu)化算法為上述問題的求解提供了新思路。典型的智能優(yōu)化算法如圖1所示,主要包括進(jìn)化計(jì)算、群體智能、仿人智能、物理現(xiàn)象模擬等幾大類。其中應(yīng)用較多的算法主要有遺傳算法、蟻群算法、粒子群算法等。

以蟻群算法為例,在三維水下環(huán)境中的規(guī)劃結(jié)果如圖2所示,圖3給出了在優(yōu)化迭代過程(即路徑搜索過程)最佳個(gè)體適應(yīng)度(即優(yōu)化目標(biāo)函數(shù)值)的變化趨勢(shì)。

圖2 蟻群路徑規(guī)劃路線

圖3 最佳個(gè)體適應(yīng)度變化曲線

基于模糊推理的方法也有廣泛的應(yīng)用。Perera提出了一種結(jié)合國際海事組織規(guī)則和避碰規(guī)則的模糊邏輯決策系統(tǒng),并將該系統(tǒng)用于航行過程中的避障控制[2]。Pietrzykowski提出了一種基于模糊邏輯的航行決策方法,用于保證船舶在航行中能夠有效避障[3]。Chien-Min采用 Visual studio軟件生成國際航行避碰規(guī)則知識(shí)庫,并提出了一種模糊監(jiān)測(cè)系統(tǒng)用于航行中的避障控制,在需要避障的時(shí)候該系統(tǒng)會(huì)直接給出一個(gè)優(yōu)化舵角以控制船舶避開障礙物[4]。Perera提出了一種船舶防碰撞系統(tǒng),該系統(tǒng)中的決策/行動(dòng)過程由一個(gè)基于模糊邏輯的并行決策(PDM)模塊組成,該模塊的決策由一個(gè)基于貝葉斯網(wǎng)絡(luò)的模塊制定連續(xù)的行動(dòng),這些決策以順序動(dòng)作執(zhí)行,可以解決存在多艘目標(biāo)船舶下的避障問題[5]。

智能優(yōu)化算法可以有效地解決復(fù)雜水下環(huán)境中的路徑搜索問題,但是也存在收斂速度慢、易陷入局部最小值等問題。針對(duì)前者針對(duì)性的算法改進(jìn)可以一定程度地加快算法收斂速度,且在離線規(guī)劃中這種速度較慢的收斂性能也是可以接受的。而從實(shí)際應(yīng)用的角度來看,局部極小值問題并不會(huì)對(duì)船舶的航行過程造成十分嚴(yán)重的影響,對(duì)于航行問題而言,局部最優(yōu)路徑也是可以接受的,因?yàn)槠渎窂剿阉髦饕繕?biāo)并不是實(shí)現(xiàn)某項(xiàng)性能指標(biāo)的絕對(duì)最優(yōu),而是可以在盡可能地保證該項(xiàng)性能指標(biāo)最優(yōu)/次優(yōu)的前提下完成一次航行任務(wù)??傊?,智能優(yōu)化算法在實(shí)際的水下三維環(huán)境中的路徑搜索問題中有很大的應(yīng)用潛力。

2.2 深度學(xué)習(xí)算法

近年來,深度學(xué)習(xí)相關(guān)研究與應(yīng)用十分火熱,相較于傳統(tǒng)的機(jī)器學(xué)習(xí)方法最大的優(yōu)勢(shì)在于能夠根據(jù)數(shù)據(jù)自主地對(duì)特征進(jìn)行學(xué)習(xí)與提取。在運(yùn)動(dòng)規(guī)劃中涉及環(huán)境等要素的特征提取問題,因此深度學(xué)習(xí)在其中的應(yīng)用優(yōu)勢(shì)是顯而易見的。深度學(xué)習(xí)中的端到端模式在處理運(yùn)動(dòng)規(guī)劃問題時(shí),算法直接處理傳感器采集到的環(huán)境信息,進(jìn)一步生成執(zhí)行空間的動(dòng)作,跳過了三維重建、SLAM等步驟,極大地簡化了自主航行架構(gòu)的設(shè)計(jì)[6]。

為了實(shí)現(xiàn)船舶異常行為預(yù)警,Perera利用神經(jīng)網(wǎng)絡(luò)提出了一種基于AIS實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)的無監(jiān)督學(xué)習(xí)方法[7]。Vespe提出了一種無監(jiān)督和增量學(xué)習(xí)的方法用來檢測(cè)船舶的動(dòng)作模式,為更上一層的決策行為提供信息[8]。針對(duì)AIS數(shù)據(jù)量大的問題,Douglas-Peucker(DP)算法可以用來壓縮AIS數(shù)據(jù),提取ASI信息中的路徑特征值[9~10]。Xinli提出了一種本體模型對(duì)交通場(chǎng)景進(jìn)行建模,通過隱馬爾可夫模型對(duì)駕駛行為進(jìn)行學(xué)習(xí),該方法可以有效地結(jié)合先驗(yàn)知識(shí)并能夠適應(yīng)不同的交通場(chǎng)景[11]。針對(duì)路徑預(yù)測(cè)的問題,張樹凱提出了一種基于大數(shù)據(jù)驅(qū)動(dòng)的海上航路推斷方法[12]。Yuanqiao提出了一種結(jié)合DBSCAN和神經(jīng)網(wǎng)絡(luò)的方法,該方法可以處理海量的AIS數(shù)據(jù)并自動(dòng)生成航跡[13]。文獻(xiàn)[14]設(shè)計(jì)了基于蟻群算法的靜態(tài)規(guī)劃算法和面向典型場(chǎng)景的動(dòng)態(tài)規(guī)劃策略作為教師系統(tǒng),以前置聲吶的探測(cè)結(jié)果為輸入、以UUV航行角度、速度為輸出,構(gòu)建了含有用于網(wǎng)絡(luò)訓(xùn)練的84350份學(xué)習(xí)數(shù)據(jù)的樣本集。由于RNN在序列信息處理方面的優(yōu)越性,設(shè)計(jì)了181維輸入、2維輸出的LSTM-RNN網(wǎng)絡(luò)用于上述樣本的訓(xùn)練,通過教師系統(tǒng)中的規(guī)劃結(jié)果對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以此使得構(gòu)建的深度網(wǎng)絡(luò)具有實(shí)時(shí)在線的規(guī)劃能力。

2.3 強(qiáng)化學(xué)習(xí)算法

船舶的實(shí)時(shí)在線運(yùn)動(dòng)規(guī)劃問題可以形式化為一個(gè)決策問題[15],即根據(jù)傳感器或者外部信息確定的當(dāng)前環(huán)境、自身狀態(tài)來決定下一時(shí)刻船舶的系列動(dòng)作。另一方面如前所述,面對(duì)未知環(huán)境時(shí)船舶很少有與環(huán)境相關(guān)的先驗(yàn)知識(shí),水下的運(yùn)動(dòng)規(guī)劃問題有很強(qiáng)的不確定性,因而要求其具有較強(qiáng)的對(duì)這種不確定性的自適應(yīng)能力,能夠借助傳感器實(shí)時(shí)感知信息進(jìn)行在線規(guī)劃。強(qiáng)化學(xué)習(xí)為這類問題的求解提供了思路。

強(qiáng)化學(xué)習(xí)是讓智能體與所處的環(huán)境不停地進(jìn)行交互與試錯(cuò),通過不斷地積累經(jīng)驗(yàn),最終使智能體選擇獎(jiǎng)勵(lì)最大值對(duì)應(yīng)的動(dòng)作去執(zhí)行任務(wù),圖4為強(qiáng)化學(xué)習(xí)的基本原理框圖[16]。

圖4 強(qiáng)化學(xué)習(xí)原理

在強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃系統(tǒng)中,策略、價(jià)值函數(shù)、獎(jiǎng)勵(lì)函數(shù)、環(huán)境模型是其組成部分,策略表征了從狀態(tài)和動(dòng)作間的映射關(guān)系,價(jià)值函數(shù)表示從當(dāng)前狀態(tài)轉(zhuǎn)移至目標(biāo)狀態(tài)過程中累積回報(bào)的數(shù)學(xué)期望,獎(jiǎng)勵(lì)函數(shù)是環(huán)境所反饋的強(qiáng)化信號(hào),用來評(píng)價(jià)動(dòng)作策略的好壞。

根據(jù)環(huán)境轉(zhuǎn)移概率將基本強(qiáng)化學(xué)習(xí)方法分為基于模型和無模型的強(qiáng)化學(xué)習(xí)兩類(如圖5所示),前者可以通過求解Bellman方程來直接求解,狀態(tài)轉(zhuǎn)移概率和回報(bào)函數(shù)模型未知時(shí),需要自主學(xué)習(xí)訓(xùn)練獲取最大獎(jiǎng)勵(lì)。基于模型算法中的動(dòng)態(tài)規(guī)劃算法和時(shí)間差分方法中的Q-learning算法是典型的強(qiáng)化學(xué)習(xí)方法[17]。

圖5 基本強(qiáng)化學(xué)習(xí)算法分類

文獻(xiàn)[16]中考慮到與目標(biāo)點(diǎn)的距離和碰撞判斷設(shè)計(jì)了獎(jiǎng)勵(lì)函數(shù),將船舶運(yùn)動(dòng)進(jìn)行了簡化,分為八種運(yùn)動(dòng)狀態(tài),采用貪心算法作為動(dòng)作選擇策略設(shè)計(jì)了基于強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)規(guī)劃算法,通過1600多次的迭代學(xué)習(xí)取得了穩(wěn)定的規(guī)劃結(jié)果?;谕瑯拥乃枷耄墨I(xiàn)[17]提出了引入具有記憶功能的記憶跡的改進(jìn)Q-learning算法QMT算法和基于Sarsa算法的改進(jìn)的同步策略SMT算法,并將其應(yīng)用于單智能體和雙智能體中,在仿真環(huán)境中取得了令人滿意的結(jié)果。Haiqing結(jié)合船員駕駛經(jīng)驗(yàn),國際避碰規(guī)則和船舶操縱性提出了一種基于強(qiáng)化學(xué)習(xí)理論的避障控制算法,并用三條船模驗(yàn)證了算法的有效性[18]。Guo將deep deterministic policy gradient方法和人工勢(shì)場(chǎng)方法相結(jié)合應(yīng)用于船舶路徑規(guī)劃,該方法在利用AIS數(shù)據(jù)訓(xùn)練并可以有效處理航行規(guī)則下的位置環(huán)境路徑規(guī)劃問題[19]。

2.4 遷移學(xué)習(xí)

基于深度/強(qiáng)化學(xué)習(xí)的規(guī)劃算法可以通過模型的學(xué)習(xí)有效解決某些特定場(chǎng)景下的運(yùn)動(dòng)規(guī)劃問題,但是由于水下的動(dòng)態(tài)復(fù)雜環(huán)境與船舶任務(wù)的多樣性,船舶面對(duì)的場(chǎng)景是多種多樣的,事先詳盡的對(duì)水下應(yīng)用場(chǎng)景進(jìn)行枚舉與數(shù)據(jù)的采集的工作是難以完成的。同時(shí)由于模型訓(xùn)練時(shí)間成本較高,為每一種場(chǎng)景都設(shè)計(jì)特定的模型進(jìn)行訓(xùn)練是不切實(shí)際的,而在特定場(chǎng)景中訓(xùn)練得到的模型往往難以直接應(yīng)用到特征差異比較顯著的場(chǎng)景中,輸出的控制指令會(huì)較大概率的導(dǎo)致事故的發(fā)生。但是,從人類自身的角度出發(fā),在實(shí)際駕駛時(shí)并不需要對(duì)每種場(chǎng)景都進(jìn)行行為學(xué)習(xí)/訓(xùn)練,更多的是“舉一反三”,即抓住新場(chǎng)景中的主要特征信息與特定場(chǎng)景之間的相似性,結(jié)合先驗(yàn)知識(shí)或駕駛經(jīng)驗(yàn)從而實(shí)現(xiàn)新場(chǎng)景下的運(yùn)動(dòng)規(guī)劃。

圖6 遷移學(xué)習(xí)基本原理

圖7所示為一種基于對(duì)抗判別網(wǎng)絡(luò)的避障算法的算法框架[6],其中強(qiáng)化學(xué)習(xí)算法部分以深度圖作為輸入,由三層卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行特征提取,五層全連接層根據(jù)CNN提取出的特征信息進(jìn)行決策,輸出定義的相關(guān)動(dòng)作的Q值。從源域到目標(biāo)域所遷移的知識(shí)具體指的就是源域的決策網(wǎng)絡(luò)部分,關(guān)鍵問題就是如何通過調(diào)整目標(biāo)域的CNN參數(shù)以適應(yīng)源域的決策網(wǎng)絡(luò)。算法框架中涉及的生成對(duì)抗網(wǎng)絡(luò)(GAN)采用的是“零和博弈”的思想,即生成器要通過噪聲模擬生成盡可能相似于原始數(shù)據(jù)分布的數(shù)據(jù),增加判別器的誤差,而判別器則盡可能地減少這種誤差?;趯?duì)抗判別網(wǎng)絡(luò)的方法主要是通過特征提取網(wǎng)絡(luò)分別提取源域和目標(biāo)域的特征,并且用判別器來判別特征的所在域,通過判別器的輸出來學(xué)習(xí)目標(biāo)域的特征提取網(wǎng)絡(luò),以此縮小目標(biāo)域和源域特征空間的距離,以實(shí)現(xiàn)復(fù)用源域的決策部分網(wǎng)絡(luò)完成目標(biāo)域相關(guān)任務(wù)的目的。最后分別在ROS/Gazebo仿真環(huán)境下和無人機(jī)平臺(tái)中進(jìn)行了算法驗(yàn)證,實(shí)驗(yàn)證明在保證避障成功率的同時(shí)遷移學(xué)習(xí)的引入將網(wǎng)絡(luò)訓(xùn)練時(shí)間縮短了40多倍。

圖7 基于對(duì)抗判別網(wǎng)絡(luò)的避障算法的算法框架

2.5 其他智能算法

在船舶的智能化實(shí)現(xiàn)時(shí),需要根據(jù)多模態(tài)感知信息進(jìn)一步提取出有效信息以進(jìn)行合理的決策規(guī)劃及控制,關(guān)于傳感器的種類及配置方案沒有唯一解,這給實(shí)際的系統(tǒng)部署帶來挑戰(zhàn)。李德毅院士團(tuán)隊(duì)針對(duì)無人車自動(dòng)駕駛平臺(tái)設(shè)計(jì)了以“駕駛腦”為核心的技術(shù)架構(gòu)[20],降低了傳感器數(shù)量、類型、安裝位置的變化對(duì)整個(gè)架構(gòu)的影響,保證了智能決策與感知(傳感器)模塊之間的低耦合,使得基于以駕駛腦為核心的技術(shù)架構(gòu)可以在不同傳感器配置的智能駕駛車輛平臺(tái)上進(jìn)行移植。

自主化、智能化的水下潛器是無人系統(tǒng)的典型代表。如前所述,無人系統(tǒng)需要實(shí)時(shí)在線進(jìn)行動(dòng)態(tài)的目標(biāo)檢測(cè)、跟蹤、語音指令識(shí)別、多模態(tài)信息融合、優(yōu)化決策、軌跡規(guī)劃、運(yùn)動(dòng)控制等一系列復(fù)雜行為,企圖通過一種通用的算法或模型有效地解決問題是不切實(shí)際的。清華大學(xué)研究團(tuán)隊(duì)以自動(dòng)駕駛自行車為對(duì)象,提出了用于圖像處理與目標(biāo)檢測(cè)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)、用于語音命令識(shí)別的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)、用于目標(biāo)跟蹤的連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)(CANN)、用于姿態(tài)平衡與方向保持的多層感知器(MLP)、用于網(wǎng)絡(luò)集成與決策的基于SNN的神經(jīng)狀態(tài)機(jī)等通用人工智能(AGI)算法解決方案,其可分為以人工神經(jīng)網(wǎng)絡(luò)(ANN)為代表的面向計(jì)算機(jī)科學(xué)的機(jī)器學(xué)習(xí)算法和以脈沖神經(jīng)網(wǎng)絡(luò)(SNN)為代表的面向神經(jīng)科學(xué)的生物啟發(fā)式算法兩大類[21]。

這兩類算法是AGI的主要實(shí)現(xiàn)方式,其在神經(jīng)元結(jié)構(gòu)上有一定的相似性,但是在具體的信息表示、計(jì)算思想、記憶組織等方面存在較大差異,因而其硬件實(shí)現(xiàn)方式是截然不同的,但是前述無人系統(tǒng)對(duì)實(shí)現(xiàn)方式提出了新的需求?;趯?duì)AGI系統(tǒng)需求深入分析的基礎(chǔ)上,清華大學(xué)研究團(tuán)隊(duì)提出了“天機(jī)芯”架構(gòu),采用眾核(many-core)、可重構(gòu)、能夠混合編碼的流水線數(shù)據(jù)流技術(shù),打通了ANN與SNN之間的界限,在單一芯片中實(shí)現(xiàn)了多種異構(gòu)神經(jīng)網(wǎng)絡(luò)的跨范式并行協(xié)同運(yùn)算,保證了其間的無縫通信。

3 人工智能技術(shù)在船舶運(yùn)動(dòng)控制中的應(yīng)用

隨著智能技術(shù)的發(fā)展,無人化是船舶未來發(fā)展的趨勢(shì)。作為船舶航行的直接控制環(huán)節(jié),自主操縱系統(tǒng)是實(shí)現(xiàn)船舶智能航行的基石,是船舶自主航行上層算法高效執(zhí)行的保障。船舶自主操縱控制器的設(shè)計(jì)有很多特有的難點(diǎn)。船舶自主操縱系統(tǒng)設(shè)計(jì)的難點(diǎn)主要有三點(diǎn):1)多變的海洋環(huán)境,對(duì)船舶自主操縱系統(tǒng)的魯棒性有較高的要求;2)復(fù)雜的船舶運(yùn)動(dòng)數(shù)學(xué)模型意味著船舶自主操縱系統(tǒng)需要具備一定的自適應(yīng)能力;3)控制器之間的耦合要求船舶自主操縱系統(tǒng)的各個(gè)子控制器之間需要協(xié)調(diào)配合,才能夠達(dá)到更好的控制效果。

對(duì)于船舶的運(yùn)動(dòng)控制,傳統(tǒng)的控制方法是以不變應(yīng)萬變的魯棒控制策略,一成不變的控制策略在保證船舶控制的魯棒性的同時(shí)通常難以兼顧控制效率,因此很難達(dá)到對(duì)船舶航向、航速高效控制的要求。隨著人工智能技術(shù)的發(fā)展以及硬件設(shè)施的不斷完善,以變應(yīng)變的自適應(yīng)控制策略得到發(fā)展,控制器的智能化設(shè)計(jì)成為了研究者們研究的焦點(diǎn)。為了達(dá)到這一目標(biāo),各種新型的智能控制算法相繼應(yīng)用到了船舶航行控制中。較為典型的新型控制算法有反步法控制,變結(jié)構(gòu)控制,神經(jīng)網(wǎng)絡(luò)控制,模糊邏輯控制,專家控制等[22]。模糊邏輯控制和神經(jīng)網(wǎng)絡(luò)控制是其中使用較為廣泛的方法。

3.1 模糊控制技術(shù)

模糊控制是基于模糊數(shù)學(xué)的基本思想和理論的控制方法,最早由美國人Zadeh于1965年提出。不需要建立被控對(duì)象的精確數(shù)學(xué)模型的特點(diǎn)使得模糊控制理論可以應(yīng)用于較為復(fù)雜的系統(tǒng)之中。模糊控制器主要包含模糊化、規(guī)則庫、模糊推理、解模糊四個(gè)部分。

模糊控制器核心在于規(guī)則庫的選取與建立。模糊規(guī)則不宜過少,否則難以完整描述較為復(fù)雜的系統(tǒng);也不宜過多,否則控制器容易在切換點(diǎn)之間不停抖動(dòng),造成抖振。模糊控制在船舶控制領(lǐng)域的應(yīng)用可以追溯到1977年Amerongen等[23]設(shè)計(jì)的船舶航向控制器,其結(jié)構(gòu)是典型的模糊控制器的結(jié)構(gòu),由模糊化,模糊推理,解模糊化三個(gè)部分構(gòu)成。另外,為了防止舵的抖動(dòng)過于頻繁,在模糊推理的過程中還加入了濾波器來抑制頻繁操舵。該系統(tǒng)實(shí)現(xiàn)了對(duì)船舶的初步控制,但是不具備自學(xué)習(xí)自適應(yīng)能力。后續(xù)應(yīng)用于船舶的模糊控制器大多以此為框架,向自學(xué)習(xí)自適應(yīng)的方向發(fā)展以適應(yīng)復(fù)雜的外部環(huán)境和船舶數(shù)學(xué)模型。1982年,在原有工作的基礎(chǔ)上Amerongen[24]基于模型參考自適應(yīng)控制理論設(shè)計(jì)了控制器,將自適應(yīng)理論引入了設(shè)計(jì)中,在擾動(dòng)較小的情況下取得了較好的效果。Jeffery等[25]則將模型參考自適應(yīng)理論與模糊控制理論結(jié)合,設(shè)計(jì)出了船舶航向的模型參考模糊自適應(yīng)控制器。使用模糊控制器作為基礎(chǔ),并用模糊逆模型對(duì)控制量進(jìn)行只是應(yīng)矯正。

除了直接使用模糊控制理論設(shè)計(jì)控制器外,模糊理論還常常作為被控對(duì)象的自適應(yīng)模型,用于觀測(cè)被控對(duì)象的狀態(tài),與基于模型的控制方法搭配進(jìn)行控制器設(shè)計(jì),其中以T-S模型使用較為廣泛。Huang[26]等基于T-S 模糊模型,設(shè)計(jì)了模糊模型預(yù)測(cè)控制器,解決了非線性模型預(yù)測(cè)控制器(NMPC)計(jì)算量大,容易陷入局部最小值等問題。該控制器分為兩層,上層用于判定總誤差是否達(dá)標(biāo),下層則使用模糊模型預(yù)測(cè)控制算法對(duì)各個(gè)子系統(tǒng)進(jìn)行控制。Killian等[27]的工作則更進(jìn)一步,將總體模型分解為若干個(gè)并行的T-S模型,分別進(jìn)行模型預(yù)測(cè)控制器設(shè)計(jì)后,通過合作環(huán)得到最終的控制量。這種方法對(duì)船舶這種多輸入多輸出(MIMO)系統(tǒng)控制器的設(shè)計(jì)具有一定的指導(dǎo)意義。

3.2 神經(jīng)網(wǎng)絡(luò)控制技術(shù)

大腦每個(gè)神經(jīng)元的結(jié)構(gòu)和功能都較為單一,但是大量神經(jīng)元通過疊加組合卻可以展現(xiàn)出相當(dāng)復(fù)雜的行為模式。人工神經(jīng)網(wǎng)絡(luò)模型(ANN)最早由Warren McCulloch 和 Walter Pitts[28]于 1943 年 提出。其設(shè)計(jì)的思想是通過一系列簡單運(yùn)算的復(fù)合引入若干待調(diào)整參數(shù),然后通過改變局部參數(shù)(權(quán)重、連接方式、運(yùn)算符等)對(duì)系統(tǒng)擬合,最終實(shí)現(xiàn)對(duì)復(fù)雜系統(tǒng)的模擬。

人工神經(jīng)網(wǎng)絡(luò)的本質(zhì)是一個(gè)擬合函數(shù),在控制器的設(shè)計(jì)中,既可以用于擬合被控對(duì)象,作為控制器的參考模型;又可以用于擬合舵手的行為,直接作為控制器。神經(jīng)網(wǎng)絡(luò)強(qiáng)大的擬合能力和自適應(yīng)能力使其很適合用于模擬人的行為,用于控制器的智能設(shè)計(jì)中。許多研究者[30~31]采用神經(jīng)網(wǎng)絡(luò)模型,對(duì)傳統(tǒng)控制器的行為特征進(jìn)行學(xué)習(xí),并借助神經(jīng)網(wǎng)絡(luò)強(qiáng)大的泛化能力,達(dá)到青出于藍(lán)勝于藍(lán)的效果。Perera制造了一個(gè)船載決策系統(tǒng)原型機(jī),該系統(tǒng)可以在惡劣海況下通過傳感器實(shí)時(shí)數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),并通過神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)船舶在當(dāng)前海況和載荷、航向角和速度以供船長進(jìn)行決策[32]。與離線訓(xùn)練方法相比,在線的訓(xùn)練算法通常具備更好的自適應(yīng)能力。孫松濤等[33]使用PID控制在線訓(xùn)練CMAC神經(jīng)網(wǎng)絡(luò),當(dāng)CMAC性能指標(biāo)較差時(shí),采用PID控制器主導(dǎo)控制;當(dāng)CMAC性能指標(biāo)小于臨界值,則切換為CMAC神經(jīng)網(wǎng)絡(luò)進(jìn)行控制。對(duì)深潛器動(dòng)力定位系統(tǒng)進(jìn)行的仿真實(shí)驗(yàn)證明了算法的有效性。R.Amin[34]等為無人水下艇NPSAUV設(shè)計(jì)了多層感知器結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)控制器。針對(duì)神經(jīng)網(wǎng)絡(luò)離線訓(xùn)練時(shí)間較長,自適應(yīng)能力較弱的問題,首先對(duì)控制器在平衡點(diǎn)附近進(jìn)行離線訓(xùn)練,然后使用基于逆模型的在線訓(xùn)練方法對(duì)控制器進(jìn)行在線訓(xùn)練。這種方法不僅縮短了離線訓(xùn)練的時(shí)間,同時(shí)由于在線訓(xùn)練模塊的存在,也提高了船舶的自適應(yīng)能力。

在子控制器設(shè)計(jì)完成之后,如何讓各個(gè)子控制器協(xié)調(diào)配合是另一個(gè)關(guān)鍵問題。在船舶平穩(wěn)航行,參數(shù)變化不大的情況下,由航行參數(shù)變化帶來的數(shù)學(xué)模型變化可以視作擾動(dòng),予以忽略,由各個(gè)子控制器自行解決;但在船舶劇烈加速減速、大角度變向等情況下,航行參數(shù)變化帶來的模型參數(shù)變化會(huì)對(duì)控制器的控制效果造成較大的影響。與外界的環(huán)境擾動(dòng)不同,由航行狀態(tài)變化帶來的運(yùn)動(dòng)模型變化是可以預(yù)知的。這時(shí),就需要各個(gè)子控制器通過協(xié)同配合來提升控制效果。各子控制器的協(xié)調(diào)配合通??梢砸曌饕粋€(gè)多目標(biāo)多約束的智能優(yōu)化問題。

3.3 多控制器協(xié)同策略

一套船舶自主航行控制系統(tǒng)通常由多個(gè)子控制器組成。而這些子控制器之間常常存在耦合。在耦合較小的時(shí)候,可以將耦合視為擾動(dòng),不進(jìn)行特殊處理;但是在船舶大變向,大變速的情況下,控制器之間的耦合通常無法忽略,此時(shí)就需要一個(gè)決策模塊對(duì)各個(gè)控制器進(jìn)行協(xié)同調(diào)節(jié),防止各個(gè)子控制器之間出現(xiàn)1+1<2的情況。

多控制器協(xié)同可以歸納為一個(gè)多目標(biāo)多約束的智能優(yōu)化問題。由于多目標(biāo)優(yōu)化問題具有多個(gè)性能指標(biāo),這些性能指標(biāo)通常來說都是相互耦合的,提升一個(gè)性能指標(biāo)要以犧牲其他性能指標(biāo)為代價(jià),因此一般并不存在最優(yōu)解,解以解集的形式存在,這樣的解集也被稱為非劣解或Pareto解。從諸多非劣解中找出一個(gè)較為滿意的解并將其轉(zhuǎn)為指令下達(dá)給子系統(tǒng)是協(xié)調(diào)模塊的首要任務(wù)。船舶控制的執(zhí)行周期較短,因此需要一種快速高效的決策方法,將多目標(biāo)問題轉(zhuǎn)化為單目標(biāo)問題,以保障控制器的實(shí)時(shí)性與魯棒性。智能化算法可以根據(jù)工作條件與外界環(huán)境自適應(yīng)調(diào)節(jié)各個(gè)子控制器的控制策略,受到了研究者的歡迎。Huang[26]等將控制器分為兩層,上層對(duì)誤差進(jìn)行監(jiān)督,如果不符合則將總誤差作為擾動(dòng)下發(fā)給各個(gè)子控制器。這一策略較為簡單,但只是權(quán)宜之計(jì)。當(dāng)系統(tǒng)間耦合較大時(shí),難以保障在每個(gè)控制周期的時(shí)限內(nèi)都一定能夠給出最優(yōu)解。Stewart[35]等提出了一種合作控制策略,保障了每個(gè)控制周期都可以得出次優(yōu)解,并且證明這種合作控制策略在系統(tǒng)存在耦合時(shí)優(yōu)于單一控制器的控制效果。

4 人工智能在船舶能耗決策中的應(yīng)用

Petersen將非線性ANN模型運(yùn)用到船舶燃油消耗預(yù)測(cè)上,并在長達(dá)兩個(gè)月的航行試驗(yàn)中對(duì)燃油消耗量進(jìn)行實(shí)時(shí)預(yù)測(cè)[36]。Be?ik?i建立了基于ANN網(wǎng)絡(luò)的船舶燃油預(yù)測(cè)模型,該模型利用船舶航速、發(fā)動(dòng)機(jī)轉(zhuǎn)速、船舶姿態(tài)、貨物量和外界海況預(yù)測(cè)船舶燃油消耗,并利用燃油消耗預(yù)測(cè)值對(duì)發(fā)動(dòng)機(jī)的節(jié)能操作提供決策信息[37]。Perera提出了一個(gè)基于大數(shù)據(jù)框架的船舶效果預(yù)測(cè)系統(tǒng),不同的機(jī)器學(xué)習(xí)算法分別被用在系統(tǒng)的數(shù)據(jù)前處理和后處理過程中以實(shí)現(xiàn)大量傳感器數(shù)據(jù)采集、數(shù)據(jù)壓縮、數(shù)據(jù)恢復(fù)等功能,最后使用數(shù)據(jù)回歸的方式對(duì)不同海況下的航行效果進(jìn)行預(yù)測(cè)[38]。Jun建立了一種高斯過程元模型以預(yù)測(cè)船舶在不同操作場(chǎng)景下的燃油消耗,該模型在預(yù)測(cè)燃油消耗的過程中不僅考慮了船舶本身的狀態(tài)同時(shí)也考慮了外界海況等因素[39]。Christos比較了支持向量機(jī)(SVM),隨機(jī)森林回歸(RFR),極端樹回歸(ETR),人工神經(jīng)網(wǎng)絡(luò)(ANN)等方法在船舶主機(jī)燃油消耗的預(yù)測(cè)效果,上述方法均可以在不同的裝載情況、天氣情況、速度、航行距離和吃水條件下較為準(zhǔn)確地預(yù)測(cè)燃油消耗量[36]。

5 結(jié)語

船舶領(lǐng)域覆蓋國防軍事、科學(xué)研究、民生工業(yè)等諸多方面,其先進(jìn)性和智能一定程度上反映了當(dāng)前的科學(xué)技術(shù)水平。自2016年工業(yè)和信息化部設(shè)立“智能船舶1.0專項(xiàng)”以來,我國智能船舶的設(shè)計(jì)、制造、運(yùn)維、管理步入正軌,應(yīng)用人工智能技術(shù)的船舶相比于傳統(tǒng)船舶的優(yōu)勢(shì)顯而易見。隨著處理器性能提升、人工智能算法的突破、數(shù)據(jù)量的增長,人工智能技術(shù)的應(yīng)用將會(huì)越來越廣泛?,F(xiàn)階段人工智能技術(shù)在飛機(jī)和汽車的無人駕駛技術(shù)等領(lǐng)域已經(jīng)得到成功運(yùn)用,未來其在船舶的智能技術(shù)和控制技術(shù)中的逐步成熟將徹底改變?nèi)祟惖暮胶8窬帧?/p>

猜你喜歡
航行控制器神經(jīng)網(wǎng)絡(luò)
基于神經(jīng)網(wǎng)絡(luò)的船舶電力系統(tǒng)故障診斷方法
三轉(zhuǎn)子式比例控制器設(shè)計(jì)與內(nèi)泄漏分析
南京溧水電子3款控制器產(chǎn)品
MIV-PSO-BP神經(jīng)網(wǎng)絡(luò)用戶熱負(fù)荷預(yù)測(cè)
基于改進(jìn)Hopfield神經(jīng)網(wǎng)絡(luò)的對(duì)地攻擊型無人機(jī)自主能力評(píng)價(jià)
到慧骃國的航行
海洋美景
第六章 邂逅“胖胖號(hào)”
基于NFV的分布式SDN控制器節(jié)能機(jī)制
潛艇
苍梧县| 营口市| 梨树县| 长春市| 通州区| 龙州县| 珲春市| 巴马| 上饶县| 富锦市| 丘北县| 泾川县| 甘泉县| 门源| 沁源县| 绥化市| 尼木县| 正宁县| 新宾| 沧州市| 沁源县| 玉龙| 泸州市| 惠安县| 呼伦贝尔市| 嘉荫县| 商都县| 韩城市| 泗阳县| 油尖旺区| 隆子县| 松原市| 蒙阴县| 新和县| 金寨县| 远安县| 安康市| 广平县| 江山市| 交口县| 会宁县|