国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

支持向量回歸機(jī)建立排氣溫度模型研究

2018-08-28 09:12夏存江
機(jī)械設(shè)計(jì)與制造 2018年8期
關(guān)鍵詞:預(yù)測(cè)值基線偏差

夏存江

1 引言

航空發(fā)動(dòng)機(jī)是飛機(jī)的核心動(dòng)力系統(tǒng),而且是一種結(jié)構(gòu)復(fù)雜高度精密的機(jī)械,對(duì)之實(shí)施有效的狀態(tài)監(jiān)控是保障飛機(jī)安全性,可靠性和經(jīng)濟(jì)性的重要途徑。發(fā)動(dòng)機(jī)排氣溫度(exhaustgastemperature,EGT)是最能反映發(fā)動(dòng)機(jī)運(yùn)行情況的性能參數(shù),通過(guò)分析EGT測(cè)量值偏離對(duì)應(yīng)基線值的偏差值,可監(jiān)控和預(yù)測(cè)發(fā)動(dòng)機(jī)的健康狀態(tài)及其性能衰退趨勢(shì)。EGT的基線值是生產(chǎn)廠家通過(guò)大量的試驗(yàn)綜合統(tǒng)計(jì)獲得,屬于航空發(fā)動(dòng)機(jī)狀態(tài)監(jiān)控核心技術(shù),廠家并未公布,國(guó)內(nèi)航空公司的狀態(tài)監(jiān)控也只是停留在監(jiān)控軟件的簡(jiǎn)單操作[1]。

為了避免過(guò)度依賴發(fā)動(dòng)機(jī)生產(chǎn)廠家,目前在航空發(fā)動(dòng)機(jī)基線挖掘方面,一些研究學(xué)者對(duì)其進(jìn)行了較深入的研究。如文獻(xiàn)[2]應(yīng)用正交實(shí)驗(yàn)設(shè)計(jì)原理和最小二乘曲線擬合的方法建立了JT9D三種類型的發(fā)動(dòng)機(jī)基線方程;文獻(xiàn)[3]采用基于核函數(shù)的多元非線性回歸分析方法,對(duì)Rolls-Royce公司的Trent700發(fā)動(dòng)機(jī)基線方程進(jìn)行挖掘,建立了標(biāo)準(zhǔn)化過(guò)程中的核函數(shù)和性能參數(shù)的偏差值模型,文獻(xiàn)[4]中,以CFM56-5B航空發(fā)動(dòng)機(jī)為例,利用RBF神經(jīng)網(wǎng)絡(luò)建立了EGT的基線模型。在以往的工作中,采用不同方法對(duì)航空發(fā)動(dòng)機(jī)的基線進(jìn)行挖掘,但很少采用支持向量回歸機(jī)(SVR)對(duì)民航發(fā)動(dòng)機(jī)EGT基線方程進(jìn)行建模分析,并且之前的研究結(jié)果和模型精度并不是很理想。

以民航某主力型號(hào)發(fā)動(dòng)機(jī)為例,采用支持向量回歸機(jī)的方法建立了精度較高且對(duì)未知數(shù)據(jù)預(yù)測(cè)能力較強(qiáng)的EGT基線模型。

2 樣本數(shù)據(jù)預(yù)處理

航空發(fā)動(dòng)機(jī)常年在高溫、高壓等惡劣環(huán)境下工作,其相關(guān)參數(shù)的測(cè)量較為困難,常見(jiàn)的問(wèn)題主要有數(shù)據(jù)測(cè)量誤差大、傳感器易發(fā)生故障、某些數(shù)據(jù)甚至難以采集等[5]。收集到的航空發(fā)動(dòng)機(jī)相關(guān)性能參數(shù)的數(shù)據(jù)若不加以預(yù)處理,則很難準(zhǔn)確反映航空發(fā)動(dòng)機(jī)的實(shí)際健康狀態(tài)。因此,首先從不同地區(qū)的兩家航空公司收集某型號(hào)發(fā)動(dòng)機(jī)的2014年5月至2015年5月的實(shí)際飛行數(shù)據(jù),然后對(duì)其進(jìn)行預(yù)處理以用于后續(xù)的發(fā)動(dòng)機(jī)基線模型訓(xùn)練和驗(yàn)證。預(yù)處理的內(nèi)容主要包括對(duì)原始數(shù)據(jù)中的異常點(diǎn)判別與粗大誤差剔除。

異常點(diǎn)的識(shí)別方法是用以往數(shù)據(jù)信息來(lái)判斷當(dāng)前點(diǎn)是否異常,即:對(duì)于某一時(shí)間序列{Xi}ni=1,判別t=i個(gè)數(shù)據(jù)是否異常,可根據(jù)t=i之前的序列{Xi}nn=1進(jìn)行判斷。判別方法可以是根據(jù)子序列{X預(yù)測(cè) t=i時(shí)的值為 Yi,預(yù)測(cè)精度為 δi,如果 Yi?[Yi-δi,Yi+δi],則稱Yi為異常點(diǎn)。針對(duì)航空發(fā)動(dòng)機(jī)數(shù)據(jù)特點(diǎn),采用拉依達(dá)準(zhǔn)則(3σ準(zhǔn)則)來(lái)判別異常點(diǎn),它以數(shù)據(jù)足夠多為前提,其預(yù)測(cè)值取為前面數(shù)據(jù)的算術(shù)平均值,預(yù)測(cè)精度為3σ(3倍的標(biāo)準(zhǔn)差)[6]。流程圖,如圖1所示。

圖1 拉依達(dá)法則流程圖Fig.1 Float Chat of Pauta Criterion

根據(jù)圖1所示的異常點(diǎn)的判別方法,將收集到的數(shù)據(jù)剔除粗大誤差之后得到回歸模型的輸入樣本訓(xùn)練數(shù)據(jù)500組和驗(yàn)證數(shù)據(jù)300組。

目前,有很多文獻(xiàn)資料中對(duì)于模型的輸出樣本即發(fā)動(dòng)機(jī)基線值的求解方法進(jìn)行了研究,計(jì)算方法如式(1):

式中:EGTb—EGT對(duì)應(yīng)的基線值;EGTk—將EGT的測(cè)量值EGTm轉(zhuǎn)化為標(biāo)準(zhǔn)大氣條件下的修正值。

查閱原始文獻(xiàn)[7],該型號(hào)發(fā)動(dòng)機(jī)參數(shù)基線值的實(shí)際求解方法如下:

由式(2)可知發(fā)動(dòng)機(jī)EGTb的計(jì)算公式如(3)式:

由于EGT基線模型是基于大氣條件等因素建立的,所以公式(3)中采用EGT的直接測(cè)量值EGTm計(jì)算EGTb,國(guó)內(nèi)許多研究學(xué)者采用的式(1)是不符合廠家系統(tǒng)的規(guī)律。為了提高后續(xù)訓(xùn)練的EGT基線模型的推廣泛化能力,考慮選取一架飛機(jī)的兩臺(tái)發(fā)動(dòng)機(jī)的相關(guān)數(shù)據(jù),由于其在巡航狀態(tài)下工作在同一個(gè)外界環(huán)境,獲得的發(fā)動(dòng)機(jī)的性能參數(shù)值也趨近于相同,并且對(duì)應(yīng)同樣的基線,所以利用式(3)分別計(jì)算兩臺(tái)發(fā)動(dòng)機(jī)的EGTb并且取兩者平均值,得到EGT基線模型的輸出樣本空間EGTb,從而保證了模型的普遍適用性。

3 支持向量回歸機(jī)建模原理

支持向量機(jī)(support vector machines,SVM)是數(shù)據(jù)挖掘問(wèn)題的一種新的、有效的方法,理論基礎(chǔ)是統(tǒng)計(jì)學(xué)理論,在小樣本建模領(lǐng)域表現(xiàn)出優(yōu)異的推廣泛化能力。處理回歸問(wèn)題的向量機(jī)稱為支持向量回歸機(jī)(support vector regression,SVR),是結(jié)構(gòu)風(fēng)險(xiǎn)最小化的實(shí)現(xiàn),它通過(guò)非線性函數(shù),將輸入樣本轉(zhuǎn)換到高維線性特征空間,巧妙地解決了維數(shù)問(wèn)題,并且能夠有效避免神經(jīng)網(wǎng)絡(luò)出現(xiàn)的過(guò)學(xué)習(xí)和局部最小化的缺陷,最終得到一個(gè)全局最優(yōu)解[8]。

假設(shè)n個(gè)訓(xùn)練數(shù)據(jù)樣本(xi,yi),式中:xi—第i個(gè)輸入樣本;yi—對(duì)應(yīng)的輸出值。首先考慮用線性函數(shù)進(jìn)行回歸,方程為:

在數(shù)值計(jì)算中,對(duì)于xi的預(yù)測(cè)值f(xi),允許其與真實(shí)值yi存在一定的誤差ε,需要引入合適的損失函數(shù),SVR常選擇的是不敏感損失函數(shù)[9]:

基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,就得到了線性的支持向量回歸算法,回歸估計(jì)問(wèn)題轉(zhuǎn)換為解決一個(gè)在約束條件下的最優(yōu)化問(wèn)題,形式為:

通過(guò)求解可得到αi和α*i,并根據(jù)Kuhn-Tucker定理計(jì)算得到b,最終得到線性回歸函數(shù)。

對(duì)于非線性回歸,支持向量回歸機(jī)的基本思想是利用合適的內(nèi)積函數(shù)把訓(xùn)練數(shù)據(jù)轉(zhuǎn)換到某一個(gè)高維Hilbert空間中,然后在此高維空間中用函數(shù)進(jìn)行線性回歸,最終取得在原空間非線性回歸的效果。此內(nèi)積函數(shù)稱為核函數(shù)K(xi,xj)。

4 發(fā)動(dòng)機(jī)EGT基線建模

分析原廠家系統(tǒng)氣路參數(shù)基線值的求解過(guò)程可知,發(fā)動(dòng)機(jī)EGT基線模型是一個(gè)關(guān)于有關(guān)測(cè)量參數(shù)的多元非線性模型,所以可以將其的求解描述為如下的數(shù)學(xué)模型:

式中:TAT—外界大氣總溫;N1K—風(fēng)扇修正轉(zhuǎn)速;Mach—飛機(jī)飛行馬赫數(shù);Alt—飛機(jī)飛行高度;Bleed—飛機(jī)環(huán)境控制及飛機(jī)和發(fā)動(dòng)機(jī)防冰系統(tǒng)的引氣量。

由于收集的數(shù)據(jù)中ECS數(shù)據(jù)都為1,飛機(jī)巡航狀態(tài)客艙引氣處于打開狀態(tài),對(duì)基線影響很小,故bleed不予考慮;通過(guò)確定每個(gè)自變量與EGTb相關(guān)程度來(lái)驗(yàn)證數(shù)據(jù)的準(zhǔn)確性,求解的每個(gè)變量與EGTb的復(fù)相關(guān)系數(shù),表明:N1K和TAT與EGTb高度相關(guān),Alt和Mach與EGTb中度相關(guān),與廠家理論模型吻合。因此在選擇EGT基線模型的訓(xùn)練集時(shí),分別構(gòu)造以下的輸入變量和輸出變量:

在模型訓(xùn)練的過(guò)程中,核函數(shù)的選擇是決定高維特征的的關(guān)鍵因素,由于高斯徑向基核函數(shù)能夠?qū)崿F(xiàn)較好的非線性映射,且具有較寬的收斂域,擬合和預(yù)測(cè)精度高,是較為理想的回歸依據(jù)函數(shù),將選用該核函數(shù),具體表達(dá)式如下[10]:

SVR模型的性能取決于選擇適當(dāng)?shù)膮?shù),懲罰因子c,高斯徑向基核函數(shù)中的g和ε-不敏感損失函數(shù)中的精度p都是影響回歸的重要因素,為了解決經(jīng)驗(yàn)法選取支持向量回歸機(jī)參數(shù)效率低,取值不準(zhǔn)確的問(wèn)題,采取遺傳算法(Genetic Algorithm,GA)對(duì)參數(shù)進(jìn)行尋優(yōu),尋優(yōu)結(jié)果,如圖2所示。

圖2遺傳算法尋找最佳參數(shù)的適應(yīng)度曲線Fig.2 Fitness Curve of the Best Parameter by Genetic Algorithm

圖2 中適應(yīng)度是在遺傳算法中描述個(gè)體性能的主要指標(biāo),用于評(píng)價(jià)個(gè)體的優(yōu)劣程度。從圖中可以得到懲罰因子c,核函數(shù)中的g和精度 p 的優(yōu)化值,分別為 c=80.4866,g=0.22163,p=0.010032,此時(shí)的均方誤差為3.3057e-5,滿足其精度要求。

結(jié)合之前構(gòu)造的輸入變量和輸出變量,利用選擇的核函數(shù)和用遺傳算法尋優(yōu)得到的最佳參數(shù)進(jìn)行發(fā)動(dòng)機(jī)EGT基線模型訓(xùn)練,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)測(cè)得到相應(yīng)的EGTb預(yù)測(cè)值,表1列舉了10組數(shù)據(jù)訓(xùn)練結(jié)果的誤差對(duì)比,平均相對(duì)誤差只有-0.0164%,表明支持向量回歸機(jī)下的模型在EGT基線求解中具有較高的精度。SVR評(píng)價(jià)回歸模型精度的高低,采用平均平方相關(guān)系數(shù)(mean squared error,MSE)和平均相關(guān)系數(shù)(squared correlation coefficient,R2)作為評(píng)價(jià)指標(biāo)。此模型的參數(shù)指標(biāo)為:

由模型參數(shù)指標(biāo)和表1所示的結(jié)果可知:EGT基線預(yù)測(cè)值與原始值高度相關(guān),模型具有很好的回歸性能。

表1 訓(xùn)練樣本的EGTb的預(yù)測(cè)值與原始值對(duì)比Tab.1 Comparison Between Predicted Values and Original Values of EGTb for Training Sample

5 EGT基線模型的驗(yàn)證

為了進(jìn)一步驗(yàn)證訓(xùn)練的EGT基線模型的精確性和推廣泛化能力,即對(duì)未知樣本的預(yù)測(cè)能力,選取另外一臺(tái)相同型號(hào)的發(fā)動(dòng)機(jī)的300組數(shù)據(jù)作為測(cè)試樣本。隨機(jī)選取該測(cè)試樣本預(yù)測(cè)值與真實(shí)值對(duì)比的50組數(shù)據(jù),對(duì)比結(jié)果,如圖3所示。

圖3 測(cè)試樣本的EGTb預(yù)測(cè)值與原始值對(duì)比Fig.3 Comparison Between Predicted Values and Original Values of EGTb for Test Sample

從圖3的對(duì)比圖可以看出,測(cè)試樣本的EGT基線預(yù)測(cè)值與真實(shí)值很接近,絕對(duì)誤差在0線上均勻分布且無(wú)突變情況,驗(yàn)證了本次模型具有較強(qiáng)的泛化能力,同時(shí)說(shuō)明了求解方法符合SVR的結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原則。

航空發(fā)動(dòng)機(jī)氣路偏差值的大小以及變化趨勢(shì)能夠反映發(fā)動(dòng)機(jī)氣路部件性能衰退的程度和速度,許多航空公司以氣路參數(shù)偏差值作為發(fā)動(dòng)機(jī)性能健康狀態(tài)評(píng)估的主要參數(shù)。所以采用本次挖掘的EGT基線模型和式(1)計(jì)算EGT的偏差值,得到EGT偏差值的對(duì)比結(jié)果,如圖4所示。

從圖4可以看出,通過(guò)該模型求出的EGT偏差值與原始值基本吻合,準(zhǔn)確度較高,在發(fā)動(dòng)機(jī)的性能監(jiān)控中具有實(shí)際意義。

圖4 EGT偏差值的預(yù)測(cè)值與原始值對(duì)比Fig.4 Comparison Between Predicted Values and Original Values of Deviation Value for EGT

6 結(jié)束語(yǔ)

以民航某主力型號(hào)發(fā)動(dòng)機(jī)為例,收集其相關(guān)性能參數(shù)數(shù)據(jù),將拉依達(dá)法則作為數(shù)據(jù)預(yù)處理方法,建立模型的輸入和輸出訓(xùn)練樣本,采用遺傳算法進(jìn)行相關(guān)參數(shù)的優(yōu)化計(jì)算,提高了模型求解精度和效率,選用另一臺(tái)相同型號(hào)的發(fā)動(dòng)機(jī)的性能參數(shù)數(shù)據(jù)作為測(cè)試樣本,并且求解測(cè)試樣本的EGTb預(yù)測(cè)值的偏差值,誤差結(jié)果表明:利用支持向量回歸機(jī)建立的EGT基線模型具有較高的精度且對(duì)未知數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確性高,使用該模型計(jì)算的EGT的偏差值與廠家返回的數(shù)據(jù)很接近,在航空發(fā)動(dòng)機(jī)性能監(jiān)控過(guò)程中具有非常高的實(shí)際應(yīng)用價(jià)值。

猜你喜歡
預(yù)測(cè)值基線偏差
加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測(cè)值
±800kV直流輸電工程合成電場(chǎng)夏季實(shí)測(cè)值與預(yù)測(cè)值比對(duì)分析
AI講座:ML的分類方法
航天技術(shù)與甚長(zhǎng)基線陣的結(jié)合探索
如何走出文章立意偏差的誤區(qū)
兩矩形上的全偏差
一種SINS/超短基線組合定位系統(tǒng)安裝誤差標(biāo)定算法
一種改進(jìn)的干涉儀測(cè)向基線設(shè)計(jì)方法
機(jī)械裝配偏差源及其偏差傳遞機(jī)理研究
技術(shù)狀態(tài)管理——對(duì)基線更改的控制