国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

測量誤差分析及數(shù)據(jù)處理若干要點系列論文(四)——統(tǒng)計學(xué)習(xí)理論及支持向量機(jī)方法統(tǒng)用于形位誤差評定

2020-08-26 06:55林洪樺
自動化與信息工程 2020年4期
關(guān)鍵詞:數(shù)據(jù)處理測點平面

林洪樺

測量誤差分析及數(shù)據(jù)處理若干要點系列論文(四)——統(tǒng)計學(xué)習(xí)理論及支持向量機(jī)方法統(tǒng)用于形位誤差評定

林洪樺

(北京理工大學(xué),北京 100081)

闡述統(tǒng)計學(xué)習(xí)理論(SLT)及支持向量機(jī)(SVM)方法統(tǒng)用于形位誤差評定。首先,簡要復(fù)述SLT-SVM方法及特點;然后,詳細(xì)描述多測點形位誤差評定要點與難點、統(tǒng)用SVM方法基本依據(jù)及評定算法等;最后,驗證現(xiàn)代數(shù)據(jù)處理對策四要訣:實、佳、智、驗。

數(shù)據(jù)處理;數(shù)學(xué)模型;誤差;統(tǒng)示法

系列論文[1-3]已述,在利用計算機(jī)分析處理現(xiàn)實問題時,在小樣本下處理三非(非線性、非高斯、非平穩(wěn))問題應(yīng)為常態(tài),并多次推薦直接采用特殊到特殊的轉(zhuǎn)導(dǎo)型推理方法,即按現(xiàn)有樣本數(shù)據(jù)及所掌握有關(guān)先驗信息直接估計和預(yù)測所求現(xiàn)實問題的某一待求結(jié)果。如,目標(biāo)只是估計誤差范圍就無需估計其理論概率分布,應(yīng)盡量降低求解要求,以獲得更為準(zhǔn)確、更合乎實際的待求結(jié)果。具體而言,可采用機(jī)器學(xué)習(xí)技術(shù)統(tǒng)計學(xué)習(xí)理論(statistiacal learning theory, SLT)及支持向量機(jī)(support vector machine, SVM)方法[4-5]。

誤差評估方法和其他科技領(lǐng)域一樣,傳統(tǒng)上多基于特殊到一般再到特殊的歸納演繹推理方法,習(xí)慣于先求出誤差的理論概率分布,再推論現(xiàn)實問題的某一待求結(jié)果。然而,實質(zhì)上這是個不適定逆問題。在有限數(shù)據(jù)或小樣本下,對概率分布統(tǒng)計推斷的結(jié)果常與實際不符或相去甚遠(yuǎn)。應(yīng)用基于轉(zhuǎn)導(dǎo)推理的SLT- SVM方法所得到現(xiàn)實問題的某個估計、預(yù)測結(jié)果,可能更直接、更客觀,而現(xiàn)實也就更準(zhǔn)確。

1 SLT-SVM方法及特點

SLT是研究利用有限經(jīng)驗數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)的一般理論;SVM是在SLT指導(dǎo)下解決實際問題的一般方法。當(dāng)前對SLT-SVM的核心內(nèi)容并不陌生,在文獻(xiàn)[4]~文獻(xiàn)[6]中已有論述。SLT-SVM是依據(jù)有限數(shù)據(jù)或小樣本,基于VC(Vapnik-Chervonnenkis)理論按結(jié)構(gòu)風(fēng)險最小化(structural risk minimization, SRM)原則進(jìn)行函數(shù)(二值或多值函數(shù)、回歸函數(shù)、概率密度等)估計方法。在此,僅簡要列出SLT-SVM方法基本特點。

1)適用于有限數(shù)據(jù)或小樣本下函數(shù)估計。設(shè)樣本為

2)基于SRM原則。在有限樣本下,真實風(fēng)險與經(jīng)驗風(fēng)險emp關(guān)系為

其后項與所估計函數(shù)的VC維有關(guān),稱為VC置信范圍。若待估計函數(shù)類= {1,2,…,f}按其VC維遞增排序,即VC(f-1) f),則emp隨之遞減;反而隨之遞增。SRM原則就是所估計函數(shù)應(yīng)使式(2)右端兩項之和最小,以避免在單純經(jīng)驗風(fēng)險最小化下出現(xiàn)過擬合問題。SVM策略為在選定最小經(jīng)驗風(fēng)險的某類函數(shù)結(jié)構(gòu)中選出VC置信范圍最小函數(shù),其VC維也即支持向量的維數(shù)。

3) SVM方法具有全局優(yōu)化性。SVM方法核心技術(shù)在于將現(xiàn)實問題轉(zhuǎn)化成二次凸優(yōu)化問題。同時,通過對偶優(yōu)化處理使最優(yōu)解只取決于少數(shù)構(gòu)成支持向量的數(shù)據(jù)點,而與其他樣本點無關(guān),即具有稀疏性、穩(wěn)健性。

4) SVM方法要點在于應(yīng)用核函數(shù)技術(shù)。SVM源于最大間隔線性分類,即求解最大化兩類樣本間隔的分類最優(yōu)超平面(?) += 0(平面內(nèi)積表達(dá)式,其中= (1,2,…,w)T為法向向量;為法向偏置),僅為線性操作。將所要解決現(xiàn)實問題的數(shù)據(jù)樣本通過核映射(不同現(xiàn)實問題選定的核函數(shù)各異),即非線性映射到高維特征空間,在該空間構(gòu)造線性分類的最優(yōu)超平面,使之簡化為對應(yīng)的線性操作,即為SVM核技術(shù)方法,支持向量分類(support vector classify-cation, SVC)通用式為[6]

式中,為Lagrange乘子,即的對偶變量;(x,x) =(x)*(x)(*為內(nèi)積)為的非線性核映射。

SVM通過引入不敏感損失函數(shù),可推廣應(yīng)用于實函數(shù)估計的回歸問題,支持向量回歸(support vector regression, SVR)通用式為[6]

總之,SLT-SVM具有嚴(yán)格理論基礎(chǔ),在解決小樣本、非線性、高維數(shù)等現(xiàn)實問題以及全局優(yōu)化中具有特殊優(yōu)勢,尤其SVM僅以小支持向量集即可代表不同學(xué)習(xí)機(jī)器的整個訓(xùn)練集,并能推廣應(yīng)用到函數(shù)擬合等各種機(jī)器學(xué)習(xí)問題,且已具有LibSVM,LSSVM等應(yīng)用軟件。然而,SVM方法仍嫌復(fù)雜,近年來經(jīng)不斷改進(jìn)、完善,包括簡化、變形等,使之在許多專業(yè)領(lǐng)域漸多應(yīng)用。

2 統(tǒng)用SVM方法評定多測點形位誤差

一般形狀與位置誤差測量及評定方法多而雜,卻難以適用于極值點較多的多測點情況。多測點形位誤差的評定恰為現(xiàn)實難題之一,可統(tǒng)用SVM方法來解決。筆者于2011年已有統(tǒng)用SVM評定形位誤差的設(shè)想,應(yīng)華南理工大學(xué)劉桂雄教授之邀,協(xié)同指導(dǎo)其博士生基本上實現(xiàn)該設(shè)想[7],驗證統(tǒng)用SVM評定形位誤差可行性。

2.1 多測點形位誤差評定的要點及難點

在大尺寸或精細(xì)測量等情況下,常要求評定數(shù)據(jù)點> 50~100以上的多測點形位誤差,其特點就在于“多”。

首先,形位公差國家標(biāo)準(zhǔn)規(guī)定形位誤差評定按最小包容區(qū)域(minimum zone, MZ)原則。在MZ評定原則下形位誤差僅取決于幾個極值點,與其余數(shù)據(jù)點無關(guān)。在多測點下,形位誤差極值點較多,尤其由于許多次極值點與極值點很接近,難以評定。

再者,按MZ原則評定形位誤差本身就是難點。大多數(shù)形狀誤差并無明確的MZ評定準(zhǔn)則,僅直線度、平面度、圓度等少數(shù)有MZ評定準(zhǔn)則可依,空間形狀誤差則更難評定。位置誤差對其基面而言,應(yīng)先評定基面形狀誤差??梢?,應(yīng)以形狀誤差評定為基點,此亦為難點。

顯然,對于多測點形位誤差評定,未必力求合乎MZ評定準(zhǔn)則,且多無準(zhǔn)則可依。要點在于形位誤差評定結(jié)果及其準(zhǔn)確度應(yīng)予驗證。

2.2 多測點形位誤差評定統(tǒng)用SVM方法基本依據(jù)

統(tǒng)用SVM評定多測點形位誤差基本依據(jù)如下:

2)巧用核技術(shù)拓展應(yīng)用SVM評定非線性形狀誤差。適當(dāng)而靈活選定核函數(shù)可擴(kuò)展應(yīng)用SVM-R非線性回歸方法評定各種形狀誤差。如,適當(dāng)選定二次型核可用于圓度、拋物面等二次型形狀誤差評定[7],可見巧用核技術(shù)有利于解決多測點空間形狀誤差評定的難題。還需指出,對于復(fù)雜形狀求得核函數(shù)本身就是個難題。

4)充分利用SVM方法自身特色[6-7]。基于有限數(shù)據(jù)下VC理論及按SRM原則進(jìn)行實值函數(shù)估計方法。強(qiáng)調(diào)直接采用從特殊到特殊的轉(zhuǎn)導(dǎo)型推理方法,采用對偶化二次凸規(guī)劃,其解具有全局最優(yōu)性,且最優(yōu)解只取決于在邊界上少數(shù)點構(gòu)成的支持向量與形位誤差MS原則的極值點一致,而與其他樣本點無關(guān),又具有稀疏性、魯棒性等。

5)驗證形位誤差評定結(jié)果準(zhǔn)確度。統(tǒng)用SVM評定多測點形位誤差的結(jié)果應(yīng)予驗證,尤其驗證其準(zhǔn)確度歷來就是難點。推薦利用基于MonteCarlo方法給定誤差(尤應(yīng)含系統(tǒng)誤差)數(shù)據(jù)仿真驗證方法。

可見,統(tǒng)用SVM評定形位誤差既合乎MZ原則,又可發(fā)揮SVM方法全局優(yōu)化等優(yōu)異性,關(guān)鍵在于需擬定簡捷算法與合適的核函數(shù)。

2.3 多測點形位誤差統(tǒng)用SVM評定的算法

顯然,核心算法為平面度的線性二分類SVM評定:平面度MZ評定要求包容實際平面的正和負(fù)2包容面間的法向距離最小,理想平面則居中位,如圖1所示。

圖1 平面度的線性二分類SVM評定

雖直接采用SVM-R即可評定,但為簡捷起見,在文獻(xiàn)[7]中用圖2等價的正、負(fù)2包容面間最大間隔為最小線性二分類SVM-C分離式方法分離式支持向量分類(separating support vector classification,SSVC)來實現(xiàn)。該算法步驟:

1)減省數(shù)據(jù)點:SVM僅取決于支持向量數(shù)據(jù)點,即平面度多測點中的正和負(fù)MZ包容面上的數(shù)據(jù)點,而與其他數(shù)據(jù)點無關(guān)。為減省SVM算法數(shù)據(jù)點,先簡捷地擬合與MZ平面接近的最小二乘(least squares, LS)平面,并移除約60%~70%小殘差數(shù)據(jù)點。

圖2 最小線性二分類SVM-C分離式方法SSVC

表1 測量示例

3 總結(jié)

在文獻(xiàn)[1]述及,值得關(guān)注的總觀念為:從特殊到特殊的轉(zhuǎn)導(dǎo)推理該論文已具體化成SLT-SVM方法?,F(xiàn)代數(shù)據(jù)處理對策四要訣:實、佳、智、驗,在多測點形位誤差評定的數(shù)據(jù)處理中也一一得以驗證。

佳即應(yīng)遵從最佳性原則。國內(nèi)與國際標(biāo)準(zhǔn)均規(guī)定評定形位誤差按MZ原則。SVM在數(shù)據(jù)處理的最佳性原則上恰為minmax準(zhǔn)則,與MZ原則完全一致。

智即處理方法智能化。盡管使用LibSVM軟件的SVM-R方法可直接用于評定多測點形位誤差,這里力求創(chuàng)新更加簡捷的智能化數(shù)據(jù)處理方法——SSVS算法。

驗即處理結(jié)果準(zhǔn)確性應(yīng)予驗證。對于以上所研究的具有創(chuàng)新性的結(jié)果更有驗證之必要。在文獻(xiàn)[1]所列舉的恰為平面度測量驗證性示例,只不過所述的是一般情況(免予重復(fù))。實用中就需細(xì)致分析現(xiàn)實被測平面實際測量狀況,擬定出合適的給定誤差的數(shù)據(jù)仿真驗證模型。

注意事項:擬定的驗證模型項數(shù)、冪次等未必整、全,需經(jīng)分析按實況而定;擬定的尺寸范圍應(yīng)與現(xiàn)實對象(即被測平面)的實物一致;擬定的誤差大小與樣本數(shù)據(jù)或數(shù)據(jù)圖的變動波度相符合;系統(tǒng)誤差設(shè)置宜有據(jù):經(jīng)驗資料、專家意見等先驗信息;隨機(jī)誤差分布設(shè)定應(yīng)基于非高斯性為常態(tài),即分布統(tǒng)示法。在文獻(xiàn)[7]中有關(guān)平面度測量的給定誤差數(shù)據(jù)仿真驗證模型分析示例值得參考。最后,對仿真結(jié)果可做出仿真圖形與原數(shù)據(jù)圖對比以判別其適合性??傊η髮嵍?。

[1] 林洪樺.測量誤差分析及數(shù)據(jù)處理若干要點系列論文(一)——現(xiàn)代數(shù)據(jù)處理基本觀念與四字要訣[J].自動化與信息工程,2020,41(1):1-4,9.

[2] 林洪樺.測量誤差分析及數(shù)據(jù)處理若干要點系列論文(二)——隨機(jī)性分布統(tǒng)示法綜論[J].自動化與信息工程,2020, 41(2):1-7.

[3] 林洪樺.測量誤差分析及數(shù)據(jù)處理若干要點系列論文(三)——隨機(jī)性分布統(tǒng)示法推薦應(yīng)用[J].自動化與信息工程,2020,41(3):1-7.

[4] Vladimir N.Vapnik.統(tǒng)計學(xué)習(xí)理論的本質(zhì)[M].張學(xué)工,譯.北京:清華大學(xué)出版社,2000.

[5] 鄧乃揚,田英杰.支持向量機(jī):理論算法與拓展[M].北京:科學(xué)出版社,2009.

[6] 林洪樺.測量誤差與不確定度評估[M].北京:機(jī)械工業(yè)出版社,2010.

[7] 姜焰鳴.多測點平面度誤差智能評定與不確定度分析方法研究[D].廣州:華南理工大學(xué),2012.

[8] 楊曉偉,郝志峰.支持向量機(jī)的算法設(shè)計與分析[M].北京:科學(xué)出版社, 2013.

Some Key Points of Measurement Error Analysis and Data Processing Series Papers (4)——Statistical Learning Theory and Support Vector Machine Method Used for the Evaluation of the Shape and Position Errors

Lin Honghua

(Beijing Institute of Technology, Beijing 100081, China)

This paper expounds the statistical learning theory and the support vector machine method used for the evaluation of the shape and position errors. First of all, the SLT-SVM method and its characteristics are sketched; then, the key points and difficulties of the shape and position errors evaluation for multiple measurement points are detailed described, as well as the basis and the evaluation algorithms of the unified SVM method; finally, the four key points of modern data processing countermeasures are verified: real, good, intelligent and empirical.

data processing; mathematical model; error; uniform expression method

林洪樺,男,1932年生,教授,主要研究方向:測試誤差分析及數(shù)據(jù)處理。

TP274

A

1674-2605(2020)04-0001-05

10.3969/j.issn.1674-2605.2020.04.001

猜你喜歡
數(shù)據(jù)處理測點平面
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
基于MEEMD與相關(guān)分析的行星齒輪箱測點優(yōu)化*
基于低頻功率數(shù)據(jù)處理的負(fù)荷分解方法
玩轉(zhuǎn)高考真題——平面解析幾何篇
無人機(jī)測繪數(shù)據(jù)處理關(guān)鍵技術(shù)及運用
基于CATIA的汽車測點批量開發(fā)的研究與應(yīng)用
立體幾何基礎(chǔ)訓(xùn)練A卷參考答案
基于MATLAB語言的物理實驗數(shù)據(jù)處理探討
參考答案
動量輪診斷測點配置與資源占用度成本評價