国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

極小樣本數(shù)據(jù)的不確定度改進灰色評定方法

2024-01-06 03:20:22朱彥龍程銀寶高宏堂施江煥李亞茹
計量學報 2023年12期
關鍵詞:總溫標準差灰色

朱彥龍, 程銀寶, 高宏堂, 王 燕,施江煥, 羅 哉, 李亞茹

(1.中國計量大學,浙江 杭州 310018; 2.中國計量科學研究院,北京 100029;3.沈陽飛機工業(yè)(集團)有限公司,遼寧 沈陽 110850;4.寧波市計量測試研究院,浙江 寧波 315048)

1 引 言

近年來,非統(tǒng)計不確定度評定方法的研究極大地促進了不確定度理論的發(fā)展,其中灰色系統(tǒng)理論評定不確定度的方法憑借著無需數(shù)據(jù)分布,對小樣本同樣適用[1]等優(yōu)點吸引著不少學者。工程應用中,樣本容量n滿足10≤n≤30時為小樣本,當樣本容量n<10時為極小樣本[2,3]。由于極小樣本數(shù)據(jù)所含的信息量極少,評定其不確定度困難較大,用傳統(tǒng)灰色方法對極小樣本數(shù)據(jù)的不確定度評定問題進行的研究非常少,這些研究表明,經(jīng)典灰色系統(tǒng)理論評定不確定度在從小樣本到極小樣本的過渡過程中,標準差計算結果的相對誤差在迅速增大[4],因此有必要研究灰色系統(tǒng)理論在極小樣本條件下的改進算法。

Ma等通過Bootstrap技術研究小樣本數(shù)據(jù)集的不確定度問題,并用實例分析了該方法的可靠性[5];Wang 等提出了小樣本數(shù)據(jù)的灰自助處理方法,并與灰色系統(tǒng)理論、自助法做了對比,得出結論灰自助法在小樣本動態(tài)信號估計方面具有優(yōu)勢[6];郭曉嫻等通過虛擬樣本增廣方法與Bootstrap方法,對樣本量為1的數(shù)據(jù)進行擴充,進而研究了軸承磨損壽命的可靠性評估問題[7];Cao等混合了虛擬樣本增廣法和Bootstrap法,證明了混合方法比半經(jīng)驗法在解決極小樣本數(shù)據(jù)問題上更加有效[8];王中宇等通過徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡和灰色系統(tǒng)理論解決了小樣本虛擬儀器測量不確定度的評定問題[9];黃家成提出基于灰色系統(tǒng)理論和貝葉斯信息融合理論評定小樣本自動測試系統(tǒng)(automatic test system,ATS)測量不確定度的新方法[10];Han針對小樣本和未知分布提出了一種基于灰色關聯(lián)系數(shù)的測量不確定度的灰色評價方法[11]。

由于極小樣本數(shù)據(jù)的信息缺失較為嚴重,灰色系統(tǒng)理論難以從中提取出規(guī)律,評定不確定度時出現(xiàn)較大偏差,因此,提出改進的灰色不確定度評定方法,認為極小樣本數(shù)據(jù)是一組不平衡數(shù)據(jù)集中的少數(shù)類,通過改進的合成少數(shù)類過采樣技術(synthetic minority oversampling technique,SMOTE)挖掘原始樣本所蘊含的信息,再通過支持向量回歸(support vector regression,SVR)模型從挖掘得到的信息中預測一定量的樣本,最后將所得預測數(shù)據(jù)與原始數(shù)據(jù)融合為灰色小樣本數(shù)據(jù)集,進行灰色不確定度評定。最后通過計算機模擬數(shù)據(jù)與實驗數(shù)據(jù)分別驗證了模型的可靠性和泛化性。

2 不確定度灰色評定原理及改進

2.1 測量不確定度灰色評定原理

灰色系統(tǒng)理論按照顏色來區(qū)分不同的系統(tǒng),其中“灰”是介于“黑”和“白”之間的,黑色系統(tǒng)是指系統(tǒng)的輸入輸出等表層關系已知、系統(tǒng)內(nèi)外部變化關系不明確、系統(tǒng)內(nèi)部結構原理未知的系統(tǒng),白色系統(tǒng)是指系統(tǒng)的所有信息都明確的系統(tǒng),而其他處于兩者之間的系統(tǒng),就是灰色系統(tǒng)。一個測量系統(tǒng)是一個典型的灰色系統(tǒng),測量得到的結果就是灰色量?;疑到y(tǒng)理論提出采用累加生成的數(shù)據(jù)處理方式探求數(shù)據(jù)中的內(nèi)在規(guī)律[12]。

2.2 改進的測量不確定度灰色評定原理

2.2.1 SMOTE原理分析

SMOTE[13]是一種過采樣方法,通過在少數(shù)類樣本之間線性插值以獲得人工合成樣本,改善數(shù)據(jù)的均衡性。運用SMOTE合成新樣本的基本原理如圖1 所示。

圖1 SMOTE合成新樣本原理

設有一少數(shù)類X,樣本量為n,對于每一個少數(shù)類樣本xi,(i=1,2,…,n)通過計算xi與xj(j=1,2,…n且j≠i)之間的距離找到xi的k個近鄰樣本,隨機挑選一個近鄰樣本xl與xi構成一條線段,通過式(1)進行線性插值合成新的樣本xnew。

xnew=xi+rand(0,1)×(xl-xi)

(1)

式中:rand(0,1)指區(qū)間[0,1]上服從均勻分布的隨機數(shù)。上述過程重復N次,可合成(n×N)個樣本。

2.2.2 SVR原理分析

SVR是由支持向量機(SVM)引申出的數(shù)據(jù)回歸模型,其關鍵在于尋找一個能夠使最多樣本點分布在其附近的超平面,對于非線性問題,已知樣本D={(x1,y1),(x2,y2),…,(xn,yn)},設樣本空間的樣本點經(jīng)過映射ψ(x)變換到高維的特征空間,則超平面方程可表示為f(x)=wTψ(x)+b,其中w為超平面的權向量,b為偏置向量。SVR的求解模型為:

(2)

(3)

ε為不敏感損失參數(shù),根據(jù)需要取定。解算后SVR模型的形式[14]如下:

i=1,2,…,n

(4)

2.2.3 改進的測量不確定度灰色評定模型

對于極小樣本的測量數(shù)據(jù)列X,假設其服從某分布P,而服從P分布的所有數(shù)據(jù)構成數(shù)據(jù)集D,則數(shù)據(jù)集D具有不平衡的特性,即已知數(shù)據(jù)列X與未知數(shù)據(jù)列(D-X)的樣本數(shù)量不在同一個數(shù)量級。想要通過X直接估計數(shù)據(jù)集D的參數(shù)較為困難,SMOTE算法思想可以有效地改善數(shù)據(jù)集的不平衡特性。

(5)

設置n為5、q為100、k為3,運用原始的SMOTE算法后,可以發(fā)現(xiàn)式(5)恒大于0,即表明運用原始SMOTE算法合成大量的新樣本將造成數(shù)據(jù)列的離散性降低,改變了極小樣本數(shù)據(jù)列的信息,這與本文將運用SMOTE挖掘極小樣本信息的目的不符。為了能夠改善上述問題,對模型(1)進行改進,將模型中的rand(0,1)改為rand(a,b),其中參數(shù)a、b與原始樣本數(shù)量與合成新樣本的數(shù)量有關,在(0,1)區(qū)間兩側對稱取值。則SMOTE的數(shù)學模型變?yōu)?

xnew=xi+rand(a,b)×(xl-xi)

(6)

為了確定參數(shù)a、b的值,通過計算機隨機生成5 000組極小樣本數(shù)據(jù)列,每組的樣本容量為5,各組單獨進行實驗,則進行SMOTE時n=5、q=100、k=3。每組實驗中,確定最優(yōu)的a、b值,使新合成的樣本與原始樣本混合后的標準差和混合前原始樣本的標準差在保留2位有效數(shù)字的情況下相等。實驗完成后對a、b值進行統(tǒng)計,統(tǒng)計結果詳見圖2。結果表明,a值有99%的概率落在[-0.8,-0.4]范圍內(nèi),b值有99%的概率落在[1.4,1.8]范圍內(nèi),則a、b分別取峰值-0.6和1.6時可以使模型(6)具有最大的泛化性。

圖2 a、b值統(tǒng)計特性

(7)

式中:c稱為灰色常系數(shù),其大小通過計算機算法仿真得到,通??扇?.5。

SMOTE的原理決定了其合成的新樣本具有一定的浮動性,但同一次SMOTE后的若干組預測數(shù)據(jù)的標準差之間滿足統(tǒng)計規(guī)律,對某隨機數(shù)據(jù)列執(zhí)行上述步驟1)~3)后循環(huán)執(zhí)行步驟4)~10) 共5 000次,對5 000次運行結果進行統(tǒng)計,得到如圖3(a)所示的直方圖,由圖可知服從正態(tài)分布,取均值表示此次SMOTE后的數(shù)據(jù)標準差普遍水平。同時,對于同一組原始數(shù)據(jù)進行多次SMOTE后,其普遍水平同樣出現(xiàn)浮動,但浮動幅度到了非常小的范圍,進行5 000次SMOTE后的標準差普遍水平有圖3(b) 直方圖,再取均值即表示此組原始數(shù)據(jù)標準差的水平。

圖3 新合成樣本標準差統(tǒng)計特性

2.3 改進效果分析

經(jīng)典灰色方法對原始數(shù)據(jù)不做處理,直接進行累加生成,因此對樣本容量提出了要求,即對于小樣本及以上樣本容量的數(shù)據(jù),所包含的信息量較多,經(jīng)典灰色方法都可以處理,但卻不適用于極小樣本數(shù)據(jù)。

通過改進,在經(jīng)典的灰色方法中加入了SMOTE-SVR模型,首先對原始數(shù)據(jù)進行處理,通過學習數(shù)據(jù)規(guī)律,將極小樣本擴充到小樣本,再進行累加生成。灰色方法改進前后的區(qū)別如圖4。

圖4 改進前后對比

3 仿真分析

為驗證上文提出方法的可行性,本節(jié)使用計算機對多種分布進行抽樣,模擬測量數(shù)據(jù),不確定度評定過程中,使用較多的數(shù)據(jù)分布類型有正態(tài)分布、均勻分布、三角分布等,則本章對此3種分布類型的模擬數(shù)據(jù)進行驗證。生成9組極小樣本數(shù)據(jù)如表1,其中每組數(shù)據(jù)的樣本容量為5,各組獨立不相關。

表1 模擬生成的9組極小樣本量數(shù)據(jù)

貝塞爾公式和極差法在不確定度評定領域具有普遍的可接受性[15],為了直觀地表示改進的灰色方法相較于經(jīng)典灰色方法的改善能力,以極差法的計算結果作為參考值,定義改善率η如式(8)。

(8)

式中:σimp_g表示改進灰色方法得出的標準差;σg表示經(jīng)典灰色方法得出的標準差;σr表示極差法得出的標準差。η為正則表示具有積極的改善作用。

分別運用貝塞爾公式法、極差法、經(jīng)典灰色方法和改進的灰色方法計算標準差,計算結果如表2。

表2 不同方法計算模擬數(shù)據(jù)標準差

表2數(shù)據(jù)表明,所提出的改進灰色方法的計算結果具有較高的可靠程度:相比于經(jīng)典灰色方法,改進后的灰色方法在結果上有不同程度的正向改善,改善率分布在8.33%~41.18%;表格中數(shù)據(jù)也表明改進的灰色方法具有較好的泛化能力:對多種分布的極小樣本數(shù)據(jù)都表現(xiàn)出適用性。改進的灰色方法更適用于極小樣本數(shù)據(jù)的不確定度評定。

4 實例分析

經(jīng)上述分析,改進的灰色方法在模擬數(shù)據(jù)上具有可靠性,以某航空發(fā)動機高空模擬試驗的空氣流量測量中的總溫數(shù)據(jù)為例,運用極差法、經(jīng)典的灰色方法、改進的灰色方法分別進行不確定度A類評定,通過比較驗證改進的灰色方法在極小樣本量數(shù)據(jù)的不確定度評定中的優(yōu)勢。

圖5為搭建的航空發(fā)動機性能測試系統(tǒng)示意圖,總溫指流量管主流區(qū)中的氣流以絕熱過程完全靜止時,動能全部轉(zhuǎn)化為內(nèi)能時反映出來的溫度[16]。實際測量中,在空氣流量測量截面上,沿周向均勻布置6支測量耙,每支測量耙上有3個總溫探針??倻靥结樀奈恢貌贾梅狭髁抗?等環(huán)面要求,并且每個探針處于所在等環(huán)面的面積中心線上。總溫測量的測量耙與總溫針的布局如圖6所示。

圖5 航空發(fā)動機性能測試系統(tǒng)示意圖

圖6 總溫測靶布局

對每個測靶的3個總溫測點進行5次重復性測量,測量結果見表3。分別運用極差法、經(jīng)典灰色方法、改進的灰色方法計算重復性,結果見表4。分析表4數(shù)據(jù)可知,改進的灰色方法能夠應對航空發(fā)動機高空模擬實驗空氣流量測量中的不同總溫數(shù)據(jù)情況,具有較高的可靠性和泛化性。對于經(jīng)典灰色方法評定的重復性結果與參考值偏差較小的數(shù)據(jù)列,改進的灰色方法評定的重復性結果與經(jīng)典灰色方法一致,對其中少部分數(shù)據(jù)列有改善,最高改善了50.00%;對于經(jīng)典灰色方法評定的重復性結果與參考值偏差較大的數(shù)據(jù)列,改進的灰色方法也有不同程度的改善,最高改善37.50%。

表3 總溫重復性測量數(shù)據(jù)

表4 總溫重復性計算結果

5 結 論

通過提出一種改進的測量不確定度灰色評定模型,以期能夠解決經(jīng)典的測量不確定度灰色評定模型在極小樣本條件下局限性的問題。首先使用模擬的極小樣本數(shù)據(jù)驗證了該模型的可靠性、泛化性,相較于經(jīng)典的灰色方法,改進的灰色方法對不同分布的數(shù)據(jù)均有改善作用,最高改善41.18%。以某航空發(fā)動機高空模擬試驗的空氣流量測量中的總溫數(shù)據(jù)為例,驗證模型的性能,用包括改進的灰色方法在內(nèi)的不同方法評定重復性,改善率最高達50.00%。改進后的灰色方法能夠有效突破經(jīng)典測量不確定度灰色評定的局限性,可為極小樣本的不確定度評定研究提供參考。

猜你喜歡
總溫標準差灰色
3m×2m結冰風洞熱流場品質(zhì)提高及評估
用Pro-Kin Line平衡反饋訓練儀對早期帕金森病患者進行治療對其動態(tài)平衡功能的影響
大型結冰風洞熱流場符合性驗證
淺灰色的小豬
高超音速氣流總溫傳感器設計
灰色時代
Coco薇(2017年2期)2017-04-25 17:59:38
她、它的灰色時髦觀
Coco薇(2017年2期)2017-04-25 17:57:49
感覺
對于平均差與標準差的數(shù)學關系和應用價值比較研究
醫(yī)學科技論文中有效數(shù)字的確定
平泉县| 庄浪县| 高唐县| 罗甸县| 会理县| 咸丰县| 观塘区| 遂溪县| 宜州市| 麻栗坡县| 台东市| 宁蒗| 固原市| 安岳县| 伊川县| 奉贤区| 龙口市| 连江县| 东台市| 青龙| 汨罗市| 滨海县| 咸阳市| 富锦市| 勐海县| 洪江市| 固阳县| 灵宝市| 牟定县| 河曲县| 南康市| 都江堰市| 开化县| 永新县| 吉安县| 莒南县| 三亚市| 沅陵县| 准格尔旗| 海淀区| 汝阳县|