王海星,歐先鋒,涂 兵
(湖南理工學(xué)院 a.機(jī)械工程學(xué)院;b.信息與通信工程學(xué)院;c.復(fù)雜系統(tǒng)優(yōu)化與控制 湖南省普通高等學(xué)校重點(diǎn)實(shí)驗(yàn)室,湖南 岳陽 414006)
駛?cè)虢菍?duì)跑偏測量值的貢獻(xiàn)量分析
王海星a,歐先鋒b,c,涂 兵b,c
(湖南理工學(xué)院 a.機(jī)械工程學(xué)院;b.信息與通信工程學(xué)院;c.復(fù)雜系統(tǒng)優(yōu)化與控制 湖南省普通高等學(xué)校重點(diǎn)實(shí)驗(yàn)室,湖南 岳陽 414006)
在汽車行駛跑偏下線檢測環(huán)節(jié)中常常利用比例換算、代數(shù)加減的方法獲得測試車輛的跑偏值。盡管測試車輛駛?cè)虢侵皇桥芷珳y試結(jié)果的一個(gè)控制變量,影響測試系統(tǒng)跑偏量輸出值的因素眾多。通過分析駛?cè)虢菍?duì)跑偏測量值的貢獻(xiàn)量,同時(shí)對(duì)殘差進(jìn)行分析論證,嚴(yán)格遵循統(tǒng)計(jì)學(xué)和概率論的思維針對(duì)具體情形細(xì)致分析了駛?cè)虢菍?duì)跑偏測試結(jié)果的影響規(guī)律。如何檢驗(yàn)多維正態(tài)分布是工程應(yīng)用中的棘手問題,本文從變量背后的實(shí)際意義出發(fā),創(chuàng)造性地通過計(jì)算變量之間的任意線性組合,轉(zhuǎn)化為運(yùn)用正態(tài)概率紙檢驗(yàn)一維正態(tài)性問題,分析所得結(jié)果均符合理論和實(shí)際情況。實(shí)際應(yīng)用中,如何透視出大量數(shù)據(jù)背后的內(nèi)在規(guī)律,本文相關(guān)處理思路與方法富有借鑒意義。
行駛跑偏;殘差分析;正態(tài)性檢驗(yàn)
目前,基于機(jī)器視覺和圖像處理的汽車行駛跑偏自動(dòng)檢測系統(tǒng)[1]通過安裝在龍門架上的工業(yè)相機(jī)采集車輛在測試點(diǎn)處的高分辨率圖像,通過主機(jī)對(duì)圖像的識(shí)別和處理,計(jì)算出車輛在測試路段上的跑偏量、跑偏方向及行駛速度,同時(shí)計(jì)算車輛的駛?cè)虢荹2]。檢測系統(tǒng)要求試車員必須在測試準(zhǔn)備區(qū)調(diào)整汽車行駛方向與道路中心基準(zhǔn)線對(duì)齊,并且達(dá)到直線行駛的穩(wěn)定狀態(tài)后,才能進(jìn)行檢測。事實(shí)上,測試車輛的駛?cè)虢钦`差必定存在。盡管汽車出現(xiàn)行駛跑偏的故障跟駛?cè)虢侵g并非因果關(guān)系,但在進(jìn)行跑偏測試的實(shí)際操作過程中,由于試車員操作上的疏忽,容易導(dǎo)致由檢測系統(tǒng)所計(jì)算出的實(shí)際汽車行駛測量值因?yàn)檐囕v駛?cè)虢嵌戎档奈⑿∽兓薮蟮恼`差[3],甚至引起檢測系統(tǒng)對(duì)測試車輛本身是否存在行駛跑偏故障的誤判。因此,本文通過分析駛?cè)虢菍?duì)跑偏測量值的貢獻(xiàn),揭示駛?cè)虢菍?duì)跑偏測試結(jié)果的影響規(guī)律,為后續(xù)優(yōu)化跑偏量的計(jì)算方法[4]、提高系統(tǒng)測試精度提供理論依據(jù)。
在應(yīng)用統(tǒng)計(jì)學(xué)中,常常需要根據(jù)實(shí)際觀測結(jié)果來檢驗(yàn)隨機(jī)變量之間的獨(dú)立性。一般而言,若總體中的個(gè)體能夠根據(jù)不同的屬性A與B進(jìn)行分類,根據(jù)屬性A的所有可能取值不同分成r個(gè)不同組A1,A2,...,Ar;根據(jù)屬性B的所有可能取值不同又分成s個(gè)不同組B1,B2,...,Bs;對(duì)(X,Y)進(jìn)行n次獨(dú)立觀測分別記錄事件(X∈Ai,Y∈Bj)出現(xiàn)的頻數(shù)mij(i=1,2,...,r;j=1,2,...,s),將所得結(jié)果列成r×s格列聯(lián)表。
列聯(lián)表從應(yīng)用統(tǒng)計(jì)學(xué)的角度證明各個(gè)屬性彼此有無關(guān)聯(lián),也就是表明各個(gè)屬性獨(dú)不獨(dú)立[5]。在本文中,要分析駛?cè)虢荴對(duì)跑偏測量值Y的貢獻(xiàn)量,首先要證明X與Y是否有關(guān)?
取統(tǒng)計(jì)量
(1)
當(dāng)原假設(shè)H0成立時(shí),且n很大時(shí),由擬合優(yōu)度檢驗(yàn)可知
χ2~χ2(υ),υ=(r-1)(s-1)
(2)
即上述統(tǒng)計(jì)量近似服從χ2分布[6],統(tǒng)計(jì)量對(duì)應(yīng)的自由度為(r-1)(s-1)。
并且可得H0的拒絕域?yàn)?/p>
(3)
記測試車輛駛?cè)虢菧y量值為隨機(jī)變量X,車輛行駛跑偏測量值為隨機(jī)變量Y。作出它們的交叉列聯(lián)表,進(jìn)行變量之間獨(dú)立性關(guān)系的檢驗(yàn)[7]。
將從檢測線反饋的X和Y值,按照駛?cè)虢谴笮『团芷珳y量值的合格標(biāo)準(zhǔn)分類記錄到表1中。
表1 (X,Y)數(shù)據(jù)點(diǎn)交叉列聯(lián)表
卡方統(tǒng)計(jì)檢驗(yàn)用于檢驗(yàn)交叉列聯(lián)表中變量之間的相互獨(dú)立性問題,相應(yīng)的假設(shè)檢驗(yàn)原理為:
給定原假設(shè)H0:列變量與行變量二者相互獨(dú)立。
如果原假設(shè)成立,則期望頻數(shù)為:
(4)
其中:ri為第i行所有頻數(shù)之和;cj為第j列所有頻數(shù)之和;n是樣本容量。
經(jīng)計(jì)算,X和Y期望頻數(shù)分布如表2所示。
表2 (X,Y)數(shù)據(jù)點(diǎn)期望頻數(shù)
構(gòu)造χ2統(tǒng)計(jì)量
(5)
其中:fij,eij分別是第i行j列所表示類別的實(shí)際頻數(shù)、期望頻數(shù)。列表計(jì)算如表3所示。
χ2統(tǒng)計(jì)量計(jì)算結(jié)果為:
(6)
由于,當(dāng)H0成立時(shí),且n很大時(shí),可以得到如下關(guān)系:
χ2~χ2(υ),υ=(r-1)(s-1)
(7)
并且可得H0的拒絕域?yàn)?/p>
(8)
根據(jù)χ2統(tǒng)計(jì)量表,查得拒絕域臨界取值為:
(9)
因?yàn)?/p>
(10)
故拒絕H0:列變量Y與行變量X之間相互獨(dú)立。
一般而言,χ2值越小,表明兩變量間的關(guān)系越弱;χ2值越大,表明兩個(gè)變量間的關(guān)系越強(qiáng)[8]。
由顯著性水平α=0.005可知,有99.995%的把握認(rèn)為測試車輛駛?cè)虢荴與車輛行駛跑偏量Y之間不獨(dú)立,存在關(guān)聯(lián)。
接下來分情況討論X與Y之間的關(guān)系。
Y的觀測值落在合理的取值區(qū)間范圍內(nèi),即Y的取值區(qū)間為[-40,30],而X的取值>40′。這種情形所對(duì)應(yīng)的實(shí)際情況是:進(jìn)行車輛行駛跑偏檢測時(shí),駕駛員沒有嚴(yán)格遵從操作規(guī)程,在駕駛汽車通過試驗(yàn)準(zhǔn)備區(qū)的過程中,沒有利用試驗(yàn)道路地面中心基準(zhǔn)線很好地引導(dǎo)調(diào)整汽車車身縱軸線與基準(zhǔn)對(duì)齊,而是車輛駛?cè)虢窍蛴移?。且由行駛跑偏自?dòng)檢測系統(tǒng)計(jì)算所得的Y落在合格范圍[-40,30]內(nèi),說明測試車輛本身并沒有嚴(yán)重的行駛跑偏現(xiàn)象(或故障)。該情形下樣本數(shù)據(jù)取值分布狀況如表4所示。
表4 樣本數(shù)據(jù)取值分布狀況
首先嘗試采用簡諧函數(shù)和的形式進(jìn)行初步擬合,其表達(dá)式形式為:
(11)
經(jīng)計(jì)算各項(xiàng)系數(shù)取值如表5所示。
2.1.1 相關(guān)指數(shù)R2評(píng)價(jià)
實(shí)際應(yīng)用中常常通過相關(guān)指數(shù)R2來評(píng)價(jià)回歸擬合的實(shí)際效果。
(12)
表5 各項(xiàng)系數(shù)取值
上述采用簡諧函數(shù)和的形式進(jìn)行初步擬合分析計(jì)算說明,X與Y數(shù)據(jù)點(diǎn)的分布具有很大的波動(dòng)性。
測試車輛行駛跑偏量除了受車輛駛?cè)虢堑挠绊懲?,還受很多其他因素的影響,例如裝配過程、車輛質(zhì)心位置、輪胎錐形側(cè)向力、輪胎氣壓、阻滯力、車輪定位參數(shù)等等。事實(shí)上,我們無法知道X和Y之間的確切關(guān)系是什么,這種情況下,由于Y在合格區(qū)間[-40,30]內(nèi),表明單從車輛行駛跑偏檢測的指標(biāo)來說,汽車沒有行駛跑偏的故障(或問題)。而經(jīng)由行駛跑偏自動(dòng)檢測系統(tǒng)測量得的Y并不為0,Y介于向左跑偏25 cm到向右跑偏19.7 cm之間,與之相對(duì)應(yīng)的X超過40′,屬于X偏大的情形。為此,可以推斷Y與X較大之間存在著密切關(guān)聯(lián)。
另外,根據(jù)對(duì)樣本數(shù)據(jù)的觀測,Y與X之間有線性回歸的趨勢。因此,可以嘗試用樣本建立變量之間的線性回歸模型。線性回歸模型的整體表達(dá)式可采用如下形式:
(14)
b和a是模型的未知參數(shù),ε是y與Ey=bx+a之間的隨機(jī)誤差。一般而言,ε的均值E(ε)=μ(一般接近于0),方差D(ε)=σ2>0。
這里只是利用線性回歸方程來近似這種關(guān)系。產(chǎn)生隨機(jī)誤差ε受上面所有提及的影響因素以及近似關(guān)系的制約,還有斜率與截距的估算誤差等等。
根據(jù)問題需選取X為自變量x,Y為因變量y,經(jīng)計(jì)算
可知回歸方程為:
y=-2.372 8+0.019 7x
(15)
2.2.1 檢驗(yàn)?zāi)P?殘差作分析
圖1 回歸分析所得殘差
從圖1能夠看出,除第15、44個(gè)數(shù)據(jù)外,樣本數(shù)據(jù)中其他殘差分布都聚集在零點(diǎn)附近,同時(shí)零點(diǎn)都包括在殘差所對(duì)應(yīng)的置信水平的區(qū)間以內(nèi),上述觀察表明原始樣本數(shù)據(jù)同所選的回歸模型y=-2.372 8+0.019 7x符合程度很高。而第15、44個(gè)數(shù)據(jù)點(diǎn)則屬于原始樣本中的異常點(diǎn)。
另外,對(duì)殘差作分析,檢驗(yàn)看它是否服從正態(tài)分布,是否與前文中所提出的假設(shè)相一致。
1)作殘差概率的具體分布圖如圖2所示。
圖2 殘差概率的具體分布
由圖2可知,殘差可能服從正態(tài)分布,因此,為了確認(rèn)殘差分布情況有必要對(duì)殘差作正態(tài)性檢驗(yàn)。
2)經(jīng)由殘差分布的正態(tài)性檢驗(yàn)可知,殘差數(shù)據(jù)分布在某一條直線的附近。
3)參數(shù)估計(jì)。估計(jì)出該殘差的均值為2.035 4e-016,非常接近零。方差為9.192 82,均值的0.95置信區(qū)間是[-2.669 3,2.669 3],方差0.95的置信區(qū)間是[7.652 7,11.514 7]。
4)假設(shè)檢驗(yàn):已知回歸分析的殘差服從正態(tài)分布,在正態(tài)分布的方差不已知的情形下,檢驗(yàn)它的期望均值與0是否相等。檢驗(yàn)結(jié)果:h=0, sig=1,ci=[-2.669 3, 2.669 3]。
檢驗(yàn)結(jié)果分析:布爾變量h=0表示不可以拒絕原假設(shè),說明第4)步所提出的假設(shè)——回歸分析所得的殘差其均值等于零是合理的;95%的置信區(qū)間是[-2.669 3, 2.669 3],它完全包括0,且精度很高; sig=1,比0.5大很多,沒有理由去拒絕原假設(shè)。
上述對(duì)回歸模型所得的殘差分析表明,駛?cè)虢桥c跑偏量之間有很強(qiáng)的線性關(guān)系,從而也表明所建立的回歸模型是有意義的。
X與Y的觀測值都落在合理的取值區(qū)間范圍內(nèi),即X在[-60,40],Y在[-40,30]。這種情形所對(duì)應(yīng)的實(shí)際情況是,進(jìn)行車輛行駛跑偏的檢測時(shí),駕駛員較為嚴(yán)格遵從操作規(guī)程,在駕駛員駕駛汽車通過試驗(yàn)準(zhǔn)備區(qū)的過程中,利用試驗(yàn)道路地面中心基準(zhǔn)線引導(dǎo)較好地調(diào)整了汽車車身縱軸線與基準(zhǔn)對(duì)齊。而且由行駛跑偏自動(dòng)檢測系統(tǒng)計(jì)算所得的Y值落在合格范圍[-40,30]內(nèi),說明測試車輛不存在嚴(yán)重的行駛跑偏現(xiàn)象(或故障)。
采用相關(guān)系數(shù)法來檢驗(yàn)X與Y之間是否存在著線性關(guān)系。相關(guān)系數(shù)的計(jì)算表達(dá)式為
(16)
通常當(dāng)|ρXY|<0.3時(shí),表示二者之間微相關(guān);當(dāng)0.3≤|ρXY|≤0.5時(shí),表示二者之間實(shí)相關(guān);當(dāng)0.5<|ρXY|≤0.8時(shí),表示二者之間顯著相關(guān);當(dāng)0.8<|ρXY|≤1時(shí),表示二者之間高度相關(guān)[9]。
上述情況中,代入數(shù)據(jù)后可以計(jì)算出X與X的相關(guān)系數(shù)ρXY=0.17,表明X和Y之間的線性相關(guān)性很微弱。
接下來檢驗(yàn)X與Y之間是否存在其他的可能關(guān)系。由X與Y構(gòu)成的點(diǎn)(X,Y)在平面XOY內(nèi)散點(diǎn)圖與二維分布直方圖如圖3所示。
已知X與Y都服從正態(tài)分布,且有,
X~N(-25.41,162)
Y~N(-2.56,10.82)
現(xiàn)在,記X與Y的任意線性組合為隨機(jī)變量Z,即Z=aX+bY。其中a,b為任意實(shí)數(shù)。繪制Z的經(jīng)驗(yàn)分布函數(shù)[10]如圖4所示。
從圖4可以看出,對(duì)于任意給定的一組實(shí)數(shù)a,b,Z的經(jīng)驗(yàn)分布函數(shù)曲線迅速上升,斜率越來越大,圖像曲線呈S型,超過曲線軌點(diǎn)后,經(jīng)驗(yàn)分布函數(shù)斜率逐漸減小,曲線平緩上升,經(jīng)驗(yàn)分布函數(shù)圖像的上述曲線特征揭示X與Y任意線性組合后的Z很可能服從正態(tài)分布。
從隨機(jī)變量概率紙檢驗(yàn)結(jié)果可知,任意給定的一組實(shí)數(shù),隨機(jī)變量數(shù)據(jù)樣本集中分布在對(duì)應(yīng)的參考直線附近;少數(shù)情形下,隨機(jī)變量數(shù)據(jù)樣本分布有些偏離對(duì)應(yīng)的參考直線,原因可能在于所討論的數(shù)據(jù)范圍內(nèi),兩隨機(jī)變量與取值區(qū)間的長度不完全一致,X取值范圍更大一些。因此,排除兩隨機(jī)變量取值區(qū)間上的差異,任意給定的一組實(shí)數(shù)a,b,隨機(jī)變量Z服從正態(tài)分布。因此,任意線性組合Z=aX+bY服從一維正態(tài)分布,由隨機(jī)變量X與Y構(gòu)成的二維隨機(jī)變量(X,Y)服從二維正態(tài)分布。
圖3 隨機(jī)點(diǎn)(X,Y)的分布
圖4 X與Y任意線性組合的經(jīng)驗(yàn)分布
盡管X與Y獨(dú)立包含了X,Y不相關(guān),但反過來,X,Y不相關(guān),X與Y可以不獨(dú)立。也就是說,“獨(dú)立”這個(gè)概念要比“不相關(guān)”這個(gè)概念強(qiáng)。然而,如果由X和Y構(gòu)成的二維隨機(jī)變量(X,Y)在服從二維正態(tài)分布的情形下,X和Y二者不相關(guān)跟X和Y二者相互獨(dú)立是完全等價(jià)互推的概念。
1) 在上述情形下,計(jì)算出相關(guān)系數(shù)ρ=0.17??梢钥闯鱿嚓P(guān)系數(shù)ρXY的值很小。
2) 下面將X的數(shù)據(jù)研究區(qū)域定位到更小的范圍,如X的2σ區(qū)間為[-40,26]。處于該區(qū)域內(nèi)的樣本數(shù)據(jù)如表6所示
表6 X的1σ區(qū)間樣本數(shù)據(jù)取值分布狀況
經(jīng)計(jì)算X的1σ區(qū)間內(nèi)的樣本數(shù)據(jù)之間的相關(guān)系數(shù)ρXY=0.06。
3) 繼續(xù)將X的數(shù)據(jù)研究區(qū)域定位到[-24,10]。處于該區(qū)域內(nèi)的樣本數(shù)據(jù)如表7所示
表7 X的2σ區(qū)間樣本數(shù)據(jù)取值分布狀況
經(jīng)計(jì)算,X的2σ區(qū)間內(nèi)的樣本數(shù)據(jù)之間的相關(guān)系數(shù)X。
上述計(jì)算說明,隨著X范圍的縮小,X與X之間的相關(guān)系數(shù)X越來越小,同時(shí),(X,Y)服從二維正態(tài)分布,因此,隨著X范圍的縮小,X與Y之間的獨(dú)立性越來越強(qiáng),特別是在X的1σ取值區(qū)間[-24,10]內(nèi),它們二者的相關(guān)系數(shù)ρXY=0.06,非常接近于0,可以認(rèn)為X與Y之間是獨(dú)立的,因此X對(duì)Y的貢獻(xiàn)量可以忽略不計(jì)。
由測試系統(tǒng)輸出的跑偏量由三部分構(gòu)成:駛?cè)虢菍?duì)跑偏測量值的貢獻(xiàn)量;不受駛?cè)虢怯绊懙呐芷抗潭ㄖ挡糠?樣本回歸方程的截距);其他未知因素產(chǎn)生的隨機(jī)部分(殘差ε)。
盡管在整個(gè)區(qū)間范圍內(nèi),X與Y之間不獨(dú)立,但在較小的X取值范圍內(nèi),可以認(rèn)為X與Y是相互獨(dú)立的,X對(duì)Y的貢獻(xiàn)量很小,可以忽略不記。這是因?yàn)檐囕v行駛跑偏是由很多隨機(jī)因素共同決定的一個(gè)隨機(jī)事件,只有當(dāng)X很大時(shí),它對(duì)Y的貢獻(xiàn)量才很大,才會(huì)對(duì)測試系統(tǒng)中Y的輸出值產(chǎn)生較大的影響。因此,在跑偏測試過程中測試車輛駛?cè)虢鞘桥芷Y(jié)果的一個(gè)不可或缺的控制因素。同時(shí),對(duì)于沒有行駛跑偏故障的測試車輛,即Y∈[-40,30],只要X調(diào)整在合理的取值范圍內(nèi),則對(duì)Y的影響可以忽略不計(jì)。
[1]楊燦.基于LabVIEW的汽車行駛跑偏測試系統(tǒng)研究開發(fā)[D].武漢:武漢理工大學(xué),2010.
[2]崔淑娟.車輛跑偏在線自動(dòng)檢測系統(tǒng)的圖像處理技術(shù)研究[D].武漢:武漢理工大學(xué),2010.
[3]廖聰.基于汽車跑偏檢測系統(tǒng)對(duì)車輛行駛跑偏的原因和解決對(duì)策的研究[D].武漢:武漢理工大學(xué),2012.
[4]魯力.汽車行駛跑偏測試系統(tǒng)的設(shè)計(jì)改進(jìn)與軟件優(yōu)化[D].武漢:武漢理工大學(xué),2012.
[5]佟毅.關(guān)于隨機(jī)變量獨(dú)立性的研究[J].石油化工高等學(xué)校學(xué)報(bào),1994(3):71-74.
[6]應(yīng)堅(jiān)剛,何萍.概率論[M].上海:復(fù)旦大學(xué)出版社,2006.
[7]張宏禮,王苫社,周曉晶,等.隨機(jī)變量獨(dú)立性的一個(gè)注記[J].高等數(shù)學(xué)研究,2010,13(1):114-115.
[8]何書元.概率論[M].北京:北京大學(xué)出版社,2006.
[9]賀昌政,梁元第,王桵.數(shù)學(xué)建模導(dǎo)論[M].成都:成都科技大學(xué)出版社,1997.
[10]張德豐.Matlab概率與數(shù)理統(tǒng)計(jì)分析[M].北京:機(jī)械工業(yè)出版社,2010.
ContributionAnalysisofEnteringAngletoWanderringTestValues
WANGHaixinga,OUXianfengb,c,TUBingb,c
(a.School of Mechanical Engineering;b.College of Information & Communication Engineering; c. Key Laboratory of Optimization & Control for Complex Systems, Hunan Institute of Science and Technology, Yueyang 414006, China)
Wandering test value is usually obtained through algebraic add and scaling conversion in the wandering test session. The output result of test system is influenced by plenty of factors, and the entering angle is just one of control variable. In this paper, the relationship between entering angle and wandering test value was elaborated according to the statistics thinking mode strictly. Meanwhile, in terms of different cases, the contribution of entering angle to wandering test values was analyzed with residual analysis as well. It is a hot potato as to the verification for the multidimensional normal distribution in engineering application. Based on the actual meaning of the variables, the verification for the multidimensional normal distribution was creatively converted to one-dimensional normality test via normal probability coordinate paper through calculating random linear combination between variables. And the obtained results are in line with the actual situation. The relevant solutions making for discovering the inherent relationship beneath mass data in this paper has a certain reference value.
driving wandering; residual analysis; normal distribution test
10.13542/j.cnki.51-1747/tn.2017.04.006
2017-09-16
國家自然科學(xué)基金項(xiàng)目(51704115);湖南省自然科學(xué)基金項(xiàng)目(2017JJ3099);湖南省科技計(jì)劃項(xiàng)目(2016TP1021);湖南省教育廳科學(xué)研究項(xiàng)目(16C0723)
王海星(1990—),男,講師,碩士,研究方向:汽車測試技術(shù)。
歐先鋒(1983—),男,講師,博士,研究方向:圖像處理/視頻壓縮編碼及傳輸,電子郵箱:ouxf@hnist.edu.cn。
U464.32,U462
A
2095-5383(2017)04-0027-05