朱 亮,李東波,何 非,童一飛,袁延強(qiáng)
(1.南京理工大學(xué)機(jī)械工程學(xué)院,210094南京;2.南京三埃工控股份有限公司,211100南京)
散狀物料連續(xù)稱重設(shè)備工作環(huán)境惡劣且長(zhǎng)時(shí)間高荷載作業(yè),致使計(jì)量精度失準(zhǔn)以及各種設(shè)備故障頻繁發(fā)生,直接造成大量貿(mào)易經(jīng)濟(jì)損失;同時(shí)其故障維修服務(wù)也一直困擾著用戶和廠家,大部分故障都要派遣經(jīng)驗(yàn)豐富的專業(yè)人員進(jìn)行現(xiàn)場(chǎng)診斷維修,致使故障診斷維修成本一直居高不下;此外,許多故障都是在貿(mào)易運(yùn)輸過(guò)程中產(chǎn)生的,需要及時(shí)檢測(cè)、診斷及維修,以避免更多經(jīng)濟(jì)損失[1].散狀物料連續(xù)稱重設(shè)備使用較多的有電子皮帶秤、視覺(jué)秤、核子秤等,雖然稱重原理不同,但設(shè)備的數(shù)據(jù)形態(tài)具有很大的相似性,都會(huì)隨著流量的變化而變化,故本文以電子皮帶秤為代表、研究散狀物料連續(xù)稱重設(shè)備故障在線檢測(cè)和診斷.隨著計(jì)量精度要求的不斷提高,電子皮帶秤已從單稱重傳感器發(fā)展到多稱重傳感器,其故障在線檢測(cè)和診斷的主要途徑是對(duì)其多個(gè)稱重傳感器的數(shù)據(jù)進(jìn)行在線檢測(cè)、分析、挖掘,以提取正常數(shù)據(jù)點(diǎn),分離故障信息,最終識(shí)別故障數(shù)據(jù),其實(shí)質(zhì)是一個(gè)在線“聚類&多分類”的問(wèn)題.
在故障信息分離階段,應(yīng)用聚類算法可降低故障數(shù)據(jù)維度,減少后續(xù)識(shí)別模型的訓(xùn)練時(shí)間,從而大大提高故障識(shí)別效率.聚類是無(wú)監(jiān)督學(xué)習(xí)算法,算法簡(jiǎn)單且效率高,對(duì)隨機(jī)性信號(hào)具有很強(qiáng)的魯棒性.Khediri等[2]將核k-means聚類算法應(yīng)用于故障數(shù)據(jù)前處理,Alaei等[3]提出一種基于WFCM聚類的在線故障檢測(cè)方法,李亞敏等[4]將相似性傳播聚類算法引入到航空發(fā)動(dòng)機(jī)突發(fā)故障診斷中.但文獻(xiàn)[2-3]中需要提前指定聚類類數(shù),文獻(xiàn)[4-5]在處理含噪聲數(shù)據(jù)時(shí)不太理想[5].DENCLUE(density-based clustEring)算法是一種基于核密度估計(jì)(Kernel Density Estimationbased)的聚類算法[6],無(wú)需提前指定聚類類數(shù)和聚類中心,而且對(duì)噪聲具有很好的免疫效果[7-8],但對(duì)密度不均勻的數(shù)據(jù)魯棒性不好.
在狀態(tài)識(shí)別的多分類階段,機(jī)械設(shè)備故障樣本的難以獲取制約了人工神經(jīng)網(wǎng)絡(luò)等智能診斷方法的發(fā)展和應(yīng)用[9-10].基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(support vector machine SVM)是一種針對(duì)有限樣本的通用機(jī)器學(xué)習(xí)方法,能夠避免過(guò)學(xué)習(xí)、局部極值等問(wèn)題,有比神經(jīng)網(wǎng)絡(luò)更好的泛化性能[11],通過(guò)引入再生核理論避免了維數(shù)災(zāi)難,成功解決了高維非線性問(wèn)題,已廣泛應(yīng)用于故障診斷[12-14].故障診斷中常用的SVM多分類器主要有:“一對(duì)一”(1-a-1)、“一對(duì)其余”(1-a-r)、二叉樹(shù)和決策導(dǎo)向無(wú)環(huán)圖(decision directed acyclic graph DDAG)等等[15].本文采用二叉樹(shù)支持向量機(jī)(Binary Tree SVM),BTSVM 與 1-a-1、1-a-r、DDAG等組合策略相比,具有分類器數(shù)目少,不存在不可識(shí)別區(qū)域,分類速度快以及嚴(yán)格的泛化誤差理論[16-17]等優(yōu)點(diǎn),廣泛應(yīng)用于在線故障識(shí)別.
本文提出一種改進(jìn)型DENCLUE聚類算法,將其應(yīng)用于電子皮帶秤在線故障檢測(cè),并提出一種二叉樹(shù)設(shè)計(jì)方法,結(jié)合二叉樹(shù)SVM對(duì)電子皮帶秤進(jìn)行在線故障識(shí)別.通過(guò)試驗(yàn)對(duì)本文診斷模型性能進(jìn)行驗(yàn)證.
電子皮帶秤稱重傳感器數(shù)據(jù)會(huì)隨著其瞬時(shí)流量的變化而變化,故其未知的故障數(shù)據(jù)也隨之變化,難以識(shí)別.正常數(shù)據(jù)點(diǎn)以及相同故障的數(shù)據(jù)點(diǎn)由于相似性極高會(huì)以集簇的形式出現(xiàn),故本文基于無(wú)監(jiān)督學(xué)習(xí)思想,通過(guò)在數(shù)據(jù)空間中進(jìn)行集簇聚類,分離正常數(shù)據(jù)點(diǎn)和故障數(shù)據(jù)點(diǎn),實(shí)現(xiàn)在線故障檢測(cè).在線故障診斷即在檢測(cè)出故障后,判別故障為哪一種已知的故障模式,是有監(jiān)督學(xué)習(xí)的多分類問(wèn)題.綜上所述,電子皮帶秤的故障在線檢測(cè)和診斷是一個(gè)在線“聚類&多分類”的問(wèn)題.
本文結(jié)合DENCLUE聚類與BTSVM分類器對(duì)電子皮帶秤進(jìn)行故障在線檢測(cè)和診斷.在線故障檢測(cè)時(shí),采用基于DENCLUE的算法對(duì)實(shí)時(shí)采集到的稱重傳感器數(shù)據(jù)進(jìn)行在線聚類分析,提取正常傳感器數(shù)據(jù).得到正常數(shù)據(jù)后,若正常數(shù)據(jù)數(shù)目等于傳感器總數(shù),則無(wú)故障;若)<#(Dt),則存在故障.
在線故障診斷是在檢測(cè)到故障后,采用已訓(xùn)練好的BTSVM分類器,以正常傳感器數(shù)據(jù)的平均值、各現(xiàn)場(chǎng)環(huán)境數(shù)據(jù)以及原始數(shù)據(jù)為故障樣本特征,對(duì)多類故障進(jìn)行在線故障模式識(shí)別,具體流程如圖1.
圖1 電子皮帶秤故障在線檢測(cè)和診斷流程
DENCLUE算法是一種基于密度的聚類算法,采用基于網(wǎng)格的方法提高了性能,其核心思想是采用核密度估計(jì)對(duì)數(shù)據(jù)空間中每點(diǎn)密度建模,并以自然的方式定義以密度吸引子(密度估計(jì)函數(shù)的局部極值點(diǎn))為核心的集簇.
定義1 若函數(shù)K:Rm→R滿足且∫RmK(x)dx=1,則K為一核函數(shù).
樣本點(diǎn)xt∈X?Rm,m∈N對(duì)其周圍點(diǎn)x∈X的影響函數(shù)可用核函數(shù)表示,若用高斯核函數(shù),有
數(shù)據(jù)空間D={x1,x2,…,xn}?Rm,m,n∈N中任一點(diǎn)x的密度估計(jì)為其他所有樣本點(diǎn)對(duì)該點(diǎn)影響函數(shù)之和,即
定義2 點(diǎn)x∈D密度吸引于密度吸引子x*,當(dāng)且僅當(dāng)開(kāi)始于x的爬山算法最后收斂于x*.DENCLUE算法中的多中心類定義見(jiàn)定義3.
定義3 集合C?D為一關(guān)于參數(shù)σ、ξ的多中心類,當(dāng)且僅當(dāng)其滿足:
1)?x∈C?x*∈X:fD(x*)≥ξ,且x密度吸引于x*,其中X為密度吸引子集合;
在上述定義基礎(chǔ)上,DENCLUE聚類(見(jiàn)圖2)步驟如下:
1)推導(dǎo)空間D中數(shù)據(jù)點(diǎn)的密度函數(shù);
2)對(duì)于任意密度吸引子,將密度吸引于其的點(diǎn)定義為一簇;
3)丟棄密度函數(shù)值小于噪聲閾ξ值的簇及點(diǎn);
4)根據(jù)定義3合并相關(guān)簇.
圖2 DENCLUE聚類示意
雖然DENCLUE算法有諸如抗噪聲能力強(qiáng),能發(fā)現(xiàn)任意形狀簇等優(yōu)點(diǎn),但同時(shí)也存在著嚴(yán)重的缺陷,例如算法復(fù)雜度比其他基于密度的聚類算法要大,處理密度不相同簇的數(shù)據(jù)時(shí)不具有很好魯棒性等.因此,若要將其引入到電子皮帶秤在線故障檢測(cè)還有待改進(jìn).
稱重傳感器在線故障檢測(cè)
在實(shí)際情況中,故障點(diǎn)相對(duì)于正常數(shù)據(jù)點(diǎn)是少量的,因此可作出以下合理假設(shè):
若Dt為t時(shí)刻N(yùn)個(gè)稱重傳感器、含有k(未知)類故障的樣本數(shù)據(jù)為正常傳感器數(shù)據(jù)點(diǎn)集合為第i類故障樣本點(diǎn)集合,則集合Dt0中元素?cái)?shù)目大于任一故障集合中數(shù)目,即
本文基于上述假設(shè),提出采用在線聚類分析提取正常傳感器數(shù)據(jù)點(diǎn),分離故障數(shù)據(jù)以檢測(cè)故障.在線提取正常傳感器數(shù)據(jù)點(diǎn)有兩種思路:一是采用諸如DBSCAN、DENCLUE、模糊系統(tǒng)聚類無(wú)需提前指定類數(shù)k的聚類算法,將t時(shí)刻數(shù)據(jù)點(diǎn)集合Dt聚類成{C1,C2,…,Ck},然后得到二是直接將正常數(shù)據(jù)從數(shù)據(jù)背景中提取出來(lái).后者比前者直接、簡(jiǎn)單、效率高,更適合在線.本文基于第二種思路,對(duì)DENCLUE算法進(jìn)行改進(jìn),具體改進(jìn)如下:
1)采用相似系數(shù)r(xt,x)替代距離函數(shù)d(xt,x).
電子皮帶秤在不同輸送流量時(shí),稱重傳感器數(shù)據(jù)點(diǎn)集合Dt內(nèi)密度不相同,d(xt,x)的分布也有較大變化,DENCLUE需采用不同噪聲閾值ξ和平滑因子σ才能將故障數(shù)據(jù)點(diǎn)與正常數(shù)據(jù)點(diǎn)分開(kāi),即DENCLUE處理不同流量數(shù)據(jù)時(shí)不具有很好魯棒性.針對(duì)這一問(wèn)題,本文采用相似系數(shù)替代距離函數(shù)d(xt,x)、并重新構(gòu)造密度估計(jì)函數(shù)以提高算法魯棒性.相似函數(shù)為
2)選取動(dòng)態(tài)噪聲閾值,提取正常傳感器數(shù)據(jù)點(diǎn).以全局極值點(diǎn)作為全局密度吸引子,再選取動(dòng)態(tài)噪聲閾值ξ=λ·f
D(x*),λ∈(0,1),提取正常數(shù)據(jù)點(diǎn)集合ξ,x∈Dt},余下的噪聲信號(hào)即為故障數(shù)據(jù).Dt0中可能有多個(gè)吸引子,但符合定義3.
通過(guò)改進(jìn)2),算法只需找出全局密度吸引子、無(wú)需找全所有,采用閾值過(guò)濾出正常數(shù)據(jù)點(diǎn)、取代了原算法中的2)、3)、4)步驟,將原先的多類聚類算法化簡(jiǎn)為二類聚類,大大降低了算法復(fù)雜度,更適合在線.改進(jìn)后算法具體步驟如下:
Step 1 采用相似系數(shù)r(xt,x)構(gòu)造相似核函數(shù):
顯然,式(2)符合定義1.再將式(2)代入式(1)得相似密度估計(jì)函數(shù):
Step 2 尋找全局密度吸引子x*,提取正常數(shù)據(jù)點(diǎn)簇
圖3 改進(jìn)型DENCLUE聚類示意圖
對(duì)于N類問(wèn)題,二叉樹(shù)SVM采用二叉樹(shù)結(jié)構(gòu)構(gòu)造N-1個(gè)分類器.二叉樹(shù)的層次結(jié)構(gòu)有兩種:一種是在每個(gè)內(nèi)節(jié)點(diǎn)處,由一個(gè)類與剩下的類構(gòu)造分割面,即偏二叉樹(shù);另一種是在內(nèi)節(jié)點(diǎn)處,可以是多個(gè)類與多個(gè)類的分割[18].本文采用偏二叉樹(shù)結(jié)構(gòu)SVM進(jìn)行故障診斷.
BTSVM整體分類性能主要與二叉樹(shù)生成順序、節(jié)點(diǎn)位置有關(guān),越是上層節(jié)點(diǎn),SVM的分類性能(分類間隔大)對(duì)BTSVM模型分類性能影響越大.為了減少誤差積累,以及讓分布廣的類擁有更大的分割區(qū)域,應(yīng)最早分割可分性最大的類以提高分類推廣能力[17][19].本文以類內(nèi)樣本和類間樣本的綜合分布情況計(jì)算可分性測(cè)度.
為了更準(zhǔn)確地估計(jì)各個(gè)樣本類的分布情況,尋找可分性最大的類以及構(gòu)建最優(yōu)性能的二叉樹(shù)結(jié)構(gòu),本文將DENCLUE聚類算法中的密度估計(jì)方法引入到二叉樹(shù)支持向量機(jī)中,以DENCLUE算法中的相似密度函數(shù)為基礎(chǔ)建立可分性測(cè)度,并以此對(duì)各個(gè)故障類進(jìn)行排序.由于各類故障數(shù)據(jù)真實(shí)分布無(wú)法獲知,可用有限樣本數(shù)據(jù)的分布對(duì)真實(shí)分布進(jìn)行近似估計(jì),本文分別定義類內(nèi)平均相似密度、類間平均相似密度,對(duì)類內(nèi)、類間樣本分布情況進(jìn)行估計(jì).在含k類故障樣本的數(shù)據(jù)空間{D0,D1,D2,…,Dk}中,類內(nèi)、類間平均相似密度定義如下:
第i類內(nèi)平均相似密度為
第i類間平均相似密度為
其中,計(jì)算電子皮帶秤各個(gè)故障類可分性測(cè)度時(shí),K(xj,x)為式(2)中所定義的核函數(shù),并且故障樣本必須是同一流量情況下的故障樣本,否則無(wú)意義.類內(nèi)相似密度越小代表類內(nèi)部分布越廣,類間相似密度越小代表該類與其他類差異越大、越可分.根據(jù)類內(nèi)分布越廣、類間可分離度越大的原則[20-21],綜合式(3)、(4)得第i類的可分性測(cè)度:
式中α為調(diào)節(jié)類內(nèi)相似密度和類間相似密度的權(quán)重系數(shù),可通過(guò)參數(shù)優(yōu)化確定.由式(5)可看出,μi值越大,該類可分性越強(qiáng).
在計(jì)算電子皮帶秤k類故障的可分性測(cè)度時(shí), 還需將樣本按不同流量分為{DQ1,DQ2,…,DQs}s個(gè)子樣本集,然后計(jì)算k類故障在每個(gè)流量樣本DQ1(j=1,2,…,s))中的可分性測(cè)度μQji,最后取所有流量樣本下的測(cè)度平均值作為每類故障的可分性測(cè)度:
改進(jìn)后的BTSVM算法步驟如下:
1)確定權(quán)值,根據(jù)式(5)或式(6)計(jì)算各類故障的可分性測(cè)度;
2)將各類按其可分性測(cè)度由大到小排序(當(dāng)存在兩個(gè)或兩個(gè)以上類別的可分性測(cè)度相同時(shí),依據(jù)人工經(jīng)驗(yàn)自由排序),得到類別排列c1,c2,…,ck,ci∈{1,2,…,k},i=1,2,…,k,即為各故障類的可分性級(jí)別;
3)依據(jù)排列c1,c2,…,ck確定偏二叉樹(shù)各節(jié)點(diǎn)位置,并采用二分類C-SVM訓(xùn)練算法構(gòu)造各節(jié)點(diǎn)最優(yōu)分類超平面,構(gòu)造流程與其他偏二叉樹(shù)SVM幾乎相同.
為驗(yàn)證改進(jìn)型偏二叉樹(shù)SVM算法的優(yōu)越性,本文以UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù)中wine、iris、segment和vowel數(shù)據(jù)集[22]分別與一對(duì)一 SVM、一對(duì)多SVM及改進(jìn)BTSVM進(jìn)行試驗(yàn)比較,各算法均在libsvm基礎(chǔ)上修改實(shí)現(xiàn),標(biāo)準(zhǔn)數(shù)據(jù)信息如表1.
表1 標(biāo)準(zhǔn)數(shù)據(jù)集信息
為了方便后續(xù)數(shù)據(jù)處理,加快算法收斂速度,試驗(yàn)時(shí)對(duì)各樣本先進(jìn)行歸一化處理,線性調(diào)整到[0,1].算法中核函數(shù)統(tǒng)一采用高斯核,以網(wǎng)格搜索最優(yōu)參數(shù)組合.改進(jìn)BTSVM中的可分性測(cè)度權(quán)值α也采用網(wǎng)格搜索,通過(guò)搜索確定權(quán)值變化時(shí)對(duì)應(yīng)的二叉樹(shù)層次結(jié)構(gòu)以及各個(gè)結(jié)構(gòu)的α臨界值.對(duì)每一種結(jié)構(gòu)尋找其最優(yōu)SVM參數(shù)組合,以獲得最高識(shí)別準(zhǔn)確率,并以此準(zhǔn)確率為對(duì)應(yīng)結(jié)構(gòu)的識(shí)別準(zhǔn)確率.試驗(yàn)結(jié)果如表2,從表2中可看出改進(jìn)后的BTSVM除了在vowel數(shù)據(jù)集中準(zhǔn)確度稍遜于一對(duì)一算法,其他數(shù)據(jù)集中均高于其他算法,可見(jiàn)改進(jìn)后BTSVM性能優(yōu)越.
表2 標(biāo)準(zhǔn)數(shù)據(jù)集試驗(yàn)結(jié)果
本文以南京三埃工控股份有限公司QPS-皮帶秤全性能試驗(yàn)中心的3#陣列式皮帶秤為故障診斷試驗(yàn)對(duì)象(圖4),皮帶秤參數(shù)見(jiàn)表3.該試驗(yàn)系統(tǒng)可循環(huán)走料.現(xiàn)場(chǎng)數(shù)據(jù)通過(guò)RS485總線傳輸,并采用單片機(jī)和周立功RSM485CHT轉(zhuǎn)換器接收,上位機(jī)采用串口通信實(shí)時(shí)采集.改進(jìn)型DENCLUE聚類算法是在Matlab環(huán)境下完成的,BTSVM是在libsvm基礎(chǔ)上修改,采用Matlab和C/C++混合編程實(shí)現(xiàn)的.測(cè)試硬件環(huán)境為Core i3-2.35 G 的 CPU,內(nèi)存 6G,硬盤 500 G.
圖4 3#陣列式皮帶秤示意
表3 QPS-皮帶秤全性能試驗(yàn)中心的3#皮帶秤參數(shù)
3#陣列式皮帶秤由8個(gè)稱重單元組構(gòu)成,8個(gè)單元都遠(yuǎn)離落料點(diǎn),從而避免了落料沖擊,尤其是突發(fā)的大塊物料沖擊對(duì)稱重故障的干擾[23].每個(gè)單元采樣頻率為10 Hz,一圈運(yùn)行周期約49 s(2.21 m/s).每個(gè)時(shí)刻的每組采樣數(shù)據(jù)由8個(gè)稱重傳感器實(shí)時(shí)數(shù)據(jù)及現(xiàn)場(chǎng)環(huán)境數(shù)據(jù)組成.試驗(yàn)過(guò)程中,在3#陣列式皮帶秤上分別模擬了表4中6類常見(jiàn)故障,每個(gè)稱重單元的故障模式相同.由于實(shí)際情況中同一時(shí)刻最多只會(huì)有3個(gè)稱重單元區(qū)域出現(xiàn)故障,故本研究在試驗(yàn)時(shí)每組最多只模擬4個(gè)稱重單元產(chǎn)生故障數(shù)據(jù),通過(guò)在空載、200、500、800 t/h不同流量下多次模擬試驗(yàn),以驗(yàn)證本文故障在線檢測(cè)和診斷模型的有效性.
表4 陣列式皮帶秤故障類別
電子皮帶秤在線故障檢測(cè)即對(duì)8個(gè)稱重單元的檢測(cè)數(shù)據(jù)進(jìn)行聚類分析.試驗(yàn)分別采用DENCLUE、DBSCAN、模糊層次聚類以及改進(jìn)型DENCLUE對(duì)8個(gè)稱重單元工作在空載、200、500、800 t/h不同流量時(shí)的實(shí)時(shí)含噪聲數(shù)據(jù)進(jìn)行在線聚類分析,并對(duì)比各算法的準(zhǔn)確度和實(shí)時(shí)性(見(jiàn)圖5).
圖5 聚類算法精度比較
由圖 5可知,模糊層次聚類和改進(jìn)型DENCLUE聚類算法的最優(yōu)模型在任何流量下的聚類精度都較高且無(wú)明顯變化,模糊層次聚類由于噪聲干擾,聚類精度受到一定影響,稍低于改進(jìn)型 DENCLUE;而采用距離函數(shù)的 DBSCAN、DENCLUE算法在200 t/h得到最優(yōu)聚類模型不具備很好的推廣能力.采用距離函數(shù)的DBSCAN、DENCLUE算法在各個(gè)流量時(shí)最優(yōu)模型精度對(duì)比見(jiàn)圖6.
圖6 DBSCAN、DENCLUE聚類效果圖
由圖6可知,有必要使用相似函數(shù)替代距離函數(shù),以提高聚類算法對(duì)于不同流量數(shù)據(jù)的魯棒性.再次進(jìn)行4種流量的在線聚類試驗(yàn),試驗(yàn)中DENCLUE和DBSCAN算法中均采用相似函數(shù),試驗(yàn)結(jié)果見(jiàn)表5.
表5 各聚類算法比較
從表5中可以看出,改進(jìn)型DENCLUE較之其他聚類算法擁有較高的聚類精度以及相當(dāng)快的聚類速度,更適合在線故障檢測(cè).
從現(xiàn)場(chǎng)采集的空載、200、500、800 t/h等4組故障數(shù)據(jù)中各抽選250個(gè)樣本訓(xùn)練診斷模型,比較各個(gè)診斷模型在散狀物料連續(xù)稱重設(shè)備在線故障診斷中的性能.為提高分類器在不同流量時(shí)的魯棒性,核函數(shù)均采用
并通過(guò)修改libsvm中的高斯核實(shí)現(xiàn);最優(yōu)參數(shù)是在網(wǎng)格C=[2-3,2-2,…,23],γ=(2-1,20,…,28)范圍內(nèi)使用5折交叉驗(yàn)證方法搜索獲得.
在使用數(shù)據(jù)集進(jìn)行訓(xùn)練和預(yù)測(cè)時(shí),每個(gè)樣本包括6個(gè)特征:當(dāng)前托輥傳感器數(shù)據(jù)、同一時(shí)刻平均正常數(shù)據(jù)、同一時(shí)刻前相鄰?fù)休伔Q重?cái)?shù)據(jù)(第1單元的前相鄰稱重?cái)?shù)據(jù)取其本身)、同一時(shí)刻后相鄰?fù)休仈?shù)據(jù)(第8單元的后相鄰稱重?cái)?shù)據(jù)取其本身)、現(xiàn)場(chǎng)溫度、傳感器靈敏度.在線診斷測(cè)試時(shí),同一時(shí)刻平均正常數(shù)據(jù)為在線聚類分析所得.在訓(xùn)練診斷模型前,本文需要根據(jù)式(3)~(6)對(duì)正常類及各個(gè)故障類進(jìn)行可分性測(cè)度估計(jì)(見(jiàn)表6),以建立偏二叉樹(shù)結(jié)構(gòu).
由表7可看出,α取任何值,F(xiàn)2的可分性測(cè)度都是最大的,故該類故障應(yīng)最優(yōu)先分離.權(quán)值α通過(guò)以1為指數(shù)增量進(jìn)行網(wǎng)格搜索優(yōu)化,研究發(fā)現(xiàn),當(dāng)28≤α≤222時(shí),二叉樹(shù)結(jié)構(gòu)為固定的8種結(jié)構(gòu),再以這8種結(jié)構(gòu)構(gòu)造BTSVM,對(duì)比8種結(jié)構(gòu)的分類效果后,得到217≤α≤220為最優(yōu).
表6 各故障類間、類內(nèi)相似密度
表7 各權(quán)值α對(duì)應(yīng)的二叉樹(shù)結(jié)構(gòu)
最后將二叉樹(shù)結(jié)構(gòu)F2>F3>F4>F6>F5>F1>F0 的BTSVM與一對(duì)多算法以及一對(duì)一算法進(jìn)行不同流量時(shí)的在線診斷試驗(yàn),將其診斷性能與其他分類器比較.從表8可以看出“1對(duì)1”SVMs平均測(cè)試時(shí)間最長(zhǎng),而本文方法的測(cè)試時(shí)間明顯最短,且精度最高,因此本文方法比較適合電子皮帶秤的故障在線檢測(cè)和診斷.
表8 幾種故障分類器性能比較
1)采用相似密度函數(shù)替代DENCLUE聚類算法中的距離函數(shù),解決了算法在處理密度不均勻數(shù)據(jù)時(shí)魯棒性很差的問(wèn)題,并采用動(dòng)態(tài)閾值法替代爬山法,降低了算法復(fù)雜度,更適于在線聚類.
2)引入DENCLUE中的密度估計(jì)方法,提出一種改進(jìn)型偏二叉樹(shù)SVM多分類器.該分類器利用類間、類內(nèi)平均相似密度建立了可分性測(cè)度,再根據(jù)可分性測(cè)度構(gòu)建偏二叉樹(shù)結(jié)構(gòu).標(biāo)準(zhǔn)數(shù)據(jù)集試驗(yàn)表明:該分類器具有很好的優(yōu)越性.
3)結(jié)合改進(jìn)型DENCLUE和改進(jìn)型偏BTSVM,提出了一種能準(zhǔn)確對(duì)電子皮帶秤常見(jiàn)故障進(jìn)行在線快速檢測(cè)和診斷的模型.最后通過(guò)陣列式皮帶秤試驗(yàn),驗(yàn)證了本文所提出電子皮帶秤故障在線檢測(cè)和診斷模型的優(yōu)越性.
[1]方原柏.電子皮帶秤[M].北京:冶金工業(yè)出版社,2008:1-4.
[2]KHEDIRI I B,WEIHS C,LIMAM M.Kernelk-means clustering based local support vector domain description fault detection of multimodal processes[J].Expert Systems with Applications,2012,39(2):2166-2171.
[3]ALAEI H K,SALAHSHOOR K,ALAEI H K,et al.A new integrated on-line fuzzy clustering and segmentation methodology with adaptive PCA approach for process monitoring and fault detection and diagnosis[J].Soft Comput,2013,17(3):345-362.
[4]李麗敏,王仲生,姜洪開(kāi).基于相似性傳播聚類的航空發(fā)動(dòng)機(jī)突發(fā)故障診斷[J].振動(dòng)與沖擊,2014,33(1):51-55.
[5]楊小兵.聚類分析中若干關(guān)鍵技術(shù)的研究[D].杭州:浙江大學(xué),2005:23-41.
[6]HINNEBURG A,KEIM D A.A general approach to clustering in large databases with noise[J].Knowledge and Information Systems,2003(5):387-415.
[7] HINNEBURG A,GABRIEL H H.DENCLUE 2.0:Fast clustering based on kernel density estimation[J].Lecture Notes in Computer Science,2007,4723:70-80.
[8]淦文燕,李德毅.基于核密度估計(jì)的層次聚類算法[J].系統(tǒng)仿真學(xué)報(bào),2004,16(2):302-309.
[9]吳丹,金敏.基于容錯(cuò)度自適應(yīng)支持向量機(jī)的液壓泵故障診斷[J].中國(guó)機(jī)械工程,2011,22(11):2582-2587.
[10]任能.制冷系統(tǒng)故障檢測(cè)、診斷及預(yù)測(cè)研究[D].上海:上海交通大學(xué),2008:3-4.
[11]LIU Zhiwen,CAO Hongrui,CHEN Xuefeng,et al.Multifault classification based on wavelet SVM with PSO algorithm to analyze vibration signals from rolling element bearings[J].Neurocomputing,2013,99:399-410.
[12]蘇小紅,趙玲玲,謝 琳,等.陰影集的模糊支持向量機(jī)樣本選擇方法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2012,44(9):78-84.
[13]OTHMAN N S,LAOUTI N,VALOUR J P,et al.Support vector machines combined to observers for fault diagnosis in chemical reactors[J].The Canadian Journal of Chemical Engineering,2014,92(4):685-695.
[14]劉本德,胡昌華,蔡艷寧.基于聚類和SVM多分類的容差模擬電路故障診斷[J].系統(tǒng)仿真學(xué)報(bào),2009,21(20):6479-6482.
[15]袁勝發(fā),褚福磊.支持向量機(jī)及其在機(jī)械故障診斷中的應(yīng)用[J].振動(dòng)與沖擊,2007,26(11):29-34.
[16]FEI B,LIU J.Binary Tree of SVM:A new fast multiclass training and classification algorithm[J].IEEE Trans on Neural Networks,2006,17(3):696-703.
[17]BENNETT K P,CRISTIANINI N,SHAWE T J,et al.Enlarging the margins in perceptron decision trees[J].Machine Learning,2000,4l(3):295-313.
[18]姚良,李艾華,王濤.運(yùn)用改進(jìn)二叉樹(shù)SVM算法的柴油機(jī)振動(dòng)診斷[J].振動(dòng)、測(cè)試與診斷,2010,30(6):689-693.
[19]趙海洋,徐敏強(qiáng),王金東.改進(jìn)二叉樹(shù)支持向量機(jī)及其故障診斷方法研究[J].振動(dòng)工程學(xué)報(bào),2013,26(5):764-769.
[20]唐發(fā)明,王仲東,陳綿云.支持向量機(jī)多類分類算法研究[J].控制與決策,2005,20(7):746-754.
[21]馮志剛,王祁,信太克規(guī).基于EMD和SVM的傳感器故障診斷方法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2009,41(5):59-63.
[22]UC Irvine Machine Learning Repository[DB/OL].Irvine,California:University of California.2014-05-03[2014-05-10].http://archive.ics.uci.edu/ml/.
[23]DONIS V K,RACHKOVSKII A E,SIN V M.How the conveyor belt length affects belt weigher accuracy[J].Measurement Techniques,2004,47(2):163-167.