潘 鵬, 王廷銀, 潘健鴻, 吳海燕, 金曉磊, 樊明輝, 吳允平
1(福建師范大學(xué) 光電與信息工程學(xué)院, 福州 350007)
2(福建省特種設(shè)備檢驗(yàn)研究院, 福州 350008)
3(福建師范大學(xué) 數(shù)學(xué)與信息學(xué)院, 福州 350007)
4(數(shù)字福建環(huán)境監(jiān)測(cè)物聯(lián)網(wǎng)實(shí)驗(yàn)室, 福州 350007)
5(福州大學(xué) 物理與信息工程學(xué)院, 福州 350108)
電梯作為現(xiàn)代人類活動(dòng)最后50米的交通工具, 已成為與城市居民生活密切相關(guān)的重要基礎(chǔ)設(shè)施之一.過(guò)去十年間, 國(guó)內(nèi)電梯保有量迅速增加, 到2016年已達(dá)到493.69萬(wàn)臺(tái)[1].電梯的構(gòu)成要素多, 事故的發(fā)生既有一定的隨機(jī)性和突發(fā)性, 又有一些必然性, 僅2016年國(guó)內(nèi)就發(fā)生電梯事故48起, 死亡41人[2];據(jù)統(tǒng)計(jì), 電梯構(gòu)成要素中發(fā)生的事故概率分別為:廳門事故占 80% 左右, 井道內(nèi)事故占 15% 左右, 其他占 5%;引發(fā)事故的原因主要有設(shè)備缺陷、作業(yè)違章、管理缺陷[3].
目前, 電梯的安全主要靠定期維護(hù)或年檢的方式,維保公司依據(jù)規(guī)程對(duì)電梯的各構(gòu)成要素進(jìn)行固定項(xiàng)目的檢修[4,5], 雖然且該方式存在“過(guò)修”或者“欠修”的情況[6], 對(duì)可能發(fā)生的異常難以檢測(cè), 但在過(guò)去10年間它為我國(guó)萬(wàn)臺(tái)電梯事故率由1.56起降至0.15起發(fā)揮了重要作用[7].
但隨著電梯保有量的持續(xù)增長(zhǎng), 電梯使用頻率的快速提高, 影響電梯安全運(yùn)行的隱患隨之進(jìn)一步加大,傳統(tǒng)管理方式面臨巨大挑戰(zhàn).毫無(wú)疑問(wèn), 將電梯聯(lián)網(wǎng)實(shí)現(xiàn)監(jiān)管已成為該行業(yè)重要舉措, 如在上海地區(qū), 將新一代電梯運(yùn)行狀態(tài)安全監(jiān)控系統(tǒng)鋪開(kāi), 到2018年預(yù)增至10萬(wàn)臺(tái)以上[8].2016年, 《質(zhì)檢總局2016年電梯安全攻堅(jiān)戰(zhàn)工作方案》首次明確要求運(yùn)用大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù), 多措并舉以提升電梯應(yīng)急能力和監(jiān)管效能[9].
國(guó)內(nèi)已有專家圍繞電梯安全積極探索評(píng)價(jià)方法.慶光蔚等選取與電梯安全相關(guān)的指標(biāo)并計(jì)算權(quán)重, 通過(guò)模糊綜合評(píng)價(jià)法評(píng)估電梯安全, 模糊綜合評(píng)價(jià)方法能夠較為準(zhǔn)確的反映和衡量電梯運(yùn)行情況及安全性能,指出群體性電梯管理提升點(diǎn), 指標(biāo)體系的建立仍有待完善, 缺乏動(dòng)態(tài)檢測(cè)、評(píng)估[10].陳國(guó)華等分析電梯歷史故障信息, 采用基于故障率修正的模糊綜合評(píng)價(jià)方法評(píng)估電梯系統(tǒng)風(fēng)險(xiǎn), 在模糊評(píng)估過(guò)程中引入故障率修正系數(shù), 故障率修正系數(shù)的引入有利于實(shí)現(xiàn)電梯系統(tǒng)風(fēng)險(xiǎn)動(dòng)態(tài)評(píng)價(jià)[11], 該方法具有較好的適應(yīng)性, 能夠隨電梯安全技術(shù)、安全管理水平修正評(píng)價(jià)系數(shù), 但評(píng)估因素的權(quán)重需要不同專業(yè)領(lǐng)域的專家依據(jù)問(wèn)卷調(diào)查表進(jìn)行主觀評(píng)分, 主觀性強(qiáng).李剛通過(guò)故障原因分析, 研究整機(jī)性能與各部件間的關(guān)系建立電梯安全評(píng)價(jià)數(shù)學(xué)模型, 提出了針對(duì)長(zhǎng)期服役電梯的安全評(píng)價(jià)項(xiàng)目、內(nèi)容、要求及流程, 為長(zhǎng)期服役電梯部件及整機(jī)報(bào)廢、維修、改造提供了技術(shù)支撐, 有利于長(zhǎng)期服役電梯安全管理及安全水平的提升, 但評(píng)價(jià)程序的智能化程度差, 僅能根據(jù)輸入進(jìn)行風(fēng)險(xiǎn)值的計(jì)算, 無(wú)法實(shí)現(xiàn)邏輯算法較為復(fù)雜的部件及整機(jī)判廢[12].這些研究方法為電梯故障分析、監(jiān)管、改進(jìn)等方面提出了建設(shè)性建議,但如何將事后評(píng)估變?yōu)閷?duì)電梯的實(shí)時(shí)評(píng)估, 快速實(shí)現(xiàn)對(duì)電梯健康狀態(tài)預(yù)警, 特別是減少評(píng)估過(guò)程的人為主觀性和加快評(píng)估過(guò)程, 無(wú)疑是一項(xiàng)具有挑戰(zhàn)性的研究.
毫無(wú)疑問(wèn), 大數(shù)據(jù)的出現(xiàn)為各個(gè)行業(yè)帶來(lái)了巨大變化[13], 它可以更有效地表征數(shù)據(jù)、解釋數(shù)據(jù)[14].電梯的物聯(lián)網(wǎng)發(fā)展已積累了海量的數(shù)據(jù), 如何應(yīng)用新的智能技術(shù), 例如Logistic回歸等適用于大數(shù)據(jù)的人工智能算法, 發(fā)揮這些數(shù)據(jù)的作用, 挖掘電梯健康狀況與運(yùn)行數(shù)據(jù)間的關(guān)聯(lián)性, 針對(duì)運(yùn)行中電梯進(jìn)行健康評(píng)估并預(yù)警、減少評(píng)估時(shí)間, 無(wú)疑是一項(xiàng)很有意義的研究.
電梯設(shè)備健康評(píng)估, 涉及到實(shí)時(shí)數(shù)據(jù)(物聯(lián)網(wǎng)技術(shù)監(jiān)控電梯運(yùn)行數(shù)據(jù))、靜態(tài)數(shù)據(jù)(設(shè)備的型號(hào)、廠商等)、維保數(shù)據(jù)和歷史運(yùn)行數(shù)據(jù), 如圖1所示, 時(shí)間跨度長(zhǎng)、數(shù)據(jù)量大, 且電梯設(shè)備健康需及時(shí)評(píng)估, 因此需要一種運(yùn)算時(shí)間短, 適用于大數(shù)據(jù)的評(píng)估算法.
圖1 電梯設(shè)備的健康評(píng)估數(shù)據(jù)組成框圖
Logistic回歸模型作為一種有效的數(shù)據(jù)處理方法在很多領(lǐng)域都有廣泛的應(yīng)用[15–18], 是公認(rèn)的最常用數(shù)據(jù)科學(xué)研究方法[19].方案最后選定Logistic回歸模型作為最終方案, 一方面由于Logistic回歸假定數(shù)據(jù)服從二項(xiàng)式分布, 電梯數(shù)據(jù)量大, 符合二項(xiàng)分布的基礎(chǔ)條件,另一方面, Logistic回歸利用統(tǒng)計(jì)學(xué)手段, 對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)分析, 提供后驗(yàn)概率, 相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法其運(yùn)算速度快, 在數(shù)據(jù)量較大時(shí)效果優(yōu)異, 適用于大數(shù)據(jù)環(huán)境下電梯健康評(píng)估.
評(píng)價(jià)方案主要包括數(shù)據(jù)清洗、特征篩選、特征處理、模型訓(xùn)練和設(shè)備評(píng)估等, 如圖2.
電梯健康運(yùn)行需要每部分有機(jī)協(xié)調(diào), 缺一不可.從功能上看, 電梯可劃分成六部分[12].結(jié)合目前的相關(guān)研究[4,5,10,12,20]結(jié)果, 選取相關(guān)的整體特征和局部特征.整體特征是評(píng)價(jià)電梯各部分共同包含的特征, 局部特征是根據(jù)各部分的特點(diǎn)篩選的特有特征.篩選發(fā)現(xiàn), 現(xiàn)有條件無(wú)法針對(duì)對(duì)重系統(tǒng)、導(dǎo)向系統(tǒng)、轎廂系統(tǒng)篩選出適宜的局部特征, 如圖3.
圖2 設(shè)備健康評(píng)估方案流程
圖3 電梯健康評(píng)價(jià)特征
電梯特征原始數(shù)據(jù)不符合評(píng)估模型要求, 因此需要借助數(shù)據(jù)清洗、預(yù)處理等方法使其符合要求, 結(jié)果如表1、表2.
電梯健康評(píng)估是評(píng)估模型根據(jù)電梯運(yùn)行數(shù)據(jù)得出的結(jié)果, 因此評(píng)估模型是整個(gè)系統(tǒng)核心.優(yōu)化評(píng)估模型,是提高評(píng)估系統(tǒng)泛化能力最關(guān)鍵的步驟.
機(jī)器學(xué)習(xí)分類方法對(duì)平衡數(shù)據(jù)集分類取得了良好的效果, 但對(duì)于基于總體分類精度為學(xué)習(xí)目標(biāo)的分類器而言, 樣本不均衡勢(shì)必會(huì)導(dǎo)致分類器過(guò)多關(guān)注多數(shù)類樣本, 從而使少數(shù)類樣本分類性能下降[21,22].
表1 電梯整體特征處理后參數(shù)
表2 電梯局部特征處理后參數(shù)
樣本數(shù)據(jù)庫(kù)中包括發(fā)生故障電梯和正常運(yùn)行電梯的數(shù)據(jù), 但正常運(yùn)行電梯的樣本量遠(yuǎn)大于故障電梯樣的數(shù)據(jù)量, 所有在訓(xùn)練分類前需要解決樣本不均衡問(wèn)題.同時(shí), 由于故障樣本數(shù)據(jù)量級(jí)不大, 所以在解決樣本不均衡的前提下需要合理利用樣本.SMOTE算法根據(jù)已有的樣本生成新樣本點(diǎn), 擴(kuò)大樣本個(gè)數(shù)[23].但SMOTE可能引入新的噪聲, 使用SMOTE過(guò)采樣算法結(jié)合KMeans++聚類降采樣, 既避免了為樣本集引入較多的噪聲, 又有效地解決了訓(xùn)練集樣本稀疏的問(wèn)題[24,25].
Logistic回歸通過(guò)擬合系數(shù), 建立評(píng)價(jià)模型.但樣本指標(biāo)單位不一致、不同的量綱, 影響訓(xùn)練模型參數(shù),降低模型泛化能力.數(shù)據(jù)的標(biāo)準(zhǔn)化將數(shù)據(jù)約束到同一標(biāo)尺,降低了單位與量綱對(duì)模型的影響[26,27].
標(biāo)準(zhǔn)分?jǐn)?shù)(Z-score)是一種常見(jiàn)的標(biāo)準(zhǔn)化法, 將數(shù)值變準(zhǔn)化到Z分?jǐn)?shù), 公式如下:
模型通過(guò)標(biāo)準(zhǔn)分?jǐn)?shù)法將不同單位的數(shù)據(jù), 統(tǒng)一到同一尺度, 降低了屬性間的關(guān)聯(lián)度, 同時(shí)壓縮了數(shù)據(jù)中的噪聲, 提高了模型泛化能力.
在電梯評(píng)價(jià)模型中, 需要對(duì)所有的特征數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理.模型訓(xùn)練時(shí), 每個(gè)特征的所有訓(xùn)練數(shù)據(jù)計(jì)算“平均值”和“方差”, 后根據(jù)公式對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理.在評(píng)估中, 所有數(shù)據(jù)的標(biāo)準(zhǔn)化參數(shù), 使用訓(xùn)練模型中“平均值”和“方差”參數(shù)帶入公式中進(jìn)行標(biāo)準(zhǔn)化.
結(jié)合本文的需要, 先對(duì)相關(guān)原理進(jìn)行分析.Logistic回歸將預(yù)測(cè)值映射到“Sigmod”函數(shù)上并將預(yù)測(cè)值轉(zhuǎn)化成預(yù)測(cè)概率, 函數(shù)形式為:
在二分類問(wèn)題中, 定義屬于“1”的概率表示為P(y=1|x,θ)=f(x), 定 義 屬 于 “0”的 概 率 是P(y=0|x,w)=1-f(x), 可以寫成:
對(duì)式(1)求最大似然估計(jì)可解得參數(shù)wT, 計(jì)算概率得:
求解的關(guān)鍵在于求解參數(shù)wT, 但本質(zhì)上是仍線性.
線性回歸通過(guò)學(xué)習(xí)、計(jì)算, 擬合出結(jié)果與特征參數(shù)間的線性數(shù)量關(guān)系:f(x)=wTx.線性回歸試圖完成使得f(xi)?yi. 即yi=f(xi)+εi, 使得εi最小.由中心極限定理可知, 誤差是獨(dú)立同分布的, 服從均值為 0, 方差為σ2的高斯分布.
根據(jù)極大似然估計(jì)法可得:
若使得式L(w)最大, 即使得式(2)最小:
利用梯度下降算法或者最小二乘法都可求解[15,28].
Logistic回歸的本質(zhì)是線性回歸, 線性回歸是變量的一階形式, 一階模型對(duì)樣本的學(xué)習(xí)不充分.將f(x)=wTx變成形如:
在變量設(shè)計(jì)上將x1與x12看作是兩個(gè)變量, 這樣就人為的將f(x)變成高級(jí)回歸, 本質(zhì)上仍是線性回歸[29].階數(shù)高時(shí)擬合效果較好, 但是存在過(guò)擬合的情況.因此使用交叉驗(yàn)證, 測(cè)試不同階數(shù)在測(cè)試數(shù)據(jù)上的準(zhǔn)確度,選擇合適的模型適合的階數(shù).
求解式(1)的最大似然估計(jì)時(shí), 解得的wT可能造成評(píng)價(jià)模型學(xué)習(xí)過(guò)擬合.為降低過(guò)擬合程度, 引入L1/L2懲罰因子[30]:
但在數(shù)學(xué)推導(dǎo)上仍舊無(wú)法推算λ 最優(yōu)解.
交叉驗(yàn)證將原始數(shù)據(jù)進(jìn)行分組, 一部分作為訓(xùn)練集, 另一部分作為驗(yàn)證集.首先用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練, 再將相關(guān)參數(shù)回帶入目標(biāo)函數(shù)選擇適合的參數(shù).通過(guò)交叉驗(yàn)證法, 如圖4, 利用測(cè)試數(shù)據(jù)以式(3)損失函數(shù)為評(píng)價(jià)標(biāo)準(zhǔn), 選取合適的 λ.
電梯健康評(píng)估系統(tǒng)主要包括離線模型訓(xùn)練和電梯設(shè)備實(shí)時(shí)評(píng)估兩個(gè)部分.
圖4 交叉驗(yàn)證
離線模型訓(xùn)練部分包括, 使用離線數(shù)據(jù), 借助統(tǒng)計(jì)算法, 數(shù)據(jù)的規(guī)整, 預(yù)處理等方法整理原始數(shù)據(jù), 利用整理后的數(shù)據(jù)學(xué)習(xí)訓(xùn)練logistic回歸模型關(guān)鍵參數(shù), 建立評(píng)價(jià)模型.
實(shí)時(shí)評(píng)估系統(tǒng)將實(shí)時(shí)上傳的數(shù)據(jù)整合后放入訓(xùn)練后的模型, 達(dá)到對(duì)電梯健康實(shí)時(shí)評(píng)估、預(yù)警, 如圖5.
圖5 電梯健康評(píng)估系統(tǒng)
評(píng)估模型計(jì)算每部分發(fā)生故障的概率Pi, 帶入公式:F(x)=100(1-Pi), 計(jì)算各部得分.將電梯各部分得分的均值作為電梯最后得分, 完成電梯健康評(píng)估, 如圖6.
圖6 評(píng)估結(jié)果
電梯是一個(gè)復(fù)雜系統(tǒng), 具有構(gòu)成要素多、供應(yīng)商多, 生命周期長(zhǎng)等特點(diǎn);從安裝、維保到維修, 影響其運(yùn)行狀態(tài)的要素很多.本文從電梯組成、影響或可以用于評(píng)價(jià)電梯健康因素入手, 選取評(píng)價(jià)參數(shù).借助現(xiàn)象與故障之間的聯(lián)系, 在歷史數(shù)據(jù)的基礎(chǔ)上建立數(shù)學(xué)模型, 利用現(xiàn)有數(shù)據(jù), 使用大數(shù)據(jù)分析方法建立評(píng)估模型.引入數(shù)據(jù)預(yù)處理、懲罰因子、交叉驗(yàn)證方法, 針對(duì)實(shí)際業(yè)務(wù)優(yōu)化評(píng)估模型.該模型評(píng)估時(shí)間周期短, 模型動(dòng)態(tài)調(diào)整, 達(dá)到了對(duì)電梯健康實(shí)時(shí)監(jiān)控并預(yù)警.
評(píng)估階段取平均值作為電梯最后評(píng)價(jià)結(jié)果, 但電梯各部分對(duì)電梯重要并不對(duì)等, 因此評(píng)價(jià)電梯各部分的比重系數(shù)可作為下階段的研究重點(diǎn).
在整個(gè)研究設(shè)計(jì)過(guò)程中, 由于缺乏統(tǒng)一的規(guī)范和標(biāo)準(zhǔn), 各廠商的數(shù)據(jù)獲取難度大, 信息孤島現(xiàn)象還比較嚴(yán)重.隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展, 應(yīng)盡快實(shí)施電梯物聯(lián)網(wǎng)的協(xié)議和接口標(biāo)準(zhǔn)化, 加快提升行業(yè)的活力和發(fā)展態(tài)勢(shì).