崔希國,于 鯤
(1.山東能源臨沂礦業(yè)集團(tuán),山東臨沂 276000;2.山東通和信息技術(shù)有限公司,山東濟(jì)南 250000)
隨著物聯(lián)網(wǎng)技術(shù)的高速發(fā)展,智能手表、智能眼鏡等可穿戴設(shè)備的使用越來越廣泛[1-2]??纱┐髟O(shè)備是一種集成于衣服、手表、鞋子等生活用品的便攜式設(shè)備,具有與用戶雙向互動的功能[3-5]??纱┐髟O(shè)備具備多種類型的微型傳感器,其所采集的數(shù)據(jù)蘊(yùn)含與佩戴人員的行為特性、健康情況等相關(guān)的豐富數(shù)據(jù)[6-7]。
在礦業(yè)方面,每年因事故傷亡的作業(yè)人員約為6 000 人。礦工作業(yè)過程中,監(jiān)控人員無法實時掌握作業(yè)人員的身體健康狀況,導(dǎo)致較多安全事故的發(fā)生[8-10]。因此,文中將可穿戴設(shè)備應(yīng)用于礦工作業(yè)過程,開展基于礦用可穿戴設(shè)備智能數(shù)據(jù)分析的礦業(yè)作業(yè)人員健康狀態(tài)評估研究。
礦用可穿戴設(shè)備為手表,用于礦業(yè)工作人員下井工作的實時安全健康數(shù)據(jù)監(jiān)測。其外觀結(jié)構(gòu)如圖1所示。礦用可穿戴設(shè)備具有以下顯著特點(diǎn):
圖1 礦用可穿戴設(shè)備外觀
1)小型化。礦用可穿戴設(shè)備具有小型化的特點(diǎn),體積較小、便于穿戴,不影響操作。
2)集成化。礦用可穿戴設(shè)備相比于普通的智能手表,集成了多種數(shù)據(jù)測量監(jiān)測功能,不僅具有計時、計步等運(yùn)動數(shù)據(jù)監(jiān)測功能,且還集成了血壓測量、血氧測量、心率測量等功能。
3)雙向化。一方面,礦業(yè)工作人員遇到緊急狀況時可通過礦用可穿戴設(shè)備向系統(tǒng)主站發(fā)送求助;另一方面,可將實時監(jiān)測數(shù)據(jù)傳回系統(tǒng)主站進(jìn)行異常數(shù)據(jù)分析,然后通過礦用可穿戴設(shè)備向礦業(yè)工作人員下發(fā)指令和安全預(yù)警。
4)智能化。礦用可穿戴設(shè)備配置智能分析平臺對采集到的數(shù)據(jù)進(jìn)行分析處理,提供統(tǒng)計分析、狀態(tài)監(jiān)測、安全預(yù)警、用戶管理等功能。
基于礦用可穿戴設(shè)備的智能分析平臺架構(gòu)如圖2所示。該智能分析平臺功能主要分為三部分:
圖2 基于礦用可穿戴設(shè)備的智能分析平臺
1)分析統(tǒng)計。礦用可穿戴設(shè)備所采集數(shù)據(jù)的分析統(tǒng)計具備計步、血氧、血壓、睡眠和心率相關(guān)數(shù)據(jù)的統(tǒng)計分析與可視化展示。
2)設(shè)備數(shù)據(jù)。實現(xiàn)對每一臺礦用可穿戴設(shè)備的數(shù)據(jù)監(jiān)測和數(shù)據(jù)管理,具有佩戴者信息、設(shè)備健康數(shù)據(jù)、定位展示、軌跡信息、家庭成員、SOS 信息、關(guān)愛提醒、IMEI 錄入、數(shù)據(jù)清除和數(shù)據(jù)權(quán)限等功能。
3)APP 管理。實現(xiàn)對APP 用戶數(shù)據(jù)的管理,包括APP 用戶管理、APP 用戶統(tǒng)計、APP 安裝設(shè)備統(tǒng)計、APP 登記統(tǒng)計等。
對于礦用可穿戴設(shè)備所采集的步數(shù)、體溫、呼吸、心率、血氧、血壓等數(shù)據(jù),文中基于多源數(shù)據(jù)融合(Multi-source Data Fusion,MDF)與支持向量機(jī)(Support Vector Machine,SVM)的智能數(shù)據(jù)分析處理方法,實現(xiàn)礦業(yè)作業(yè)人員的健康情況實時監(jiān)測。
文中所提基于礦用可穿戴設(shè)備的智能數(shù)據(jù)分析算法流程如圖3 所示。
圖3 基于礦用可穿戴設(shè)備的智能數(shù)據(jù)分析算法
該算法的主要流程:首先對礦用可穿戴設(shè)備所采集的數(shù)據(jù)進(jìn)行預(yù)處理,便于后續(xù)的數(shù)據(jù)分析;然后采用數(shù)據(jù)融合方法進(jìn)行多源數(shù)據(jù)融合,進(jìn)一步采用小波變換方法進(jìn)行數(shù)據(jù)特征提取,并將數(shù)據(jù)樣本按一定比例劃分為測試樣本和訓(xùn)練樣本;將訓(xùn)練樣本作為支持向量機(jī)算法的輸入,實現(xiàn)SVM 模型的訓(xùn)練;用測試樣本對訓(xùn)練好的SVM 模型進(jìn)行測試,微調(diào)校正SVM 模型參數(shù);最終輸出礦業(yè)作業(yè)人員的身體健康等級評估結(jié)果。
常見的數(shù)據(jù)標(biāo)準(zhǔn)化方法有min-max 標(biāo)準(zhǔn)化和zscore 標(biāo)準(zhǔn)化[11]:
1)min-max 標(biāo)準(zhǔn)化
規(guī)范化后DE 數(shù)據(jù)描述如下:
2)z-score 標(biāo)準(zhǔn)化
規(guī)范化后的數(shù)據(jù)描述如下:
數(shù)據(jù)融合的原理如圖4 所示。其方法是直接將來自不同傳感器的原始信息進(jìn)行融合處理,具有保留原始數(shù)據(jù)完整信息的優(yōu)點(diǎn)[12]。
圖4 數(shù)據(jù)融合原理
礦用可穿戴設(shè)備采集的原始數(shù)據(jù)雖然包含了關(guān)聯(lián)礦業(yè)作業(yè)人員的各類相關(guān)信息,但這些原始數(shù)據(jù)的密度和體量都比較大,需要經(jīng)過數(shù)據(jù)特征提取將有用的特征參數(shù)提取出來,并將不相關(guān)的數(shù)據(jù)過濾。文中基于小波變換方法實現(xiàn)數(shù)據(jù)特征提取[13]。
定義一個基本小波函數(shù)及其Fourier 變化,滿足以下關(guān)系:
式中,ψ(w) 為基本小波函數(shù)φ(t) 的Fourier 變化式。
則連續(xù)小波函數(shù)變換式為:
式中,x(t)為連續(xù)小波函數(shù),ψ*(·)表示函數(shù)ψ(·)的共軛運(yùn)算,a表示尺度因子,τ表示時間位移。
為了滿足實際工程應(yīng)用中離散化信號處理需求,將尺度因子與時間位移進(jìn)行離散化操作:
離散化的小波變換公式表示為:
在內(nèi)積空間H中,定義一個超平面,其代數(shù)表示方式為:
式中,x為自變量向量,w為權(quán)重系數(shù)向量,b為常數(shù)項。
支持向量機(jī)的目的是構(gòu)造一個超平面,將測試數(shù)據(jù)盡可能準(zhǔn)確地分類。為了便于計算,通常采用歸一化方法來建立規(guī)范化的超平面模型:
式中,(xi,yi)為第i個訓(xùn)練樣本,xi為訓(xùn)練樣本的特征參數(shù),yi為分類標(biāo)簽。
如圖5 所示,H值越大表明分類結(jié)果越優(yōu),H值的計算公式如下:
圖5 支持向量機(jī)原理
式中,||·||為二范數(shù)運(yùn)算符。
因此訓(xùn)練尋優(yōu)問題轉(zhuǎn)化為:
式中,?(x)為映射函數(shù)。
為驗證所提方法的正確性和有效性,采用礦用可穿戴設(shè)備的10 000 條測量數(shù)據(jù)作為數(shù)據(jù)樣本。按8 000∶2 000 的比例劃分為訓(xùn)練樣本和測試樣本,輸出結(jié)果等級分為健康、非健康兩種。
每個樣本中包含的特征參數(shù)包括體溫、心率、呼吸、血壓和血氧等,部分測試數(shù)據(jù)如表1 所示。
表1 部分測試數(shù)據(jù)
為了驗證所提算法的性能,將相同數(shù)據(jù)樣本作為文中所提算法和BP 神經(jīng)網(wǎng)絡(luò)算法的輸入。算法的性能對比如表2 所示。
表2 算法性能對比
由表2 可知,基于BP 神經(jīng)網(wǎng)絡(luò)算法的礦業(yè)作業(yè)人員健康等級評估準(zhǔn)確率為94.8%,算法收斂步數(shù)為85 步,訓(xùn)練時間為1 832.7 s?;谒酳VM 算法的礦業(yè)作業(yè)人員健康等級評估準(zhǔn)確率為98.6%,算法收斂步數(shù)為32 步,訓(xùn)練時間為654.6 s。由此可見,所提算法在準(zhǔn)確率、計算時間、收斂速度方面均更具優(yōu)勢。
為分析多源數(shù)據(jù)融合對礦業(yè)作業(yè)人員健康等級評估結(jié)果的影響,設(shè)置以下5 組對比方案。計算結(jié)果如表3 所示。
表3 多源數(shù)據(jù)融合對健康等級評估結(jié)果的影響
方案1:僅采用體溫特征參數(shù)作為輸入;
方案2:采用體溫+心率特征參數(shù)作為輸入;
方案3:采用體溫+心率+呼吸特征參數(shù)作為輸入;
方案4:采用體溫+心率+呼吸+血壓特征參數(shù)作為輸入;
方案5:所提方法采用全部特征參數(shù)作為輸入。
由表3 可知,礦業(yè)作業(yè)人員健康等級評估結(jié)果的準(zhǔn)確率由大到小依次為:方案5>方案4>方案3>方案2>方案1。這是因為礦業(yè)作業(yè)人員健康等級與體溫、心率、呼吸、血氧、血壓等特征參數(shù)均相關(guān),采用更多類型的特征參數(shù)作為算法的輸入,能夠更加準(zhǔn)確地分析出作業(yè)人員的健康狀態(tài)。
文中基于礦用可穿戴設(shè)備的數(shù)據(jù)結(jié)合多源數(shù)據(jù)融合與支持向量算法開展礦業(yè)作業(yè)人員健康狀態(tài)評估研究。通過算例分析表明,文中所提方法相比于BP 神經(jīng)網(wǎng)絡(luò)算法,在準(zhǔn)確率、計算時間和收斂速度方面具有更優(yōu)的性能;通過體溫、心率、呼吸、血氧、血壓等多種數(shù)據(jù)融合分析,實現(xiàn)了礦業(yè)作業(yè)人員健康狀態(tài)評估,而且數(shù)據(jù)類型越多其評估結(jié)果的準(zhǔn)確性就會越高。但文中對于礦業(yè)作業(yè)人員健康狀態(tài)等級,僅劃分為健康和非健康兩種。為了更全面、清晰地監(jiān)測礦業(yè)作業(yè)人員的身體健康情況,需要進(jìn)行更加細(xì)致的等級劃分,而這有待于結(jié)合醫(yī)學(xué)技術(shù),合理配置參數(shù)權(quán)重展開更深入的研究。