廣東電網(wǎng)有限責(zé)任公司中山供電局 范德和 李新海 劉文平 羅其鋒 周 恒 侯 偉
變電站主要負(fù)責(zé)對電力分配和傳輸?shù)娜蝿?wù),站內(nèi)設(shè)備的安全穩(wěn)定運(yùn)行至關(guān)重要。而隨著電網(wǎng)規(guī)模的不斷擴(kuò)大,變電設(shè)備巡視、檢修、缺陷消除工作量也隨之增長。如果不能及時消除設(shè)備缺陷,可能會造成設(shè)備損壞、爆炸,甚至引發(fā)大面積停電事件。目前,變電設(shè)備出現(xiàn)缺陷時,通常先由變電站運(yùn)行人員進(jìn)行現(xiàn)場檢查,然后向遠(yuǎn)程應(yīng)急指揮人員進(jìn)行匯報。遠(yuǎn)程應(yīng)急指揮人員根據(jù)了解到的缺陷情況,組織檢修專業(yè)班組制定缺陷處理工作方案,安排檢修人員到站缺陷處理。遠(yuǎn)程應(yīng)急指揮人員、遠(yuǎn)程專家與現(xiàn)場運(yùn)行人員、檢修人員主要通過電話、微信、網(wǎng)絡(luò)視頻等方式進(jìn)行溝通?,F(xiàn)場運(yùn)維檢修人員由于經(jīng)驗不足以及準(zhǔn)備資料不夠全面,上報的缺陷信息可能失真而造成誤判,可能導(dǎo)致制定不準(zhǔn)確的缺陷處理方案,進(jìn)而影響相應(yīng)備品備件、工器具的準(zhǔn)備工作,降低變電設(shè)備缺陷處理效率。同時,檢修人員缺陷處理時一邊翻看廠家說明書、圖紙資料、作業(yè)指導(dǎo)書等資料一邊操作,方法繁瑣且不方便,降低了作業(yè)效率。在上述問題下,如何提升變電站設(shè)備缺陷處理工作效率,是一個迫切需要解決的問題。
近年來,增強(qiáng)現(xiàn)實(shí)(Augmented Reality,AR)和智能語音技術(shù)的智能終端在變電站設(shè)備運(yùn)檢中的應(yīng)用,為該問題提供了解決方法。電力系統(tǒng)中利用AR 技術(shù)是在現(xiàn)實(shí)世界中疊加一定時間和空間范圍內(nèi)難以體驗的實(shí)體信息,并將該信息應(yīng)用于現(xiàn)實(shí)世界,不僅可以展示現(xiàn)實(shí)世界信息,而且可以將虛擬世界的信息進(jìn)行顯示,獲得超越現(xiàn)實(shí)的交互體驗,為變電站運(yùn)維檢修工作提供技術(shù)支持[1]。智能語音通過將智能語音識別技術(shù)與電網(wǎng)業(yè)務(wù)的融合,使用語音命令進(jìn)行操作,減輕工作量,提高工作效率[2]。但變電站交互式智能運(yùn)檢系統(tǒng)等相關(guān)技術(shù)研究尚未系統(tǒng)開展。如何結(jié)合智能語音和AR 技術(shù)提高變電運(yùn)行、檢修工作效率,成為新的研究目標(biāo)。
本文提出了一種變電站交互式智能運(yùn)檢系統(tǒng),作業(yè)人員可以通過語音控制智能終端,實(shí)時觀看到AR目鏡所展現(xiàn)的后臺傳輸廠家資料、圖紙、歷史缺陷信息、作業(yè)指導(dǎo)書等作業(yè)指導(dǎo)資料,指導(dǎo)現(xiàn)場作業(yè)人員巡視、維護(hù)、缺陷處理等工作,作業(yè)過程中可以拍攝照片視頻方便歸檔,實(shí)時畫面可以同步視頻會診,后臺專家針對現(xiàn)場實(shí)況作業(yè)指導(dǎo),提高了變電設(shè)備運(yùn)檢效率,確保電網(wǎng)、設(shè)備安全可靠運(yùn)行。
變電站交互式智能運(yùn)檢系統(tǒng)主要由智能終端、后臺管理系統(tǒng)、云/本地服務(wù)器三個部分構(gòu)成,如圖1所示。
圖1 變電站交互式智能運(yùn)檢系統(tǒng)整體架構(gòu)
1.1.1 云/本地服務(wù)器
云服務(wù)器是一種簡單高效、安全可靠、處理能力可彈性伸縮的計算服務(wù)。其管理方式比物理服務(wù)器更簡單高效。云服務(wù)器可以快速構(gòu)建更穩(wěn)定、安全的應(yīng)用,降低開發(fā)運(yùn)維的難度和整體成本。云服務(wù)器存儲的數(shù)據(jù)包括作業(yè)現(xiàn)場圖片錄像、運(yùn)檢數(shù)據(jù)庫(廠家資料,圖紙,缺陷信息)、智能終端定位信息、云數(shù)據(jù)識別庫等內(nèi)容。
1.1.2 后臺系統(tǒng)
變電站交互式智能運(yùn)檢系統(tǒng)監(jiān)控后臺采用Linux 系統(tǒng)開發(fā),包括電腦終端、攝像頭、音響、移動設(shè)備等。電腦終端通過網(wǎng)絡(luò)與移動終端、智能終端進(jìn)行數(shù)據(jù)交互,并對數(shù)據(jù)進(jìn)行儲存和處理,最后將處理結(jié)果輸出到智能終端供作業(yè)人員查看。用戶可以通過監(jiān)控后臺查看作業(yè)人員定位信息和作業(yè)現(xiàn)場的實(shí)時畫面,并與作業(yè)人員交流互動,具有良好的人機(jī)交互效果,實(shí)現(xiàn)遠(yuǎn)程移動視頻監(jiān)控和指揮調(diào)度,極大方面了運(yùn)檢人員的工作。
1.1.3 智能終端
智能終端是一款帶智能眼鏡攝像頭及帶網(wǎng)絡(luò)的智能安全帽。有錄像、本地存儲及夜間照明的功能。智能終端包括:主控模塊、攝像模塊、通信模塊、近電告警模塊、定位模塊、電源模塊、智能語音識別模塊、拾音器模塊和AR 成像模塊。如圖2所示;其中通信模塊包括4G/5G 通信單元、藍(lán)牙通信單元;主控模塊用以接收/輸出數(shù)據(jù);電源模塊連接并為整個變電站交互式智能運(yùn)檢系統(tǒng)提供運(yùn)行用電??梢?,在作業(yè)過程中,無需工作人員雙手手動介入,通過智能語音交互與穿透式AR 影像展示,即可實(shí)現(xiàn)攝制、遠(yuǎn)程會診交流、影像展示、后臺專家的同步視頻會診及危險警告等功能,從而作業(yè)人員可專注于工作,降低操作難度,進(jìn)而提高作業(yè)安全性。
圖2 智能安全帽硬件架構(gòu)
1.2.1 智能識別
智能語音以作業(yè)人員語音和設(shè)備運(yùn)行聲音為研究對象,通過語音信號處理和模式識別,使機(jī)器自動識別人聲和設(shè)備運(yùn)行的聲音。運(yùn)行人員在巡視過程中,通過識別指令信息展示巡視路線圖、作業(yè)表單、作業(yè)指導(dǎo)書、缺陷跟蹤情況、派工信息等內(nèi)容并自動記錄需要的信息;通過識別運(yùn)行設(shè)備聲響并與缺陷庫對比,確認(rèn)設(shè)備運(yùn)行狀態(tài);發(fā)現(xiàn)缺陷時,通過識別運(yùn)行人員指令信息搜索備品備件庫。檢修人員在缺陷處理過程中,通過識別指令信息顯示需要的廠家說明書、圖紙、作業(yè)指導(dǎo)書、歷史缺陷信息等內(nèi)容。圖像識別是通過識別變電站設(shè)備圖片信息,在數(shù)據(jù)庫搜索作業(yè)人員需要的信息。
1.2.2 AR 影像展示
作業(yè)人員在使用穿透式AR 目鏡時,會診數(shù)據(jù)中的會診影像以AR 影像的形式顯示于穿透式AR目鏡的顯示屏上,作業(yè)人員近眼查看會診影像中所包含的施工圖紙、設(shè)計資料,專家指導(dǎo)等,可查閱并對照進(jìn)行缺陷處理,有效解放了工作人員的雙手,使其可專注于缺陷處理作業(yè),提高了作業(yè)效率。
1.2.3 遠(yuǎn)程視頻會診平臺
會診平臺與現(xiàn)場作業(yè)前端進(jìn)行實(shí)時交互、數(shù)據(jù)儲存、功能設(shè)置、人員定位、場景展示和數(shù)據(jù)收集,檢修人員在缺陷處理時通過遠(yuǎn)程視頻會診平臺與專家交流互動,為現(xiàn)場缺陷處理工作提供遠(yuǎn)程技術(shù)支持。
1.2.4 近電告警
當(dāng)作業(yè)人員戴智能安全帽誤入帶電區(qū)和誤攀帶電桿時,近電報警器能及時發(fā)出連續(xù)的音響報警信號,提醒作業(yè)人員注意危險,防止由于錯覺和失誤造成的觸電傷亡事故。
1.2.5 人員定位
定位模塊是對巡視和檢修工作進(jìn)行實(shí)時引導(dǎo)的基礎(chǔ),系統(tǒng)提供實(shí)時準(zhǔn)確的定位,通過在智能終端里面安裝定位模塊達(dá)到定位目的。
智能語音控制技術(shù)通過4G、5G、WIFI 和藍(lán)牙等傳輸途徑,實(shí)現(xiàn)AR 自由曲面目鏡/穿透式顯示設(shè)備實(shí)現(xiàn)遠(yuǎn)程攝像及視頻會診、錄制視頻同步上傳數(shù)據(jù)到后臺、高清攝像頭還原現(xiàn)場故障,即時傳至后臺,實(shí)時進(jìn)行GPRS、北斗等全球定位,精準(zhǔn)定位作業(yè)人員位置。
語音識別是以語音為研究對象,通過語音信號處理和模式識別,使機(jī)器自動識別人類口述的語音。高斯模型(Gaussian Mixture Model,GMM)和隱馬爾可夫模型(Hidden Markov Model,HMM)在語音識別領(lǐng)域廣泛使用[3]。隨著計算機(jī)人工智能領(lǐng)域廣泛發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)被應(yīng)用于機(jī)器學(xué)習(xí),可結(jié)合HMM與DNN 融合搭建DNN-HMM 混合系統(tǒng),可以提高語音的識別率。
語音識別系統(tǒng)框圖包括聲音輸入、語音數(shù)據(jù)、聲學(xué)模型、語音模塊、詞組數(shù)據(jù)、語言模型、語言模塊、結(jié)果輸出等模塊,如圖3所示。聲音輸入到語音模塊,然后將麥克風(fēng)變化的聲音轉(zhuǎn)變?yōu)殡娦盘?,通過消除噪聲和信道失真增強(qiáng)語音信號,將時域信號轉(zhuǎn)化為頻域信號,并為聲學(xué)模型提取有代表性的特征向量,語音模塊數(shù)據(jù)到語言模塊進(jìn)行組合和識別,最后輸出識別結(jié)果;語音數(shù)據(jù)輸出到聲學(xué)模型提取特征向量,輸出到語音模塊進(jìn)行語音識別;詞組數(shù)據(jù)輸出到語言模型提取特征向量,輸出到語言模塊進(jìn)行語言識別。
圖3 語音識別系統(tǒng)框圖
語音識別系統(tǒng)遵循貝葉斯模型,其表達(dá)式為式(1)、式(2)。
式中:L 表示文字序列概率;A 表示語音輸入。式(1)表示語音識別需要在給定的語音輸入情況下,找到最有可能的文字序列。根據(jù)貝葉斯規(guī)則變換,可得式(2)。其中,P(A/L)表示給定一個字節(jié)序列出現(xiàn)該條音頻的概率,即語音識別中的聲學(xué)模型;P(L)表示出現(xiàn)該文字序列的概率,即語音識別中的語言模型。基于GMM-HMM 算法屬于雙重隨機(jī)過程,該算法試圖找到顯性語音輸入與隱性文字輸出之間的概率。
人工智能領(lǐng)域的重要分支深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,混合DNN-HMM 聲學(xué)模型[4]具有很強(qiáng)的學(xué)習(xí)能力和序列化建模能力,在大規(guī)模復(fù)雜的連續(xù)語音識別任務(wù)中,DNN-HMM 聲學(xué)模型比傳統(tǒng)的GMMHMM 模型有大幅度的性能提升。DNN-HMM 混合型系統(tǒng)如圖4所示,HMM 用來描述語音信號的動態(tài)變化,其模型由不同狀態(tài)和狀態(tài)轉(zhuǎn)移概率組成。DNN 在估計觀測概率時考慮了語音特征,使概率分布更加合理有效??梢酝ㄟ^給定的特征向量和詞序列,計算出聲學(xué)模型分?jǐn)?shù)和語言模型分?jǐn)?shù),計算總分最高的詞序作為識別結(jié)果。
圖4 DNN-HMM 混合型結(jié)構(gòu)
變電站語音識別是通過求解輸出字符串與電力詞匯的相似程度,然后按照一定規(guī)則提取數(shù)字化、判決等方法,提高語音識別準(zhǔn)確率。
當(dāng)變電站語音識別模塊有特定語音偵輸入后,系統(tǒng)開始啟動,開始語音識別。語音識別處理程序?qū)⒉粩噍営?xùn)輸出,確認(rèn)是否有識別輸出。如有輸出,則對該識別結(jié)果進(jìn)行特征提取。否則超過一定時間后,系統(tǒng)進(jìn)入休眠狀態(tài)。
人機(jī)交互技術(shù)是結(jié)合語音或肢體手勢等識別算法,將用戶的交互操作經(jīng)過計算后顯示在設(shè)備上,實(shí)現(xiàn)虛擬事物與現(xiàn)實(shí)世界交互[5]。人機(jī)交互技術(shù)逐漸從鍵盤、鼠標(biāo)、按鍵的交互方式發(fā)展為語音、手勢交互等交互方式。人機(jī)交互技術(shù)的發(fā)展,能夠使AR 設(shè)備的應(yīng)用范圍更廣。目前AR 人機(jī)交互的方式主要包括:
(1)手勢交互,人手被當(dāng)成了人機(jī)交互接口,通過設(shè)定的手勢動作和動作作為輸入,對設(shè)備進(jìn)行移動、拖拽和操作等,運(yùn)檢人員可以通過手勢動作實(shí)現(xiàn)翻看文件、聚焦拍照等功能,這種交互方式更加直觀、自然;
(2)語音交互,運(yùn)檢人員可以通過語音進(jìn)行菜單操作,包括搜索資料、拍照、錄像、云臺呼叫等功能。語音交互可以解放用戶的雙手;
(3)多通道交互:作業(yè)人員的手勢、姿態(tài)、語言動作、眼球動作都可作為AR 系統(tǒng)與作業(yè)人員的交互方式。眼球運(yùn)動的跟蹤是通過模式識別、角膜反射點(diǎn)分析、眼球形狀分析和用眼模式分析等方法與AR 系統(tǒng)互動,運(yùn)檢人員頭戴AR 智能設(shè)備凝視特定設(shè)備,識別設(shè)備的狀態(tài)變化。
本系統(tǒng)通過多通道交互方式,實(shí)現(xiàn)變電設(shè)備巡視維護(hù)、操作、缺陷處理等工作更加高效便捷,保證電網(wǎng)的安全穩(wěn)定。
在變電站設(shè)備運(yùn)檢工作過程中對設(shè)備的識別,包括設(shè)備本身的識別和設(shè)備銘牌識別。設(shè)備本身識別用于確定運(yùn)檢的具體設(shè)備以及運(yùn)檢任務(wù)信息等;設(shè)備銘牌識別則主要是獲取設(shè)備信息方便查找備品備件。具體的圖像識別包括一次設(shè)備、二次設(shè)備、設(shè)備銘牌等。
圖像識別技術(shù)廣泛采用哈希算法[6],但這種算法只能用于靜態(tài)圖片的識別,不同的光照、拍攝角度等因素會影響圖像識別質(zhì)量。采用一種性能更好的檢測算法尤為重要,A-KAZE 特征提取算法就比較適合。
2.3.1 圖像特征
圖像特征是指變電站設(shè)備識別時圖像唯一性,區(qū)別于其他圖像,具有可重復(fù)檢測性,在不同的角度,位置,姿態(tài)和環(huán)境亮度情況下,所提取的特征是相同的[7]。
2.3.2 A-KAZE 算法
A-KAZE 算法采用非線性方式擴(kuò)散濾波法,將圖像亮度(L)在不同尺度上的變化視為流動函數(shù)的散度[8],可以用以下非線性偏微分方程來表示:
式中,div 表示散度;?表示梯度;L 表示圖像的亮度;c 表示傳導(dǎo)擴(kuò)散函數(shù),其中t 表示尺度參數(shù),其值越大表示圖像尺度越大,圖像就越簡單。
通過設(shè)置傳導(dǎo)函數(shù)c(x,y,t),傳導(dǎo)函數(shù)設(shè)置公式如下:
由式(3)可知,圖像L(x,y,t)隨時間t 的推移而變化,由此構(gòu)成非線性尺度空間。且事件證明非線性尺度空間無線性尺度空間模糊圖像。
通過圖像識別技術(shù)可在AR 眼鏡上展示設(shè)備的出廠信息、運(yùn)維信息、竣工圖紙等。為變電運(yùn)檢工作帶來便捷,提高現(xiàn)場作業(yè)的效率。
本文研制的變電站交互式智能運(yùn)檢系統(tǒng)已應(yīng)用于某220kV 變電站,共設(shè)計有三套智能終端設(shè)備,供變電運(yùn)行、檢修、繼保人員使用,實(shí)現(xiàn)了變電專業(yè)人員全覆蓋。智能終端安裝在安全帽上,方便檢修人員使用。通過高清攝像視頻實(shí)時連接,語音在線通話,后方遠(yuǎn)程觀看實(shí)時指導(dǎo)作業(yè),管理更加高效便捷,APP 端直播視頻,支持多人觀看管理同一設(shè)備。檢修人員通過該系統(tǒng)可以與后臺專家的同步視頻會診,提高了檢修人員缺陷處理效率。通過后臺監(jiān)控系統(tǒng)與現(xiàn)場作業(yè)前端進(jìn)行實(shí)時交互、數(shù)據(jù)儲存、功能設(shè)置、人員定位、場景展示和數(shù)據(jù)收集,通過大數(shù)據(jù)分析,為每位現(xiàn)場作業(yè)人員保駕護(hù)航,解除安全隱患、提高工作效率。
經(jīng)試驗該變電站交互式智能運(yùn)檢系統(tǒng)語音識別率大于95%,能夠準(zhǔn)確執(zhí)行檢修人員的命令,不受個體差異影響,智能語音識別穩(wěn)定可靠。
該變電站在投入該系統(tǒng)后,有效節(jié)省了人員和時間成本,提高了變電站運(yùn)檢工作效率和識別準(zhǔn)確率,具體作業(yè)時間統(tǒng)計如表1所示,耗時為多次數(shù)據(jù)平均值。
本文研制的變電站交互式智能運(yùn)檢系統(tǒng)集成應(yīng)用了智能語音控制技術(shù)、人機(jī)交互技術(shù)、圖像識別技術(shù),通過智能語音識別即可獲取所需的文件資料,提高作業(yè)安全和作業(yè)效率。運(yùn)檢人員通過AR 智能眼鏡查閱相關(guān)資料,指導(dǎo)現(xiàn)場作業(yè)人員巡視、維護(hù)、缺陷處理等工作;運(yùn)檢人員通過該系統(tǒng)實(shí)現(xiàn)與專家遠(yuǎn)程會診,為現(xiàn)場缺陷處理提供遠(yuǎn)程技術(shù)支持,有效減輕了運(yùn)檢人員的工作負(fù)擔(dān),提升了變電部門缺陷處理工作質(zhì)量和效率,確保電網(wǎng)、設(shè)備安全可靠運(yùn)行。