張莎 李玉兵 高偉 潘虹
[摘 要] 針對(duì)當(dāng)前電網(wǎng)可靠性問題,以輸電線路缺陷數(shù)據(jù)為研究核心,分析缺陷發(fā)生的各種規(guī)律,找出引發(fā)缺陷的關(guān)鍵因素;通過(guò)數(shù)據(jù)實(shí)際反映線路缺陷與桿塔信息間的邏輯關(guān)系,實(shí)現(xiàn)多角度、多維度數(shù)據(jù)分析。通過(guò)篩選關(guān)聯(lián)性高解釋能力強(qiáng)的桿塔信息做缺陷預(yù)測(cè),及時(shí)發(fā)現(xiàn)設(shè)備隱患,分析設(shè)備存在的問題,輔助管理人員決策。
[關(guān)鍵詞] 多維度數(shù)據(jù)分析;隨機(jī)森林分類模型;輸變電設(shè)備;缺陷評(píng)估
中圖分類號(hào):F407.61 文獻(xiàn)標(biāo)識(shí)碼:A
一、輸電線路設(shè)備缺陷評(píng)估分析現(xiàn)狀
輸電線路設(shè)備是電網(wǎng)內(nèi)重要設(shè)備,各級(jí)輸電線路多數(shù)處在野外,所以其遭受自然、人為破壞的影響比較大,缺陷的出現(xiàn)會(huì)造成各級(jí)線路處于危險(xiǎn)當(dāng)中,因此研究缺陷發(fā)生的線路、發(fā)生的部位、地段等,對(duì)指導(dǎo)線路運(yùn)檢和管理具有很現(xiàn)實(shí)的意義[1]。以某市供電公司330kV及110kV輸電線路為例,其普遍采用人工巡檢的方式,該方式有顯著的不足:
一是工作效率低。據(jù)輸電線路人員定額標(biāo)準(zhǔn)測(cè)算,每人平均工作效率為4公里/日,在沒有大規(guī)模應(yīng)用機(jī)巡作業(yè)之前,輸電運(yùn)維缺員嚴(yán)重。二是巡檢質(zhì)量不高。受地形、觀察視角、技能、經(jīng)驗(yàn)等因素影響,工人依靠肉眼或望遠(yuǎn)鏡等簡(jiǎn)單工具容易對(duì)隱患判斷失誤。三是作業(yè)風(fēng)險(xiǎn)高。工人經(jīng)常需要翻山越嶺、登塔走線,不僅勞動(dòng)強(qiáng)度大,而且工作條件艱苦,且工作中存在野生動(dòng)物傷人、高空墜落、中暑、凍傷等人身安全風(fēng)險(xiǎn)[2]。
二、輸電線路缺陷評(píng)估分析設(shè)計(jì)思路
針對(duì)目前輸電線路巡檢管理存在的一些現(xiàn)狀,為有效對(duì)輸電線路設(shè)備的缺陷進(jìn)行有效管理,需要我們運(yùn)用新的技術(shù)來(lái)開展工作。根據(jù)分析結(jié)果,可以準(zhǔn)確判別缺陷類別、缺陷嚴(yán)重程度、設(shè)備的狀態(tài)等信息。及時(shí)發(fā)現(xiàn)設(shè)備隱患,分析設(shè)備存在的問題,輔助管理人員決策,從而進(jìn)一步完善輸電線路設(shè)備管理體系。
三、輸電線路設(shè)備缺陷評(píng)估數(shù)據(jù)分析
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律的信息和知識(shí)的技術(shù),是統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)技術(shù)和人工智能技術(shù)的綜合。結(jié)合項(xiàng)目需求,項(xiàng)目組對(duì)某市供電公司的輸電線路設(shè)備歷史缺陷數(shù)據(jù)進(jìn)行了如下分析:
(一)數(shù)據(jù)集構(gòu)建
原始數(shù)據(jù)來(lái)源見下圖:
其中基礎(chǔ)數(shù)據(jù)規(guī)模約30 Mb,缺陷數(shù)據(jù)規(guī)模約2Mb。
基礎(chǔ)數(shù)據(jù)的質(zhì)量問題重點(diǎn)來(lái)自于缺失值,通過(guò)對(duì)數(shù)據(jù)整體做非空頻次分析,利用唯一值判斷等手段評(píng)估缺失率超過(guò)90%的多列數(shù)據(jù)挖掘意義不大,予以舍棄;缺陷數(shù)據(jù)的質(zhì)量問題重點(diǎn)來(lái)自于編碼不一致,存在大量主觀描述、同義近義詞數(shù)據(jù),通過(guò)查閱輸電運(yùn)檢規(guī)程予以統(tǒng)一。
數(shù)據(jù)預(yù)處理分為數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)整合三個(gè)步驟:
1.數(shù)據(jù)清洗。通過(guò)確定缺失值范圍,去除不需要的字段,連續(xù)變量使用平均值或中值填充,其余根據(jù)輸電業(yè)務(wù)知識(shí)推測(cè)填充。2.數(shù)據(jù)轉(zhuǎn)換。對(duì)數(shù)據(jù)做了統(tǒng)一化、標(biāo)準(zhǔn)化、離散化處理。3.數(shù)據(jù)整合?;谝淹瓿汕逑础⑥D(zhuǎn)換工作的基礎(chǔ)數(shù)據(jù)和缺陷數(shù)據(jù),基于所屬線路和桿塔編號(hào)兩個(gè)關(guān)聯(lián)變量,整合完成寬表。
(二)多維相關(guān)性分析
1.通過(guò)缺陷大類和電壓等級(jí)的Pareto分析,確定分析的重點(diǎn)在于330kV和110kV線路的本體缺陷。2.通過(guò)本體缺陷的分布分析,得知本體缺陷多發(fā)于鄉(xiāng)鎮(zhèn)及農(nóng)牧區(qū)的戈壁灘平原;且在本體缺陷中占比最高的是桿塔缺陷和金具缺陷。3.通過(guò)桿塔外部缺陷的鳥害缺陷數(shù)據(jù)分析,發(fā)現(xiàn)該地區(qū)輸電線路鳥害有季節(jié)性、反復(fù)性、區(qū)域性三個(gè)明顯特征。4.通過(guò)缺陷分類和所屬線路的偏差分析,得到宗龍線、永夾線無(wú)論是一般還是危急缺陷異常值高,急需安排B、C類檢修的分析結(jié)論。
(三)隨機(jī)森林模型預(yù)測(cè)分析
通過(guò)K折交叉驗(yàn)證法,項(xiàng)目組選取準(zhǔn)確率最高的模型:隨機(jī)森林(RandomForest)作為本研究的建模工具。
隨機(jī)森林從本質(zhì)上屬于機(jī)器學(xué)習(xí)的一個(gè)很重要的分支,叫做集成學(xué)習(xí)。它的工作原理是生成多個(gè)分類器/模型,各自獨(dú)立地學(xué)習(xí)和作出預(yù)測(cè)。這些預(yù)測(cè)最后結(jié)合成單預(yù)測(cè),因此優(yōu)于任何一個(gè)單分類做出的預(yù)測(cè)。
隨機(jī)森林最主要的兩個(gè)參數(shù)是n_estimators和max_ features以及max_depth。
n_estimators:表示森林里樹的個(gè)數(shù)。理論上是越大越好,但是計(jì)算時(shí)間也相應(yīng)增長(zhǎng)。所以,并不是取得越大就會(huì)越好,預(yù)測(cè)效果最好的將會(huì)出現(xiàn)在合理的個(gè)數(shù)。
max_depth:決策樹最大深度。
max_features:每個(gè)決策樹的隨機(jī)選擇的特征數(shù)目。每個(gè)決策樹在隨機(jī)選擇的max_features特征里找到某個(gè)“最佳”特征,使得模型在該特征的某個(gè)值上分裂之后得到的收益最大化。max_features越少,方差就會(huì)減少,但同時(shí)偏差就會(huì)增加。對(duì)于分類問題,max_features=sqrt(n_features)。
由于本研究使用的模型為隨機(jī)森林,主要的可調(diào)超參數(shù)為多個(gè),故用網(wǎng)格搜索法確定最優(yōu)參數(shù)。主要評(píng)價(jià)指標(biāo)為擬合效果,次要評(píng)價(jià)指標(biāo)為訓(xùn)練時(shí)間。
n_estimators取值為[1,2,3,4,5,6,7,8,9,10,15,20,30]
引入網(wǎng)格搜索,實(shí)驗(yàn)結(jié)果如下:
最佳的弱學(xué)習(xí)器迭代次數(shù)= {n_estimators: 30}
擬合結(jié)果= 0.7558819171324392
網(wǎng)格搜索經(jīng)歷時(shí)間:0.978 S
接著項(xiàng)目組選取對(duì)決策樹最大深度max_depth和內(nèi)部節(jié)點(diǎn)再劃分所需最小樣本數(shù)min_samples_split進(jìn)行網(wǎng)格搜索。
實(shí)驗(yàn)結(jié)果如下:
決策樹最大深度 {max_depth: 7}
擬合結(jié)果 0.791231732776618
網(wǎng)格搜索經(jīng)歷時(shí)間:0.792 S
引入以上兩個(gè)最佳參數(shù)后,看看現(xiàn)在模型的袋外分?jǐn)?shù),實(shí)驗(yàn)結(jié)果如下:
{max_features: 5}
擬合結(jié)果0.8225469728601252
最后用搜索到的最佳參數(shù)(n_estimators=30,max_ depth= 7,max_features=5)結(jié)合最終的模型擬合,得到袋外分?jǐn)?shù)oob_score_= 0.868,模型此時(shí)已經(jīng)接近最優(yōu)了。
通過(guò)網(wǎng)格搜索進(jìn)行參數(shù)調(diào)優(yōu),驗(yàn)證模型的質(zhì)量分別從耗時(shí)、準(zhǔn)確率、誤差和ROC曲線方面比較判斷,驗(yàn)證了改進(jìn)的系統(tǒng)分類模型無(wú)論在耗時(shí)上還是在分類的精確率上都有所提高,促使本機(jī)器學(xué)習(xí)模型能夠變成得到較高精度的缺陷預(yù)測(cè)模型。
四、輸電線路設(shè)備缺陷評(píng)估成果應(yīng)用
本項(xiàng)目的多維分析內(nèi)容在輸電線路設(shè)備缺陷數(shù)據(jù)結(jié)構(gòu)化后,可作為智能監(jiān)測(cè)分析平臺(tái)的應(yīng)用參考,結(jié)合輸電運(yùn)維指標(biāo)體系,形成一套完整的輸電運(yùn)維駕駛艙系統(tǒng)。
本項(xiàng)目使用的交叉驗(yàn)證法-隨機(jī)森林分類模型在訓(xùn)練樣本不斷充實(shí)、基礎(chǔ)數(shù)據(jù)不斷完善的趨勢(shì)下,可以有諸多的應(yīng)用擴(kuò)展。例如通過(guò)對(duì)時(shí)間序列再次建模,可以對(duì)未來(lái)1-2個(gè)檢修基準(zhǔn)周期內(nèi)任意線路的任意桿塔做缺陷預(yù)測(cè),從而達(dá)到故障預(yù)警輔助運(yùn)維人員決策的目的;
五、輸電線路設(shè)備缺陷評(píng)估成果成效
項(xiàng)目應(yīng)用預(yù)期成效主要體現(xiàn)在以下三個(gè)方面:
(一)資金方面合理高效使用
通過(guò)對(duì)缺陷和隱患的分析,評(píng)估線路運(yùn)行狀態(tài),為線路規(guī)劃設(shè)計(jì)、施工驗(yàn)收、大修技改項(xiàng)目?jī)?chǔ)備等各環(huán)節(jié)提供依據(jù)。
(二)管理更高效智能
目前基層班組普遍缺員嚴(yán)重,通過(guò)數(shù)據(jù)分析情況評(píng)價(jià)線路風(fēng)險(xiǎn)及狀態(tài),自動(dòng)告警,為輔助決策提供依據(jù)。更合理使用人力資源,避免人力資源的浪費(fèi)以及該巡視的地方?jīng)]有巡視到情況的發(fā)生。
(三)線路運(yùn)檢更加科學(xué)
通過(guò)數(shù)據(jù)的分析和模型預(yù)測(cè)應(yīng)用,可以發(fā)現(xiàn)設(shè)備缺陷和隱患的具體位置,自動(dòng)告警,為輔助決策。從多個(gè)維度分析各類缺陷的發(fā)生規(guī)律,建立分類模型進(jìn)行缺陷預(yù)測(cè),更有助于有的放矢,大大減少資源浪費(fèi),增強(qiáng)輸電運(yùn)檢單兵戰(zhàn)斗力。
六、結(jié)語(yǔ)
通過(guò)建立智能監(jiān)測(cè)分析平臺(tái),輸電線路缺陷數(shù)據(jù)將由非結(jié)構(gòu)化轉(zhuǎn)向結(jié)構(gòu)化,過(guò)程管控也由人工化轉(zhuǎn)為科學(xué)化,不僅降低了電力企業(yè)的成本預(yù)算,還提高了電力巡檢工作的效率,這讓供電公司輸電運(yùn)檢智能化業(yè)務(wù)能力支撐能力明顯增強(qiáng)。
通過(guò)對(duì)桿塔臺(tái)賬數(shù)據(jù)和無(wú)人機(jī)自動(dòng)巡視缺陷報(bào)告數(shù)據(jù)資源的梳理和整合,使供電公司輸電運(yùn)維檢修方案決策第一次實(shí)現(xiàn)“用數(shù)據(jù)說(shuō)話”,有助于公司未來(lái)更好地運(yùn)用大數(shù)據(jù),實(shí)現(xiàn)電力大數(shù)據(jù)的價(jià)值挖掘,激發(fā)企業(yè)的創(chuàng)新模式,實(shí)現(xiàn)公司管理水平的全面飛躍。
參考文獻(xiàn):
[1]李志鵬.基于大數(shù)據(jù)分析的輸電線路管理系統(tǒng)及故障診斷研究[D].武漢:湖北工業(yè)大學(xué),2015.
[2]李龍.輸電線路的狀態(tài)檢修技術(shù)的探討初探[J].山東工業(yè)技術(shù),2018(22):209.