張?zhí)K,郭裕鈞,張血琴,寧曉雁,尹彩琴
(1.國(guó)網(wǎng)經(jīng)濟(jì)技術(shù)研究院有限公司,北京 102200;2.西南交通大學(xué),四川 成都 611731)
電力系統(tǒng)由發(fā)電廠、變電站、供配電線路以及各類用電負(fù)荷組成,涉及發(fā)輸變配用各個(gè)環(huán)節(jié),輸電線路作為其中的重要一環(huán),是實(shí)現(xiàn)電廠與用戶連接的紐帶。線路故障包括短路故障與斷線故障[1],最為常見的是各種類型的短路,其中單相接地故障的發(fā)生率超過90%,三相短路發(fā)生的概率最低但危害最嚴(yán)重。當(dāng)系統(tǒng)發(fā)生短路時(shí),往往伴隨電流的突增與電壓的驟降,除此之外,還有一些非電氣量的變化。配電網(wǎng)發(fā)生短路故障時(shí),如果由于故障定位不準(zhǔn)確而不能及時(shí)切除,可能會(huì)給供變電設(shè)備帶來不可逆的危害,影響供電穩(wěn)定性[2]。
輸電系統(tǒng)由于長(zhǎng)期暴露于野外,受到周圍環(huán)境諸如暴風(fēng)雨雪、鳥禽以及其他因素的影響,難免遭受電氣故障的侵?jǐn)_[3]。從故障來源的角度分析,線路故障的成因主要來自線路本身與外界環(huán)境兩個(gè)方面。其中,自身因素主要是輸電線路運(yùn)行過程中由于線路接地、線路短路和超負(fù)荷等導(dǎo)致的故障[4];環(huán)境因素則是由于雷電、污蝕、機(jī)械傷害以及導(dǎo)線腐蝕等導(dǎo)致的故障[5]。系統(tǒng)發(fā)生故障后,應(yīng)當(dāng)盡快提取故障特征以確定故障點(diǎn)位置和類型并果斷切除[6]。對(duì)故障的精準(zhǔn)定位可以極大縮短維修時(shí)間與維修成本,縮小停電范圍,盡可能減小對(duì)用戶的影響,提高電網(wǎng)供電的可靠性。除此之外,識(shí)別故障位置還有利于預(yù)防性的維護(hù),減小運(yùn)維人員的勞動(dòng)量等。
諸多學(xué)者對(duì)輸電線路的故障診斷進(jìn)行研究[7-10]。傳統(tǒng)的故障診斷方法有行波法[11-12]和阻抗法[13],行波法隨著新能源大量接入電網(wǎng)適用性降低,而阻抗法在線路結(jié)構(gòu)復(fù)雜時(shí)計(jì)算效率大大下降。隨著數(shù)據(jù)采集與監(jiān)控系統(tǒng)(Supervisory Control And Data Acquisition,SCADA)應(yīng)用于電網(wǎng),一些智能算法如專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)[14-16]、模糊理論[17-18]、Petri 網(wǎng)、粗糙集理論[19-20]等開始嶄露頭角。專家系統(tǒng)是早期使用且相對(duì)成熟的一種診斷方法,其核心在于專家知識(shí)庫(kù)和推理機(jī)的構(gòu)建,在面對(duì)復(fù)雜故障時(shí),診斷速度緩慢甚至可能出現(xiàn)錯(cuò)誤。人工神經(jīng)網(wǎng)絡(luò)雖然在一定程度上可以避免專家知識(shí)庫(kù)構(gòu)建的難題,更穩(wěn)定地進(jìn)行故障診斷,但對(duì)于電力系統(tǒng)的規(guī)模有要求,難以滿足大規(guī)模的電力系統(tǒng)的使用需求。模糊集理論通常會(huì)與其他診斷方法一起使用,對(duì)系統(tǒng)中不確定的故障信息有一定辨識(shí)能力,但診斷系統(tǒng)的結(jié)構(gòu)相對(duì)固定,一旦發(fā)生變化,就需要對(duì)診斷規(guī)則做出改變,維護(hù)性能差。Petri 網(wǎng)診斷方法以網(wǎng)絡(luò)理論為基礎(chǔ),注重事件時(shí)序,對(duì)于大規(guī)模復(fù)雜電網(wǎng)的診斷能力較差,無(wú)法正確識(shí)別錯(cuò)誤和警告信息。粗糙集理論只適用于中小型電力系統(tǒng),對(duì)于大規(guī)模復(fù)雜電網(wǎng)的故障無(wú)法正確診斷,但在信息殘缺問題的處理上有一定優(yōu)勢(shì)。上述方法雖然有較多的應(yīng)用,但仍具有局限性,除了這些算法外,還有一些相對(duì)研究較少的智能算法諸如免疫算法、布谷鳥算法[21]和蝙蝠算法等,在計(jì)算的準(zhǔn)確性和容錯(cuò)性方面都有所改善。另外,由于單一的智能方法進(jìn)行故障診斷仍然存在較大的局限性,且尋優(yōu)過程可能無(wú)法達(dá)到理想效果。因此近幾年診斷算法的混合優(yōu)化成為了研究的熱點(diǎn),將不同算法不同優(yōu)勢(shì)進(jìn)行結(jié)合,揚(yáng)長(zhǎng)避短,在解決大規(guī)模、結(jié)構(gòu)復(fù)雜的故障問題方面具有優(yōu)越性。中國(guó)地質(zhì)大學(xué)的吳笑民[22]等人考慮到支持向量機(jī)模型參數(shù)的問題,利用遺傳算法對(duì)其進(jìn)行優(yōu)化并通過D-S 證據(jù)理論融合方不同支持向量機(jī)模型的診斷結(jié)果,使得診斷準(zhǔn)確率穩(wěn)定達(dá)到97%,還有學(xué)者將模糊邏輯[23]、小波分析[24]與支持向量機(jī)(Support Vector Machine,SVM)結(jié)合對(duì)輸電線路故障進(jìn)行診斷分類,均具有較好的效果。
通過搭建配電線路的四分支仿真模型,分析線路不同位置在正常運(yùn)行以及發(fā)生不對(duì)稱故障(單相接地、相間故障)時(shí)的電氣量變化,將支持向量機(jī)與隨機(jī)森林二者相互結(jié)合,對(duì)線路故障類型進(jìn)行診斷與辨識(shí)。結(jié)果表明,通過測(cè)量故障前后電流與電壓參量的變化可用于推敲故障點(diǎn)位置以及故障類型,該方法能夠?qū)崿F(xiàn)線路故障的快速定位與及時(shí)切除。
算法是目前學(xué)術(shù)界公認(rèn)的,在機(jī)器學(xué)習(xí)、模式識(shí)別及神經(jīng)網(wǎng)絡(luò)最有影響力的成就之一[25]。SVM 基于數(shù)理統(tǒng)計(jì)中較全新的理論,兼顧訓(xùn)練誤差與泛化能力,無(wú)須依賴數(shù)據(jù)且不存在局部極小值問題,其核心思想在于求解出能正確劃分樣本數(shù)據(jù)集,且滿足幾何間隔最大的分離超平面。該理論能實(shí)現(xiàn)對(duì)二維數(shù)據(jù)的線性和非線性可分。其原理如圖1所示[26]。
圖1 SVM原理
圖1 中,分別使用實(shí)心圈和空心圈代表待分類的兩類樣本數(shù)據(jù),實(shí)線用來表示分類的超平面;兩條虛線指的是能夠準(zhǔn)確區(qū)分兩類樣本數(shù)據(jù)且與超平面距離最短的兩個(gè)平面,這兩個(gè)平面之間的距離表示分類間隔,兩條虛線附近紅色的圈代表待分類的支持向量機(jī),w表示超平面的法向量。
假定訓(xùn)練樣本為Di=(xi,yi),i=1,2,…,n,yi={1,-1},其中,xi表示源數(shù)據(jù),yi表示類別值,超平面為w·X+b=0,定義超平面與樣本點(diǎn)的幾何間隔為δi=,需要滿足的約束條件是在準(zhǔn)確區(qū)分樣本數(shù)據(jù)的基礎(chǔ)上使得間隔最大,因此可將該分類問題轉(zhuǎn)化為求解帶約束條件表達(dá)式的最小值問題:
SVM 算法的數(shù)學(xué)本質(zhì)是求解二次優(yōu)化問題,最終結(jié)果為無(wú)解或只有一個(gè)極值。若低維樣本空間難以進(jìn)行線性處理可將其上升至高維空間轉(zhuǎn)化成線性問題再運(yùn)算,比如很多二維不可分的問題在轉(zhuǎn)換至三維空間卻能線性可分。SVM 分類模型構(gòu)建的基本步驟如圖2所示[27]。
圖2 SVM分類步驟
目前,常規(guī)的SVM算法只能用于二分類,對(duì)于數(shù)據(jù)缺失情況容易出現(xiàn)分類錯(cuò)誤。因此,常將SVM算法和其他算法融合使用,取長(zhǎng)補(bǔ)短,提高算法的正確性。如劉永梅等人[28]將SVM 和神經(jīng)網(wǎng)絡(luò)融合進(jìn)行觸電電流檢測(cè);葉遠(yuǎn)波等人[29]將麻雀搜索算法(Sparrow Search Algorithm,SSA)和SVM 結(jié)合用于評(píng)估繼電保護(hù)裝置狀態(tài);方科等人[30]將SVM 和自適應(yīng)粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法融合用于變壓器絕緣故障診斷。融合算法的使用大大提升了評(píng)估、檢測(cè)以及故障診斷的準(zhǔn)確性。
在故障診斷研究中,單一的分類算法均具有各自的缺陷,而集成的分類器通過將單一的分類器進(jìn)行結(jié)合能夠提高分類效果,具有較高的準(zhǔn)確率[31],比如隨機(jī)森林(Randon Forest,RF)。隨機(jī)森林的核心主要體現(xiàn)在“隨機(jī)”和“森林”兩個(gè)方面,“隨機(jī)”是指在構(gòu)建決策樹和環(huán)節(jié)中,采用有放回的抽樣方式,故所產(chǎn)生的每棵決策樹均具有隨機(jī)性;“森林”是指所產(chǎn)生的諸多決策樹彼此之間相互獨(dú)立,也正因如此,這些互不相關(guān)的決策樹才會(huì)產(chǎn)生涵蓋所有可能結(jié)果的預(yù)測(cè)值,不同預(yù)測(cè)值對(duì)最終結(jié)果的影響有差別,這之中少數(shù)較優(yōu)的預(yù)測(cè)結(jié)果會(huì)“脫穎而出”,最終投票的結(jié)果具有較好的可解釋性[32]。目前隨機(jī)森林算法被廣泛應(yīng)用于輸電線路的故障檢測(cè)環(huán)節(jié),且得到了不錯(cuò)的應(yīng)用效果。楊杰和李旭明等人[33-34]均是采用隨機(jī)森林的模型對(duì)輸電線路進(jìn)行故障診斷,且診斷的特征量均是電流量,檢測(cè)結(jié)果均具有較高的準(zhǔn)確性。
隨機(jī)森林不僅能夠?qū)斎氲母呔S特征樣本進(jìn)行重要性評(píng)估,而且對(duì)于缺省值問題有很好的預(yù)測(cè)效果。美中不足的是,在某些干擾較大的分類和回歸問題上,隨機(jī)森林容易出現(xiàn)過擬合現(xiàn)象,而且不同屬性值所占比例也可能會(huì)影響最終分類或回歸結(jié)果。
因此,通??梢钥紤]改進(jìn)隨機(jī)森林算法或?qū)⑵渑c其他算法融合使用,主要體現(xiàn)為兩方面:一是對(duì)構(gòu)建決策樹算法進(jìn)行改進(jìn)和優(yōu)化,二是對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,使其具有更好的適配性。本文主要是考慮將SVM 算法用于隨機(jī)森林決策樹的構(gòu)建,以此達(dá)到提升故障診斷正確率的目的。
1.3.1 SVM-RF模型框架
SVM-RF模型主要由核函數(shù)選擇、決策樹構(gòu)建和分類器三部分組成。在模型訓(xùn)練前,需要先對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,再選擇最優(yōu)的核函數(shù),進(jìn)而利用SVM對(duì)其進(jìn)行模型訓(xùn)練[35];隨后利用SVM 有放回地抽取數(shù)據(jù)使之構(gòu)成決策樹,多個(gè)互不相關(guān)的決策樹構(gòu)建成完整的隨機(jī)森林模型,最后使用這個(gè)模型進(jìn)行電力線路故障類型診斷。模型的總體框架如圖3所示。
圖3 SVM-RF模型框架
第一部分是核函數(shù)選擇。當(dāng)要對(duì)輸入空間的樣本進(jìn)行非線性分類時(shí),由于目標(biāo)函數(shù)和分類決策函數(shù)都只涉及實(shí)例和實(shí)例之間的內(nèi)積,通常利用核函數(shù)代替當(dāng)中的內(nèi)積。常用的核函數(shù)有:高斯核函數(shù)、S型核函數(shù)、h度多項(xiàng)式核函數(shù)等。文章對(duì)比常用的幾種核函數(shù)使用時(shí)SVM 算法的正確率,并通過交叉驗(yàn)證選擇出最佳參數(shù)C和g。
第二部分是決策樹構(gòu)建?;谇笆霾煌撕瘮?shù)的情況,有放回地進(jìn)行抽樣,構(gòu)建多個(gè)互不相關(guān)的SVM決策樹。
第三部分是分類器。將第二部分構(gòu)建的多個(gè)互不相關(guān)的SVM 決策樹用于構(gòu)建隨機(jī)森林分類器,最終形成SVM-RF 分類模型,以此實(shí)現(xiàn)樣本數(shù)據(jù)的分類預(yù)測(cè)功能。
1.3.2 SVM-RF算法流程
基于SVM-RF 的電力線路故障診斷的基本步驟為:
步驟1)每次有放回地從數(shù)據(jù)集中抽取n個(gè)數(shù)據(jù),形成新的訓(xùn)練集,共計(jì)形成K個(gè)訓(xùn)練集。
步驟2)為將數(shù)據(jù)樣本成功區(qū)分單相故障、相間故障及三相故障,可先分離出三相故障,再對(duì)單相故障和相間故障進(jìn)行分類。因此決策樹形成的過程中共計(jì)有2 個(gè)節(jié)點(diǎn)。選取基于高斯徑向基的核函數(shù),通過交叉驗(yàn)證選取最佳參數(shù)C和g值,構(gòu)建初始SVM決策模型。
步驟3)利用抽取的K個(gè)訓(xùn)練集,輸入SVM 決策模型,訓(xùn)練得到K個(gè)決策子模型。
步驟4)眾多決策樹構(gòu)成了隨機(jī)森林,每棵決策樹都會(huì)有一個(gè)投票結(jié)果,最終投票結(jié)果最多的類別,就是最終的模型預(yù)測(cè)結(jié)果。
配電網(wǎng)多分支線路的顯著特點(diǎn)是分支數(shù)量多且網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,西安交通大學(xué)王開等人[36]提出一種多分支配電線路故障定位方法,通過推導(dǎo)傳輸線沿線的電壓與線路端點(diǎn)電壓、電流的關(guān)系,根據(jù)沿線電壓的唯一性來求取故障點(diǎn)位置,能夠取得較高的測(cè)量精度。
文章基于MATLAB/Simulink 仿真軟件,并參考文獻(xiàn)[37]所述,對(duì)四分支配電線路進(jìn)行建模,正常情況下,在主線路M、N 兩端與分支線路P1、P2、P3、P4終端安裝故障監(jiān)測(cè)裝置,線路模型如圖4 所示,其中,EM、EN為主線路首末兩端電源;E1、E2、E3、E4為分支電源,并獲取其在正常運(yùn)行以及多個(gè)不同位置發(fā)生不對(duì)稱故障(A、B 相單相接地故障,AB 相間故障以及三相故障)時(shí)的電壓、電流特征數(shù)據(jù)。線路采用分布參數(shù)模型,M 端電源電壓為110 kV,頻率為50 Hz,輸電線路具體參數(shù)設(shè)置如表1 所示。仿真的故障時(shí)間設(shè)置為0~0.3 s,采樣步長(zhǎng)為0.001 s,仿真算法為ode23tb,仿真時(shí)長(zhǎng)取0.35 s,以此獲得配電系統(tǒng)在不同故障類型時(shí)各相的電壓和電流數(shù)據(jù)。
圖4 四分支110 kV輸電線路模型
表1 輸電線路參數(shù)
鑒于獲得的樣本數(shù)據(jù)具有不穩(wěn)定性與冗余性,故在數(shù)據(jù)預(yù)處理階段,需要依據(jù)不同故障類型的電壓電流特點(diǎn),對(duì)數(shù)據(jù)集進(jìn)行特征選擇和去除冗余操作,各類故障發(fā)生時(shí)的電壓、電流波形變化如圖5 所示,圖5分別展示了A相接地故障、AB相間故障及三相故障時(shí)各相的電壓及電流情況。
圖5 不同故障時(shí)電壓、電流波形變化情況
單相故障時(shí),故障相電壓大幅下降,電流幅值增大且與非故障相反向;兩相相間故障時(shí),故障相電壓出現(xiàn)明顯降低,電流反而呈現(xiàn)增大的態(tài)勢(shì);三相故障時(shí),三相的電壓驟降,電流增大。
3.2.1 故障信息不同完整程度的診斷檢測(cè)率
選用輸電線路發(fā)生故障前后的電氣量(主要指電流、電壓)變化進(jìn)行隨機(jī)森林分類模型訓(xùn)練,分別測(cè)試故障信息完整和缺失兩種情況下各類故障診斷的準(zhǔn)確率,其診斷結(jié)果如表2 所示。由表2 可得,在故障信息完整時(shí),對(duì)于3 種不同類型故障的診斷正確率均達(dá)到95%以上;當(dāng)故障信息出現(xiàn)缺失后,對(duì)各類型的故障診斷誤差均變大,正確率明顯降低,其中單相接地故障診斷的正確率降低30%多,而三相故障診斷的正確率降低最少,但正確率仍高于95%。綜合來看,信息缺失對(duì)于不同故障類型診斷的影響程度不同,后續(xù)還可對(duì)算法進(jìn)行改進(jìn),以使其即使在各類型故障信息缺失時(shí)仍能具有較優(yōu)的準(zhǔn)確率。
表2 不同故障類型診斷正確率 單位:%
3.2.2 故障信息缺失時(shí)不同診斷方法的正確率
對(duì)比分析在故障信息部分殘缺情況下,SVM 算法、RF 算法以及SVM-RF 算法對(duì)不同故障類型的診斷情況,結(jié)果如圖6 所示。圖6 中縱坐標(biāo)中僅整數(shù)值有含義,標(biāo)簽1表示單相故障,標(biāo)簽2表示兩相故障,標(biāo)簽3表示三相故障。
圖6 不同算法的故障診斷正確率
圖6 中,對(duì)于單相故障,三種診斷算法均更易將其誤判為兩相故障;對(duì)于兩相故障,RF 算法更易誤判為單相故障,SVM-RF 更易誤判為三相故障,而SVM 算法的誤判概率最高;對(duì)于三相故障,SVM-RF算法相較于單一的SVM或者RF算法誤判大大降低,診斷正確率大幅度提高。但整體而言,SVM-RF 算法對(duì)于三種故障類型的診斷正確率最好,單一SVM 算法的診斷正確率最差,RF 算法的診斷正確率介于兩者之間。這主要是因?yàn)槌R?guī)的SVM 算法自身不適用于解決多分類問題,而取值劃分比較多的特征影響RF 的決策,從而影響擬合的模型的效果,但使用融合算法時(shí),能夠在一定程度上彌補(bǔ)單一算法的缺陷。
輸電線路是故障頻發(fā)的區(qū)域,對(duì)其進(jìn)行準(zhǔn)確的故障辨識(shí)尤為重要。針對(duì)輸電線路故障數(shù)據(jù)集的特點(diǎn),提出了一種SVM-RF 的線路故障診斷算法,并進(jìn)行仿真分析。
SVM-RF 是SVM 與RF 以及相關(guān)理論的有機(jī)結(jié)合,融合了兩種獨(dú)立算法的優(yōu)勢(shì),相較于單一的算法具有更高的故障診斷準(zhǔn)確率。
通過仿真驗(yàn)證了SVM-RF 算法的可行性,在故障信息完整時(shí),對(duì)于單相接地故障、相間故障、三相故障的診斷正確率分別為95.43%、100%、100%;而在故障信息缺失時(shí),對(duì)于三者的診斷正確率出現(xiàn)明顯降低,分別為62.5%、83.33%、95.8%。
故障信息的缺失對(duì)于不同類型故障的影響程度不同,從而導(dǎo)致對(duì)故障診斷準(zhǔn)確率的不一致。
故障準(zhǔn)確率依賴于故障信息的完整度,在缺失故障信息時(shí)仍能保證對(duì)故障類型較高的準(zhǔn)確率,這將是未來研究工作的主要內(nèi)容。