柯霖
(武漢中超電網(wǎng)建設監(jiān)理有限公司,湖北武漢 430000)
電力工程針對電力系統(tǒng)的發(fā)輸配變環(huán)節(jié)進行建設或改造,對保障系統(tǒng)安全、可靠運行具有重要意義[1-2]。隨著用電服務需求的提升,電網(wǎng)公司對電力工程的精準投資及高效管理也越發(fā)重視。但目前其對于電力工程項目的風險管控主要以事后控制為主,這一管控方式不僅被動且效率較低,因此無法從根本上解決風險問題[3-5]。而電網(wǎng)公司在推進電力工程項目的過程中積累了海量數(shù)據(jù),如何利用這類數(shù)據(jù)實現(xiàn)對工程項目的風險識別與智能管控,也是亟需解決的關(guān)鍵問題[6]。
針對上文所述,文中基于電力工程多源數(shù)據(jù)融合方法,通過將模糊C均值聚類(Fuzzy C-Means,F(xiàn)CM)、改進螢火蟲算法(Improve Firefly Algorithm,IFA)與支持向量機(Support Vector Machine,SVM)相結(jié)合,實現(xiàn)了對電力工程項目風險的精準識別,并有效提升了相關(guān)項目監(jiān)理管控的智能化水平。
為了利用電力工程數(shù)據(jù)智能處理系統(tǒng)實現(xiàn)對多源數(shù)據(jù)的分析,對工程項目的風險進行精準識別并保障項目的質(zhì)量,該文構(gòu)建了如圖1 所示的風險識別指標體系。該體系包括環(huán)境風險、技術(shù)風險、經(jīng)濟風險與管理風險四個方面的18 個關(guān)鍵技術(shù)指標。
圖1 風險識別指標體系框架
該文提出一種融合了FCM、IFA 及SVM 算法的電力工程項目風險識別方法,其結(jié)構(gòu)如圖2 所示。該方法首先采用FCM 對多源異構(gòu)數(shù)據(jù)樣本進行聚類分析,以減少不同簇類特征差異對后續(xù)風險識別過程的干擾;然后利用IFA 算法對SVM 模型的懲罰系數(shù)與核函數(shù)參數(shù)進行優(yōu)化,從而提高SVM 模型的風險識別準確率;將聚類完成的數(shù)據(jù)輸入優(yōu)化完成的SVM 模型中,從而實現(xiàn)對電力工程項目風險的精準識別。
圖2 FCM-IFA-SVM算法結(jié)構(gòu)
由于FCM 具有計算過程簡便、場景適應性較強以及收斂速度快等特點[7-9],故其在高緯度、大規(guī)模的多源數(shù)據(jù)融合分析中應用廣泛。
假設輸入數(shù)據(jù)集共有N個數(shù)據(jù)樣本,每個數(shù)據(jù)樣本維度為D維,則數(shù)據(jù)集可用矩陣的形式描述如下:
式中,X為輸入數(shù)據(jù)矩陣。
FCM 算法經(jīng)過聚類最終得到c個簇類,而各個簇類的中心為:
其中,zc為第c個簇類的中心,其定義為:
FCM 算法與其他聚類算法的不同之處在于,每個數(shù)據(jù)樣本xn并非嚴格地劃分至某一簇類,而是以模糊隸屬度值的形式描述其歸屬于某一簇類的可能性。且數(shù)據(jù)樣本之間的模糊隸屬度滿足以下關(guān)系:
式中,vnc為數(shù)據(jù)樣本xn劃分為簇類中心zc的可能性,即模糊隸屬度;同時,每個數(shù)據(jù)樣本歸屬于所有簇類的可能性之和為1。
因此,聚類迭代過程的目標即為令目標函數(shù)取值最?。?/p>
式中,β為權(quán)重參數(shù);hnc為數(shù)據(jù)樣本xn與簇類中心zc的笛卡爾距離,其計算方式如下:
其中,xnd和zcd分別為數(shù)據(jù)樣本xn與簇類中心zc的d維特征值。
FCM 算法的基本過程為:從數(shù)據(jù)樣本中隨機選取初始化簇類中心;再根據(jù)模糊隸屬度對其進行計算并更新;從而使式(5)中的目標函數(shù)達到最小。該算法流程如圖3 所示。
圖3 FCM算法流程
FCM 算法主要步驟如下:
1)參數(shù)初始化:輸入FCM 算法簇類個數(shù)C及權(quán)重參數(shù)β,并計算代數(shù)上限G、精度閾值ε。
2)初始化模糊隸屬度與簇類中心:隨機選取C個數(shù)據(jù)樣本作為簇類中心,且隨機初始化模糊隸屬度,進而令計算代數(shù)g=1。
3)根據(jù)模糊隸屬度更新簇類中心:
4)根據(jù)簇類中心更新模糊隸屬度,同時計算目標函數(shù)值:
目標函數(shù)值的計算方式如下:
5)判斷是否滿足終止條件,若是,則結(jié)束計算;否則,跳至步驟3)。終止條件為:
6)經(jīng)過FCM 迭代計算后,得到最終的簇類中心及每個數(shù)據(jù)樣本所屬聚類中心的模糊隸屬度值。再選取最大模糊隸屬度所對應的簇類作為數(shù)據(jù)樣本最終的歸屬:
式中,cn為數(shù)據(jù)樣本xn所屬的簇類,且其簇類中心為zc。
傳統(tǒng)的FA 算法是模擬螢火蟲利用光強度進行信息傳遞的行為機制[11-12],且螢火蟲的光強度越大,對其他螢火蟲的吸引力便越強。其中,螢火蟲的吸引力計算方式為:
式中,φ0為初始吸引力;λ為光吸引參數(shù);rij為位置在xi和xj螢火蟲之間的距離,其計算方式如下:
式中,‖?‖為二范數(shù),d為待求解問題的解空間維數(shù)。
FA算法根據(jù)下式來計算并更新螢火蟲所處位置:
在該次所采用的IFA 算法中,光強較弱的螢火蟲將不斷向光強較強的螢火蟲移動,并使得所有螢火蟲最終聚集到光強較強的個體附近,從而得到最優(yōu)解。在算法前期,螢火蟲之間的距離較遠,可通過式(14)中的固定步長進行搜索,令搜索速度降低。但當算法進入后期,螢火蟲之間的距離較小,固定步長易使螢火蟲在移動過程中越過最優(yōu)解,且出現(xiàn)收斂速度慢、在最優(yōu)解附近來回震蕩的現(xiàn)象。因此,文中針對式(14)加以改進,將固定步長改進為與螢火蟲之間距離呈正相關(guān)的自適應步長。IFA 算法中,螢火蟲位置的更新機制如下:
此次所采用SVM 算法[13]的核心思想是通過函數(shù)?(x)將非線性數(shù)據(jù)樣本映射至高維空間,從而將非線性問題轉(zhuǎn)化為線性問題。SVM 算法可描述為求解如下所述的數(shù)學規(guī)劃問題:
式中,J為損失函數(shù),w為斜率;b為截距;η為懲罰系數(shù);κq為松弛因子。
?(x)通常為徑向核函數(shù):
其中,σ為核函數(shù)參數(shù)。由上述討論可知,η和σ對SVM 算法的計算準確性具有較大影響,但對二者的選取通常存在隨機性[14-16]。為了提高電力工程項目風險識別的準確性,該文采用IFA 算法對這兩個關(guān)鍵參數(shù)進行優(yōu)化,實現(xiàn)了如圖2 所示的FCMIFA-SVM 算法。
為驗證所提FCM-IFA-SVM 算法在電力工程項目中的風險識別準確性,從某省電網(wǎng)的電力工程數(shù)據(jù)智能處理系統(tǒng)中篩選出580 條數(shù)據(jù)作為訓練樣本集,并進行了相關(guān)的仿真分析。
傳統(tǒng)FA 算法與文中所提IFA 算法,對SVM 模型中的懲罰系數(shù)η及核函數(shù)參數(shù)σ進行優(yōu)化的迭代過程,如圖4所示??梢奍FA算法相比于FA算法具有更快的收斂速度,且其在第13 次迭代計算時已經(jīng)達到最優(yōu)值,而傳統(tǒng)FA算法在第24次迭代時才開始收斂。
圖4 算法迭代過程
FA 算法與IFA 算法的優(yōu)化結(jié)果,如表1 所示。結(jié)合圖4 可知,IFA 算法的最終誤差比FA 算法更小,優(yōu)化結(jié)果更為理想。因此,SVM 模型的懲罰系數(shù)η及核函數(shù)參數(shù)σ分別取為32.8 和0.012。
表1 兩種算法對參數(shù)優(yōu)化的結(jié)果對比
進一步將相同數(shù)據(jù)樣本作為輸入,對比分析SVM、FCM-SVM 與FCM-IFA-SVM 算法的電力工程項目風險識別準確度,結(jié)果如表2 所示。由表可知,F(xiàn)CM-IFA-SVM 算法的識別結(jié)果明顯優(yōu)于其他兩種算法,其風險識別平均準確率可達92.4%。相比于其他兩種算法的識別結(jié)果,分別提升了7.1%和2.9%。
表2 不同算法風險識別結(jié)果對比
與SVM 相比,F(xiàn)CM-SVM 算法通 過FCM 實現(xiàn)了對具有相同特征數(shù)據(jù)樣本的聚類分析,并降低了樣本間的簇類差異對于風險識別結(jié)果的干擾,所以其具有更高的風險識別準確度。而FCM-IFA-SVM 相比于FCM-SVM 算法,其利用IFA 來完成對SVM 模型中懲罰系數(shù)η與核函數(shù)參數(shù)σ的優(yōu)化選取,從而進一步提升了SVM 模型對風險識別的準確度。
將本算法應用于10 個電力工程項目的風險識別中,所得結(jié)果如表3 所示。表中“1”代表電力工程項目風險識別屬于該風險等級,“0”則代表不屬于該風險等級。
表3 實際電力工程項目風險識別結(jié)果
從表3 可看出,10 個電力工程項目中,風險等級為“較低風險”及以下的有8 個,占比達到80%。而項目2 和項目9 為“中風險”,故需加強對這兩個項目的監(jiān)理管控。
利用電力工程中產(chǎn)生的多源數(shù)據(jù),該文結(jié)合模糊聚類與機器學習算法實現(xiàn)了對電力工程項目風險的精準識別。所提FCM-IFA-SVM 算法通過FCM 降低了樣本數(shù)據(jù)簇類之間差異對風險識別結(jié)果的干擾,利用IFA 算法優(yōu)化了SVM 模型的參數(shù),進而提高了模型的分類性能。與經(jīng)典算法相比,該文算法的電力工程項目風險識別準確率顯著提高。在某省電網(wǎng)實際應用中,其能夠準確評估電力工程項目的風險等級,這對于電力工程項目的智能管控而言具有重要的工程意義。但所提算法僅能評估風險等級,無法實現(xiàn)對風險來源的獲取及識別,這將在下一步研究中開展。