袁天夢
(國網(wǎng)冀北電力有限公司唐山供電公司,河北 唐山 063000)
由國家統(tǒng)計局數(shù)據(jù)可知,2019年我國全年發(fā)電量達到7 000 TW·h,相比2014年上漲近2 000 TW·h,這表明“十三五”以來,我國發(fā)電廠建設速度顯著提升,且當前發(fā)電廠建設速度仍有逐年加快的趨勢。在發(fā)電廠選址規(guī)劃中,采用合理的協(xié)調(diào)發(fā)展評估模型對電網(wǎng)投資決策過程進行量化評估,是確保投資合理性的重要評估過程[1]。后續(xù)研究中引用的相關數(shù)據(jù),主要來自國家統(tǒng)計局公布數(shù)據(jù)及國家電網(wǎng)相關部門的官網(wǎng)數(shù)據(jù)。
改進歐氏距離協(xié)調(diào)發(fā)展評估模型,是較為常用的電網(wǎng)投資協(xié)調(diào)發(fā)展投資模型,其算法依據(jù)為將GIS(地球地理信息系統(tǒng))的非歐氏距離在小區(qū)域范圍內(nèi)進行歐氏投影,進而以歐氏距離為資源評價權(quán)重,對相關的投資方案進行量化分析,其中更側(cè)重電力需求、實際負荷、區(qū)域經(jīng)濟狀態(tài)等指標。該模型同時還考慮到了各種經(jīng)濟及電力負荷的絕對空間分布,以及相應投資成果的分布密度[2]。
本文在傳統(tǒng)歐氏距離協(xié)調(diào)發(fā)展評估模型的基礎上,對其進行優(yōu)化設計,使該模型可以在機器學習系統(tǒng)中得到應用,實現(xiàn)基于計算機輔助系統(tǒng)的智能化決策。
本文從協(xié)調(diào)性評價目標入手,分析電網(wǎng)的服務型產(chǎn)品種類、投資建設規(guī)模、投資和施工進度、投入產(chǎn)出及盈利所得等指標,可以得知電網(wǎng)投資過程與區(qū)域經(jīng)濟、民生及其他社會效益之間存在協(xié)調(diào)性[3]。
使用AHP(層次分析法)對影響電網(wǎng)投資的相關參數(shù)進行分解,可以得到表1。
表1中形成了投資建設、經(jīng)濟表達、電量供應等3個子系統(tǒng),每個子系統(tǒng)均可以在AHP分析架構(gòu)下得到充分展開。表中共給出24個具體評價指標,雖然該指標體系并不是完備體系,但機器學習評價系統(tǒng)可以有效給出不完備指標體系下的特征傳導通道,此特征也表明如果采用傳統(tǒng)歐氏距離協(xié)調(diào)模型存在數(shù)據(jù)不完備的分析缺陷。
表1 模型相關評價指標體系
協(xié)調(diào)模型可以避免均值評估法的數(shù)據(jù)信息損失量過大的問題,也可以避免中位數(shù)法在區(qū)域特征數(shù)據(jù)信息量損失過程的控制力度較弱的問題[4]。采用高斯模糊法將數(shù)據(jù)進行投影重排,得到式(1):
(1)
從式(1)中可以看到,高斯模糊法是數(shù)據(jù)模糊方案的重要實現(xiàn)模式,其模糊后的投影落點區(qū)間集中在[0,1]區(qū)間,但不局限于[0,1]區(qū)間,所以在函數(shù)域設定中給出[0,1]區(qū)間的函數(shù)域,此時會標定出諸多離群值。與常用的minmax模糊法(線性強制投影法)和Z-score投影法(偏差率去量綱法)相比,該投影模糊法得到的數(shù)據(jù)信息量損失最小,數(shù)據(jù)特征更加明顯[5]。
此時,對表1中數(shù)據(jù)在時間線上進行展開,即在時間j上記錄上述i=24個評價指標的時域分布值,并將其使用高斯模糊重投影法進行去量綱重投影運算,可以得到一個多指標時域矩陣ai,j,假定時域跨度為n,則可以通過式(2)進行歸一計算:
(2)
從時域發(fā)展空間j≤n角度出發(fā),在時域空間上進行進一步統(tǒng)計,可以得到式(3):
(3)
式(3)給出的是所有指標經(jīng)過加權(quán)后在時域j上的歸一傳導公式,如果在此基礎上給出協(xié)調(diào)性最終公式,則可以寫作式(4)、(5):
(4)
(5)
本文梳理的歐氏距離協(xié)調(diào)評估模型的一般實現(xiàn)步驟如圖1所示。
圖1 傳統(tǒng)歐氏距離協(xié)調(diào)評估模型的實現(xiàn)步驟
首先采用高斯模糊對數(shù)據(jù)進行逐一模糊去量綱處理;其次在時間j的驅(qū)動下,實現(xiàn)對每個指標的第i個輸入矩陣逐行歸一化,此歸一化過程為進一步數(shù)據(jù)模糊的過程;再次通過加權(quán)評估模型將歐氏距離權(quán)重系數(shù)ω的信息在i的驅(qū)動下與每個指標進行加權(quán)融合;最終在式(4)的融合模式下,將每個指標信息進行充分融合,輸出信息[6]。
由分析可知,因為24個指標的評價體系并非完備指標體系,可能存在其他相關性指標同時作用于電網(wǎng)投資過程,即該模型無法全面考慮整個因子體系,所以在不完備體系下,應在上述評估體系中,使用基于神經(jīng)網(wǎng)絡的評估體系對歐氏距離協(xié)調(diào)評估模型進行優(yōu)化,使其適應不完備因子體系。
上述方案中,神經(jīng)網(wǎng)絡系統(tǒng)的介入目標是解決24個評價因子不能完全覆蓋可能影響投資綜合結(jié)果所有因子的因子不完備問題,即歐氏距離協(xié)調(diào)評估模型本身并無直接不完備性,所以在使用神經(jīng)網(wǎng)絡介入?yún)f(xié)調(diào)評估模型時,應保留整個歐氏距離協(xié)調(diào)評估模型,并在該模型基礎上加入數(shù)據(jù)融合的神經(jīng)網(wǎng)絡模塊。歐氏距離協(xié)調(diào)評估模型作為模糊多列神經(jīng)網(wǎng)絡的數(shù)據(jù)模糊部分,本文使用多列神經(jīng)網(wǎng)絡對其歸一結(jié)果進行進一步歸一融合[7]。優(yōu)化后的評估模塊,仍然通過X值進行輸出。如圖2所示。
圖2 神經(jīng)網(wǎng)絡模塊的介入方案圖
本文在傳統(tǒng)歐氏距離協(xié)調(diào)評估模型的基礎上,增加了降維模塊、分列模塊、整合模塊,而其他的數(shù)據(jù)處理模塊并未發(fā)生改變。
2.2.1降維模塊
降維模塊的統(tǒng)計學意義是將式(3)輸出的一列時域j驅(qū)動的一維矩陣進行降維卷積,形成1個雙精度浮點變量(Double變量)對其特征進行歸納。該降維過程需要保留足夠的信息損失量存儲空間,即在降維過程中損失的數(shù)據(jù)信息,應通過待回歸變量保存在降維模塊內(nèi),所以應采用多項式回歸函數(shù)對其節(jié)點進行設計,如式(6)所示:
(6)
降維模塊的隱藏層設計受到經(jīng)過高斯模糊的數(shù)據(jù)矩陣中j=n值的影響,輸入層為n個節(jié)點,按照每層隱藏層壓縮2/3節(jié)點數(shù)的梯度進行隱藏層設計,其每層隱藏層的節(jié)點數(shù)n′可由式(7)求得:
(7)
式中:mod(*)函數(shù)為向上取整函數(shù),即將所有小數(shù)位均采用進位方式進行處理。最終通過解算發(fā)現(xiàn):n′<1時跳出,進入輸出層;輸出層為1個節(jié)點。
2.2.2分列模塊
分列模塊的統(tǒng)計學意義是利用降維模塊數(shù)據(jù)和歐氏距離加權(quán)系數(shù)的逐一數(shù)據(jù)融合過程對歐氏距離加權(quán)系數(shù)進行強化,所以該模塊需要對數(shù)據(jù)細節(jié)進行充分放大,常見的神經(jīng)網(wǎng)絡基函數(shù)類型中,log投影回歸函數(shù)符合該設計需求,其基函數(shù)為:
Y=∑(A·lnXi+B)
(8)
式中:A,B為待回歸系數(shù)。
該分列模塊均為2個輸入節(jié)點,包括1個歐氏距離權(quán)重系數(shù)ωi和1個降維模塊的輸入量。因為分列模塊本身無須深度迭代回歸,所以其隱藏層按照2層設計,每層設計3個節(jié)點。
2.2.3整合模塊
因為X值使用式(4)直接輸出,所以整合模塊的統(tǒng)計學意義是在神經(jīng)網(wǎng)絡輸出信息導入原距離協(xié)調(diào)評估模型前,對數(shù)據(jù)進行整理,使其數(shù)據(jù)結(jié)構(gòu)滿足后續(xù)數(shù)據(jù)處理過程的需要。由此可知,其本質(zhì)應為數(shù)據(jù)融合,而非深度迭代回歸,其輸入因子相對復雜,為24個歐氏距離加權(quán)系數(shù)ω和1個降維模塊輸出系數(shù)。該數(shù)據(jù)整合過程的本質(zhì)也是進一步數(shù)據(jù)降維過程[8],所以該模塊應使用多項式回歸函數(shù)進行節(jié)點設計,如式(6)所示。
因為缺少具有數(shù)據(jù)信度的最終評價指標,所以采用電力系統(tǒng)中用于誤差評測的標準偏差率法進行數(shù)據(jù)評估結(jié)果的數(shù)據(jù)效能評價。仿真數(shù)據(jù)來自某電網(wǎng)企業(yè)2019年全年電網(wǎng)投資及全公司運營數(shù)據(jù)和區(qū)域經(jīng)濟統(tǒng)計數(shù)據(jù),仿真平臺使用電力仿真慣用平臺SimuLink 17.0[9],數(shù)據(jù)比較分析使用SPSS24.0的T校驗結(jié)果和P校驗結(jié)果作為參考[10],傳統(tǒng)模型與革新模型之間的分析數(shù)據(jù)標準偏差率比較情況見表2。
表2 仿真驗證結(jié)果比較表
T校驗結(jié)果中,T<10.000時認為數(shù)據(jù)存在差異性。P校驗結(jié)果中,當P<0.05時,結(jié)果處于置信空間;當P<0.01時,認為結(jié)果具有顯著統(tǒng)計學意義。因為兩個模型的F因子歸一過程完全一致,均如式(3)所示,且原始數(shù)據(jù)完全一致,所以其得到了無統(tǒng)計學差異的分析結(jié)果。而革新模型對ω因子進行了基于多列神經(jīng)網(wǎng)絡的強化迭代回歸數(shù)據(jù)挖掘,所以二者出現(xiàn)了顯著的統(tǒng)計學差異(T=2.771<10.000,P=0.003<0.01),傳統(tǒng)模型的偏差率為革新模型的4.32倍。最終X因子的評價結(jié)果中,同樣存在T<10.000且P<0.01的顯著統(tǒng)計學差異,傳統(tǒng)模型的偏差率為革新模型的5.13倍。因此可以說革新模型在數(shù)據(jù)可靠性方面顯著優(yōu)于傳統(tǒng)模型[11]。
將表2中部分數(shù)據(jù)繪制成對比圖,得到圖3。
圖3 系統(tǒng)誤差對比圖
圖3中,革新模型的最終X結(jié)果偏差率和中間結(jié)果ω歸一偏差率顯著低于傳統(tǒng)模型,其根本原因在于使用神經(jīng)網(wǎng)絡深度迭代回歸后,在神經(jīng)網(wǎng)絡模塊兩側(cè)數(shù)據(jù)的統(tǒng)計學關系中可以進行更貼近的數(shù)據(jù)擬合,中間結(jié)果F歸一化處理過程未經(jīng)過神經(jīng)網(wǎng)絡的深度迭代回歸處理,因此其偏差率并未發(fā)生顯著改變。由此可知,在建立邏輯關系不明確但有數(shù)據(jù)驅(qū)動關系的兩列數(shù)據(jù)分析過程算法時,使用更深層次的神經(jīng)網(wǎng)絡深度迭代回歸分析,可以對數(shù)據(jù)分析的標準偏差率進行有效控制。該原理在其他數(shù)據(jù)挖掘分析中依然有效。
該研究的創(chuàng)新點為在保留歐氏距離協(xié)調(diào)發(fā)展評估模型全部基礎數(shù)據(jù)處理模塊的基礎上,使用模糊多列神經(jīng)網(wǎng)絡分析法,對傳統(tǒng)歐氏距離協(xié)調(diào)發(fā)展評估模型進行拆分,在神經(jīng)網(wǎng)絡用于歐氏距離加權(quán)系數(shù)之后,將其與因子歸一化結(jié)果進行逐一融合,最終將數(shù)據(jù)輸送到傳統(tǒng)歐氏距離協(xié)調(diào)發(fā)展評估模型的X值計算模塊中,即傳統(tǒng)歐氏距離協(xié)調(diào)評估模型的各計算模塊作為革新后模糊多列神經(jīng)網(wǎng)絡評價體系的數(shù)據(jù)模糊和數(shù)據(jù)解模糊用途。最終的仿真結(jié)果表明,革新后的歐氏距離協(xié)調(diào)發(fā)展評估模型具有更高的數(shù)據(jù)分析精度。