李 蓋,鄭克行,楊斌浩,沈 杰
(1.國網(wǎng)浙江省電力有限公司樂清市供電公司,浙江 樂清 325600; 2.國網(wǎng)溫州供電公司,浙江 溫州 325028)
產(chǎn)業(yè)鏈是產(chǎn)業(yè)經(jīng)濟學中的一個概念,是各個產(chǎn)業(yè)部門之間基于一定的技術經(jīng)濟關聯(lián),并依據(jù)特定的邏輯關系和時空布局關系客觀形成的鏈條式關聯(lián)關系形態(tài)。產(chǎn)業(yè)鏈是一個包含價值鏈、企業(yè)鏈、供需鏈和空間鏈四個維度的概念。產(chǎn)業(yè)鏈中存在著大量上下游關系和相互價值的交換,上游環(huán)節(jié)向下游環(huán)節(jié)輸送產(chǎn)品或服務,下游環(huán)節(jié)向上游環(huán)節(jié)反饋信息。從經(jīng)濟視角對產(chǎn)業(yè)鏈所作的研究工作相當豐富,但一個不可避免的瓶頸和制約在于,產(chǎn)業(yè)鏈研究需要基于經(jīng)濟統(tǒng)計數(shù)據(jù),而經(jīng)濟統(tǒng)計數(shù)據(jù)存在較大的時滯,長達1~2個月甚至一個季度,對管理和決策部門來說,達不到提前預判的時效性需求,從用電量的視角來分析產(chǎn)業(yè)鏈顯得十分必要。結合先驗的產(chǎn)業(yè)鏈經(jīng)濟特征,著重挖掘用電量的關聯(lián)強度和集群關系,建立合理模型,借助可視化的手段探索得出產(chǎn)業(yè)鏈拓撲結構以及子結構,通過網(wǎng)絡節(jié)點相對位置和邊的長度,體現(xiàn)出產(chǎn)業(yè)鏈關鍵特征,透視產(chǎn)業(yè)結構的規(guī)律及其隨時間的演化趨勢。
對于電力網(wǎng)絡的研究主要有3大分支。一是使用真實的電力物理運輸網(wǎng)絡,通過研究復雜網(wǎng)絡線路的拓撲結構的改變,來研究電力網(wǎng)絡在停電事故中表現(xiàn)出的脆弱性[1]。文獻[2]基于復雜系統(tǒng)理論對電網(wǎng)故障的時空分布特性和結構脆弱性進行了研究;文獻[3]針對電力系統(tǒng)故障診斷問題的特征對因果網(wǎng)絡進行了擴展,構建了一種新的時序因果網(wǎng)絡,并提出了基于時序因果網(wǎng)絡的故障診斷方法[3]。第二種是分析電力市場價格時序網(wǎng)絡。文獻[4]運用復雜網(wǎng)絡理論分析了2007—2012年13個歐洲(歐盟)電力現(xiàn)貨價格的代表性樣本的相互作用,其構建的網(wǎng)絡包含7 651個動態(tài)變量,其中節(jié)點對應于不同的歐盟國家,節(jié)點的連邊加權了各個電價變化之間的格蘭杰(Granger)因果關系[4];文獻[5]將動態(tài)網(wǎng)絡分析應用于電力部門,考察澳大利亞國家電力市場(NEM)中區(qū)域現(xiàn)貨電價之間的關系, 通過交互連接的網(wǎng)絡區(qū)域市場表現(xiàn)出更強的依賴性,而Granger因果關系的方向可能與區(qū)域間貿(mào)易有關。第三種主要是考察不同行業(yè)、地區(qū)或企業(yè)用電量之間的邏輯聯(lián)系,包括因果關系和相關關系等,通過最小生成樹(MST)、層次樹(Hierarchical Tree)、聚類分析等方法,考察用電量網(wǎng)絡的多種結構和特性。文獻[6]使用上海市不同行業(yè)的用電量數(shù)據(jù)建立行業(yè)用電量關系網(wǎng)絡,并利用最小生成樹和復雜網(wǎng)路的社團發(fā)現(xiàn)對不同行業(yè)網(wǎng)絡進行聚類分析,以此揭示行業(yè)間的聯(lián)系;文獻[7-8]分別采用皮爾遜相關性和偏相關關系建立因果關系,檢驗行業(yè)用電量間的動態(tài)關系;文獻[9]使用層次結構法對南方各省的電力消耗網(wǎng)絡進行了網(wǎng)絡拓撲結構分解[9];文獻[10]對歐洲電力市場建立因果關系網(wǎng)絡,并使用方差分解的思想,來判定影響歐洲用電量結構穩(wěn)定的因素。
本文溯源時間序列的Granger因果推斷的初始想法[11],在前述文獻的基礎上,創(chuàng)新性地建立了以灰色關聯(lián)度為基礎的因果網(wǎng)絡,并用多維標度法合理降維,使得原始信息得到最大比例的保留,從而得到性質(zhì)更優(yōu)良、分析更便捷、時間動態(tài)更顯性化的因果網(wǎng)絡。
本項目研究數(shù)據(jù)主要是溫州市2019年以來的分行業(yè)日用電量時序數(shù)據(jù)。來源為網(wǎng)上電網(wǎng)、中國政府網(wǎng)以及中國歷史氣象網(wǎng)站。時間區(qū)間為2019年1月1日至2021年6月30日。數(shù)據(jù)內(nèi)容可概括為以下幾個方面。
(1) 全行業(yè)日電量數(shù)據(jù)。主要是依照國民經(jīng)濟行業(yè)分類(GB/T 4754—2017)所形成的133個行業(yè)大類的日用電量數(shù)據(jù)以及企業(yè)級用戶數(shù)據(jù)。后者包含字段:用戶編號、額定容量(kVA)、電壓等級、行業(yè)類型、用電地址、用戶狀態(tài)、用戶類別、用電量(kWh)、立戶日期、銷戶日期、管理單位、日期等。
(2) 溫州市每日氣溫數(shù)據(jù)。包含字段:日期、星期、日最高氣溫、日最低氣溫、天氣、風力風向、空氣質(zhì)量指數(shù)等。
(3) 節(jié)假日安排表。根據(jù)2019—2021年這3年的《國務院辦公廳關于部分節(jié)假日安排的通知》,將節(jié)日標簽添加一列嵌入到時序數(shù)據(jù)中。
數(shù)據(jù)預處理按照慣例流程,先將原始用電量數(shù)據(jù)的多個表格拼接,組成完整時間序列。然后對用電量數(shù)據(jù)進行行業(yè)匯總,并刪除缺失值較多的行業(yè),行業(yè)分類中的四級子行業(yè)予以刪除。對行業(yè)進行編號,并建立編號與行業(yè)名稱的對照表。氣象數(shù)據(jù)的最高溫和最低溫字段轉(zhuǎn)換為數(shù)值型。行業(yè)用電量受氣溫變化影響會在冬夏兩季包含控溫負荷,將行業(yè)用電量的氣溫因素排除。根據(jù)行業(yè)用電特性,先要依據(jù)行業(yè)氣溫與用電量呈現(xiàn)二次函數(shù)的特征篩選出受影響的行業(yè),再具體建立二次回歸模型去除這些行業(yè)的溫控用電量。
行業(yè)用電量與氣溫變化時序如圖1所示。
圖1 行業(yè)用電量與氣溫變化時序圖
本文先將日用電量時序數(shù)據(jù),通過灰色關聯(lián)度體現(xiàn)選取時段的相關關系,再結合以該相關關系構建的距離矩陣,通過多維標度(MDS)法降維至二維平面上的點陣。在盡可能少地損失信息的前提下,能將原始行業(yè)用電量時序的相關關系保留。技術路線圖如圖2所示。
圖2 技術路線圖
灰色關聯(lián)分析法(GRA),是指對于兩個系統(tǒng)之間的因素,其隨時間或不同對象而變化的關聯(lián)性大小的量度。在系統(tǒng)發(fā)展過程中,若兩個因素變化的趨勢具有一致性,即同步變化程度較高,即可謂二者關聯(lián)程度較高;反之,則較低。因此,灰色關聯(lián)分析方法,是根據(jù)因素之間發(fā)展趨勢的相似或相異程度,亦即“灰色關聯(lián)度”,作為衡量因素間關聯(lián)程度的一種方法。時間序列波動的相似性如圖3所示。
圖3 時間序列波動的相似性
通過灰色關聯(lián)分析,可以得出兩個影響因素之間的關聯(lián)性。具體到本文的行業(yè)用電量時間序列,通過所述方法去掉周末和溫度影響,構建行業(yè)用電量波動的相似性。具體步驟如下。
(1) 確定反映系統(tǒng)行為特征的參考數(shù)列和影響系統(tǒng)行為的比較數(shù)列。
(2) 確定各個指標的權重,可用層次分析法。
(3) 確定參考數(shù)列與比較數(shù)列的灰色關聯(lián)系數(shù)ξ。
灰色關聯(lián)系數(shù)的計算公式如下:
(1)
ξ0i(k)為比較數(shù)列xi對參考數(shù)列x0在第k個指標上的關聯(lián)系數(shù),其中ρ∈[0,1]為分辨系數(shù)。一般來講分辨率會隨分辨系數(shù)ρ同步變化。目前大多數(shù)研究在利用Granger因果檢驗進行實證研究時都取分辨系數(shù)為0.5。
多維標度法(Multidimensional Scaling,簡稱MDS)是一種多元統(tǒng)計方法,它是一種在低維空間展示“距離”數(shù)據(jù)結構的多元數(shù)據(jù)分析技術。多維標度法起源于心理測度學,用于理解人們判斷的相似性。Torgerson拓展了Richardson及Klingberg等人的研究,突破性地提出了多維標度法,后經(jīng)Shepard和Kruskal等人進一步發(fā)展完善。
多維標度法解決的問題是:當n個對象(object)中各對對象之間的相似性(或距離)給定時,確定這些對象在低維空間中的表示(感知圖Perceptual Mapping),并使其盡可能與原先的相似性(或距離)“大體匹配”,使得由降維所引起的任何變形達到最小。多維空間中排列的每一個點代表一個對象,因此點間的距離與對象間的相似性高度相關。也就是說,兩個相似的對象由多維空間中兩個距離相近的點表示,而兩個不相似的對象則由多維空間兩個距離較遠的點表示。多維空間通常為二維或三維的歐氏空間,但也可以是非歐氏三維以上空間。多維標度法的具體步驟如下。
(1) 建立距離矩陣D;若為相似性矩陣C,則需要通過變換dij=1-cij得到距離矩陣。相似度越高,距離越近,反之越遠。
(3) 求原始數(shù)據(jù)的高維距離結構的低維擬合構圖。記λ1≥λ2≥L≥λr為B的正特征根,λ1,λ2,L,λr對應的單位特征向量為e1,e2,L,er,Γ=(e1,e2,L,er)是單位特征向量為列組成的矩陣,則:
(2)
矩陣X中每一行對應空間中的一個點。其中n為行業(yè)數(shù),r一般取2或3.這里要投射成二維擬合構圖,設定r為2。相當于將每一個行業(yè)變成了一個二維平面上的點,點之間的距離體現(xiàn)了行業(yè)用電量的相似性。該相似性將在其后得到的因果網(wǎng)絡圖中得以保留。
對于用電波動相關性強的行業(yè),只能得到在時間上的繼起性,兩者電量波動更可能同時發(fā)生,而無法判斷因果方向,也就是得不到哪個行業(yè)是用電量視角的先導性產(chǎn)業(yè)。要得到這種關系,本文借助于統(tǒng)計學中的Granger因果檢驗的方法來實現(xiàn)。
(3)
(4)
式中的X和Y為差分平穩(wěn)后的時間序列,式(3)表示子自回歸,式(4)表達的含義是X是否受到Y的滯后項的影響。其理論依據(jù)在于:在僅有一個變量(X)的預測系統(tǒng)中,如果增加另一個變量(Y)能提高系統(tǒng)的預測精度,則認為Y是X的Granger原因。Y行業(yè)影響X行業(yè)并不是以同步增減的方式進行,而是以循序漸進的累積效應而驅(qū)動它的發(fā)展。這符合實際的產(chǎn)業(yè)發(fā)展特征。
Granger因果檢驗的步驟如下。
(1) ADF單位根檢驗,看變量序列是否為平穩(wěn)序列,若平穩(wěn),可構造回歸模型等經(jīng)典計量經(jīng)濟學模型;若非平穩(wěn),進行差分,當進行到第i次差分時序列平穩(wěn),則服從i階單整(注意趨勢、截距不同情況選擇,根據(jù)P值和原假設判定)。
(2) 若所有檢驗序列均服從同階單整,構造VAR模型,做協(xié)整檢驗。根據(jù)AIC和BIC指標最小化原則確定最佳滯后期。
(3) 確定好滯后期,可以構造VEC模型或者進行Granger因果檢驗,檢驗變量之間是否存在“誰引起誰變化”,即因果關系是否存在。因果檢驗的F值可以理解為概率上的顯著性,是因果關系成立的強弱指標。
根據(jù)Granger因果檢驗結果,建立有向圖網(wǎng)絡,箭頭表示因果方向。對于兩個行業(yè)而言,存在互為因果的可能,比如“電氣制造業(yè)”的用電量波動是“金屬冶煉行業(yè)”電量波動的原因,這種關系也可以反過來。基于Granger因果關系的有向圖網(wǎng)絡,以長期(如一年)的時間序列的灰色關聯(lián)矩陣的MDS二維構圖點設定相對位置,以顯著性水平F值作為網(wǎng)絡中邊的權值,以邊的粗細來體現(xiàn)。F檢驗的統(tǒng)計量公式如下:
(5)
式(5)中的RSS0和RSS1分別是xi系數(shù)為0的帶約束回歸平方和不帶約束的回歸平方和,n是樣本數(shù),p為滯后期數(shù)。通過兩兩關聯(lián)的時序因果分析,最后能得出帶權重的因果網(wǎng)絡有向圖,該圖可以分析出行業(yè)間的相互驅(qū)動關系。
對133個行業(yè)作預處理刪除后還剩下96個行業(yè),這96個主導行業(yè)所形成的因果網(wǎng)絡如圖4所示。該因果網(wǎng)絡的顯著特征是其中每一個節(jié)點代表一個特定時間段的行業(yè)用電量時序,并且節(jié)點間的距離反映了行業(yè)間用電量的相關性。距離越近,相關性越強,反之則越弱。箭頭的出發(fā)端表示原因,箭頭指向端表示結果,邊的粗細反應因果關系的顯著性程度,邊越粗越顯著。該網(wǎng)絡可以隨時間變化而動態(tài)調(diào)整,考慮到行業(yè)間用電量的相互影響傳導周期,這里體現(xiàn)的時間段以180天為基準。
圖4 全行業(yè)用電量的因果網(wǎng)絡圖
對圖4的全局因果網(wǎng)絡,可以很容易計算主要的復雜網(wǎng)路特征,度值排序在前10位的行業(yè)節(jié)點特征見表1所示。按出度排序是“紡織業(yè)”“食品制造業(yè)”“采礦業(yè)”居前,按總度值和入度排序是“食品制造業(yè)”“汽車制造業(yè)”“非金屬礦采選業(yè)”居前。
表1 因果網(wǎng)絡的度值特征
從全局網(wǎng)絡中,可以摘取局部子網(wǎng)絡進行分析。是以醫(yī)藥制造業(yè)、軟件和信息技術服務業(yè)以及金屬制品業(yè)為中心節(jié)點的子網(wǎng)絡分別見圖5~7。
圖5 醫(yī)藥制造業(yè)子網(wǎng)絡
圖6 軟件和信息技術服務業(yè)的子網(wǎng)絡
圖7 金屬制品業(yè)的子網(wǎng)絡
從圖7可以看出,“儀器儀表制造業(yè)”“計算機、通信及其他電子設備制造業(yè)”“橡膠與塑料制品業(yè)”“金屬制品業(yè)”“有色金屬冶煉和壓延加工業(yè)”和“電氣機械和器材制造業(yè)”構成了一個關聯(lián)緊密的產(chǎn)業(yè)集群,“計算機、通信及其他電子設備制造業(yè)”的用電波動會引發(fā)“金屬制品業(yè)”的用電波動,“電氣機械和器材制造業(yè)”的用電波動會引發(fā)“儀器儀表制造業(yè)”“橡膠與塑料制品業(yè)”以及“有色金屬冶煉和壓延加工業(yè)”的用電波動。
本文采用溫州市2019年1月1日至2021年6月30日的行業(yè)日用電量數(shù)據(jù)和其他輔助數(shù)據(jù),結合統(tǒng)計模型和復雜網(wǎng)絡原理,構建了帶權重值的有向因果網(wǎng)絡。該網(wǎng)絡基于時序相似性的灰色關聯(lián)度,以及多維標度的降維方法,可以對全市用電關聯(lián)情況作可視化呈現(xiàn),對全市用電關聯(lián)有全局性的了解,并可以捕捉隨時間推移的動態(tài)變化規(guī)律。因果網(wǎng)絡不僅可以凸顯出網(wǎng)絡中的關鍵節(jié)點(行業(yè)),還可以對行業(yè)之間的經(jīng)濟聯(lián)系作預判。用電樞紐節(jié)點的用電量發(fā)生大幅下降,會影響到全局網(wǎng)絡的脆弱性。借助層次分析法,還對行業(yè)進行層次聚類,可以將所有行業(yè)得到不同的行業(yè)集群。因果網(wǎng)絡是基于Granger因果檢驗方法,對最近一年以來的行業(yè)用電時序作統(tǒng)計上的因果推斷,根據(jù)因果方向以及F檢驗的強度,得出帶權重的有向圖。該有向圖反映了行業(yè)用電波動的傳播途徑,即一個行業(yè)的用電波動會引發(fā)另一行業(yè)的用電波動,形成鏈條式的產(chǎn)業(yè)鏈圖譜。因果網(wǎng)絡不同于相關網(wǎng)絡,相關網(wǎng)絡反映同時性的用電相關關系,即用電量同時朝同一方向呈力度相近的趨勢變化,可以用來作趨勢預判。因果網(wǎng)絡則適用于邏輯關聯(lián),該邏輯關聯(lián)不一定會馬上呈現(xiàn)彼此間的驅(qū)動關系,但存在內(nèi)在邏輯聯(lián)系,在時間上通過一段時滯的傳導,能對另外的行業(yè)產(chǎn)生影響。