柳青,劉小平,陳浩,張振宇,朱彥卿,李勇
(1.國網(wǎng)湖南省電力有限公司供電服務(wù)中心,長沙 410004; 2.湖南大學(xué) 電氣與信息工程學(xué)院,長沙 410082)
非侵入式負(fù)荷監(jiān)測(Non-intrusive Load Monitoring,NILM)是指在用戶用電入口處安裝測量設(shè)備,采集電壓、電流、頻率、功率等電力數(shù)據(jù),并將其分解為獨立設(shè)備的用電狀態(tài)、用電電量等信息的方法[1]。根據(jù)負(fù)荷監(jiān)測得到的用戶用電行為信息,可為電網(wǎng)公司的調(diào)度,需求響應(yīng)等高級用電策略制定提供依據(jù),也可為用戶自我制定合理的用電規(guī)劃提供參考[2]。
自從文獻(xiàn)[3]在20世紀(jì)80年代提出非侵入式負(fù)荷監(jiān)測的基本思想后,國內(nèi)外學(xué)者已經(jīng)針對該問題進(jìn)行了大量的研究分析。對于這些研究,可以從使用的特征類型與算法類型兩個角度對其進(jìn)行分類。文中著重討論使用的特征對負(fù)荷辨識的影響。從特征角度,可以分為穩(wěn)態(tài)度量(電壓、電流、諧波等有效值數(shù)據(jù))、暫態(tài)度量(電壓、電流等暫態(tài)波形數(shù)據(jù))兩大類。在其中,最典型的穩(wěn)態(tài)度量是Hart提出的在有功功率與無功功率構(gòu)成的復(fù)功率平面上進(jìn)行聚類對設(shè)備分類的方法[3]。有功功率與無功功率可以說是最常見的特征,在文獻(xiàn)[4-12]中均有提及與分析。文獻(xiàn)[13]增廣了穩(wěn)態(tài)電流、暫態(tài)電流等典型負(fù)荷特征,進(jìn)行降維后形成了負(fù)荷空間,并在負(fù)荷空間中進(jìn)行設(shè)備的劃分。文獻(xiàn)[14-16]對設(shè)備特征進(jìn)行了分析,使用了諧波特征進(jìn)行負(fù)荷的分類,結(jié)果表明效果優(yōu)于僅使用有功功率與無功功率。然而,這些基于諧波的方法僅是對于部分設(shè)備可區(qū)分特征的經(jīng)驗性總結(jié),缺乏可拓展性。
另一類基于暫態(tài)波形的負(fù)荷辨識方法,一般基于每周波高達(dá)幾十次至幾百次不等的高頻率采樣與存儲,在這種高頻采樣的情況下,很容易分辨出不同設(shè)備的特定波形與振幅特點[17]。但是由于高頻采樣對通信,存儲與計算帶來的壓力,僅有少量的方法直接基于暫態(tài)波形進(jìn)行負(fù)荷辨識[18]。然而,基于高頻測量轉(zhuǎn)化后的新特征方法被得到了廣泛的應(yīng)用。包括基于傅立葉變換的特征表達(dá)[19-22],基于小波的特征表達(dá)[23-25],基于高斯濾波與工業(yè)檢測累加求和的邊緣檢測方法[26],以及基于V-I曲線的特征表達(dá)[27-31]。另外,這類方法通過對原始高頻采樣數(shù)據(jù)的加工,從中提取出可辨別性強(qiáng)的特征,并進(jìn)一步的加以處理。
對于復(fù)雜運行狀態(tài)中的設(shè)備辨識,常用于家庭環(huán)境下的聚類模型無法正常工作。來自中科院的結(jié)果表明,使用聚類的方法,無法從中得到具體設(shè)備的運行信息,僅能獲得多設(shè)備整體的運行行為分析[32]。伯明翰大學(xué)[33]與牛津大學(xué)[34],早稻田大學(xué)[35]等進(jìn)行的類似研究也表明,聚類等方法在較高的測量層級上能夠分析負(fù)荷的整體行為,但卻難以分離出具體到設(shè)備的行為。因此,較為合理的方法應(yīng)是在合理的特征層級上,使用具備強(qiáng)特征提取能力的方法進(jìn)行數(shù)據(jù)分析。
并且,在復(fù)雜設(shè)備環(huán)境下,由于多種變頻負(fù)荷同時運行,會導(dǎo)致負(fù)荷的功率狀態(tài)在一個較大的范圍內(nèi)波動,并且,多設(shè)備間可能存在運行狀態(tài)耦合,從而產(chǎn)生僅與該環(huán)境相關(guān),與具體設(shè)備無關(guān)的額外特征。對此,一種合理的解決方案是針對每一種設(shè)備進(jìn)行針對性的建模與辨識,從而規(guī)避模型學(xué)習(xí)到多臺設(shè)備間運行關(guān)聯(lián)造成的額外特性,影響模型的遷移能力。也即是說,所謂的“單輸入單輸出”模型,在針對復(fù)雜設(shè)備環(huán)境下的負(fù)荷辨識,具備積極的意義。
雖然轉(zhuǎn)化后的特征對負(fù)荷的辨識具有積極的意義,但是對這些特征的轉(zhuǎn)化計算往往無法在測量同時完成,實質(zhì)上這無法規(guī)避高頻采樣帶來的巨大存儲與通信壓力。相對的,本文發(fā)現(xiàn)大多數(shù)較高等級的電能質(zhì)量分析設(shè)備具備符合IEC 61000-4-30標(biāo)準(zhǔn)的測量,其中包括高頻諧波的幅值,相角等高層次的信息,并且其相對的分析頻率比高頻測量要低得多?;贗EC 61000-4-30標(biāo)準(zhǔn)測量的負(fù)荷辨識算法有望成為一個合理的、介于高頻采樣與低頻采樣中的兼具高表達(dá)能力與低存儲壓力的合理表達(dá)方式。
基于IEC 61000-4-30的測量往往會帶來巨大的特征空間。以日置的某型號電能質(zhì)量分析儀為例,對三相電的測量而言,其可以每秒生成高達(dá)3 537種特征。極高的特征維度為下游的算法帶來了表征的困難,并且顯然會產(chǎn)生維度災(zāi)難,使得下游的算法面對的數(shù)據(jù)過于稀疏,降低算法的效率。
為了解決維度過高帶來的問題,文中提出了一種使用皮爾遜相關(guān)系數(shù)的特征提取方法,并且進(jìn)一步的,在提取的特征基礎(chǔ)上,使用深度卷積神經(jīng)網(wǎng)絡(luò)作為辨識方法,從而實現(xiàn)了對中壓配電網(wǎng)單設(shè)備運行狀態(tài)的辨識。此外,為了表明提出算法的性能,將提出的方法與傳統(tǒng)的支持向量機(jī)(Support Vector Machine,SVM)、K近鄰分類(K-Nearest Neighbor,KNN)和決策樹(Decision Tree,DT)算法進(jìn)行了比較。
(1)
對典型的非侵入式負(fù)荷狀態(tài)辨識任務(wù)而言,測量點的位置在待辨識負(fù)荷的上游。測量點下游其他負(fù)荷產(chǎn)生的特征可以認(rèn)為是與不同特征相關(guān)的干擾噪聲,因此式(1)可以添加噪聲項后修正為:
(2)
該式可以表示負(fù)荷辨識問題的實質(zhì)。在給定時間,給定測量特征中通過映射,得到指定負(fù)荷狀態(tài)的問題可以定義為負(fù)荷狀態(tài)辨識問題。
皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient)一般用來度量變量之間的線性相關(guān)程度。在文中,我們使用皮爾遜相關(guān)系數(shù)來度量特征時間序列Fi與狀態(tài)時間序列S的相關(guān)性,用以在含噪多維特征中篩選出與負(fù)荷狀態(tài)最相關(guān)的特征序列。
對于時長為T的特定的特征序列Fi與狀態(tài)序列S,為求取兩者間的皮爾遜相關(guān)系數(shù),首先求取其均值:
(3)
(4)
以及二者的協(xié)方差Cov(Fi,S)和標(biāo)準(zhǔn)差σFi,σS:
(5)
(6)
(7)
最終可以求取得到兩者間的皮爾遜相關(guān)系數(shù):
(8)
皮爾遜相關(guān)系數(shù)的結(jié)果ρFi,S∈[-1,1],由于本文中的應(yīng)用不關(guān)心具體是正相關(guān)或負(fù)相關(guān),只關(guān)心兩者間是否有相關(guān)關(guān)系,因此本文將得到的皮爾遜相關(guān)系數(shù)取絕對值,使用|ρFi,S|表示二者間的相關(guān)程度,該數(shù)值越趨于1,則越表示該特征與負(fù)荷狀態(tài)之間的相關(guān)度越高。提取與負(fù)荷狀態(tài)相關(guān)性最高的特征序列,即可完成特征篩選工作。
由于卷積神經(jīng)網(wǎng)絡(luò)一般需要的輸入為二維多通道矩陣,與測量形成的一維時間序列不符,因此需要對原始測量數(shù)據(jù)特征重映射為二維多通道矩陣。
對于N維特征時間序列F={F1,F2,…,FN},目標(biāo)是將其重構(gòu)為形狀為n×lw的二維矩陣M,其中n為篩選出的特征數(shù)目,lw是選擇的時間窗長度。令該二維矩陣表示的特征對應(yīng)的時間點為tp,則特征重映射過程可用下式表示:
(9)
為了提升特征的表達(dá)能力,也可以使用差分特征構(gòu)建矩陣M:
(10)
經(jīng)過特征篩選與特征重映射后,特征從多維時間序列變換成為了可供卷積神經(jīng)網(wǎng)絡(luò)處理的類圖像的矩陣特征。
深度卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層,池化層,全連接層,輸出層以及對應(yīng)的激活函數(shù)組成[36]。對于分類任務(wù)來說,卷積神經(jīng)網(wǎng)絡(luò)輸入一般為二維多通道的矩陣,輸出為一維向量。
1.4.1 卷積層
使用N表示輸入的批量,Cin表示通道數(shù),H表示矩陣的行數(shù),W表示矩陣的列數(shù)。對于一個輸入維度為(N,Cin,H,W)的四維矩陣而言,卷積層可以精確的表達(dá)為:
input(Ni,k)
(11)
其中*表示2維滑動點積操作符,i,j分別表示輸出在矩陣中的位置,weight表示權(quán)重。一次完整的卷積操作,需要對輸入的每個點周圍分別進(jìn)行式(11)中的運算。
1.4.2 池化層
文中采用的是全局平均池化,該池化層對每個通道進(jìn)行計算,給定卷積核的尺寸(kH,kW)后,全局平均池化可以表示如下:
(12)
其中,sw,sh分別指池化層在長與寬方向跨步的步長。
1.4.3 全連接層
全連接層即為數(shù)據(jù)的線性關(guān)系。令輸入向量為x,輸出向量為y,偏置值為b,參數(shù)矩陣為A,則線性層可以表示為:
y=xAT+b
(13)
1.4.4 激活函數(shù)
本文中采用的激活函數(shù)主要為Relu函數(shù),變量含義同上,函數(shù)可以表示為:
y=max(0,x)
(14)
1.4.5 深度殘差網(wǎng)絡(luò)
深度殘差網(wǎng)絡(luò)(Residual Neural Network, ResNet)由何凱明在2015年提出,并在同年獲得了ImageNet大規(guī)模視覺識別賽(ImageNet Large Scale Visual Recognition Challenge, ILSVRC)中的圖像分類和物體識別的優(yōu)勝。該網(wǎng)絡(luò)由于采用了殘差結(jié)構(gòu),所以非常容易優(yōu)化。具體而言,以34層的深度殘差網(wǎng)絡(luò)為例,該網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。
圖1 34層的深度殘差網(wǎng)絡(luò)結(jié)構(gòu)
深度殘差網(wǎng)絡(luò)具備卓越的信息提取能力,能夠在圖像中提取出原始數(shù)據(jù)的高效表征組合。在文中,使用深度殘差網(wǎng)絡(luò)來尋找隱含的模式,從而辨識出負(fù)荷對應(yīng)的狀態(tài)。并且,通過使用ImageNet預(yù)訓(xùn)練模型的方式,提升小樣本情況下的模型特征提取能力。
基于以上幾個部分,提出了一種基于深度學(xué)習(xí)與特征篩選的負(fù)荷狀態(tài)辨識方法,如圖2所示。首先針對原始數(shù)據(jù),選擇目標(biāo)測量中可以表征負(fù)荷狀態(tài)的特征,一般來講可以選擇電流特征。其次,對該負(fù)荷狀態(tài)表達(dá)特征與辨識測量點所產(chǎn)生的特征進(jìn)行差分,計算兩兩的皮爾遜相關(guān)系數(shù),選取相關(guān)系數(shù)最高的n條數(shù)據(jù)作為篩選后的特征。隨后,經(jīng)過特征重映射,將其轉(zhuǎn)化為深度殘差網(wǎng)絡(luò)可以處理的格式,然后進(jìn)行訓(xùn)練,最終得到預(yù)測模型。
圖2 所提方法的流程圖
在特征重映射與特征篩選過程中,可以通過差分的方式來增強(qiáng)特征的表達(dá)能力,從而避免持續(xù)的背景功率噪聲對負(fù)荷狀態(tài)辨識的影響。
值得注意的是,圖2中所述的負(fù)荷辨識訓(xùn)練方法是針對單種負(fù)荷而言,對于多測量裝置下接入的不同負(fù)荷,可以采取并行的方法進(jìn)行多設(shè)備識別的處理,具體的流程如圖3所示。左側(cè)部分是進(jìn)行訓(xùn)練的方法,具體而言應(yīng)將不同設(shè)備的運行時在對應(yīng)的測量表中進(jìn)行標(biāo)注,隨后根據(jù)設(shè)備種類來保存設(shè)備的模型,并最終保存入多設(shè)備模型庫中。在推理階段,根據(jù)需求識別設(shè)備的不同,分別對多個表計采集的數(shù)據(jù)進(jìn)行推理,并最終合并結(jié)果獲取多設(shè)備的運行狀態(tài)。
文中的數(shù)據(jù)集采集自某學(xué)校的教學(xué)樓,其配電間的連接關(guān)系圖如圖4所示。
測量點1為總測量,是該配電所的總進(jìn)線。測量點2與3測量的是電梯的負(fù)荷線。三臺設(shè)備之間時間同步,采樣頻率為1 Hz。采樣共進(jìn)行一周,從周五的17:12至下周五的17:01。在采樣期間,教學(xué)樓正常的進(jìn)行教學(xué)工作。文中將電梯電流大于1 A的狀態(tài)定義為運行狀態(tài)。
計算使用的特征為所采集到的特征種類,包括:電壓、電流、有功功率、無功功率、各次電壓電流的諧波與半諧波的有效值與相角,三相不平衡度等參數(shù)的最大值、最小值、平均值。經(jīng)過統(tǒng)計,每臺設(shè)備共產(chǎn)生3 537種有效測量特征。
其中,測量點1的數(shù)據(jù)用于算法訓(xùn)練的輸入數(shù)據(jù),測量點2與3僅用作算法訓(xùn)練的結(jié)果反饋,以及正確率計算的依據(jù)。訓(xùn)練中不采用所有數(shù)據(jù)進(jìn)行訓(xùn)練,僅采用一周中某幾個小時的數(shù)據(jù)。文中的訓(xùn)練僅取一個小時的測試數(shù)據(jù),也就是約占全部采集數(shù)據(jù)的0.59%的數(shù)據(jù)量測試其在極端小樣本條件下的算法性能。通過僅取白天的運行數(shù)據(jù)作為訓(xùn)練,可以測試其在夜晚的泛化性能,進(jìn)而可以推斷在其他不同時間的推理性能。
對非侵入式負(fù)荷辨識算法,常用實際為正預(yù)測為正的真正例(True Positive, TP),實際為負(fù)預(yù)測為正的假正例(False Positive, FP),實際為正預(yù)測為負(fù)的假負(fù)例(False Negative, FN),實際為負(fù)預(yù)測為負(fù)的真負(fù)例(True Negative, TN)作為分類算法性能度量的標(biāo)準(zhǔn)[37]。使用以上四種定義,可以進(jìn)一步的定義精確率P(Precision)、召回率R(Recall)、準(zhǔn)確率A(Accuracy)以及F1-score[38]。
精確率指真正例與所有預(yù)測為正的案例的比值,用來表示算法抗誤檢的能力,定義為:
(15)
召回率為所有正測試案例中算法識別為正的比例,表示算法抗漏檢的能力,定義如:
(16)
準(zhǔn)確率表示測試中預(yù)測正確的案例占全部案例的比值,一般而言準(zhǔn)確率是算法優(yōu)化的第一目標(biāo):
(17)
F1-score為一個平衡了精確率與召回率的指標(biāo),可以較綜合的反應(yīng)不平衡數(shù)據(jù)條件下的算法性能:
(18)
電梯的負(fù)荷辨識屬于難以使用傳統(tǒng)策略的負(fù)荷辨識難題,主要原因在于其有功功率與無功功率的變化范圍十分廣泛,如圖5所示。不同于傳統(tǒng)的單狀態(tài)或多狀態(tài)負(fù)荷,電梯的功率狀態(tài)受承載人數(shù),上升或下降,樓層跨度等多種因素影響,呈現(xiàn)出復(fù)雜的負(fù)荷狀態(tài)。
圖5 電梯負(fù)荷的有功功率(P)與無功功率(Q)的聯(lián)合分布
盡管對電梯的高分辨率能耗進(jìn)行建模是復(fù)雜的[39],但是得益于數(shù)據(jù)驅(qū)動的策略,可以略過建模分析而直接提取出對辨識具有作用的相關(guān)特征。本文設(shè)定兩種特征策略,一種是使用皮爾遜相關(guān)系數(shù)對差分的特征向量進(jìn)行計算,進(jìn)行特征提取,另一種是采用常規(guī)非侵入式負(fù)荷辨識算法中的低次電流諧波有效值及相角,兩種特征策略均選擇50種特征作為算法的輸入。通過皮爾遜相關(guān)系數(shù),可以提取出與負(fù)荷運行狀態(tài)高度相關(guān)的特征,有助于增強(qiáng)特征的信息密度。
圖6展示了使用皮爾遜相關(guān)系數(shù)篩選出的相關(guān)性最高的9組特征,具備高相關(guān)性的數(shù)據(jù),其分布應(yīng)近乎在一條直線上。與圖7中的低次電流諧波特征相比,可以看出前者的變量間具有更高的線性相關(guān)度,二者的變化幾乎呈現(xiàn)線性關(guān)系。而常規(guī)特征中的一些特征與電梯的負(fù)荷并不具備十分強(qiáng)烈的相關(guān)關(guān)系,其實質(zhì)上輸入對電梯辨識無效的特征。綜合對比圖5與圖6,可以發(fā)現(xiàn)使用皮爾遜系數(shù)篩選出的特征具備更好的相關(guān)性。
圖6 皮爾遜系數(shù)法篩選出的特征與電梯電流的聯(lián)合分布圖
圖7 常規(guī)電流特征與電梯電流的聯(lián)合分布圖
在辨識算法上,對比了KNN、SVM、決策樹、Resnet以及預(yù)訓(xùn)練的Resnet共五種模型,運行狀態(tài)辨識的準(zhǔn)確率結(jié)果見圖8,F1-score的結(jié)果見圖9。
圖8 0.59%數(shù)據(jù)量訓(xùn)練的準(zhǔn)確率結(jié)果
圖9 0.59%數(shù)據(jù)量訓(xùn)練的F1-score
算法辨識的目標(biāo)是通過總?cè)肟谔幍淖儔浩鞑杉臄?shù)據(jù),判斷電梯是否處于運行狀態(tài)。圖9中,可以發(fā)現(xiàn)具有最高準(zhǔn)確率的模型是經(jīng)過了預(yù)訓(xùn)練的Resnet模型。除此以外,結(jié)果還表明:(1)預(yù)訓(xùn)練的Resnet模型在差分的特征輸入條件下具有較強(qiáng)的學(xué)習(xí)能力;(2)使用皮爾遜相關(guān)系數(shù)提取特征對算法水平的提升具有強(qiáng)烈的正效應(yīng);(3)即使在小樣本的條件下,通過合適的特征提取方法,也能使得機(jī)器學(xué)習(xí)算法正確的提取出關(guān)鍵的特征組合。這在圖8中展現(xiàn)的算法的F1-score比較中更為明顯。對結(jié)果的分析說明了結(jié)合特征篩選與深度神經(jīng)網(wǎng)絡(luò)的負(fù)荷狀態(tài)辨識方法的有效性。
本文提出了一種基于皮爾遜相關(guān)系數(shù)的特征篩選方法與深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜設(shè)備環(huán)境中多狀態(tài)負(fù)荷狀態(tài)辨識方法。該方法能夠在僅提供少量訓(xùn)練樣本的情況下,取得較高的電梯負(fù)荷運行狀態(tài)辨識成功率。實驗的結(jié)果表明了提出方法的有效性,并且指出:(1)對特征進(jìn)行差分能夠更有效的幫助機(jī)器學(xué)習(xí)算法對負(fù)荷狀態(tài)的特征組合進(jìn)行學(xué)習(xí);(2)圖像識別的預(yù)訓(xùn)練對負(fù)荷狀態(tài)辨識存在積極的效果。在未來的研究中,可以進(jìn)一步地引入更大范圍的時間依賴關(guān)系,從而捕獲負(fù)荷的時間尺度上的行為與狀態(tài)的關(guān)系。