田 豐,鄧曉平,張桂青,王保義
(山東建筑大學(xué)信息與電氣工程學(xué)院山東省智能建筑技術(shù)重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250101)
智能電網(wǎng)的發(fā)展和電力需求的持續(xù)增長(zhǎng)促進(jìn)了智能用電技術(shù)的日益更新,電器層面海量的用電信息逐漸體現(xiàn)其數(shù)據(jù)支撐的關(guān)鍵作用[1]。負(fù)荷監(jiān)測(cè)一方面能夠使電力用戶更為詳細(xì)地了解其不同時(shí)段各類用電設(shè)備的電能消耗,幫助其制定合理的節(jié)能計(jì)劃,減少電費(fèi)開支,另一方面有助于電力公司實(shí)現(xiàn)“削峰填谷”,促進(jìn)電網(wǎng)穩(wěn)定運(yùn)行[2-3]。
負(fù)荷監(jiān)測(cè)包括非侵入式負(fù)荷監(jiān)測(cè)和侵入式負(fù)荷監(jiān)測(cè)(Intrusive Load Monitoring, ILM)2類。NILM相較于ILM不需安裝大量的傳感器和測(cè)量裝置,只需要在用戶電力總回路處安裝測(cè)量裝置,就能夠監(jiān)測(cè)用戶每一個(gè)電器的用電信息,從而減小購(gòu)買、安裝和維護(hù)NILM系統(tǒng)硬件的成本,是未來負(fù)荷分解的發(fā)展熱點(diǎn)之一[4]。
NILM的關(guān)鍵在于負(fù)荷特征和識(shí)別算法的選擇。負(fù)荷特征通常分為穩(wěn)態(tài)特征和暫態(tài)特征2類。功率變化是最常使用的時(shí)域穩(wěn)態(tài)特征,文獻(xiàn)[5]通過計(jì)算功率變化量提取特征,這類特征簡(jiǎn)單直觀,但當(dāng)負(fù)荷數(shù)量很多時(shí),特征會(huì)重疊,影響識(shí)別準(zhǔn)確度;文獻(xiàn)[6-7]對(duì)電流電壓波形計(jì)算出一系列統(tǒng)計(jì)特征,如峰值、均值等,可以很容易對(duì)負(fù)荷種類進(jìn)行區(qū)分,但還是不能處理特征重合問題;文獻(xiàn)[8-9]提取U-I軌跡(Voltage-current Trajectory)特征進(jìn)行負(fù)荷識(shí)別,效果比功率特征更好,但難以區(qū)分小型負(fù)荷;文獻(xiàn)[10]通過傅里葉變換,得到穩(wěn)態(tài)電流諧波特征,這種方法抗干擾能力差,容易受到噪聲干擾。
相對(duì)于穩(wěn)態(tài)特征,暫態(tài)特征與設(shè)備本身的特性相關(guān)性更強(qiáng),所以能夠更好地進(jìn)行設(shè)備辨識(shí)。文獻(xiàn)[11-12]通過計(jì)算功率波形的指標(biāo)如峰值、均值、均方根等進(jìn)行負(fù)荷識(shí)別,這種方式可以辨識(shí)功耗相近的設(shè)備;文獻(xiàn)[13]通過對(duì)電器狀態(tài)變化時(shí)產(chǎn)生的電壓擾動(dòng)求傅里葉變換,得到電壓諧波特征,這種方式?jīng)]有考慮外界影響所引起的電壓波動(dòng),可適用性不高;文獻(xiàn)[14]利用暫態(tài)過程瞬時(shí)電流進(jìn)行負(fù)荷識(shí)別,對(duì)瞬時(shí)電流做小波變換,轉(zhuǎn)換為時(shí)頻域特征,或者計(jì)算瞬時(shí)電流波形的峰值、均值、均方值等指標(biāo)進(jìn)行負(fù)荷識(shí)別,這種方式能實(shí)現(xiàn)負(fù)載相近的設(shè)備的識(shí)別,對(duì)于波形指標(biāo)的計(jì)算更快速簡(jiǎn)單。
綜合考慮負(fù)荷穩(wěn)態(tài)與暫態(tài)特征的優(yōu)勢(shì),能進(jìn)一步提高負(fù)荷識(shí)別精度,具有更廣的應(yīng)用前景。文獻(xiàn)[15]選取電流、電壓、有功、無功四者組合的7種負(fù)荷特征進(jìn)行負(fù)荷識(shí)別,發(fā)現(xiàn)4種負(fù)荷特征聯(lián)合時(shí)能獲得更高的識(shí)別準(zhǔn)確度。文獻(xiàn)[16]采用2步分類算法實(shí)現(xiàn)負(fù)荷識(shí)別,第1步使用暫態(tài)信號(hào)的變化率特征初步識(shí)別負(fù)荷的種類,第2步使用穩(wěn)態(tài)電流的諧波特征進(jìn)一步識(shí)別出具體負(fù)荷種類,這種方式降低了分解難度,提高了負(fù)荷識(shí)別的準(zhǔn)確率。
負(fù)荷識(shí)別算法大致分為組合優(yōu)化和模式識(shí)別2類。基于組合優(yōu)化的模型對(duì)于負(fù)荷較少且設(shè)備特性已知的情況有比較好的分解效果,但是模型本身是NP完全問題,優(yōu)化困難[17]?;谀J阶R(shí)別的算法能直接從數(shù)據(jù)中學(xué)習(xí)設(shè)備特征,應(yīng)用更廣泛。其中支持向量機(jī)(Support Vector Machine, SVM)[18-19]、k均值(k-means)[20-21]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)[22-24]、隱馬爾科夫模型[25-26]、模糊聚類模型[27]都是在負(fù)荷識(shí)別中常用的模型。但是現(xiàn)有算法的研究大多數(shù)是以提高負(fù)荷識(shí)別準(zhǔn)確率為目的,算法的復(fù)雜度和計(jì)算量不斷增加,NILM系統(tǒng)最終需要應(yīng)用在嵌入式設(shè)備中以實(shí)現(xiàn)實(shí)時(shí)的負(fù)荷識(shí)別,現(xiàn)有的算法研究忽略了實(shí)際應(yīng)用中NILM低成本的需求。
針對(duì)上述研究不足,本文提出一種基于改進(jìn)kNN算法與暫穩(wěn)態(tài)特征的非侵入式負(fù)荷監(jiān)測(cè)方法。首先,選擇無需訓(xùn)練的kNN算法作為負(fù)荷識(shí)別模型,采用基于距離權(quán)重的統(tǒng)計(jì)方法對(duì)傳統(tǒng)的kNN模型進(jìn)行改進(jìn),彌補(bǔ)了數(shù)據(jù)采集過程中引起的誤差擾動(dòng)導(dǎo)致的負(fù)荷識(shí)別準(zhǔn)確率低的問題,同時(shí)對(duì)kNN算法識(shí)別結(jié)果增加余弦相似度判斷機(jī)制,實(shí)現(xiàn)對(duì)電路中陌生設(shè)備的辨識(shí);其次,針對(duì)使用單一的特征負(fù)荷識(shí)別準(zhǔn)確率不足問題,提出暫穩(wěn)態(tài)特征結(jié)合方案,選擇分離穩(wěn)態(tài)過程波形的暫態(tài)時(shí)域統(tǒng)計(jì)特征和穩(wěn)態(tài)頻域諧波特征作為負(fù)荷特征;最后通過實(shí)驗(yàn)采集數(shù)據(jù)驗(yàn)證提出的非侵入式負(fù)荷監(jiān)測(cè)方法的有效性。
NILM系統(tǒng)可以僅在電力總回路入口處采集總電氣參數(shù)信息,根據(jù)每種負(fù)荷狀態(tài)變化時(shí)具備的獨(dú)有特征識(shí)別出不同負(fù)荷。因此負(fù)荷特征是NILM系統(tǒng)能實(shí)現(xiàn)負(fù)荷識(shí)別的主要依據(jù),負(fù)荷特征的選擇應(yīng)具有足夠的區(qū)分度。
穩(wěn)態(tài)特征可以很容易對(duì)負(fù)荷的種類進(jìn)行區(qū)分,但當(dāng)負(fù)荷數(shù)量很多時(shí),穩(wěn)態(tài)負(fù)荷特征容易出現(xiàn)特征重合現(xiàn)象。而暫態(tài)特征與設(shè)備本身的特性相關(guān)性更強(qiáng),文獻(xiàn)[12]通過計(jì)算瞬時(shí)電流波形的峰值、均值、均方值等指標(biāo)進(jìn)行負(fù)荷識(shí)別,能夠有效地辨識(shí)出同時(shí)性時(shí)間及功耗相近的設(shè)備。所以本文在使用穩(wěn)態(tài)諧波特征的基礎(chǔ)上增加暫態(tài)統(tǒng)計(jì)特征,能有效提高負(fù)荷特征區(qū)分度。
負(fù)荷識(shí)別的第一步是檢測(cè)出電力總回路中是否有負(fù)荷投切。當(dāng)負(fù)荷啟?;蚬ぷ鳡顟B(tài)切換時(shí),電流有效值會(huì)發(fā)生明顯的波動(dòng),因此本文利用相鄰周期電流有效值的突變實(shí)現(xiàn)投切事件的檢測(cè)。事件檢測(cè)實(shí)現(xiàn)的流程如圖1所示。通過實(shí)時(shí)監(jiān)測(cè)主回路中每個(gè)周期的電流有效值,并比較相鄰2個(gè)周期的電流有效值的變化量,相鄰2個(gè)周期的電流有效值變化量由公式(2)計(jì)算。
(1)
ΔI=|Is+1-Is|>δ
(2)
其中Is為當(dāng)前周期電流有效值,s為當(dāng)前周期,N為一個(gè)周期內(nèi)采樣點(diǎn)數(shù),t為周期內(nèi)任一采樣點(diǎn),it為采樣點(diǎn)t的電流瞬時(shí)值,Is+1為Is的下一個(gè)周期電流有效值,δ為判斷有暫態(tài)過程發(fā)生的閾值。δ值由接入電路中功率最小的電器決定,同時(shí)也利用ΔI作為暫態(tài)過程結(jié)束的判斷基準(zhǔn):
ΔI<γ
(3)
其中γ為判斷暫態(tài)過程結(jié)束閾值。
在真實(shí)場(chǎng)景中,往往存在多個(gè)負(fù)荷同時(shí)運(yùn)行的情況,此時(shí)利用事件檢測(cè)機(jī)制提取的負(fù)荷投切事件波形混合了總回路中正常運(yùn)行負(fù)荷的波形。對(duì)混合波形進(jìn)行分析將極大地增加負(fù)荷識(shí)別的難度,使得識(shí)別結(jié)果準(zhǔn)確率降低,因此需要對(duì)檢測(cè)到的事件波形進(jìn)行分離。本文根據(jù)電流疊加原理對(duì)電力總回路中的負(fù)荷進(jìn)行分離。
根據(jù)電流疊加原理,主回路中的總電流由回路中投入運(yùn)行的各種負(fù)荷的電流信號(hào)混合形成。當(dāng)n個(gè)負(fù)荷同時(shí)處于運(yùn)行狀態(tài)時(shí),混合電流的模型可表示為:
(4)
式中,Ik(t)是負(fù)荷k獨(dú)立運(yùn)行時(shí)的電流信號(hào),即為待識(shí)別負(fù)荷;I(t)為采集的實(shí)際混合電流信號(hào);e(t)為噪聲信號(hào)。
因此利用電流疊加原理分離電力總回路中穩(wěn)態(tài)過程的影響。采取的事件波形分離的過程如下所示:
首先,事件檢測(cè)機(jī)制檢測(cè)出事件,截取完整的暫態(tài)過程波形,獲得暫態(tài)過程的持續(xù)周期T;獲取兩側(cè)穩(wěn)態(tài)過程中與暫態(tài)過程相同時(shí)長(zhǎng)的穩(wěn)態(tài)過程波形,然后計(jì)算比較暫態(tài)兩邊穩(wěn)態(tài)電流有效值。
然后,使用暫態(tài)過程波形和有效值較大的穩(wěn)態(tài)過程波形分別減去有效值較小的穩(wěn)態(tài)過程波形,得到暫態(tài)過程分離波形和穩(wěn)態(tài)過程分離波形。
這樣就得到單獨(dú)的負(fù)荷狀態(tài)變化時(shí)的穩(wěn)態(tài)和暫態(tài)過程波形數(shù)據(jù),消除了主回路中正常運(yùn)行負(fù)荷的擾動(dòng)。最后分別對(duì)暫態(tài)和穩(wěn)態(tài)過程波形提取特征。
利用傅里葉變換對(duì)負(fù)荷穩(wěn)態(tài)過程周期電流進(jìn)行諧波分解,提取諧波幅值較大的諧波次數(shù)作為負(fù)荷特征,以降低噪聲干擾,獲得負(fù)荷區(qū)分度較好的穩(wěn)態(tài)特征。使用DFT對(duì)離散的負(fù)荷周期電流提取諧波特征方法如公式(5)所示。
(5)
其中,i(n)為周期電流采樣點(diǎn)n的電流,Nk為每個(gè)周期采樣點(diǎn)個(gè)數(shù),k為諧波次數(shù),D(k)為復(fù)數(shù)形式的DFT諧波系數(shù)。
將D(k)乘以歸一化系數(shù)1/Nk,并利用歐拉公式將其整理成實(shí)數(shù)表達(dá)形式:
(6)
(7)
(8)
其中ak為D′(k)的實(shí)部,bk為D′(k)的虛部。
當(dāng)電流波形滿足公式(9)時(shí),稱為半波對(duì)稱,即一個(gè)周期電流波形沿時(shí)間軸平移半個(gè)周期后與原波形相對(duì)于時(shí)間軸鏡像對(duì)稱,偶次諧波為0。
(9)
常見的電器設(shè)備的電流波形均能近似滿足半波對(duì)稱條件。圖2展示了5種電器穩(wěn)態(tài)工作時(shí)的基波和第2~第13次諧波幅值,可以看出奇次諧波幅值更加突出,偶次諧波幾乎為0。因此本文選擇基波和第3、5、7、9、11、13次電流諧波作為穩(wěn)態(tài)頻域特征。
為全面反映暫態(tài)波形特性,本文選擇9種統(tǒng)計(jì)特征量作為暫態(tài)波形的特征。NILM系統(tǒng)最終需要運(yùn)行在嵌入式設(shè)備中,為降低模型運(yùn)算開銷,提升模型效果,需要進(jìn)行特征選擇,去除冗余特征。9種暫態(tài)特征如下所示:
Ip:峰值,取暫態(tài)波形絕對(duì)值的最大值。
Ipp:峰峰值,暫態(tài)波形最大值與最小值的差值。
Imean:平均值,所有暫態(tài)過程樣本點(diǎn)的平均值。
Imean′:絕對(duì)平均值,所有暫態(tài)過程樣本點(diǎn)絕對(duì)值的平均值。
Irms:有效值,具體數(shù)值由公式(1)計(jì)算。
I:穩(wěn)態(tài)有效值,暫態(tài)發(fā)生前后穩(wěn)態(tài)電流波形有效值的差值。
Fform:波形因數(shù),數(shù)值為Irms/Imean′。
Fcrest:波峰因數(shù),數(shù)值為Ip/Irms。
Rpta:峰均比,數(shù)值為Ipp/Irms。
本文采用卡方檢驗(yàn)法對(duì)暫態(tài)特征進(jìn)行選擇,通過公式(10)計(jì)算出每個(gè)特征的卡方值。卡方值越大,表明特征與預(yù)測(cè)結(jié)果的相關(guān)性越大。因此應(yīng)該優(yōu)先選擇卡方值大的特征。卡方檢驗(yàn)中卡方的計(jì)算公式為:
(10)
其中n為樣本總數(shù),k為樣本類別數(shù),Aij為觀測(cè)值,Eij為期望值。
kNN算法的工作機(jī)制是通過給定的測(cè)試樣本,基于某種距離度量找出訓(xùn)練集中與其最靠近的k個(gè)訓(xùn)練樣本,然后基于這k個(gè)“鄰居”的信息進(jìn)行預(yù)測(cè),通常選擇這k個(gè)樣本中出現(xiàn)最多的類別標(biāo)簽作為預(yù)測(cè)結(jié)果。具體過程如下:
1)對(duì)于待測(cè)樣本X,計(jì)算X與訓(xùn)練集D中所有樣本xi的距離。
2)對(duì)計(jì)算的距離按遞增次序排序,在訓(xùn)練集D中選取與當(dāng)前待測(cè)樣本X距離最小的k個(gè)點(diǎn),含有這k個(gè)點(diǎn)的X的鄰域記作Nk(X)。最后在Nk(X)中根據(jù)多數(shù)表決規(guī)則決定X的類別cX,分類表決函數(shù)如式(11)所示。
(11)
其中L為所有樣本類別集合;class(cxi)為訓(xùn)練樣本xi的類別;I(V=class(cxi))是一個(gè)指標(biāo)函數(shù),當(dāng)其值為真時(shí)返回1,否則返回0,即計(jì)算選出的k個(gè)近鄰數(shù)據(jù)中多數(shù)屬于某個(gè)類,則判斷待測(cè)樣本為該類。
由于在提取負(fù)荷設(shè)備運(yùn)行的電氣參數(shù)特征時(shí),往往會(huì)因?yàn)橹骰芈返脑肼晹_動(dòng)和硬件設(shè)備的精度等問題,導(dǎo)致采集的特征信號(hào)存在差異,即同一種負(fù)荷設(shè)備的狀態(tài)變化的特征數(shù)據(jù)存在擾動(dòng)。當(dāng)2種負(fù)荷特征相近時(shí),利用傳統(tǒng)的kNN模型,可能出現(xiàn)訓(xùn)練集中較多的其他類別的負(fù)荷特征進(jìn)入k最近鄰范圍,而同一種類型負(fù)荷特征進(jìn)入k最近鄰范圍的較少,導(dǎo)致分類結(jié)果錯(cuò)誤。因此將基于距離權(quán)重的統(tǒng)計(jì)方法應(yīng)用在kNN算法中,可以彌補(bǔ)數(shù)據(jù)采集過程中引起的誤差擾動(dòng)導(dǎo)致的負(fù)荷識(shí)別錯(cuò)誤問題。具體改進(jìn)過程如下:
首先計(jì)算出待測(cè)樣本與訓(xùn)練樣本之間的距離,并按照距離遞增排序選擇前k個(gè)樣本,按照公式(12)計(jì)算k個(gè)樣本的距離權(quán)重Wi:
(12)
其中,di為待測(cè)樣本與第i個(gè)近鄰的距離;d1為k近鄰中最近的距離;dk為k近鄰中最遠(yuǎn)的距離。
然后對(duì)公式(11)的分類表決函數(shù)添加權(quán)重因子Wi,對(duì)計(jì)算得到的距離權(quán)重按照類別進(jìn)行歸類疊加,選擇疊加距離權(quán)重最大的類別,即為分類結(jié)果。其分類表決函數(shù)為:
(13)
在真實(shí)環(huán)境中,總會(huì)存在特征集以外的負(fù)荷設(shè)備,視為陌生設(shè)備。如果陌生設(shè)備在回路中運(yùn)行,事件檢測(cè)機(jī)制也會(huì)檢測(cè)到,kNN算法模型總會(huì)將樣本進(jìn)行分類,因此添加負(fù)荷類別判斷機(jī)制,用于判斷并識(shí)別陌生設(shè)備。將改進(jìn)kNN算法與相似度判斷機(jī)制相結(jié)合,實(shí)現(xiàn)具有識(shí)別陌生設(shè)備的負(fù)荷識(shí)別方案。負(fù)荷識(shí)別算法總體流程如圖3所示。
基于距離權(quán)重統(tǒng)計(jì)方法的kNN算法與余弦相似度判斷機(jī)制結(jié)合的負(fù)荷識(shí)別工作流程如下:
1)首先提取待分類樣本特征向量。
2)計(jì)算特征集中所有已知類別樣本到當(dāng)前待分類樣本之間的距離。
3)選擇與當(dāng)前樣本距離最近的k個(gè)點(diǎn)并代入權(quán)重因子(公式(12)),計(jì)算每一點(diǎn)所占權(quán)重,并統(tǒng)計(jì)出每一負(fù)荷類別疊加權(quán)重。
4)由分類表決函數(shù)(公式(13))選擇出疊加權(quán)重最大的類別,然后使用余弦相似度判斷機(jī)制進(jìn)行判斷。
5)計(jì)算待分類樣本特征向量與分類結(jié)果所屬類別特征庫中的樣本中心點(diǎn)的相似程度,其中類別樣本中心點(diǎn)為所有同種類別樣本的均值點(diǎn)。相似程度由余弦相似度表示,余弦相似度計(jì)算公式為:
(14)
其中A為待分類樣本特征向量,B為分類結(jié)果樣本中心值向量。
6)若兩者余弦相似度大于σ,則認(rèn)為分類正確,輸出分類結(jié)果;若余弦相似度小于σ,則認(rèn)為分類錯(cuò)誤,視為陌生設(shè)備,輸出分類結(jié)果為其他。
本文選擇LED燈、飲水機(jī)、取暖器、電動(dòng)車充電器和微波爐等5種用電設(shè)備作為實(shí)驗(yàn)對(duì)象。其中飲水機(jī)和取暖器為線性大功率設(shè)備;LED燈和電動(dòng)車充電器為非線性設(shè)備,二者功率相近均屬于小功率電器;微波爐屬于非線性大功率設(shè)備。
按照?qǐng)D4所示示意圖搭建實(shí)驗(yàn)采集平臺(tái),采用基于DL-CT27C2.0電流互感器的電氣參數(shù)采集模塊采集數(shù)據(jù),以6.4 kHz采樣頻率實(shí)時(shí)采集回路電流。實(shí)驗(yàn)設(shè)備分別接通至電路總回路中隨機(jī)啟停若干次,并根據(jù)事件檢測(cè)機(jī)制檢測(cè)回路中由設(shè)備狀態(tài)變化引起的電流突變事件,根據(jù)圖1所示流程提取事件暫穩(wěn)態(tài)波形,并分別提取暫態(tài)時(shí)域特征和穩(wěn)態(tài)頻域特征。
實(shí)驗(yàn)電器設(shè)備信息與采集的對(duì)應(yīng)事件特征樣本數(shù)量如表1所示。對(duì)采集的事件特征數(shù)據(jù)做歸一化處理,采用min-max標(biāo)準(zhǔn)化方法將數(shù)據(jù)進(jìn)行線性變換,使結(jié)果映射在[0,1]區(qū)間上,轉(zhuǎn)換函數(shù)如下:
表1 實(shí)驗(yàn)設(shè)備信息與對(duì)應(yīng)事件特征樣本數(shù)量
(15)
其中X為原始數(shù)據(jù),Xmax、Xmin分別為數(shù)據(jù)最大值和最小值。
根據(jù)采集的數(shù)據(jù)按照公式(10)計(jì)算每個(gè)暫態(tài)特征量對(duì)應(yīng)的卡方值,如表2所示。選擇前4種卡方值最大的特征即Ipp、Imean′、Irms、I作為暫態(tài)特征量。
表2 暫態(tài)特征量對(duì)應(yīng)卡方值
本文算例中功率最小電器LED燈的額定功率Pmin=100 W,在220 V電壓下的額定電流為Imin=0.45 A??紤]到正常電路正常工作設(shè)備的功率變化擾動(dòng),為負(fù)荷投切域值留出一定的裕度,參考文獻(xiàn)[22]中功率閾值可取0.25Pmin~0.8Pmin,本文取電流閾值δ=0.6Imin=0.27 A,事件結(jié)束閾值γ取0.01 A。由經(jīng)驗(yàn)設(shè)置基于余弦相似度的分類結(jié)果判斷機(jī)制閾值σ=0.9。
為驗(yàn)證不同距離度量公式對(duì)kNN算法識(shí)別準(zhǔn)確率的影響,本文選擇歐式距離(Euclidean Distance,deuc)、曼哈頓距離(Manhattan Distance,dman)和切比雪夫距離(Chebyshev Distance,dche)進(jìn)行對(duì)比實(shí)驗(yàn),3種距離計(jì)算公式分別為:
(16)
(17)
(18)
實(shí)驗(yàn)比較了3種距離度量方式在改進(jìn)的加權(quán)kNN算法中使用暫穩(wěn)態(tài)特征時(shí)負(fù)荷識(shí)別的準(zhǔn)確率。選擇表1中的LED燈、飲水機(jī)、取暖器和電動(dòng)車充電器4種電器所有事件樣本特征作為數(shù)據(jù)集進(jìn)行驗(yàn)證,按每種用電設(shè)備特征樣本數(shù)量等比例劃分訓(xùn)練集和測(cè)試集,其中訓(xùn)練集占比30%。
如圖5所示,使用切比雪夫距離的加權(quán)kNN算法識(shí)別準(zhǔn)確率明顯偏低,且受k值影響較明顯;使用曼哈頓距離時(shí),負(fù)荷識(shí)別準(zhǔn)確率與使用歐式距離相近,但當(dāng)k值較小或較大時(shí),負(fù)荷識(shí)別準(zhǔn)確率偏低。因此本文選擇加權(quán)的歐式距離作為改進(jìn)kNN算法的距離度量公式。
3.2.1 不同負(fù)荷識(shí)別方案對(duì)比
為驗(yàn)證本文提出的改進(jìn)的kNN算法和暫穩(wěn)態(tài)特征結(jié)合方案對(duì)負(fù)荷識(shí)別性能的提升,使用實(shí)驗(yàn)環(huán)境中采集的特征數(shù)據(jù)集進(jìn)行測(cè)試。將表1中所示LED燈、飲水機(jī)、取暖器和電動(dòng)車充電器4種電器所有事件樣本特征作為數(shù)據(jù)集。按每種用電設(shè)備特征樣本數(shù)量等比例劃分訓(xùn)練集和測(cè)試集,其中訓(xùn)練集占比30%。
實(shí)驗(yàn)比較了暫穩(wěn)態(tài)特征與單獨(dú)使用暫態(tài)特征或穩(wěn)態(tài)特征時(shí)負(fù)荷識(shí)別的準(zhǔn)確率。如圖6所示,當(dāng)使用暫穩(wěn)態(tài)結(jié)合特征作為負(fù)荷識(shí)別的特征時(shí),傳統(tǒng)kNN算法和改進(jìn)kNN算法負(fù)荷識(shí)別準(zhǔn)確率均優(yōu)于單獨(dú)使用暫態(tài)特征或穩(wěn)態(tài)特征的情況,因此本文提出的暫穩(wěn)態(tài)特征結(jié)合方案可以有效提高負(fù)荷識(shí)別準(zhǔn)確率。
實(shí)驗(yàn)對(duì)比了暫穩(wěn)態(tài)特征結(jié)合時(shí)傳統(tǒng)kNN算法與改進(jìn)kNN算法在不同k值下對(duì)負(fù)荷識(shí)別準(zhǔn)確率的影響。從圖6可以看出,k值的選擇對(duì)改進(jìn)kNN算法的準(zhǔn)確率并未造成明顯影響,而傳統(tǒng)kNN算法受k值的影響明顯,因此改進(jìn)kNN算法穩(wěn)定性比傳統(tǒng)kNN更好,魯棒性更強(qiáng);在識(shí)別準(zhǔn)確率方面,改進(jìn)kNN算法無論使用暫穩(wěn)態(tài)結(jié)合特征還是單獨(dú)使用暫態(tài)特征或穩(wěn)態(tài)特征,其識(shí)別準(zhǔn)確率都要高于傳統(tǒng)kNN算法,因此改進(jìn)kNN算法可以明顯提升負(fù)荷識(shí)別準(zhǔn)確率。
3.2.2 多場(chǎng)景負(fù)荷識(shí)別
為驗(yàn)證提出的負(fù)荷識(shí)別模型的泛化性能,設(shè)計(jì)了多種設(shè)備組合場(chǎng)景,包括單項(xiàng)負(fù)荷設(shè)備運(yùn)行場(chǎng)景、陌生設(shè)備接入場(chǎng)景和多個(gè)設(shè)備組合運(yùn)行場(chǎng)景。
實(shí)驗(yàn)對(duì)象包含LED燈、飲水機(jī)、取暖器、電動(dòng)車充電器和微波爐等5種電器設(shè)備。將微波爐視為陌生設(shè)備,其事件樣本特征不加入訓(xùn)練集。實(shí)驗(yàn)采集各電器單獨(dú)工作時(shí)的數(shù)據(jù)和各種設(shè)備組合工作時(shí)的事件樣本特征,實(shí)驗(yàn)數(shù)據(jù)信息如表1所示,其中“充電器+取暖器”為在充電器正常工作,取暖器開關(guān)操作;同樣“取暖器+LED燈”和“取暖器+充電器+LED燈”分別為取暖器正常工作時(shí)和取暖器、充電器均正常工作時(shí),LED燈開關(guān)操作。
分別使用傳統(tǒng)kNN算法與改進(jìn)kNN算法進(jìn)行測(cè)試,模型參數(shù)k設(shè)置為10。其中LED燈、飲水機(jī)、取暖器、電動(dòng)車充電器4種已知標(biāo)簽樣本數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練集占4種已知標(biāo)簽樣本30%,其余樣本作為測(cè)試集。
測(cè)試結(jié)果如表3所示。改進(jìn)kNN算法在各種場(chǎng)景下均比傳統(tǒng)kNN算法具備更高的識(shí)別準(zhǔn)確率。其中在單項(xiàng)設(shè)備識(shí)別上,改進(jìn)kNN算法對(duì)電動(dòng)車充電器的識(shí)別準(zhǔn)確率提升達(dá)5.38個(gè)百分點(diǎn),其他3種電器也有較明顯的提升;陌生設(shè)備(微波爐)的識(shí)別是將其識(shí)別為其他標(biāo)簽,傳統(tǒng)kNN算法和改進(jìn)kNN算法都能達(dá)到很高的準(zhǔn)確率,改進(jìn)kNN算法識(shí)別準(zhǔn)確率高達(dá)98.18%,表明提出的負(fù)荷識(shí)別方案可以有效地識(shí)別陌生設(shè)備;對(duì)于多種設(shè)備組合運(yùn)行的場(chǎng)景,改進(jìn)kNN算法識(shí)別準(zhǔn)確率略高于kNN算法,但均能達(dá)到較高的水平,表明本文提出的負(fù)荷識(shí)別方案對(duì)多設(shè)備同時(shí)運(yùn)行時(shí)的場(chǎng)景也能做到很高的設(shè)備識(shí)別準(zhǔn)確率。
表3 不同場(chǎng)景下傳統(tǒng)kNN算法與改進(jìn)kNN算法對(duì)比
綜合考慮多種應(yīng)用場(chǎng)景,改進(jìn)kNN算法負(fù)荷識(shí)別總準(zhǔn)確率達(dá)到97.63%,比kNN算法識(shí)別準(zhǔn)確率高3.38個(gè)百分點(diǎn),性能提升明顯。
3.2.3 不同負(fù)荷識(shí)別算法對(duì)比
選擇SVM模型、BP神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)3種算法模型與本文提出的改進(jìn)kNN算法進(jìn)行比較。
kNN模型參數(shù)k值設(shè)置為10;為解決SVM模型的非線性分類問題,引入RBF徑向基函數(shù),懲罰系數(shù)C設(shè)置為2.0,核函數(shù)參數(shù)gamma設(shè)置為1;BP神經(jīng)網(wǎng)絡(luò)模型如圖7所示,優(yōu)化器為Adam,損失函數(shù)為L(zhǎng)ogistic Loss。
LSTM神經(jīng)網(wǎng)絡(luò)模型如圖8所示,優(yōu)化器為Adam,損失函數(shù)為稀疏函數(shù)交叉熵(Sparse Categorical Cross Entropy, SCCE)。為避免LSTM模型訓(xùn)練時(shí)出現(xiàn)過擬合現(xiàn)象,在每層LSTM后面添加Dropout層,Dropout機(jī)制可以使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中,以一定的概率隨機(jī)丟棄神經(jīng)元,可以有效防止過擬合發(fā)生,丟棄率設(shè)置為0.2。同時(shí)對(duì)損失函數(shù)引入L2范數(shù),采用L2正則化方法避免模型過擬合,L2正則化系數(shù)λ設(shè)置為0.1。
采用表1中前4種負(fù)荷特征樣本作為數(shù)據(jù)集,其中訓(xùn)練集占比均為30%。測(cè)試結(jié)果如表4所示,4種算法負(fù)荷識(shí)別準(zhǔn)確率均在96%以上??梢钥闯霾煌姆诸愃惴▽?duì)識(shí)別準(zhǔn)確率的影響較小,即本文提出的基于暫穩(wěn)態(tài)特征結(jié)合的方案在數(shù)據(jù)上具有較好的區(qū)分度。
表4 不同模型負(fù)荷識(shí)別性能對(duì)比
改進(jìn)kNN算法識(shí)別準(zhǔn)確率為98.18%,略高于LSTM算法的98.08%,但是LSTM算法模型的訓(xùn)練需要大量時(shí)間。改進(jìn)kNN算法預(yù)測(cè)耗時(shí)比SVM和BP神經(jīng)網(wǎng)絡(luò)長(zhǎng),但是SVM和BP神經(jīng)網(wǎng)絡(luò)模型需要預(yù)訓(xùn)練,且模型移植至嵌入式設(shè)備時(shí)較為復(fù)雜。改進(jìn)基于距離權(quán)重統(tǒng)計(jì)方法的kNN算法不需要預(yù)訓(xùn)練,且算法原理簡(jiǎn)單,能更好地部署至嵌入式設(shè)備中。綜合來看改進(jìn)kNN算法能更好地實(shí)現(xiàn)負(fù)荷識(shí)別任務(wù)。
針對(duì)非侵入式負(fù)荷監(jiān)測(cè)系統(tǒng)在實(shí)際應(yīng)用中低成本高準(zhǔn)確率的要求,本文提出一種基于改進(jìn)kNN算法和暫穩(wěn)態(tài)特征的非侵入式負(fù)荷監(jiān)測(cè)方法。
首先,通過增加距離權(quán)重的方式改進(jìn)傳統(tǒng)kNN算法,彌補(bǔ)了數(shù)據(jù)采集過程中引起的誤差擾動(dòng)導(dǎo)致的負(fù)荷識(shí)別錯(cuò)誤問題。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的kNN算法相較于傳統(tǒng)kNN算法對(duì)k值設(shè)置不敏感,具有較高的魯棒性,改進(jìn)kNN算法負(fù)荷識(shí)別準(zhǔn)確率比傳統(tǒng)kNN算法高3.38個(gè)百分點(diǎn),識(shí)別準(zhǔn)確率更高。其次,分別提取暫態(tài)時(shí)域統(tǒng)計(jì)特征和穩(wěn)態(tài)頻域諧波特征,使用暫穩(wěn)態(tài)特征結(jié)合方式進(jìn)行負(fù)荷識(shí)別。實(shí)驗(yàn)表明,使用暫穩(wěn)態(tài)特征融合進(jìn)行負(fù)荷識(shí)別,準(zhǔn)確率優(yōu)于單獨(dú)使用暫態(tài)特征或穩(wěn)態(tài)特征的情況。本文提出的負(fù)荷識(shí)別方案在實(shí)驗(yàn)環(huán)境下的多種應(yīng)用場(chǎng)景下均能保證較高負(fù)荷識(shí)別準(zhǔn)確率,不僅能實(shí)現(xiàn)單項(xiàng)負(fù)荷識(shí)別,還能夠?qū)崿F(xiàn)陌生設(shè)備的辨識(shí)以及多種負(fù)荷同時(shí)運(yùn)行場(chǎng)景下的負(fù)荷識(shí)別。最后使用SVM、BP神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)3種算法模型與改進(jìn)的kNN算法進(jìn)行對(duì)比。改進(jìn)kNN算法負(fù)荷識(shí)別準(zhǔn)確率僅略低于LSTM,但kNN不需要預(yù)訓(xùn)練,結(jié)構(gòu)簡(jiǎn)單更易實(shí)現(xiàn),能更好地部署至嵌入式設(shè)備中。
綜合考慮,本文提出的基于改進(jìn)kNN算法和暫穩(wěn)態(tài)特征的非侵入式負(fù)荷監(jiān)測(cè)方法在實(shí)際應(yīng)用中更具有優(yōu)勢(shì)。