賈東寧
(1. 中國海洋大學信息科學與工程學院,山東 青島 266100; 2.青島海洋科學與技術試點國家實驗室,山東 青島 266237)
近年來,隨著海洋勘探與海洋開發(fā)的迅猛發(fā)展,船舶技術也有了突破性的發(fā)展,船舶數量與日俱增。在促進資源采集與經濟提升的同時,隨之也帶來了船舶系統(tǒng)經濟性與安全性的問題,尤其是船載電力系統(tǒng)的控制問題,成為海洋船舶系統(tǒng)安全與節(jié)能的一個關鍵點。由于船舶內部的電力改造涉及的問題較多,如何實現(xiàn)低成本、低工時、高效益的電力監(jiān)測與控制成為船載電力系統(tǒng)發(fā)展的重中之重,亦是實現(xiàn)船載電力終端與船員之間實時交互的重要支撐[1-3]。該技術的關鍵在于高級量測體系(Advanced metering infrastructure,AMI)系統(tǒng)及終端技術,智能用電雙向互動運行模式及支撐技術,用戶用電環(huán)境與用電模式的互相影響三個方面[4]組成。而船載負荷監(jiān)測技術是AMI最為重要的組成部分,是實現(xiàn)用電分析,實現(xiàn)船舶電力安全預警,節(jié)能降耗的基礎和關鍵。因此,開展有效的負荷監(jiān)測方法研究對船舶電力系統(tǒng)的高質、高效發(fā)展具有重要的指導意義。
非侵入式負荷監(jiān)測技術(Non-intrusive load monitoring,NILM)基于傳統(tǒng)的侵入式負荷監(jiān)測方法增加了成本低、便于安裝、可接受性良好等優(yōu)點[5]。主要的實現(xiàn)思路就是通過負荷分解方法,將入戶總負荷信息分解為各電器設備信息,進而獲取不同電器的能耗情況等用電信息[6]。NILM方法以其經濟成本少,實用性強成為國內外研究的熱點。NILM的典型過程是在電力入口處安裝監(jiān)測設備,通過監(jiān)測該處的電壓、電流等信號就可以分析得到負荷集群中單個負荷的種類和運行情況[7]。
本文主要就負荷識別技術展開探討。負荷識別技術主要通過數學優(yōu)化方法和模式識別方法進行分析。文獻[8]應用啟發(fā)式算法實現(xiàn)穩(wěn)態(tài)電流波形的分解,但該方法分解的電流波形偏差較大。文獻[9-10]使用支持向量機(SVM)在低頻采樣的情況下對負荷種類進行識別,該方法對大功率阻性電器的識別效果較好,但難以識別小功率電器。文獻[11]考慮了電器設備在時間上的使用規(guī)律,應用因子隱式Markov 模型,簡化對負荷電器添加標簽的過程,但該方法僅考慮存在開關狀態(tài)的用電負荷,當負荷種類較多時,該方法識別精度較低。文獻[12]將單個周期的電流電壓波形表示為V-I圖,應用卷積神經網絡進行船舶電力負荷種類的識別,得到了較好的識別效果。文獻[13]使用k-近鄰(k-Nearest Neighbor,k-NN)以及動態(tài)模糊C均值聚類對船舶電力負荷種類的識別,實現(xiàn)了對小功率電器約90%的識別準確率。總體而言,基于數學優(yōu)化方法[14]及機器學習方法相關的負荷識別算法研究已相對較多,但大部分算法均基于單一負荷識別算法進行探究,且涉及負荷種類不多,處理的場景也比較簡單。應對復雜場景的綜合型識別算法相對較少。因此,為保證在復雜場景下對多類負荷識別的準確性與穩(wěn)定性,本文提出了一種基于混合SVM/GMM算法的負荷識別方法。應用事件檢測過程中提取的有效負荷特征建立識別模型并進行負荷種類的辨識。
NILM系統(tǒng)主要依靠安裝在用戶電力入口處的硬件設備采集用電信息并進行分析處理。本文依靠實驗室開發(fā)的智能用電采集模塊進行電力數據的采集和處理,該模塊采樣率為4k,可同時采集電流電壓數據并完成特征提取工作。通過智能用電采集模塊提取3類具備代表性的負荷電流數據進行分析如下。
圖1為計算機電流波形。圖形上半部分為計算機一個完整運行過程概況。圖形下半部分自左至右依次為開啟、運行、關閉三段過程的細節(jié)波形圖。容易看出計算機啟動過程需要經過數個工頻周期才能進入穩(wěn)態(tài)過程,且計算機通常具備EIST-智能降頻等技術,使得計算機的運行電流幅值持續(xù)變化。
圖1 計算機電流波形
圖2為冰箱電流波形,冰箱屬于船載電器常用的常開型電器,其啟動瞬時電流較大。并且由于其相對特殊的啟動方式,開啟冰箱時,需要經歷數秒的電流變化才能達到穩(wěn)定狀態(tài)。
圖3為制氧機的電流波形。在制氧機的運行過程中,電流存在周期性的幅值變化,該過程極易被誤判為小功率負荷的重復投切。
圖2 冰箱電流波形
圖3 制氧機電流波形
由于電器種類繁多,不可避免的會出現(xiàn)電流峰值相似的電器。同時,由于部分電器之間的電流幅值相差較大,并且部分電器基本不存在穩(wěn)定狀態(tài),這給電器的識別問題帶來了較大的難度。但不同類型的電器由于內部硬件特性的差異,其暫態(tài)電流形式會有所區(qū)別。為實現(xiàn)負荷類型的準確識別,應從負荷的電流波形數據中提取有效特征,以最大程度描述每種電器負荷的獨特性,本文提取包括主峰值(Ipeak)、峰峰值(Ipp)、均方根(Irms)、標準差(Isd)、波形系數(FF)、相位角(PA)、波動傾斜度(Slope)、暫態(tài)能量(TE)、暫態(tài)平均功率(TP)、單個周期波形面積(Iarea)、三次諧波(TH)和五次諧波 (FH)共計12個負荷特征用于識別。
支持向量機模型是定義于特征空間上的線性分類器,其學習策略為間隔最大化,可形式化為求解凸二次規(guī)劃問題,等價于正則化的合頁損失函數最小化問題。而核函數的使用,使得SVM成為實質上的非線性分類器。SVM方法具有良好的推廣泛化能力,但在用電分析實際應用過程中發(fā)現(xiàn)單獨使用SVM對提取的特征進行模型訓練與測試時,其準確率雖能夠保持較高的識別能力,但尚存在可優(yōu)化的空間。因此,引入具有良好統(tǒng)計分布描述能力的GMM方法,結合兩種方法構成混合分類器可以進一步提高單獨使用SVM分類器時的分類性能,實現(xiàn)具備更高準確率的分類方法。
給定特征空間上的訓練數據集:
T={(x1,y1),(x2,y2),…,(xN,yN)},
xi∈X=Rn,yi∈Y={+1,-1},i=1,2,…,N。
式中:xi是第i個樣本所包含的特征,yi為第i個樣本所屬類別。假定訓練集線性可分。訓練分類器的目標是在特征空間找到一個分割超平面,該超平面能將樣本特征分割到不同的類別中。通常,當訓練數據集線性可分時,存在無窮多個分離超平面可將兩類數據正確分離,而為了得到唯一最優(yōu)解,引入間隔最大化概念求解最優(yōu)分離超平面。為求解方便,將最大化問題轉換為最小化問題,即
s.t.yi(w·xi+b)-1≥0,i=1,2,…,N。
可以看出,上式為一個凸二次規(guī)劃問題。對該問題求解可得最大間隔分離超平面及分類決策函數。為實現(xiàn)對線性不可分問題的處理,對每個樣本點引入松弛變量ξi≥0,使函數間隔加上松弛變量大于或等于1。則約束條件變?yōu)?/p>
yi(w·xi+b)≥1-ξi。
式中,C>0為懲罰參數,通常由應用問題決定,C值大時對誤分類的懲罰增大,C值小時對誤分類的懲罰小。此時,將線性不可分的SVM學習問題轉換為如下最小化問題
s.t.yi(w·xi+b)≥1-ξi,i=1,2,…,N;
ξi≥0,i=1,2,…,N。
此時得到的SVM模型可對線性分類問題實現(xiàn)較好的分類效果。而對于非線性問題,需借助核函數將輸入空間映射到特征空間,使得輸入空間的超曲面模型對應到特征空間的超平面模型。如此,分類問題的學習過程可通過在特征空間中求解線性支持向量機來實現(xiàn)。
如前所述,支持向量機本身是一個解決二分類問題的模型,而對于多分類問題,可采用”一對一”或”一對多”策略實現(xiàn)分類模型的建立。本文使用高斯核函數SVM分類器,并結合”一對一”策略實現(xiàn)對多類電器負荷分類模型的建立。識別過程中,待識別的特征樣本輸入到SVM模型中,輸出判別結果在每個類別上的概率分布。SVM算法考慮了學習空間的復雜性,在有限樣本中在擬合程度和判別準確率之間折中選擇最佳,使其能夠實現(xiàn)對未知樣本的良好識別能力。
高斯混合函數(Gaussian Mixed Model,GMM)指多個高斯分布函數的線性組合,GMM理論上可以解決同一集合下包含多個不同分布的情況。設有隨機變量X,高斯混合模型可表示為
式中:N(x|μk,Σk)表示GMM中的第k個分量;πk是權值因子,且滿足
高斯混合算法是一種聚類算法,但當每個樣本的類別已知時,其模型參數可通過最大似然估計較容易的獲得。本文提取用于模型訓練的特征通常帶有標簽,因此可設定樣本容量N,K分類的樣本為L(k)=N1,N2,…,Nk。有
通過上述過程即可求解GMM模型參數。對每類負荷特征建立一個GMM模型,識別過程中將待識別的樣本傳入到每一個GMM模型計算對數似然函數,其可表示待識別樣本與該類別的接近程度,對所有類別得到的結果做歸一化處理,轉換為近似概率分布的形式。
本文通過融合GMM與SVM的輸出結果,實現(xiàn)對待識別樣本的判別。通過智能硬件采集模塊對電器開關狀態(tài)進行監(jiān)測和判定,當識別到電器開關時,將硬件模塊提取上傳的12種特征數據構成樣本特征。為實現(xiàn)樣本均衡,在實際用電環(huán)境下對每類電器進行同等次數的開關操作,采集特征數據并添加類別標簽構建模型訓練樣本庫。訓練過程中,使用兩種算法分別通過樣本庫中的特征數據獨立進行模型訓練,得到支持向量機模型(S-model)和高斯混合模型(G-model)。在識別過程中,分別通過S-model和G-model對待識別樣本進行結果預估。將SVM預測結果由輸出分類類別調整為輸出測試樣本在各個類別上的概率分布Psvm。同時,計算待識別樣本在每個類別GMM模型上的對數似然函數,得到Fi(i=1,2,…,n)。對Fi進行歸一化近似轉換為輸出測試樣本在各個類別上的概率。最終加權融合兩類算法輸出的概率分布,獲取融合算法對待識別樣本最終判別的電器類型
為驗證本文所提方法的有效性,通過智能硬件采集模塊采集包括電飯煲、冰箱、筆記本等共計46類電器的開關特征數據進行算法有效性的驗證工作。將開和關特征分別作為獨立的模型特征庫,進行模型訓練和測試工作。對每類電器采集同等數量的特征樣本用于建模,并進行同等次數的測試以保證結果的均衡性。
參與模型訓練的電器主要為船載常用電器,并包括不同品牌的同類電器(以數字區(qū)別)。電器額定功率范圍約10~1 600 W。電器詳細類別如表1所示。
表1 46類電器類型列表
每類電器各采集200組開關數據作為訓練樣本,每類電器特征數據保存為一個CSV文件構成模型特征庫。每類電器進行約80次識別測試。由于當智能硬件采集模塊識別到電器開關時才將特征數據上傳,且算法本身復雜度較低,因此足以實現(xiàn)基于SVM算法和基于混合SVM/GMM算法的同時判別測試。應用基于RBF核函數的SVM方法進行S-model的訓練,通過網格遍歷優(yōu)化得到最優(yōu)參數設定c=32 768.0,g=8.0。應用GMM方法對每類負荷建模,構建G-model。
建模成功后,通過開關電器實現(xiàn)對模型的測試。記錄基于SVM與基于混合SVM/GMM方法的識別情況。為全面的比較分析兩種多分類算法的分類性能,除準確率外,引入微平均F1指標與宏平均F1指標。其中宏平均F1指標需先求解每個類別的F1值,再對得到的所有F1值求取算術平均值作為全局指標。而微平均F1指標通過先累加計算各個類別的TP,F(xiàn)N,F(xiàn)P的值,再通過這些累加值求取F1值。通過這兩種方式的平均F1值的計算實現(xiàn)對系統(tǒng)整體性能的評測。宏平均F1指標平等對待每一個類別,因此其值主要受稀有類別的影響,而微平均F1指標平等考慮所有測試樣本,其值受常見類別的影響比較大。兩種算法的性能對比分析見表2。
表2 算法性能指標對比
Note:①Algorithm; ②On-off state; ③Macro; ④Micro;⑤Precision; ⑥Recall; ⑦F-value; ⑧This paper; ⑨On; ⑩Off.
可以看出,應用本文所提混合方法在識別測試過程中,在開關狀態(tài)下的各項指標均優(yōu)于單獨使用SVM方法,宏觀查準率(Precision)平均提高3.91%,宏觀查全率(Recall)平均提高3.78%,宏平均在開關狀態(tài)下平均提高3.85%。微觀查準率(Precision)平均提高3.7%,微觀查全率(Recall)平均提高3.7%,微平均在開關狀態(tài)下平均提高3.7%。可以看出,當本文所提方法用于多分類船舶電力負荷識別時,在性能指標上較單獨應用支持向量機方法有一定的提高。
應用支持向量機與高斯混合模型相結合的方式對船舶電力負荷特征進行分類模型構建。通過對高斯混合模型輸出值進行變換,轉換為近似的概率分布,與支持向量機得到的概率分布進行融合,實現(xiàn)識別準確率的提升。本文所提方法實現(xiàn)簡單,可行性較高, 具有較好的工程實用價值。但該方法過分依賴負荷特征,一旦負荷特征計算偏差較大將導致誤判。因此,后續(xù)將考慮引入更高效的原始波形處理算法并與當前模型相結合,以進一步提高整個系統(tǒng)的穩(wěn)定性和識別準確率。