国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類與SVM短期負荷預測的算法

2019-01-17 03:06:02陳祖成王碩禾趙紹策
關(guān)鍵詞:聚類向量負荷

陳祖成,王碩禾,王 剛,趙紹策,韓 帥

(石家莊鐵道大學 電氣與電子工程學院,河北 石家莊 050043)

1 問題提出

企業(yè)采用最大需量標準支付基礎(chǔ)電價時,如能準確預測峰值負荷出現(xiàn)的時間和強度,采取有效技術(shù)手段避免大的峰值負荷的產(chǎn)生,對以電弧爐為主要設備的特鋼生產(chǎn)廠家這樣的高耗能企業(yè)來說,不僅能降低裝機容量、節(jié)約基礎(chǔ)電費開支,而且能夠避免對上一級電網(wǎng)造成過大沖擊[1]。不少學者對電力度負荷預測做了研究,文獻[2]提出了一種相間重構(gòu)與支持向量機相結(jié)合的短期功率預測方法,利用相間重構(gòu)的方法獲取相空間中的數(shù)據(jù)序列,作為支持向量機的輸入,建立負荷預測模型,提高了一定的預測精度,但是效率較低;文獻[3]提出采用加權(quán)粒子群優(yōu)化的 LSSVM電力負荷預測,該算法采用加權(quán)的粒子群優(yōu)化傳統(tǒng)的LSSVM的參數(shù),并將此模型應用于鋼鐵企業(yè)的電力負荷預測,結(jié)合實際條件,選取合理因子,算例分析取得了較好的預測效果,但是對于歷史數(shù)據(jù)的處理做得不精細,存在一定缺陷。

支持向量機(SVM)是統(tǒng)計學習理論中最實用的一部分,主要是針對模式識別問題和統(tǒng)計回歸問題。

支持向量機作為一種解決小樣本、非線性、高維度數(shù)據(jù)的擬合問題上有著優(yōu)良的效果。采用結(jié)構(gòu)化風險最小的原則可以對數(shù)據(jù)進行全局最優(yōu)化處理且模型的訓練較為容易[4]。在對現(xiàn)場工況和數(shù)據(jù)進行詳細分析的基礎(chǔ)上,本文提出首先利用聚類算法對大量源數(shù)據(jù)進行分析,然后以聚類之后的統(tǒng)計數(shù)據(jù)經(jīng)過matlab歸一化函數(shù)處理后做為輸入向量,通過CV判別算法選擇具有很好逼近效果的核函數(shù),在輸入空間計算出點積。為了有效地消除SVM中的“維數(shù)災難”影響,需要通過非線性變換將原空間轉(zhuǎn)換成高維特征空間中的線性問題,從而建立最優(yōu)超平面模型,最后利用該模型完成48 h短期負荷預測[5-6]。

2 聯(lián)合聚類與SVM的短期負荷預測算法實現(xiàn)

SVM是一種適用于小樣本數(shù)據(jù)的機器學習算法。在給定的數(shù)據(jù)逼近的精度與逼近函數(shù)的復雜性之間尋求折中,以獲得最好的泛化性能,SVM的基本點是回歸。當SVM在實際應用時,需要選擇合適的模型,即對選擇合適的參數(shù)和核函數(shù)。

2.1 歷史負荷數(shù)據(jù)的預處理

短期負荷預測需要收集大量的負荷數(shù)據(jù),如果不對負荷數(shù)據(jù)進行預處理勢必會造成預測精度的降低,選用合適的數(shù)據(jù)處理方法尤為重要。歷史負荷數(shù)據(jù)的預處理包括對數(shù)據(jù)進行補缺和修正,以提高數(shù)據(jù)質(zhì)量。本文主要采用以下方法:

1)數(shù)據(jù)的初始濾波。假設電力系統(tǒng)的歷史負荷數(shù)據(jù)的變化可用下式表示:

(1)

3)數(shù)據(jù)的補充。電力負荷數(shù)據(jù)有一定的規(guī)律性,根據(jù)歷史數(shù)據(jù)的規(guī)律,采用聚類的方法選取與缺失數(shù)據(jù)相似度最高的幾個數(shù)據(jù)求取均值作為補充,提高數(shù)據(jù)質(zhì)量。

最后利用歸一化函數(shù)對電力負荷的歷史數(shù)據(jù)進行歸一化,主要目的是消除量綱等其他因素對輸入向量的影響,繼而使權(quán)值調(diào)整進入誤差平坦區(qū)。

2.2 利用聚類算法實現(xiàn)SVM輸入向量的確定

聚類是分類問題中一種統(tǒng)計分析方法,也是數(shù)據(jù)挖掘中的重要算法,是從大量的歷史數(shù)據(jù)中挖掘其潛在價值[7-9]。本文利用分割聚類法(partitioning methods)中的K均值聚類,它是基于距離平方和最小的聚類方法:

1) 假設要聚成K個類,那么首先選擇K個初始質(zhì)心c1,c2,…,ck;

根據(jù)劃分到每個簇內(nèi)的點,更新質(zhì)心,直至質(zhì)心不在變化。以誤差平方和(sum of squared error,SSE)為衡量聚類效果的目標函數(shù),求其最小值,進行全局優(yōu)化。SSE為:

(2)

式(2)中Ci是第i個簇,x是Ci中的點,ci是x的平均值。對SSE求導,令導數(shù)為0,求出第k個質(zhì)心ck。簇的最小化SSE的最佳質(zhì)心即為簇中各點的均值。應用中通過有效的數(shù)據(jù)預處理避免了K均值算法在聚類過程中趨向于無解的情況,提高了輸入量的聚類質(zhì)量,獲得較理想的聚類效果。見表1。

通過設置不同的參數(shù)和得到的結(jié)果,找到了以誤差平方和最小值為目標的48點聚類中心,即這48個點同一簇實例之間的距離最小。在聚類過程中,通過比較同一類數(shù)據(jù)之間的相似程度平滑了負荷序列,經(jīng)過聚類之后,日負荷數(shù)據(jù)信息容量大量減少,由原來的1 440組數(shù)據(jù)壓縮成48點數(shù)據(jù),解決了樣本容量過大而導致的復雜性問題和數(shù)據(jù)不規(guī)范性。最終由聚類的輸出確定了支持向量回歸模型的輸入向量。

表1 日48點中部分點負荷聚類輸出結(jié)果

2.3 交叉驗證評判確定SVM核函數(shù)的選擇

SVM經(jīng)常選用線性函數(shù)、RBF函數(shù)和多項式函數(shù)做為內(nèi)積函數(shù)。核函數(shù)的形式確定了特征空間,核函數(shù)的選擇決定了構(gòu)造分類器空間性質(zhì)[10]。

對于某一具體問題,選擇合適的核函數(shù)并沒有標準準則。本文提出通過交叉驗證算法(CV)來判斷確定核函數(shù)的選擇是否恰當。評價SVM算法的效果通常是通過對比較該算法的泛化能力來完成,小樣本數(shù)據(jù)時,CV是評估分類器泛化殘差的一種有效方法,當采用k折交叉驗證方法時,訓練樣本M劃分為容量大致相同的k個互不相交的樣本,及S=S1∪S2∪S3…Sk,共進行k次訓練和測試。

利用算法導入訓練及計算出決策函數(shù)后,就可以對預測樣本Si進行預測,根據(jù)不同時段的數(shù)據(jù)采取不同的核函數(shù)進行預測的結(jié)果如表2。

表2 不同內(nèi)積函數(shù)的誤差和運行時間結(jié)果

比較結(jié)果,多項式和徑向基核函數(shù)的預測效果要好于線性函數(shù),在上午(8:00—10:00)和傍晚(18:00—21:00),多項式和徑向基核函數(shù)的預測精度基本一致,但是在預測速度上明顯是多項式核函數(shù)快,所以這兩個時段內(nèi)選擇多項式函數(shù)作為預測核函數(shù);對于凌晨(0:00—3:00)和中午(11:00—13:00)系統(tǒng)負荷較低的時間段,徑向基核函數(shù)的預測準確度明顯高于多項式核函數(shù),所以在這個時間段內(nèi)選擇徑向基核函數(shù)作為預測;剩余時間段內(nèi),選用徑向基核函數(shù)可以保證預測速度和精度。

2.4 算例分析與實現(xiàn)

算法的實現(xiàn)框圖如圖1所示。選擇邊際系數(shù)C、不敏感損失函數(shù)中的誤差ε以及核函數(shù)寬度系數(shù)σ2進行SVR回歸模型訓練,實現(xiàn)步驟如下:

1)拉格朗日乘數(shù)取初始值,通常αi=0;

2)首先利用第一個訓練樣本,計算其KKT互補條件,尋找與KKT互補條件的樣本點不相符的拉格朗日乘數(shù),將該乘數(shù)作為兩個擬優(yōu)化的拉格朗日乘數(shù)之一;

3)由最大優(yōu)化步數(shù)選取在原始樣本集中滿足max|f(x1)-f(x2)+y1-y2|條件的樣本點對應的拉格朗日乘數(shù)。保證其余拉格朗日乘數(shù)不變,形成一個最小規(guī)模的二次規(guī)劃問題。求解上述問題,得到一對新的α1、α2;

4)樣本計算結(jié)束,執(zhí)行下一步,否則返回(2),計算下一樣本;

5)將0<αi

待訓練完成,在建立模型對樣本進行預測,把歸一化后的結(jié)果與真實值進行比對,能夠清晰地比較預測結(jié)果。在表3和圖2中,分別計算出實際運行系統(tǒng)中每日48點的負荷預測數(shù)據(jù)與真實數(shù)據(jù),相對誤差參數(shù)等信息,選擇部分數(shù)據(jù)列出在表3。

表3 SVM預測值與真實值的部分數(shù)據(jù)比較結(jié)果

由計算的預測數(shù)據(jù)可以得出以下結(jié)論:1)負荷的波動性對預測結(jié)果影響不大;2)預測值與實際負荷結(jié)果基本一致,相對誤差很??;3)對沖擊性負荷的預測效果也很好,最大誤差僅為4.11%。所以該算法具有一定的實用價值和研究價值。

3 結(jié)論

SVM在負荷預測研究中經(jīng)常被用到[11-13]。本文提出了一種基于聚類和支持向量機的短期負荷預測算法,該算法先采用數(shù)據(jù)挖掘技術(shù)中常用的聚類算法對歷史數(shù)據(jù)進行預處理,在確保數(shù)據(jù)質(zhì)量的情況下,選取聚類中心作為SVM短期預測模型的特征輸入,然后利用交叉驗證方法選取合適的SVM內(nèi)積函數(shù),最終完成負荷預測。結(jié)合相關(guān)企業(yè)的研究背景,收集相應的歷史負荷數(shù)據(jù),采用該模型進行預測,經(jīng)過算例分析,發(fā)現(xiàn)該算法能夠提高電力負荷預測精度,尤其對沖擊性負荷,逼近效果也很好;該算法還可以有效地去除數(shù)據(jù)的異常、缺失和復雜性對預測效果的影響。對AI預測算法,很大程度上取決于訓練集,選取合適的訓練集可以有效提升預測效果,達到誤差范圍。

猜你喜歡
聚類向量負荷
向量的分解
聚焦“向量與三角”創(chuàng)新題
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
防止過負荷時距離保護誤動新判據(jù)
主動降負荷才是正經(jīng)事
向量垂直在解析幾何中的應用
基于改進的遺傳算法的模糊聚類算法
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
負荷跟蹤運行下反應堆一回路控制系統(tǒng)仿真與驗證
一種層次初始的聚類個數(shù)自適應的聚類方法研究
盐津县| 大庆市| 枝江市| 柳江县| 泰州市| 兴安县| 霍林郭勒市| 阿图什市| 密山市| 廉江市| 玛纳斯县| 迁西县| 疏附县| 鹿泉市| 碌曲县| 宣武区| 宁晋县| 朔州市| 屏东县| 北流市| 茌平县| 登封市| 岢岚县| 黄石市| 沁水县| 延安市| 龙南县| 富蕴县| 南雄市| 吴桥县| 上饶市| 米泉市| 东光县| 济阳县| 瓮安县| 达尔| 南和县| 桐城市| 兴安盟| 古浪县| 视频|