, , ,
(上海師范大學(xué) 信息與機(jī)電工程學(xué)院,上海 200234)
基于優(yōu)化模糊C均值聚類選取相似日的燃?xì)庳?fù)荷預(yù)測
邱 靜,徐曉鐘*,鄧松,王婷
(上海師范大學(xué) 信息與機(jī)電工程學(xué)院,上海200234)
針對短期負(fù)荷預(yù)測方法中傳統(tǒng)的模糊C均值(FCM)聚類容易陷入局部最優(yōu)和對初始聚類中心敏感的問題,提出利用粒子群優(yōu)化(PSO)算法的全局搜索特性來優(yōu)化此缺點.通過優(yōu)化的FCM聚類來選取與預(yù)測日相似的日期作為支持向量機(jī)的訓(xùn)練樣本,既強(qiáng)化了訓(xùn)練樣本的數(shù)據(jù)規(guī)律,又保證數(shù)據(jù)特征的一致性.實驗結(jié)果表明,優(yōu)化預(yù)測模型的預(yù)測精度優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)算法.
短期負(fù)荷預(yù)測; 相似日; 相似性; 模糊C均值(FCM)聚類; 粒子群優(yōu)化(PSO)算法; 支持向量機(jī)(SVM)
提高燃?xì)庳?fù)荷的預(yù)測精度,既是為了工業(yè)用氣和居民生活用氣得到合理分配和調(diào)度,也是燃?xì)夤I(yè)自身健康發(fā)展的需要.燃?xì)庳?fù)荷預(yù)測對燃?xì)夤I(yè)乃至整個國民經(jīng)濟(jì)的發(fā)展都有著十分重要的意義[1].
目前負(fù)荷預(yù)測大致可以分為傳統(tǒng)方法和智能方法.用傳統(tǒng)方法所建的模型由于難以表達(dá)負(fù)荷與其影響因素的非線性關(guān)系,其預(yù)測精度難以進(jìn)一步提高,限制了它在短期負(fù)荷預(yù)測中的應(yīng)用[2-3].作為智能方法主要代表的人工神經(jīng)網(wǎng)絡(luò),以其強(qiáng)大的自主學(xué)習(xí)能力、非線性處理能力等特性,較好地克服了傳統(tǒng)方法的缺點[4-5],但在實際運用中還存在著網(wǎng)絡(luò)結(jié)構(gòu)選擇困難,泛化能力較差,易陷入局部極小,收斂慢等缺陷[6-7].支持向量機(jī)作為數(shù)據(jù)挖掘的一項新技術(shù),在模式識別、處理回歸問題等方面已得到了成功應(yīng)用,被認(rèn)為是神經(jīng)網(wǎng)絡(luò)的替代方法[8-9],文獻(xiàn)[10-11]將支持向量機(jī)和聚類算法相結(jié)合,以改善支持向量機(jī)在短期負(fù)荷預(yù)測中的應(yīng)用效果.
模糊C均值聚類存在兩個嚴(yán)重的缺陷[12]:1) 算法的性能依賴于初始聚類中心的選取,同時聚類的效果受初始值的影響較大;2) 模糊C均值(FCM)聚類算法在迭代尋找最優(yōu)解的過程中使用的是梯度下降的方法,會不可避免地導(dǎo)致陷于局部最優(yōu)值.針對這些問題,本文作者結(jié)合粒子群算法的全局搜索特性優(yōu)化FCM聚類.通過優(yōu)化后的FCM聚類,獲取歷史負(fù)荷樣本的最優(yōu)模式分類,再通過模式識別抽取出與預(yù)測樣本相似的樣本,作為最優(yōu)訓(xùn)練樣本集,強(qiáng)化了參與支持向量機(jī)(SVM)訓(xùn)練建模的樣本數(shù)據(jù)規(guī)律性,使訓(xùn)練樣本都具有相同或相近的輸入、輸出數(shù)學(xué)關(guān)系,實現(xiàn)了FCM聚類分析和SVM的有效結(jié)合,同時也改善了SVM算法的預(yù)測效果.
設(shè)樣本空間X={x1,x2,…,xn},聚類數(shù)為c,且2≤c (1) FCM算法是通過梯度下降方法尋找最優(yōu)解,即使其目標(biāo)函數(shù)達(dá)到極小值.算法的目標(biāo)函數(shù)為: ‖xk-zi‖, (2) 式中dik為第k個樣本到第i類的中心距離,zi為第i類的中心.目標(biāo)函數(shù)具有極小值的必要條件為: (3) 式中l(wèi)是迭代次數(shù),m是加權(quán)指數(shù). FCM聚類算法的迭代步驟如下: 1) 確定聚類數(shù)目c,加權(quán)指數(shù)m,一般m=2;隨機(jī)生成聚類中心矩陣Z(0),并令迭代次數(shù)l=0. 2) 利用式(3)分別計算隸屬度矩陣U(l),并修改聚類中心Z(l+1). 由于FCM聚類算法是基于目標(biāo)函數(shù)的聚類過程,其本質(zhì)上是一種局部尋優(yōu)的求解過程,如果初始化不當(dāng),就會導(dǎo)致算法陷入局部收斂達(dá)不到全局最優(yōu)解.為此,可以采用粒子群的全局搜索特性優(yōu)化. 2.1粒子群優(yōu)化(PSO)算法 PSO算法是一種基于群體智能的隨機(jī)全局優(yōu)化技術(shù),粒子群由許多粒子組成,每個粒子的位置代表優(yōu)化問題在搜索空間中的候選解,粒子的速度決定它們飛行的方向和距離,并且有一個適應(yīng)度函數(shù)來決定每一個粒子在群體中的適應(yīng)度.群體中每一個粒子在迭代過程中,通過跟蹤兩個“最好的位置”來不斷更新自己,一個是粒子本身目前所找到的最好位置pi_best,另一個是目前整個群體中所有粒子發(fā)現(xiàn)的最好位置gbest,更新公式如下: (4) (5) 每個粒子本身最佳位置更新公式為: (6) 所有粒子的全局最佳位置更新公式為: n. (7) 2.2粒子群優(yōu)化FCM聚類算法 由于FCM聚類算法使用梯度下降方法尋找最優(yōu)解,存在對初始值敏感和容易陷入局部最優(yōu)解的缺陷.利用PSO算法的優(yōu)化搜索能力對FCM聚類算法改進(jìn),能保證得到問題的全局最優(yōu)解. 2.2.1 粒子編碼 FCM聚類算法的核心就是聚類中心的確定,因此可以選取聚類中心作為種群的個體,一個粒子表示待求解的聚類中心的集合.則每個粒子xi編碼為 xi=(s11,s12,…,s1d,…si1,si2,…,sid,…,sc1,sc2,…,scd), (8) 式中(si1,si2,…,sid)表示第i類的聚類中心,d為樣本的維數(shù). 2.2.2 適應(yīng)度函數(shù) 對FCM聚類,最優(yōu)聚類結(jié)果即是其目標(biāo)函數(shù)取得最小值對應(yīng)的結(jié)果.由于每一個粒子代表的是一種聚類中心的選取,所以每個粒子適應(yīng)度的大小表明了在這種聚類中心的選取下其聚類效果的好壞.可以把FCM聚類目標(biāo)函數(shù)的倒數(shù)作為對每個粒子適應(yīng)度的評價: (9) 從式(9)可以知,如果目標(biāo)函數(shù)Jm越小,則個體適應(yīng)度f(xi)就越大,聚類效果就越好. 2.3基于粒子群優(yōu)化的FCM聚類算法的步驟 步驟1:確定聚類數(shù)目c,群體規(guī)模N,學(xué)習(xí)因子c1,c2,慣性權(quán)重w范圍,最大迭代次數(shù)itermax. 步驟2:從n個樣本中隨機(jī)的選取c個不同的樣本向量作為染色體的初始聚類中心,每個粒子代表各類的聚類中心. 步驟3:根據(jù)式(9)計算初始種群中個體的適應(yīng)度值. 步驟4:根據(jù)式(6)計算粒子當(dāng)前的位置,并根據(jù)式(5)更新粒子的位置,產(chǎn)生下一代種群. 步驟5:計算種群中個體的適應(yīng)度值,若滿足終止條件,算法結(jié)束,輸出整個搜索空間找到的最小適應(yīng)度值所對應(yīng)的類的聚類中心,并通過FCM算法得到最終劃分結(jié)果;否則返回到步驟4. 圖1 FCM聚類優(yōu)化前后的目標(biāo)函數(shù)值圖 FCM聚類優(yōu)化前后目標(biāo)函數(shù)值與迭代次數(shù)的關(guān)系如圖1所示.可以看出粒子群優(yōu)化后的FCM聚類具有更強(qiáng)的全局搜索能力. 3.1相似日 人們在進(jìn)行短期負(fù)荷預(yù)測時,發(fā)現(xiàn)如果預(yù)測日在氣象狀況、日類型等影響因素上與某歷史日比較相似,則預(yù)測日的負(fù)荷與該歷史日的負(fù)荷也比較接近,通常把該歷史日稱為相似日.在實際運行中,很多負(fù)荷預(yù)測工作人員就是通過尋找相似日來進(jìn)行負(fù)荷預(yù)測的.但該方法過度依賴于工作人員的經(jīng)驗,合理選擇相似日對于提高短期負(fù)荷預(yù)測的精度非常重要,沒有太多工作經(jīng)驗的預(yù)測人員往往無法找到與預(yù)測日相似的歷史日,降低預(yù)測效果. 3.2特征向量的選取 利用優(yōu)化的FCM聚類算法選取相似日時,首先需確定顯著影響燃?xì)庳?fù)荷變化的特征因素:溫度(日平均溫度,日最高溫度,日最低溫度)、星期類型(周一到周日)、天氣類型等. 3.3映射數(shù)據(jù)庫的設(shè)計 由于各個特征因素的量綱各不相同,因此需要把各個物理量作適當(dāng)?shù)挠成?把不同的量綱映射到特定的區(qū)間,使得各個量之間具有數(shù)值上的可比性.根據(jù)文獻(xiàn)[13]的思想建立符合上海市的映射數(shù)據(jù)庫,如表1所示. 表1 各特征量的映射數(shù)據(jù)表 4.1最小二乘支持向量機(jī)算法 對于訓(xùn)練樣本集T={(xi,yi)|i=1,2,…,l},其中xi∈Rn為輸入向量,yi∈R為相應(yīng)的輸出目標(biāo)值,l為訓(xùn)練樣本的個數(shù).SVM先采用非線性映射φ(x):Rm→RM將低維輸入空間映射到高維特征空間,再在高維特征空間進(jìn)行線性回歸,達(dá)到原線性空間非線性回歸的效果.決策線性回歸函數(shù)為: f(x)=wφ(x)+b, (10) 式中w是特征空間中的權(quán)系數(shù)向量,b∈R是常數(shù).SVM采用結(jié)構(gòu)化風(fēng)險最小化準(zhǔn)則來確定參數(shù)w和b,即 (11) 式中Rstr是結(jié)構(gòu)風(fēng)險,Remp是損失函數(shù), (12) (13) (14) 式中K(xi,xj)=[φ(xi),φ(xj)]為核函數(shù),其作用是不必知道從低維輸入空間到高維特征空間非線性映射φ(x)的具體形式,通過引入核函數(shù)就可得到?jīng)Q策回歸方程. 求解上述問題,可得到支持向量機(jī)回歸函數(shù): (15) 4.2樣本輸入量的選擇 本文作者把影響燃?xì)庳?fù)荷的特征因子作為輸入向量包括:1) 預(yù)測日前K日預(yù)測日的負(fù)荷數(shù)據(jù)A=[a1,a2,…,ak];2) 預(yù)測日的氣象數(shù)據(jù)B=[b1,b2,…,bi],包括最高溫度、最低溫度、平均溫度和天氣類型等;3) 預(yù)測日的日屬性D=[d1,d2,…,d7],代表周一至周日. 4.3燃?xì)庳?fù)荷預(yù)測流程 用基于PSO算法的FCM聚類與SVM算法進(jìn)行燃?xì)庳?fù)荷預(yù)測時,先將用于確定預(yù)測因子與預(yù)測負(fù)荷之間非線性關(guān)系的歷史數(shù)據(jù)用基于粒子群算法優(yōu)化的FCM算法聚類,得到最佳聚類中心.通過計算待預(yù)測樣本到各個聚類中心的距離,選擇最小距離對應(yīng)的類包含的數(shù)據(jù)找到與待預(yù)測樣本的相似日,并將這些相似日作為SVM算法的訓(xùn)練樣本,從而進(jìn)行燃?xì)庳?fù)荷預(yù)測,如圖2所示. 4.4實驗結(jié)果分析 圖3為上海市2011~2014年的燃?xì)庳?fù)荷聚類結(jié)果,每一種顏色代表一種類別,共6個類.由圖3可知,不同年中相同的燃?xì)庳?fù)荷值都在一個類中,即每一類都代表了相似的燃?xì)庳?fù)荷值. 圖2 燃?xì)庳?fù)荷預(yù)測流程 圖3 上海市2011~2014年的燃?xì)庳?fù)荷分類結(jié)果 根據(jù)圖3,分別采用BP神經(jīng)網(wǎng)絡(luò)、傳統(tǒng)的SVM及提出的基于優(yōu)化的FCM聚類及SVM結(jié)合的算法對2014年8月1到9月30日的燃?xì)庳?fù)荷進(jìn)行仿真預(yù)測,結(jié)果對比如圖4所示. 圖4 三種預(yù)測算法仿真值與實際值對比圖 平均相對誤差 (16) 利用PSO算法的全局搜索能力優(yōu)化FCM聚類算法.并將改進(jìn)后的FCM聚類與SVM結(jié)合建立新型的燃?xì)庳?fù)荷預(yù)測模型,對燃?xì)庳?fù)荷數(shù)據(jù)分類,依據(jù)分類結(jié)果選取訓(xùn)練樣本,選用同類特征的數(shù)據(jù)作為預(yù)測輸入,保證了數(shù)據(jù)特征的一致性,強(qiáng)化了歷史數(shù)據(jù)的規(guī)律.而且充分發(fā)揮了SVM算法結(jié)構(gòu)風(fēng)險最小化及小樣本、高泛化能力的優(yōu)勢.實驗結(jié)果證明了該方法的有效性,該方法比傳統(tǒng)的SVM算法和BP神經(jīng)網(wǎng)絡(luò)都具有更高的預(yù)測精度. [1] Apergis N,Payne J E.Natural gas consumption and economic growth:A panel investigation of 67 countries [J].Appl Energy,2010,87:2759-2763. [2] 張昀,周湶,任海軍,等.改進(jìn)人工免疫網(wǎng)絡(luò)算法在電力短期負(fù)荷預(yù)測中的應(yīng)用 [J].重慶大學(xué)學(xué)報,2013,36 (4):33-39. Wang J,Zhou Q,Reng H J,et al.Application and research of improved artificial immune network to power short-term load forecasting [J].Journal of Chongqing University,2013,36 (4):33-39. [3] 虞尚智.機(jī)器學(xué)習(xí)算法在短期負(fù)荷預(yù)測中的應(yīng)用 [J].科學(xué)技術(shù)與工程,2013,13 (18):2231-2236. Yu S Z.Application and research of improve artificial immune network to power short-term load forecasting [J].Science Technology and Engineering,2013,13 (18):2231-2236. [4] Ding N,Benoit C,Foggia G,et al.Neuralnetwork-based model design for short-term load forecast in distribution systems [J].IEEE Transactions on Power Systems,2016,31 (1):72-81. [5] Szoplik J.Forecasting of natural gas consumption with artificial neural networks [J].Energy,2015,85 (1):208-220. [6] Grant J,Eltoukhy M,Asfour S.Short-term electric peak demand forecasting in a large government building using artificial neural networks [J].Energies,2014,7 (4):1935-1953. [7] Cecati C,Kolbusz J,Rozycki P,et al.A novel RBF training algorithm for short-term electric load forecasting and comparative studies [J].IEEE Transactions on Industrial Electronics,2015,62 (10):6519-6529. [8] Ren F,Hu C,Tang F Z,et al.Load forecasting based on self-organizing map and support vector machines [C].Proceeding of the 11th World Congress on Intelligent Control and Automation,2015:3148-3150. [9] Kavousi-Fard A,Samet H,Marzbani F.A new hybrid modified firefly algorithm and support vector regression model for accurate short term load forecasting [J].Expert Systems with Applications,2014,41 (13):6047-6056. [10] 劉永光,孫超亮,牛貞貞,等.改進(jìn)型模糊C均值聚類算法的電力負(fù)荷特性分類技術(shù)研究 [J].電測與儀表,2014,18:5-9. Liu Y G,Sun C L,Niu Z Z,et al.Research on the improve fuzzy c-means clustering algorithm based power load characteristic classification technology [J].Electrical Measurement & Instrumentation,2014,18:5-9. [11] Duan P,Xie K,Guo T T,et al.Short-term load forecasting for electric power systems using the PSO-SVR and FCM clustering techniques [J].Energies,2011,4:173-184. [12] Khalialia M A,Bezdek J,Popescu M,et al.Improvements to the relational fuzzy c-means clustering algorithm [J].Pattern Recognition,2014,47 (12):3920-3930. [13] 廖宗明.基于K均值聚類與支持向量機(jī)的電力系統(tǒng)短期負(fù)荷預(yù)測 [D].廣州:華南理工大學(xué),2012. Liao Z M.The research of short term load forecasting of power system based on fuzzy-means clustering and SVM [D].Guangzhou:South China University of Technology,2012. (責(zé)任編輯:包震宇) Gasloadforecastingbasedonoptimizedfuzzyc-meanclusteringanalysisofselectingsimilardays Qiu Jing,XuXiaozhong*,DengSong,WangTing (The College of Information,Mechanical and Electrical Engineering,Shanghai Normal University,Shanghai200234,China) Traditional fuzzy c-means (FCM) clustering in short term load forecasting method is easy to fall into local optimum and is sensitive to the initial cluster center.In this paper,we propose to use global search feature of particle swarm optimization (PSO) algorithm to avoid these shortcomings,and to use FCM optimization to select similar date of forecast as training sample of support vector machines.This will not only strengthen the data rule of training samples,but also ensure the consistency of data characteristics.Experimental results show that the prediction accuracy of this prediction model is better than that of BP neural network and support vector machine (SVM) algorithms. short term load forecasting; similar days;similarity; fuzzy c-means (FCM) clustering; particle swarm optimization (PSO) algorithm;support vector machine (SVM) 2016-05-04 邱 靜(1990-),女,碩士研究生,主要從事人工智能數(shù)據(jù)挖掘方面的研究.E-mail:572148690@qq.com 導(dǎo)師簡介: 徐曉鐘(1964-),男,高級工程師,主要從事人工智能數(shù)據(jù)挖掘及計算機(jī)軟件架構(gòu)設(shè)計方面的研究.E-mail:xxz_edu@shnu.edu.cn TP315.69 :A :1000-5137(2017)04-0560-07 *2 基于粒子群優(yōu)化FCM聚類算法
3 基于優(yōu)化的FCM聚類選取相似日
4 基于優(yōu)化FCM聚類選取相似日的燃?xì)庳?fù)荷預(yù)測
5 結(jié) 論