盧錦玲, 馬 沖, 馮翠香
(華北電力大學(xué) 電氣與電子工程學(xué)院,河北 保定 071003)
隨著智能電表的普及和數(shù)量的日益增多,由大規(guī)模智能電表采集得到的用電數(shù)據(jù)不僅具有大數(shù)據(jù)的4 V特點(diǎn)(volume, variety, velocity and value),還具有電力系統(tǒng)特有的3E特點(diǎn)(energy, exchange and empathy)[1]。對海量用戶用電數(shù)據(jù)的有效分析不僅可以滿足負(fù)荷預(yù)測、風(fēng)險預(yù)警、異常檢測、負(fù)荷模式提取、優(yōu)化生產(chǎn)調(diào)度、需求響應(yīng)分析等[2-4]的基礎(chǔ)工作,還可以科學(xué)地提高電網(wǎng)自動化水平,從而實(shí)現(xiàn)電網(wǎng)可靠、安全、經(jīng)濟(jì)、高效、和諧友好和用電安全的環(huán)境。
對負(fù)荷模式的有效提取對應(yīng)用于負(fù)荷控制、負(fù)荷預(yù)測、風(fēng)險預(yù)警、分時電價的制定與實(shí)施、用電異常檢測等[5-10]具有重要的指導(dǎo)作用,負(fù)荷模式提取的準(zhǔn)確性很大程度上影響后續(xù)工作的穩(wěn)定進(jìn)行。目前國內(nèi)外對用電大數(shù)據(jù)的負(fù)荷模式提取研究,已成為當(dāng)下熱點(diǎn)課題[11-14]。文獻(xiàn)[6]利用云計算強(qiáng)大的數(shù)據(jù)存儲及并行計算能力,進(jìn)行Map-Reduce并行處理模型下基于改進(jìn)K-means算法的海量用戶用電數(shù)據(jù)并行挖掘。文獻(xiàn)[7]針對單一聚類算法的不足,研究基于經(jīng)典聚類算法的集成算法,并將其應(yīng)用于負(fù)荷曲線聚類,最后結(jié)合主成分分析降維方法對高維數(shù)據(jù)進(jìn)行降維。文獻(xiàn)[12]利用K-means算法具有收斂速度快、效率高的優(yōu)勢,采用了改進(jìn)K-means算法對用戶進(jìn)行聚類,并根據(jù)模型對負(fù)荷需求進(jìn)行預(yù)測。文獻(xiàn)[15]提出了一種函數(shù)型聚類分析方法,利用K-means聚類算法,對海量電力用戶稀疏、不規(guī)律的日耗電量數(shù)據(jù)進(jìn)行特征分析,并對用戶進(jìn)行分類。文獻(xiàn)[16]利用基于聚類有效性修正的德爾菲方法配置特性指標(biāo)權(quán)重,提出一種特性指標(biāo)降維的日負(fù)荷曲線聚類方法。但在聚類過程中,由于聚類中心點(diǎn)的隨機(jī)選取使得聚類結(jié)果穩(wěn)定性不高。文獻(xiàn)[17]利用改進(jìn)K-means聚類算法,并結(jié)合有效指標(biāo)準(zhǔn)則,能夠有效地提取出日負(fù)荷曲線,但該方法需要遍歷所有聚類數(shù)K,以得到最優(yōu)聚類數(shù),使得算法效率不高。
由此可以看出,國內(nèi)外對海量負(fù)荷模式的提取主要集中在對算法的改進(jìn)和大數(shù)據(jù)處理效率方面[8-12],其聚類可靠性高,處理大數(shù)據(jù)時有顯著優(yōu)勢,但是對數(shù)據(jù)清理方面所做工作較少,往往使得修正后數(shù)據(jù)準(zhǔn)確率有待提高,此外,在對用戶更細(xì)粒度的聚類研究較少,當(dāng)用戶種類較多時提取最優(yōu)負(fù)荷模式所用時間較長。
針對上述問題,本文首先考慮到用電大數(shù)據(jù)的分布特點(diǎn),將四分位法與3σ法相結(jié)合,提出一種“橫向—縱向”法來對異常用電數(shù)據(jù)檢測與修正,以提高數(shù)據(jù)修正的速率與準(zhǔn)確率;其次,綜合對比了幾種典型的數(shù)據(jù)降維方法,得出用主成分分析法對海量用電數(shù)據(jù)進(jìn)行降維后將極大地提高負(fù)荷模式提取效率;最后,在傳統(tǒng)K-means算法簡單快速優(yōu)勢的基礎(chǔ)上改進(jìn)得到Fast K-means(FK-means)算法,該算法利用二分法思想來減小聚類時間,將聚類有效性指標(biāo)DBI與CHI相結(jié)合來提高聚類結(jié)果可靠性,該算法不僅具有魯棒性好,對負(fù)荷模式提取速率快的優(yōu)勢,并且隨著電力用戶種類的增多,效果提升更明顯。
本文將從負(fù)荷模式提取的各個步驟來詳細(xì)介紹,具體流程如圖1所示。對負(fù)荷模式提取的步驟如下:
(1)對采集得到的用戶用電數(shù)據(jù)進(jìn)行異常值處理:包含離群點(diǎn)和空缺值,并對處理后的數(shù)據(jù)進(jìn)行歸一化處理。
(2)對數(shù)據(jù)進(jìn)行降維處理。
圖1 FK-means算法對負(fù)荷模式提取流程圖
(3)采用FK-means算法進(jìn)行聚類,快速確定最優(yōu)聚類數(shù)所在區(qū)間,并計算最優(yōu)聚類數(shù)所在區(qū)間中DBI與CHI指標(biāo),從而得到max{CHIK-DBIK},K即為對應(yīng)的最優(yōu)聚類數(shù)。
(4)對數(shù)據(jù)還原,從而得到聚類后的用戶用電特性曲線。
由于用電數(shù)據(jù)在橫向上具有相似性,短時間間隔內(nèi)(本文處理的用電數(shù)據(jù)采集時間間隔為30 min,每個用戶采集30天)在縱向上具有無突變性的特點(diǎn),而且用電數(shù)據(jù)為單一屬性數(shù)據(jù)。本文根據(jù)用電數(shù)據(jù)的分布和屬性特點(diǎn),提出一種“橫向—縱向”法來辨別修正異常用電數(shù)據(jù)。
由于用電數(shù)據(jù)的橫向相似性,在橫向上利用四分位法簡單快速的優(yōu)勢來對異常用電數(shù)據(jù)進(jìn)行初步定位,其定義如下。
(2)其中前25%為上四分位用FL表示,后25%處于下四分位用FU表示。四分位數(shù)間距為:dF=FU-FL,上截斷點(diǎn)為:Q1=λdF-FL,下截斷點(diǎn)為:Q2=FU+(1-λ)dF。
(3)其中小于Q1或者大于Q2的數(shù)據(jù)將其初步定為異常用電數(shù)據(jù)。
上式參數(shù)λ取值0.5~1,本文λ取為0.85。
在橫向上用四分位法對用電數(shù)據(jù)進(jìn)行粗辨識后,利用短時間間隔內(nèi)用電數(shù)據(jù)在縱向上無突變性的特點(diǎn),對初步篩選出的異常用電數(shù)據(jù)在縱向上用3σ法的精確性對其進(jìn)一步辨別并修正,其定義如下。
(1)
(2)
(3)
凡滿足式(3)的均為異常用電數(shù)據(jù),將異常用電數(shù)據(jù)用其所在時刻的其他樣本點(diǎn)的平均值來代替。
對用電數(shù)據(jù)進(jìn)行處理后,取各用戶月數(shù)據(jù)(不含周末)平均值作為典型日負(fù)荷曲線,每條負(fù)荷曲線表示為xi={xi,j,j=1,2,…,n},由于每個負(fù)荷樣本具有不同的最大最小負(fù)荷,為了后續(xù)方便分析,采用如下的方法進(jìn)行數(shù)據(jù)歸一化:
(4)
對用電數(shù)據(jù)進(jìn)行處理后得到的用戶典型日負(fù)荷曲線仍具有維度高的特點(diǎn),使得后續(xù)聚類耗時較長。為了對海量用戶進(jìn)行負(fù)荷模式提取時能夠進(jìn)一步提高效率,有必要對高維數(shù)據(jù)進(jìn)行降維處理,降維的目的是用較低維數(shù)的向量來表示負(fù)荷曲線。降維不僅能夠節(jié)約數(shù)據(jù)的存儲空間,還能夠減少計算時間,提高算法效率。本節(jié)對當(dāng)下主流的無監(jiān)督降維方法進(jìn)行對比分析,從而選取一種最優(yōu)降維方法。
常用的無監(jiān)督降維方法有主成分分析PCA、局部保持投影LPP、特征值提取FE[18]等。
(1)主成分分析PCA(Principal Component Analysis, PCA)
PCA的目標(biāo)是通過某種線性投影,將高維的數(shù)據(jù)映射到低維的空間中表示,并期望在所投影的維度上數(shù)據(jù)的方差最大,以此使用較少的數(shù)據(jù)維度,同時保留住較多的原數(shù)據(jù)的特性。目標(biāo)函數(shù)定義如下:
E(S)=STPTS
(5)
考慮到約束條件STS=1,利用拉格朗日乘子法,構(gòu)造拉格朗日函數(shù)為:
L(S,φ)=STPTS-φ(STS-1)
(6)
式中:φ為拉格朗日乘子;對式(6)中S求偏導(dǎo),令偏導(dǎo)數(shù)為零,之后便轉(zhuǎn)化為求ST特征值的問題,將前d個最大的特征值組成投影矩陣,從而將高維數(shù)據(jù)通過投影矩陣映射到d維上。
(2)局部保持投影LPP(Locality Preserving Projections, LPP)
LPP是能夠保護(hù)數(shù)據(jù)中的簇結(jié)構(gòu)的線性降維方法。設(shè)yi為xi的一維描述,其目標(biāo)函數(shù)如下:
(7)
式中:A為投影降維矩陣;相似度矩陣W=[Wij]N×N為對稱陣,矩陣內(nèi)部元素定義為:
(8)
式中:參數(shù)δ0等于總體樣本方差;xi∈N(xj)表示xi與xj相鄰。
從該方法的權(quán)值矩陣S的設(shè)置中可以看出,其在對應(yīng)近鄰樣本的位置上賦了一個非零權(quán)值,而對于相距較遠(yuǎn)的樣本則賦零。這樣就可以在投影中,達(dá)到保留樣本的近鄰結(jié)構(gòu)的目的。
(3)特征值提取FE(Feature Extraction, FE)
特征值提取法是對每條負(fù)荷曲線提取特性指標(biāo),本節(jié)采用6種特性指標(biāo),分別為:日負(fù)荷率、最高利用小時率、日峰谷差率、峰期負(fù)載率、平期負(fù)載率、谷期負(fù)載率。
在原始數(shù)據(jù)保留度相同的情況下,對部分樣本采用上述降維方法進(jìn)行降維,對比結(jié)果如圖2所示。
圖2 各種降維算法計算時間
從圖2可以看出,隨著數(shù)據(jù)量的增加,LPP用時最多,PCA用時最少,且數(shù)據(jù)量越大越明顯,故選用主成分分析PCA來對樣本數(shù)據(jù)進(jìn)行降維。
傳統(tǒng)K-means算法具有簡單、收斂速度快的優(yōu)勢,其時間復(fù)雜度為O(KNT),其中K為聚類數(shù),N為樣本總數(shù),T為迭代次數(shù)。但傳統(tǒng)K-means算法有兩點(diǎn)不足:聚類數(shù)K與初始聚類中心需要事先確定。本節(jié)將介紹FK-means算法如何減小聚類時間并提高穩(wěn)定性。
聚類有效性是通過建立有效性指標(biāo),評價最佳聚類質(zhì)量并得到最佳聚類數(shù)的過程,當(dāng)數(shù)據(jù)的原始正確劃分未知時,采用內(nèi)部評價指標(biāo)。常用的內(nèi)部評價指標(biāo)有DBI(Davies-Bouldin Index)指標(biāo)、XBI(Xie-Beni Index)指標(biāo)、CHI(Calinski-Harabasz Index)指標(biāo)和PBM指標(biāo)[19]。其定義分別如下。
(1)DBI指標(biāo)
(9)
式中;Ci為類簇i所構(gòu)成的集合;Wi表示類Ci中的所有樣本到其聚類中心的平均距離;∣Cij∣表示類Ci與Cj中心之間的距離。可以看出DBI指標(biāo)越小表示類與類之間的相似度越低,同一類內(nèi)的相似度越高,從而對應(yīng)的聚類數(shù)越佳。Wi與∣Cij∣表達(dá)如下:
(10)
式中:ni表示類Ci中樣本數(shù)據(jù)xi的個數(shù);Zi為類Ci中心點(diǎn)。
(11)
(2)XBI指標(biāo)
(12)
式中:μij是一個布爾值。當(dāng)xj屬于第i類時,μij為1,否則為0。分子表示屬于同一類簇的樣本到其類簇中心的距離,衡量緊密性;分母表示不同類簇中心之間的距離,衡量分離性,因此XBI值越小,聚類效果越好。
(3)CHI指標(biāo)
(13)
式中:類內(nèi)離差WGSS定義如下:
(14)
類間離差BGSS定義如下:
(15)
式中:Z為整個樣本集的中心。
該指標(biāo)分母衡量類內(nèi)緊密性,分子衡量類間分離性,因此CHI指標(biāo)越大聚類效果越好。
(4)PBM指標(biāo)
(16)
式中:DB表示樣本中類簇中心間的最大距離,即:
(17)
式中:EW表示樣本中每個類簇內(nèi)的所有點(diǎn)到該簇質(zhì)心的距離之和,即:
(18)
式中:ET表示樣本中所有點(diǎn)到整個樣本集中心的距離之和,即:
(19)
PBM指標(biāo)越大,聚類效果越好。
本次實(shí)驗(yàn)數(shù)據(jù)取自SEAI發(fā)布的愛爾蘭智能電表實(shí)際量測數(shù)據(jù),采集頻率為30 min,實(shí)驗(yàn)數(shù)據(jù)包含24 611條負(fù)荷曲線。對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行處理并聚類,聚類所得的各聚類指標(biāo)與聚類數(shù)的關(guān)系如如圖3所示。
圖3 各聚類指標(biāo)與聚類數(shù)的關(guān)系
從圖3可以看出,4種聚類指標(biāo)隨著聚類數(shù)目的增加都有一個最大轉(zhuǎn)折點(diǎn),即為對應(yīng)的最優(yōu)聚類數(shù)。不同的是,PBM指標(biāo)數(shù)值較大,而XBI指標(biāo)數(shù)值較小,若作為評價指標(biāo)使用則對比效果不明顯,此外,若采用單一聚類指標(biāo)評價聚類結(jié)果,則可靠性不高。由于CHI與DBI指標(biāo)特點(diǎn)具有互補(bǔ)性,且指標(biāo)數(shù)值較為接近。故本文采用CHI與DBI指標(biāo)相結(jié)合的方法,以提高聚類結(jié)果的準(zhǔn)確性和穩(wěn)定性。
圖4 FK-means聚類
根據(jù)CHI與DBI指標(biāo)的特點(diǎn),λ1取0.5,λ2取0.9。本文α取0.8。
由于隨機(jī)確定初始聚類中心,使得傳統(tǒng)K-means穩(wěn)定性不高。為了解決上述問題,本文采用基于“最大最小距離”法來確定初始聚類中心,即初始聚類中心相距盡可能遠(yuǎn),避免了初始聚類中心過于臨近而陷入局部最優(yōu),從而獲得更高質(zhì)量的聚類?!白畲笞钚【嚯x”法原理如下:
(1)先從總樣本數(shù)據(jù)集X={x1,x2,…,xN}中隨機(jī)挑選一個xi作為初始中心點(diǎn)A。
(2)計算余下數(shù)據(jù)集中每個樣本點(diǎn)與初始中心點(diǎn)A的距離,選取距離最大的樣本點(diǎn)作為中心點(diǎn)B。
(3)再計算余下數(shù)據(jù)集中每個樣本點(diǎn)與各個中心點(diǎn)的距離distiA與,得到兩個中心距離中最小的點(diǎn)min{disti,A,distiB},再從所有樣本點(diǎn)的距離中找到最大的距離,此樣本點(diǎn)作為下一個中心點(diǎn)C。迭代條件滿足:
式中:distiA為樣本點(diǎn)xi與中心點(diǎn)A之間的距離;distiB為樣本點(diǎn)xi與中心點(diǎn)B之間的距離;distiC為樣本點(diǎn)xi與中心點(diǎn)A、B距離的最小值;DistiC為樣本點(diǎn)xi中所有最小距離中的最大值。
(4)重復(fù)步驟3,直到選取K個中心點(diǎn)。
以上是初始聚類中心的選取原則,在之后迭代中,聚類中心取聚類后類間距離的平均值作為新的聚類中心。當(dāng)聚類中心不再發(fā)生變化時,則迭代結(jié)束算法收斂。
圖5 用戶日用電模式結(jié)果
為便于直觀分析,用典型用電曲線代表所在類簇的負(fù)荷,將典型用電曲線進(jìn)行類比,得到的用戶日用電模式結(jié)果如圖5所示。
從圖中可以看出,類1、類7、類8、類9、類11、類14和類16在晚間用電量大,此類用戶多為娛樂消費(fèi)場所或?qū)懽謽堑?;?、類4、類5午和類13午間用電量大,此類用戶多為居民用電或醫(yī)院學(xué)校等;類3,、類6、類10和類15用電較為平緩,但是用電量有所差異,此類用戶多為商業(yè)或工業(yè)等用電,并根據(jù)用電量的大小可以劃分商業(yè)或工業(yè)規(guī)模的大小;類12和類17用電波動較大,此類用戶多為農(nóng)業(yè)用電。
用FK-means算法對數(shù)據(jù)集聚類所用的時間為1 104.59 s。而將最大聚類數(shù)Kmax設(shè)定為80時,采用傳統(tǒng)K-means法來進(jìn)行負(fù)荷模式提取,用傳統(tǒng)K-means算法對數(shù)據(jù)集進(jìn)行聚類后所用時間為 4 634.83 s??梢钥闯?,F(xiàn)K-means算法相較于傳統(tǒng)K-means算法計算時間大幅降低,并且隨著用戶種類的增多,F(xiàn)K-means算法這一優(yōu)勢越明顯。
用FK-means算法分別對降維前后的用電數(shù)據(jù)進(jìn)行負(fù)荷模式提取,其中對降維后的負(fù)荷模式提取耗時306.37 s,而對未降維的用電數(shù)據(jù)進(jìn)行聚類所需時間為1 104.59 s,可見結(jié)合降維技術(shù)的FK-means算法在對負(fù)荷模式提取時效率更高。
K-means算法對負(fù)荷模式進(jìn)行提取時異常用電數(shù)據(jù)直接進(jìn)行刪除,而FK-means算法采用“橫向—縱向”檢測法來對異常用電數(shù)據(jù)進(jìn)行修正。從37 611個用戶數(shù)據(jù)中選取部分?jǐn)?shù)據(jù)進(jìn)行對比驗(yàn)證。兩種情況下的聚類差異性如表1所示。
表1 FK-means算法與K-means算法聚類結(jié)果差異比較
從表1可知,F(xiàn)K-means算法比K-means算法聚類所得結(jié)果可靠性更高,由于K-means算法對異常用電數(shù)據(jù)直接進(jìn)行刪除,隨著異常用電數(shù)據(jù)的增加,其對聚類產(chǎn)生的影響越明顯,得到的結(jié)果越不可靠,此外,由于傳統(tǒng)K-means是隨機(jī)產(chǎn)生初始聚類中心,使得聚類結(jié)果易陷入局部最優(yōu),無法得到高質(zhì)量的聚類。而FK-means算法在經(jīng)過“橫向—縱向”法對異常用電數(shù)據(jù)修正之后,其對整體聚類結(jié)果所產(chǎn)生的影響可以忽略,并且消除了初始聚類中心的隨機(jī)性問題,從而使得聚類結(jié)果更穩(wěn)定,算法魯棒性好。
本文提出了一種FK-means算法的電力用戶用電特性快速提取法。
(1)本文采取一種“橫向—縱向”檢測法,來檢測并糾正異常用電數(shù)據(jù),首先利用四分位法簡單快速的優(yōu)勢,初步確定異常用電數(shù)據(jù)點(diǎn),然后利用3σ法的精確性,對初步確定的異常用電數(shù)據(jù)進(jìn)一步檢測并修正。
(2)對于海量的高維負(fù)荷曲線,本文對比了幾種常用的降維方法,從而得出主成分分析法用時最短,效率最高。
(3)為了降低負(fù)荷模式提取所用時間,本文利用二分法思想來快速確定最優(yōu)聚類數(shù)范圍,極大地減小了聚類時間。為了提高負(fù)荷模式提取結(jié)果的可靠性,本文對比了幾種常用的聚類有效性指標(biāo),采用DBI與CHI指標(biāo)相結(jié)合的方法,兩種指標(biāo)相結(jié)合使得聚類結(jié)果更穩(wěn)定更準(zhǔn)確。
(4)本文提出的FK-means算法能夠快速準(zhǔn)確的確定最優(yōu)聚類數(shù),相較于傳統(tǒng)的K-means算法,F(xiàn)K-means算法能夠顯著減小聚類時間,魯棒性好,并且對處理大數(shù)據(jù)具有很大優(yōu)勢。
參考文獻(xiàn):
[1]DEFU C. Electric power big data and its applications[A]. Science and Engineering Research Center. Proceedings of 2016 International Conference on Energy, Power and Electrical Engineering (EPEE2016)[C]. Science and Engineering Research Center, 2016: 4.
[2]王桂蘭, 周國亮, 趙洪山, 等. 大規(guī)模用電數(shù)據(jù)流的快速聚類和異常檢測技術(shù)[J]. 電力系統(tǒng)自動化, 2016, 40 (24): 27-33.
[3]宋亞奇, 周國亮, 朱永利. 智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J]. 電網(wǎng)技術(shù), 2013, 37 (4): 927-935.
[4]張素香, 趙丙鎮(zhèn), 王風(fēng)雨, 等. 海量數(shù)據(jù)下的電力負(fù)荷短期預(yù)測[J]. 中國電機(jī)工程學(xué)報, 2015, 35 (1): 37-42.
[5]馮麗, 邱家駒. 基于電力負(fù)荷模式分類的短期電力負(fù)荷預(yù)測[J]. 電網(wǎng)技術(shù), 2005 (4): 23-26.
[6]趙莉, 候興哲, 胡君, 等. 基于改進(jìn)k-means算法的海量智能用電數(shù)據(jù)分析[J]. 電網(wǎng)技術(shù), 2014, 38 (10): 2715-2720.
[7]張斌, 莊池杰, 胡軍, 等. 結(jié)合降維技術(shù)的電力負(fù)荷曲線集成聚類算法[J]. 中國電機(jī)工程學(xué)報, 2015, 35 (15): 3741-3749.
[8]王德文, 周昉昉. 基于無監(jiān)督極限學(xué)習(xí)機(jī)的用電負(fù)荷模式提取[J/OL]. 電網(wǎng)技術(shù), 1-8[2017-12-24].https://doi.org/10.13335/j.1000-3673.pst.2017.1644.
[9]趙巖, 李磊, 劉俊勇, 等. 上海電網(wǎng)需求側(cè)負(fù)荷模式的組合識別模型[J]. 電網(wǎng)技術(shù), 2010, 34 (1): 145-151.
[10]陸俊, 朱炎平, 彭文昊, 等. 智能用電用戶行為分析特征優(yōu)選策略[J]. 電力系統(tǒng)自動化, 2017, 41 (5): 58-63.
[11]馮曉蒲, 張鐵峰. 基于實(shí)際負(fù)荷曲線的電力用戶分類技術(shù)研究[J]. 電力科學(xué)與工程, 2010, 26 (9): 18-22.
[12]VIEGAS J L, VIEIRA S M, SOUSA J M C. Electricity demand profile prediction based on household characteristics [C]//European Energy Market. IEEE,2015:1-5.
[13]張素香, 劉建明, 趙丙鎮(zhèn), 等. 基于云計算的居民用電行為分析模型研究[J]. 電網(wǎng)技術(shù), 2013, 37 (6): 1542-1546.
[14]朱文俊, 王毅, 羅敏, 等. 面向海量用戶用電特性感知的分布式聚類算法[J]. 電力系統(tǒng)自動化, 2016, 40 (12): 21-27.
[15]張欣, 高衛(wèi)國, 蘇運(yùn). 基于函數(shù)型數(shù)據(jù)分析和k-means算法的電力用戶分類(英文)[J]. 電網(wǎng)技術(shù), 2015, 39 (11): 3153-3162.
[16]劉思, 李林芝, 吳浩, 等. 基于特性指標(biāo)降維的日負(fù)荷曲線聚類分析[J]. 電網(wǎng)技術(shù), 2016, 40 (3): 797-803.
[17]劉莉, 王剛, 翟登輝. k-means聚類算法在負(fù)荷曲線分類中的應(yīng)用[J]. 電力系統(tǒng)保護(hù)與控制, 2011, 39 (23): 65-68.
[18]譚璐. 高維數(shù)據(jù)的降維理論及應(yīng)用[D]. 北京:國防科學(xué)技術(shù)大學(xué), 2005.
[19]謝娟英. 無監(jiān)督學(xué)習(xí)方法及其應(yīng)用[M]. 北京:電子工業(yè)出版社, 2016.