国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電網(wǎng)斷面越限預(yù)測(cè)滑動(dòng)可變窗口方法研究

2019-04-08 02:46趙瑞鋒王海柱郭文鑫
自動(dòng)化儀表 2019年3期
關(guān)鍵詞:樣本容量均方樣本量

張 銳,趙瑞鋒,王海柱,郭文鑫

(廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心,廣東 廣州 510600)

0 引言

穩(wěn)定斷面作為電網(wǎng)重要組成部分,其安全穩(wěn)定與否對(duì)電力系統(tǒng)的安全運(yùn)行有直接影響,需要電網(wǎng)運(yùn)行人員予以重點(diǎn)監(jiān)視和控制。依靠穩(wěn)定斷面分析來(lái)快速識(shí)別系統(tǒng)中的重要輸電斷面,研究電力系統(tǒng)的薄弱環(huán)節(jié),對(duì)保證電網(wǎng)的安全可靠運(yùn)行、防止大面積連鎖性故障的發(fā)生具有重要意義。目前,隨著電力系統(tǒng)自動(dòng)化技術(shù)的發(fā)展,開(kāi)展對(duì)海量存儲(chǔ)的斷面歷史狀態(tài)數(shù)據(jù)分析,統(tǒng)計(jì)用戶(hù)自由定制組成的設(shè)備穩(wěn)定斷面的歷史過(guò)載信息,進(jìn)行穩(wěn)定斷面越限預(yù)測(cè)分析,供調(diào)度和方式進(jìn)行穩(wěn)定斷面預(yù)警,具有重要的理論和實(shí)踐意義。

現(xiàn)階段,已有很多方法可用穩(wěn)定斷面越限分析,如回歸分析模型、時(shí)序分析模型、灰色模型(grey model,GM)[1-3]等,但大部分模型都有一定的局限性。回歸分析模型對(duì)樣本容量要求較高,觀測(cè)數(shù)據(jù)過(guò)少會(huì)嚴(yán)重影響試驗(yàn)結(jié)果[4-8],時(shí)序分析模型在模型適應(yīng)性、時(shí)序的間距等方面仍需進(jìn)一步探索[7-10],GM在發(fā)生突變時(shí)預(yù)測(cè)精度極低[9]。針對(duì)現(xiàn)有模型過(guò)于復(fù)雜及效率過(guò)低的問(wèn)題,本文提出了滑動(dòng)可變窗口方法,對(duì)數(shù)據(jù)進(jìn)行回歸分析,簡(jiǎn)化對(duì)電網(wǎng)穩(wěn)定斷面越限的分析預(yù)測(cè)。

1 預(yù)備知識(shí)

本系統(tǒng)使用二次多項(xiàng)式回歸模型和指數(shù)回歸模型,對(duì)電網(wǎng)穩(wěn)定斷面越限進(jìn)行動(dòng)態(tài)預(yù)測(cè)。涉及的理論背景將在下文進(jìn)行介紹。

1.1 基礎(chǔ)回歸理論

回歸分析是一種統(tǒng)計(jì)學(xué)數(shù)據(jù)分析方法,主要目的是了解兩個(gè)或多個(gè)變量之間是否相關(guān)、相關(guān)方向與強(qiáng)度,同時(shí)建立數(shù)學(xué)模型以實(shí)現(xiàn)對(duì)數(shù)據(jù)的最優(yōu)擬合[11-14]。

回歸分析主要分為兩類(lèi):線(xiàn)性回歸分析和非線(xiàn)性回歸分析。線(xiàn)性回歸給定的樣本需要滿(mǎn)足線(xiàn)性關(guān)系的前提條件,公式如下:

y=β0+β1x1+β2x2+…+βixi+ε

(1)

即:

y=Xβ+ε

(2)

為了對(duì)β進(jìn)行估計(jì),需要借助一種合適的評(píng)判標(biāo)準(zhǔn)來(lái)尋找β的最優(yōu)估計(jì)。最小二乘法提供了一個(gè)標(biāo)準(zhǔn),其基本原理是使樣本數(shù)據(jù)的均方誤差達(dá)到最小,成本函數(shù)為:

(3)

式中:k為樣本的個(gè)數(shù)。

其向量形式可以表示為:

β=(XTX)-1XTy

(4)

此方法需要滿(mǎn)足X列向量線(xiàn)性無(wú)關(guān)。

本文使用二次多項(xiàng)式回歸模型和指數(shù)回歸模型。多項(xiàng)式回歸是線(xiàn)性回歸的推廣,其公式為:

y=β0+β1x+β2x2+ε

(5)

令x1=x、x2=x2,二次多項(xiàng)式可以轉(zhuǎn)換為二元線(xiàn)性回歸,并且在參數(shù)估計(jì)上并不改變?chǔ)轮怠?/p>

指數(shù)在數(shù)學(xué)中代表次方,即有理數(shù)乘方的一種運(yùn)算形式。指數(shù)回歸的普遍公式為:

(6)

式中:α為指數(shù)回歸系數(shù);β1、β2為指數(shù)偏回歸系數(shù)。本文中只有一個(gè)自變量,僅需要用到一元指數(shù)回歸,其公式為:

y=αβx

(7)

1.2 漸進(jìn)抽樣回歸

時(shí)序數(shù)據(jù)的回歸分析,應(yīng)該考慮到樣本數(shù)據(jù)的即時(shí)性。顯然,對(duì)于很多工程預(yù)測(cè),如果采用的樣本與所需預(yù)測(cè)的目標(biāo)點(diǎn)相隔較久,預(yù)測(cè)結(jié)果與實(shí)際值會(huì)相差比較大,這種情況在進(jìn)行短期預(yù)測(cè)時(shí)極為明顯。

在時(shí)間上呈現(xiàn)出一種連續(xù)的順序的數(shù)據(jù)集,具有時(shí)序性。漸近抽樣回歸考慮了數(shù)據(jù)的時(shí)序特性,以便采集更好的樣本。漸近抽樣可以動(dòng)態(tài)獲取時(shí)序樣本,如果時(shí)序樣本量過(guò)小,不能很好地反映總體情況,則逐漸增大樣本量以對(duì)其進(jìn)行優(yōu)化,使最終所獲取的樣本能夠最大程度地反映總體特征。

漸近抽樣回歸是漸近抽樣在回歸中的應(yīng)用,其數(shù)學(xué)描述如下。已知時(shí)序數(shù)據(jù)集為:

D={(xi,yi)|i=1,2,…,n}

(8)

式中:x為自變量;y為響應(yīng)變量。

漸近抽樣擬合是先從數(shù)據(jù)集D中抽取一個(gè)時(shí)間上距離元素m最近的子集來(lái)預(yù)測(cè),然后逐步增加樣本量,從而找到一個(gè)最優(yōu)的樣本集合以獲取對(duì)響應(yīng)變量ym的最優(yōu)估計(jì)。此時(shí)的樣本量也就是最優(yōu)樣本量。

S={(Xm-iym-i)|i=k,k-1,…,1}

(9)

S*={(Xm-i,ym-i)|i=k,k-1,…,1}

(10)

2 基于滑動(dòng)可變窗口的動(dòng)態(tài)數(shù)據(jù)擬合方法

2.1 算法描述

為了保證電網(wǎng)斷面運(yùn)行安全,需要對(duì)運(yùn)行數(shù)據(jù)進(jìn)行分析預(yù)測(cè),由于電網(wǎng)斷面數(shù)據(jù)量大,傳統(tǒng)的數(shù)據(jù)分析算法難以高效準(zhǔn)確地進(jìn)行預(yù)測(cè),本文提出了基于滑動(dòng)可變窗口的動(dòng)態(tài)數(shù)據(jù)擬合方法。使用二次多項(xiàng)式模型和指數(shù)模型動(dòng)態(tài)預(yù)測(cè)短時(shí)間內(nèi)電網(wǎng)斷面越限次數(shù),以更高效、準(zhǔn)確地對(duì)電網(wǎng)斷面運(yùn)行狀況進(jìn)行有效判斷并采取相應(yīng)措施。

基于可變滑動(dòng)窗口的動(dòng)態(tài)數(shù)據(jù)擬合法是一種新型的動(dòng)態(tài)預(yù)測(cè)方法?;瑒?dòng)窗口機(jī)制中,發(fā)送方根據(jù)確認(rèn)信息,可以改變窗口的尺寸,對(duì)窗口的大小進(jìn)行調(diào)節(jié)以控制流量。將滑動(dòng)窗口和回歸分析相結(jié)合,回歸分析模型對(duì)數(shù)據(jù)量要求較大的特點(diǎn),與穩(wěn)定斷面監(jiān)測(cè)數(shù)據(jù)量大的特點(diǎn)相契合,非常適用于電網(wǎng)穩(wěn)定斷面越限的預(yù)測(cè)分析??勺兓瑒?dòng)窗口方法綜合兩種方法的優(yōu)勢(shì),靈活取樣,針對(duì)不同的樣本數(shù)據(jù),調(diào)整合適的樣本容量。樣本容量即為所謂的窗口,由于預(yù)測(cè)點(diǎn)是不斷變化的,所以可以看作是可變滑動(dòng)窗口。

本算法實(shí)現(xiàn)動(dòng)態(tài)選擇樣本容量,由于某個(gè)特定的樣本容量很難適應(yīng)所有的預(yù)測(cè)點(diǎn),所以靜態(tài)樣本容量準(zhǔn)確性很低。穩(wěn)定斷面每天都需要監(jiān)測(cè),獲取的數(shù)據(jù)量極大,對(duì)每個(gè)預(yù)測(cè)點(diǎn)都要選取合適的樣本容量才能進(jìn)行準(zhǔn)確預(yù)測(cè)。樣本容量過(guò)小或過(guò)大會(huì)導(dǎo)致欠擬合或過(guò)擬合,嚴(yán)重影響預(yù)測(cè)的準(zhǔn)確性。所以,為了保證預(yù)測(cè)的準(zhǔn)確性,根據(jù)樣本數(shù)據(jù)的不同,所選取的樣本容量也應(yīng)該隨之改變。本算法針對(duì)不同的預(yù)測(cè)點(diǎn),動(dòng)態(tài)獲取窗口大小,在每次預(yù)測(cè)時(shí),程序都能自動(dòng)獲取合適的窗口大小及位置,對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),并在預(yù)測(cè)結(jié)束后自動(dòng)對(duì)下一個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè)。在這里不需要人工干預(yù),實(shí)現(xiàn)了算法的自動(dòng)化,減少了人工操作失誤對(duì)預(yù)測(cè)準(zhǔn)確性的影響,大大提高了預(yù)測(cè)結(jié)果的準(zhǔn)確性。

圖1 算法流程圖Fig.1 Algorithm flowchart

2.2 算法實(shí)現(xiàn)

2.2.1 樣本容量的動(dòng)態(tài)選取

綜合二次多項(xiàng)式模型和指數(shù)模型這兩種候選模型,確定樣本容量下限為4。根據(jù)上文介紹,二次多項(xiàng)式擬合有β0、β1、β2三個(gè)系數(shù),所以樣本量至少為3。但是在樣本容量為3時(shí),會(huì)出現(xiàn)完全擬合的情況。此時(shí),對(duì)其他數(shù)據(jù)進(jìn)行預(yù)測(cè),很難得到預(yù)期的結(jié)果。因此,只有在樣本中非空數(shù)據(jù)的個(gè)數(shù)≥4的條件下,才能進(jìn)行二次多項(xiàng)式模型擬合和指數(shù)模型擬合。選擇窗口下限為4,滿(mǎn)足了最低樣本容量要求。

通過(guò)多次迭代提高擬合的準(zhǔn)確性,計(jì)算樣本均方誤差。在樣本均方誤差達(dá)到收斂時(shí),確定此時(shí)的最小樣本均方誤差。此次迭代的樣本容量即為最優(yōu)樣本容量。

2.2.2 模型的動(dòng)態(tài)選取

本算法涵蓋兩種模型,分別是二次多項(xiàng)式模型和指數(shù)模型。本文主要研究的是電網(wǎng)穩(wěn)定斷面越限次數(shù)的變化,曲線(xiàn)走勢(shì)與二次多項(xiàng)式以及指數(shù)函數(shù)曲線(xiàn)走勢(shì)相似,故使用二次多項(xiàng)式擬合和指數(shù)擬合比較合適。

導(dǎo)入數(shù)據(jù)后,進(jìn)行多次迭代計(jì)算,每次均選取一定的樣本數(shù)據(jù)進(jìn)行二次多項(xiàng)式擬合和指數(shù)擬合,得到樣本均方誤差。在進(jìn)行一次計(jì)算時(shí),可以得到在當(dāng)前樣本容量下兩種模型擬合的樣本均方誤差,選取較小值為此時(shí)的最小均方誤差,相應(yīng)的模型即為此時(shí)的最優(yōu)模型。多次計(jì)算后,得到最優(yōu)樣本容量時(shí),對(duì)應(yīng)的模型即為最終選取的最優(yōu)模型。

if(abs(e_rmse)

{

good_model<--"指數(shù)模型"

chk_err<-- e_err_g

chk_yh<-- eyh_g

select_rmse<-- e_rmse;

select_step<-- es_g

}

else if(abs(e_rmse) > abs(p2_rmse))

{

good_model<--"二次多項(xiàng)式模型"

chk_err<-- p2_err_g

chk_yh<-- p2yh_g

select_rmse<—— p2_rmse

select_step<-- p2s_g

}

2.2.3 評(píng)判標(biāo)準(zhǔn)的確定

本算法選取最小均方誤差值(root mean square error,RMSE)為評(píng)判標(biāo)準(zhǔn),對(duì)二次多項(xiàng)式模型和指數(shù)模型的預(yù)測(cè)準(zhǔn)確度進(jìn)行比較,選取最優(yōu)模型。RMSE的計(jì)算公式為:

(12)

絕對(duì)誤差是預(yù)測(cè)值與實(shí)測(cè)值的差的絕對(duì)值,與樣本均方誤差一樣,均能反映預(yù)測(cè)結(jié)果的好壞,但以最小絕對(duì)誤差作為最優(yōu)方法的衡量指標(biāo),容易出現(xiàn)“過(guò)擬合”現(xiàn)象。同時(shí),選擇樣本均方誤差作為標(biāo)準(zhǔn)滿(mǎn)足大數(shù)定律,其假設(shè)隨機(jī)誤差項(xiàng)滿(mǎn)足“零均值”和“同方差”的正態(tài)分布假設(shè),即ε~N(0,σ2)。所以與最小絕對(duì)誤差相比較,樣本均方誤差值更適合作為模型擬合的衡量指標(biāo)。

2.2.4 收斂性

在實(shí)際生活中,之前的穩(wěn)定斷面越限數(shù)據(jù),對(duì)后續(xù)數(shù)據(jù)的影響微乎其微,所以在預(yù)測(cè)時(shí)樣本量不宜過(guò)大。為了控制樣本量的大小,本算法對(duì)迭代次數(shù)加以限制。

算法對(duì)均方誤差進(jìn)行觀測(cè),當(dāng)均方誤差逐漸收斂時(shí),停止迭代。在樣本容量遞增的過(guò)程中,如果樣本均方誤差有所減小,則繼續(xù)迭代尋找最優(yōu)均方誤差;如果樣本均方誤差在7次迭代中都沒(méi)有減小,可認(rèn)為均方誤差已經(jīng)收斂,不再擴(kuò)大樣本量,選取最優(yōu)模型,跳出迭代。

if (p2fg.rmse < p2_rmse)

{ p2yh_g<--p2yh

p2_err_<--p2_err

p2s_g<--step

p2_rmse<--p2fg.rmse

p2_cnt<--0

}

else

p2_cnt<--p2_cnt+1

本算法根據(jù)伯努利試驗(yàn)控制迭代的次數(shù)。將樣本容量增加1來(lái)求解局部最優(yōu)看成是一次伯努利試驗(yàn),每次試驗(yàn)可認(rèn)為是相互獨(dú)立的(每次都有可能達(dá)到最優(yōu))。每次試驗(yàn)中結(jié)果能否達(dá)到最優(yōu)的概率均為0.5,如果經(jīng)過(guò)連續(xù)7次試驗(yàn)都不能改善樣本均方誤差,7次以后再次改善樣本均方誤差值的概率小于0.003 91。在給定顯著性水平為0.01時(shí),7次試驗(yàn)以后再次改善樣本均方誤差這一事件為小概率事件,在一次試驗(yàn)中往往不會(huì)發(fā)生,此時(shí)認(rèn)為在置信度為99%的情況下模型取到最優(yōu)。此評(píng)判標(biāo)準(zhǔn)的添加,有效避免了過(guò)擬合的發(fā)生,同時(shí)讓擬合的效果達(dá)到最優(yōu)。

3 試驗(yàn)與評(píng)估

本試驗(yàn)的測(cè)試平臺(tái)及參數(shù)為:Intel酷睿i5、8G內(nèi)存、Windows7,使用Matlab軟件進(jìn)行結(jié)果仿真。

本試驗(yàn)基于前文所介紹的預(yù)測(cè)算法,選取某穩(wěn)定斷面2015年1月至2017年6月的越限數(shù)據(jù)進(jìn)行預(yù)測(cè),利用Matlab編制可變滑動(dòng)窗口預(yù)測(cè)法對(duì)所選觀測(cè)資料進(jìn)行計(jì)算擬合。

擬合所得到的樣本均方誤差點(diǎn)圖和直方圖分別如圖2、圖3所示。直觀顯示:0.2、0.4、0.6可以作為該測(cè)點(diǎn)下的三個(gè)閾值標(biāo)準(zhǔn)。

圖2 樣本均方誤差點(diǎn)圖Fig.2 Point diagram of sample mean square error

圖3 樣本均方誤差直方圖Fig.3 Histogram of sample mean square error

樣本均方誤差累計(jì)分布如表1所示,樣本均方誤差小于0.4的所占比例達(dá)到95%。在所選擬合模型準(zhǔn)確性的衡量指標(biāo)為0.4時(shí),如果某次擬合模型的均方誤差大于0.4,表明所確定的動(dòng)態(tài)最優(yōu)模型在95%的準(zhǔn)確率的情況下是不可信的,這時(shí)應(yīng)該予以監(jiān)控。

表1 樣本均方誤差累計(jì)分布表Tab.1 Cumulative distribution of sample mean square error

為進(jìn)一步探討動(dòng)態(tài)最優(yōu)模型的預(yù)測(cè)能力,選取所選擇樣本緊鄰的下一次測(cè)點(diǎn)數(shù)據(jù)進(jìn)行檢驗(yàn),得到校驗(yàn)誤差如圖4所示。累計(jì)分布如表2所示。

圖4 校驗(yàn)誤差Fig.4 Calibration error

表2 累計(jì)分布表Tab.2 Cumulative distribution

根據(jù)試驗(yàn)結(jié)果得到的最優(yōu)模型步長(zhǎng)的數(shù)據(jù)分布如圖5所示。樣本量在15以?xún)?nèi)所占的比例達(dá)到95.78%(如表3),擬合的結(jié)果比較理想。樣本容量大多數(shù)在15以?xún)?nèi),超過(guò)20的僅為少數(shù),可見(jiàn)樣本容量不需要太大,否則只會(huì)出現(xiàn)過(guò)擬合現(xiàn)象,使預(yù)測(cè)效果變差。

圖5 步長(zhǎng)分析Fig.5 Step length analysis

表3 樣本步長(zhǎng)累計(jì)分布表Tab.3 Cumulative distribution of sample step size

4 結(jié)束語(yǔ)

電網(wǎng)穩(wěn)定斷面越限預(yù)測(cè)的研究,在理論和實(shí)踐上都具有重要意義。本文針對(duì)電網(wǎng)穩(wěn)定斷面越限數(shù)據(jù)特點(diǎn),提出了一種基于滑動(dòng)可變窗口的電網(wǎng)穩(wěn)定斷面預(yù)測(cè)方法。該方法利用二次多項(xiàng)式模型和指數(shù)模型,實(shí)現(xiàn)了最優(yōu)擬合模型的動(dòng)態(tài)獲取,同時(shí)針對(duì)不同的模型,動(dòng)態(tài)獲取兩種模型的最優(yōu)樣本,大幅減小試驗(yàn)誤差。在選擇最優(yōu)樣本容量時(shí),算法對(duì)樣本容量進(jìn)行調(diào)整,有效避免了“欠擬合”和“過(guò)擬合”現(xiàn)象。試驗(yàn)結(jié)果表明,該方法對(duì)電網(wǎng)穩(wěn)定斷面越限預(yù)測(cè)的準(zhǔn)確性高。該方法也具有適用性,在應(yīng)用于其他領(lǐng)域時(shí),根據(jù)問(wèn)題的實(shí)際情況,選擇相應(yīng)的模型,也可以達(dá)到很好的預(yù)測(cè)效果。

該方法仍有一些方面需要完善。在數(shù)據(jù)量特別大的情況下,運(yùn)行該方法需要耗費(fèi)大量時(shí)間,系統(tǒng)計(jì)算成本較高,在以后的研究中,將改進(jìn)算法的運(yùn)行速度,使算法更高效、精簡(jiǎn)。

猜你喜歡
樣本容量均方樣本量
一種基于進(jìn)化算法的概化理論最佳樣本量估計(jì)新方法:兼與三種傳統(tǒng)方法比較*
醫(yī)學(xué)研究中樣本量的選擇
構(gòu)造Daubechies小波的一些注記
采用無(wú)核密度儀檢測(cè)壓實(shí)度的樣本容量確定方法
Beidou, le système de navigation par satellite compatible et interopérable
樣本量估計(jì)及其在nQuery和SAS軟件上的實(shí)現(xiàn)*——均數(shù)比較(十一)
樣本量估計(jì)及其在nQuery和SAS軟件上的實(shí)現(xiàn)*——均數(shù)比較(十)
蒙特卡羅模擬在計(jì)量經(jīng)濟(jì)學(xué)中的應(yīng)用
分層抽樣技術(shù)在課堂滿(mǎn)意度調(diào)查中的應(yīng)用研究
一類(lèi)隨機(jī)微分方程的均方漸近概自守溫和解
呼伦贝尔市| 绥阳县| 玛多县| 兴安盟| 麻城市| 赞皇县| 肇庆市| 九台市| 襄城县| 正镶白旗| 沈丘县| 澎湖县| 合肥市| 上思县| 都匀市| 嘉峪关市| 乐清市| 石门县| 红河县| 贵州省| 永州市| 高淳县| 昔阳县| 安国市| 屯门区| 万山特区| 景东| 清涧县| 中山市| 勃利县| 枣强县| 浪卡子县| 合山市| 遵化市| 洪雅县| 长岭县| 分宜县| 重庆市| 兴安县| 武陟县| 丰原市|