国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關(guān)聯(lián)分析與機(jī)器學(xué)習(xí)的配網(wǎng)臺(tái)區(qū)重過(guò)載預(yù)測(cè)方法

2018-03-01 03:48:52張國(guó)賓王曉蓉鄧春宇
大數(shù)據(jù) 2018年1期
關(guān)鍵詞:臺(tái)區(qū)關(guān)聯(lián)負(fù)荷

張國(guó)賓,王曉蓉,鄧春宇

中國(guó)電力科學(xué)研究院,北京 100192

1 引言

配變臺(tái)區(qū)作為面向低壓用戶(hù)的最末一級(jí)供電單位,臺(tái)區(qū)供電設(shè)備的運(yùn)行狀態(tài)直接影響臺(tái)區(qū)內(nèi)的供電質(zhì)量。設(shè)備的重過(guò)載運(yùn)行是引起故障停電的主要原因之一,而重過(guò)載現(xiàn)象通常也伴隨著三相不平衡、電壓偏移等其他問(wèn)題,嚴(yán)重影響用戶(hù)安全可靠用電。此外,設(shè)備長(zhǎng)時(shí)間處于重過(guò)載狀態(tài)會(huì)加快元件的非正常損耗,降低設(shè)備使用壽命,給電網(wǎng)帶來(lái)故障隱患和運(yùn)行風(fēng)險(xiǎn)。因此,臺(tái)區(qū)重過(guò)載治理一直是配網(wǎng)運(yùn)維檢修工作的重要內(nèi)容。

目前,對(duì)于配變臺(tái)區(qū)的重過(guò)載治理通常分為事中監(jiān)測(cè)和事后處理兩個(gè)階段,即實(shí)時(shí)監(jiān)測(cè)配變運(yùn)行情況,在發(fā)現(xiàn)重過(guò)載事件后,向運(yùn)維人員發(fā)出告警信息,然后由現(xiàn)場(chǎng)專(zhuān)工根據(jù)具體情況采取相應(yīng)措施進(jìn)行處理。在大部分情況下,考慮到實(shí)際工況中允許設(shè)備短時(shí)間重過(guò)載運(yùn)行,為保證持續(xù)供電,對(duì)一般的重過(guò)載事件只進(jìn)行監(jiān)測(cè),對(duì)頻繁出現(xiàn)重過(guò)載的配變進(jìn)行報(bào)備,并列入周期性技術(shù)改造大修計(jì)劃。而對(duì)于可能或已經(jīng)造成停電的重過(guò)載事件,可以通過(guò)切改用戶(hù)線(xiàn)路或臨時(shí)替換大容量變壓器消除重過(guò)載現(xiàn)象,但臨時(shí)停電依然不可避免。

在現(xiàn)有設(shè)備水平和電網(wǎng)運(yùn)行技術(shù)條件下,較為理想的重過(guò)載治理方式仍是通過(guò)合理地安排技術(shù)改造大修計(jì)劃,及時(shí)進(jìn)行調(diào)整用戶(hù)線(xiàn)路和配變?cè)鋈?,減少非計(jì)劃停電。因此開(kāi)展重過(guò)載影響因素分析并實(shí)現(xiàn)事前預(yù)測(cè),對(duì)于及時(shí)發(fā)現(xiàn)重過(guò)載隱患、優(yōu)化設(shè)備升級(jí)改造計(jì)劃具有重要作用[1]。

在理論研究方面,參考文獻(xiàn)[2,3]分析了氣象指標(biāo)、用電類(lèi)別、行業(yè)類(lèi)別與配變重過(guò)載發(fā)生概率的變化關(guān)系,并就可能的重過(guò)載成因進(jìn)行了初步探討,最后利用基于隨機(jī)森林理論改進(jìn)的決策樹(shù)模型對(duì)配變重過(guò)載狀態(tài)進(jìn)行預(yù)測(cè)。參考文獻(xiàn)[4]面向負(fù)荷增長(zhǎng)較快的高速發(fā)展區(qū)域,從用戶(hù)、氣象和歷史負(fù)荷出發(fā),提出基于邏輯回歸的重過(guò)載中長(zhǎng)期預(yù)測(cè)方法,但未給出邏輯回歸模型中各項(xiàng)參數(shù)的選擇過(guò)程,方法中對(duì)重過(guò)載的定義也與參考文獻(xiàn)[2]中不同。參考文獻(xiàn)[5]針對(duì)春節(jié)期間的重過(guò)載現(xiàn)象,提出基于BP神經(jīng)網(wǎng)絡(luò)與灰色模型的重過(guò)載預(yù)測(cè)方法。將春節(jié)前后配電變壓器的負(fù)荷變化作為模型輸入對(duì)負(fù)載率進(jìn)行預(yù)測(cè),進(jìn)而判斷設(shè)備重過(guò)載情況。通過(guò)該方法獲取的重過(guò)載預(yù)測(cè)模型不具備泛化能力,也不能適應(yīng)大規(guī)模配電網(wǎng)的快速分析。參考文獻(xiàn)[6]以一周為周期,對(duì)6 000個(gè)居民用戶(hù)臺(tái)區(qū)每周同一天共7類(lèi)負(fù)荷曲線(xiàn)進(jìn)行了研究,并加入氣象和經(jīng)濟(jì)數(shù)據(jù),采用不同的機(jī)器學(xué)習(xí)方法對(duì)負(fù)荷曲線(xiàn)進(jìn)行了預(yù)測(cè)。但該方法忽略了負(fù)荷的季度年度規(guī)律,且對(duì)異常值較為敏感,預(yù)測(cè)效果受到了影響。參考文獻(xiàn)[7]基于線(xiàn)性回歸模型討論了在聚合和分解兩種模型處理下預(yù)測(cè)效果的差異,通過(guò)算例說(shuō)明了通過(guò)對(duì)訓(xùn)練節(jié)點(diǎn)進(jìn)行分解能夠有效提高負(fù)荷預(yù)測(cè)精度,但算例只采用了天氣和時(shí)間數(shù)據(jù)用于模型訓(xùn)練,對(duì)配變負(fù)荷影響因素分析不足。參考文獻(xiàn)[8]提出了一種趨勢(shì)分析與指數(shù)加權(quán)模型的超短期負(fù)荷預(yù)測(cè)方法,該方法能夠提高對(duì)負(fù)荷峰谷的預(yù)測(cè)精度,且對(duì)負(fù)荷缺失值和異常值有較好的適應(yīng)性。參考文獻(xiàn)[9]在基本的氣象指標(biāo)之外,研究了風(fēng)寒指數(shù)、空氣污染指數(shù)、人體舒適指數(shù)等氣象指數(shù)與配變重過(guò)載的關(guān)系,在此基礎(chǔ)上運(yùn)用小波神經(jīng)網(wǎng)絡(luò)(wavelet neural network,WNN)模型對(duì)配變負(fù)荷進(jìn)行預(yù)測(cè)。

在應(yīng)用實(shí)踐方面,國(guó)網(wǎng)黑龍江省電力有限公司哈爾濱供電公司[10]依托運(yùn)監(jiān)中心數(shù)據(jù)開(kāi)展重過(guò)載監(jiān)測(cè),同時(shí)利用配電變壓器型號(hào)、設(shè)備容量、運(yùn)行年限等設(shè)備臺(tái)賬信。國(guó)網(wǎng)福建省電力有限公司福州供電公司[11]針對(duì)城網(wǎng)公變開(kāi)展重過(guò)載預(yù)測(cè)研究,從風(fēng)險(xiǎn)角度對(duì)重過(guò)載配電變壓器進(jìn)行多方面綜合評(píng)估,能夠在一定程度上指導(dǎo)運(yùn)維工作,但模型效果仍有提升空間。

由上可見(jiàn),目前的研究大多數(shù)仍然以配變負(fù)荷預(yù)測(cè)為切入點(diǎn),包括利用歷史負(fù)荷數(shù)據(jù)外推負(fù)荷的典型變化規(guī)律,加入氣象條件、經(jīng)濟(jì)指標(biāo)等外部間接因素分析與負(fù)荷的關(guān)聯(lián)程度,嘗試采用各類(lèi)機(jī)器學(xué)習(xí)方法構(gòu)建負(fù)荷預(yù)測(cè)模型,最后基于負(fù)荷預(yù)測(cè)結(jié)果對(duì)重過(guò)載進(jìn)行判斷。但目前各類(lèi)負(fù)荷預(yù)測(cè)方法在預(yù)測(cè)精度上的局限性導(dǎo)致基于負(fù)荷預(yù)測(cè)結(jié)果的重過(guò)載預(yù)測(cè)不能適應(yīng)業(yè)務(wù)實(shí)際情況。對(duì)于短期負(fù)荷預(yù)測(cè),考慮到目前消除重過(guò)載的手段以實(shí)施周期較長(zhǎng)的線(xiàn)路切改和設(shè)備改造為主,短期的預(yù)測(cè)結(jié)果不足以提供足夠的時(shí)間裕度消除重過(guò)載隱患;對(duì)于中長(zhǎng)期負(fù)荷預(yù)測(cè),考慮到臺(tái)區(qū)負(fù)荷的突變性和波動(dòng)性,負(fù)荷預(yù)測(cè)結(jié)果本身不能滿(mǎn)足對(duì)重過(guò)載進(jìn)行判斷的基本精度。

本文直接以重過(guò)載事件為目標(biāo),從歷史運(yùn)行數(shù)據(jù)中抽取重過(guò)載記錄,融合設(shè)備臺(tái)賬數(shù)據(jù)、臺(tái)區(qū)用戶(hù)數(shù)據(jù)以及供電環(huán)境屬性,利用多維關(guān)聯(lián)分析方法挖掘可能與重過(guò)載相關(guān)的影響因素組合,利用歷史數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型,建立配電臺(tái)區(qū)重過(guò)載預(yù)測(cè)模型。最后,利用某地市供電公司實(shí)際數(shù)據(jù),對(duì)方法分析過(guò)程和模型效果進(jìn)行了驗(yàn)證。

2 整體研究思路

配電臺(tái)區(qū)重過(guò)載預(yù)測(cè)研究大致分為以下3個(gè)階段。

● 數(shù)據(jù)收集與預(yù)處理:從各個(gè)業(yè)務(wù)系統(tǒng)中獲得原始數(shù)據(jù)后,對(duì)重過(guò)載相關(guān)數(shù)據(jù)項(xiàng)進(jìn)行初步篩選和清洗,量化分析目標(biāo)和樣本規(guī)模。

● 重過(guò)載影響因素分析:從原始數(shù)據(jù)中抽取或設(shè)計(jì)特征變量,通過(guò)多變量多層關(guān)聯(lián)找到單個(gè)變量或變量組合與重過(guò)載事件之間的強(qiáng)弱關(guān)聯(lián)。

● 重過(guò)載預(yù)測(cè)模型訓(xùn)練:結(jié)合上一階段中獲得的相關(guān)特征構(gòu)造機(jī)器學(xué)習(xí)模型,通過(guò)歷史數(shù)據(jù)樣本對(duì)重過(guò)載模型參數(shù)進(jìn)行訓(xùn)練及效果評(píng)估。

上述研究思路可以進(jìn)一步分解為以下步驟,如圖1所示。

圖1 整體研究思路

● 明確業(yè)務(wù)定義與模型目標(biāo)。長(zhǎng)期以來(lái)重過(guò)載管理水平不高導(dǎo)致業(yè)務(wù)上對(duì)于重過(guò)載的判定過(guò)于簡(jiǎn)單模糊,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。因此,必須對(duì)重過(guò)載定義做出清晰、可執(zhí)行的限定。此外,需要結(jié)合業(yè)務(wù)需求明確模型的技術(shù)目標(biāo),包括模型的預(yù)測(cè)精度、預(yù)測(cè)效率、預(yù)測(cè)時(shí)間跨度等,模型的目標(biāo)一定程度上決定了特征變量和模型架構(gòu)的選擇。

● 數(shù)據(jù)獲取與預(yù)處理。隨著電力系統(tǒng)信息化程度的不斷加深,目前在電力企業(yè)的各業(yè)務(wù)環(huán)節(jié)中都具備信息化系統(tǒng)支撐,系統(tǒng)之間的數(shù)據(jù)貫通和融合不在本文討論范圍內(nèi),但數(shù)據(jù)的獲取是開(kāi)展任何大數(shù)據(jù)應(yīng)用研究的前提,本文涉及的業(yè)務(wù)系統(tǒng)及數(shù)據(jù)規(guī)模會(huì)在下文中說(shuō)明。數(shù)據(jù)質(zhì)量決定了模型效果的上限,因此從業(yè)務(wù)系統(tǒng)中獲取原始數(shù)據(jù)后需要對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,必要時(shí)通過(guò)清洗、補(bǔ)齊等技術(shù)手段對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。

● 設(shè)計(jì)并提取特征變量。特征變量是進(jìn)行關(guān)聯(lián)分析的直接輸入,特征變量可以來(lái)自原始數(shù)據(jù)字段,也可以通過(guò)對(duì)原始數(shù)據(jù)字段進(jìn)行加工獲得。特征變量的設(shè)計(jì)可以依靠業(yè)務(wù)經(jīng)驗(yàn),也可以依據(jù)某些標(biāo)準(zhǔn)原則。特征變量的提取是指在從原始數(shù)據(jù)到特征變量數(shù)據(jù)的實(shí)現(xiàn)過(guò)程中,通過(guò)提取形成用于關(guān)聯(lián)分析的特征變量數(shù)據(jù)集。

● 特征變量關(guān)聯(lián)分析。通過(guò)關(guān)聯(lián)分析方法對(duì)特征變量數(shù)據(jù)集進(jìn)行操作,得到與重過(guò)載相關(guān)的關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則中的特征變量集合代表了重過(guò)載影響因素。關(guān)聯(lián)規(guī)則中的特征變量大多不唯一。關(guān)聯(lián)分析方法的選擇需要根據(jù)數(shù)據(jù)類(lèi)型和分析目標(biāo)綜合確定。

● 模型選擇與參數(shù)訓(xùn)練。重過(guò)載預(yù)測(cè)屬于數(shù)據(jù)挖掘中的預(yù)測(cè)問(wèn)題范疇。從傳統(tǒng)的回歸方法到ANN、支持向量機(jī)(support vector machine,SVM)等人工智能方法,各類(lèi)預(yù)測(cè)模型在具體問(wèn)題上的表現(xiàn)都有所差異。而從實(shí)際應(yīng)用情況來(lái)看,機(jī)器學(xué)習(xí)在非線(xiàn)性擬合問(wèn)題上具有天然優(yōu)勢(shì),同時(shí)對(duì)于輸入特征的自學(xué)習(xí)性也是本文選擇機(jī)器學(xué)習(xí)的重要原因。需要注意的是,成為影響因素的特征變量一般需要進(jìn)行一定的數(shù)據(jù)變換才能成為預(yù)測(cè)模型的輸入變量。

● 模型效果驗(yàn)證與優(yōu)化。通過(guò)一部分歷史數(shù)據(jù)對(duì)模型效果進(jìn)行驗(yàn)證,除了準(zhǔn)確率、命中率等模型性能指標(biāo)外,業(yè)務(wù)層面對(duì)模型的認(rèn)可程度也是評(píng)價(jià)模型效果的重要依據(jù)。

3 方法與技術(shù)路線(xiàn)

3.1 業(yè)務(wù)定義與模型目標(biāo)

目前實(shí)際業(yè)務(wù)中使用較多的配變重過(guò)載的定義通常為:每天00:00配變功率曲線(xiàn)中,連續(xù)3個(gè)點(diǎn)負(fù)載率為80%~100%,視為重載;連續(xù)3個(gè)點(diǎn)負(fù)載率超過(guò)100%,視為過(guò)載。但從實(shí)際數(shù)據(jù)和業(yè)務(wù)需求來(lái)看,上述定義存在3方面問(wèn)題:

● 配變重過(guò)載中,負(fù)載率經(jīng)常頻繁波動(dòng),存在大量重載與過(guò)載混雜存在的情況,無(wú)法按照現(xiàn)有定義進(jìn)行識(shí)別;

● 相當(dāng)一部分重過(guò)載現(xiàn)象在持續(xù)時(shí)間上不足2 h,這類(lèi)重過(guò)載對(duì)設(shè)備和電網(wǎng)的影響理論上雖然小于長(zhǎng)時(shí)間重過(guò)載,但對(duì)于分析重過(guò)載成因具有很高的價(jià)值;

● 大部分重過(guò)載發(fā)生于單相,還有部分重過(guò)載會(huì)同時(shí)發(fā)生在多相,如果能夠?qū)ο鄤e進(jìn)行識(shí)別,則對(duì)于重過(guò)載治理措施的選擇至關(guān)重要。

針對(duì)上述3方面問(wèn)題,本文對(duì)重過(guò)載定義做出調(diào)整:每天00:00配變功率曲線(xiàn)中,連續(xù)兩個(gè)或以上點(diǎn)三相負(fù)載率中的最大值超過(guò)80%,視為重過(guò)載。連續(xù)3個(gè)點(diǎn)負(fù)載率超過(guò)100%,視為過(guò)載。針對(duì)上述3方面問(wèn)題,本文對(duì)重過(guò)載定義做出調(diào)整:每天00:00配變功率曲線(xiàn)中,連續(xù)兩個(gè)或以上點(diǎn)三相負(fù)載率中的最大值超過(guò)80%,視為重載;連續(xù)3個(gè)點(diǎn)負(fù)載率超過(guò)100%,視為過(guò)載。

重過(guò)載定義優(yōu)化如圖2所示。

在模型目標(biāo)方面,模型結(jié)果必須能夠與業(yè)務(wù)環(huán)節(jié)形成銜接,才能實(shí)現(xiàn)模型的應(yīng)用價(jià)值。這就要求模型預(yù)測(cè)結(jié)果必須與目前配變重過(guò)載治理方法和周期匹配。針對(duì)重過(guò)載現(xiàn)象,目前電網(wǎng)側(cè)的治理手段包括以下兩方面:

● 對(duì)用戶(hù)進(jìn)行臨時(shí)線(xiàn)路切改,這種調(diào)整方式相對(duì)便捷,處理周期短,但由于臺(tái)區(qū)用戶(hù)情況復(fù)雜,部分重過(guò)載臺(tái)區(qū)可能不具備調(diào)相條件;

● 通過(guò)設(shè)備升級(jí)改造,永久性解決重過(guò)載問(wèn)題,但該途徑周期較長(zhǎng),不適用于突發(fā)情況。

結(jié)合數(shù)據(jù)支撐情況和業(yè)務(wù)流程,對(duì)重過(guò)載預(yù)測(cè)的目標(biāo)確定為:預(yù)測(cè)精度以天為單位,預(yù)測(cè)時(shí)間跨度不低于3天。

圖2 重過(guò)載定義優(yōu)化

3.2 數(shù)據(jù)選擇與獲取

重過(guò)載現(xiàn)象本質(zhì)上反映了相對(duì)靜態(tài)的電源容量不能滿(mǎn)足某些條件下的用戶(hù)用電需求。臺(tái)區(qū)內(nèi)的用戶(hù)類(lèi)型、用戶(hù)數(shù)量、用電行為等不同程度上決定了用戶(hù)的用電負(fù)荷特征。進(jìn)一步擴(kuò)展來(lái)看,用戶(hù)方面的各項(xiàng)變化又受到天氣、時(shí)節(jié)、群體活動(dòng)、經(jīng)濟(jì)波動(dòng)等眾多自然環(huán)境與社會(huì)環(huán)境的影響。此外,設(shè)備自身的缺陷以及臺(tái)區(qū)內(nèi)拓?fù)涞牟缓侠硗瑯訒?huì)導(dǎo)致重過(guò)載的發(fā)生。惡劣的運(yùn)行環(huán)境引起的設(shè)備非正常損耗也會(huì)增加重過(guò)載風(fēng)險(xiǎn)。

通過(guò)數(shù)據(jù)調(diào)研,在充分考慮數(shù)據(jù)獲取途徑和難度后,確定用于本項(xiàng)研究的數(shù)據(jù)規(guī)模,如圖3所示。內(nèi)部數(shù)據(jù)包括某地市公司所屬的所有配變?cè)O(shè)備臺(tái)賬、臺(tái)區(qū)用戶(hù)的部分檔案信息以及變更記錄、配變負(fù)荷曲線(xiàn)、配變改造記錄,覆蓋近3萬(wàn)個(gè)配電臺(tái)區(qū)。同時(shí)受數(shù)據(jù)粒度所限,外部數(shù)據(jù)選擇了時(shí)間數(shù)據(jù)、節(jié)假日信息、各類(lèi)氣象指標(biāo)等數(shù)據(jù)。數(shù)據(jù)時(shí)間跨度為2014—2015年底。總數(shù)據(jù)量超過(guò)3億條。

圖3 數(shù)據(jù)分析范圍與規(guī)模

數(shù)據(jù)的獲取通過(guò)系統(tǒng)間接口完成。通過(guò)大數(shù)據(jù)平臺(tái)與業(yè)務(wù)數(shù)據(jù)中心進(jìn)行數(shù)據(jù)集成,不直接與各源業(yè)務(wù)系統(tǒng)(調(diào)度、運(yùn)檢、營(yíng)銷(xiāo)等業(yè)務(wù)信息系統(tǒng),如EMS/配網(wǎng)自動(dòng)化/PMS/營(yíng)銷(xiāo)/95598/用電信息采集系統(tǒng)等)對(duì)接。業(yè)務(wù)數(shù)據(jù)中心直接將相關(guān)數(shù)據(jù)庫(kù)表提供給大數(shù)據(jù)平臺(tái)及應(yīng)用直接訪(fǎng)問(wèn),以供大數(shù)據(jù)平臺(tái)及應(yīng)用接入數(shù)據(jù),創(chuàng)建中間庫(kù),用戶(hù)在中間庫(kù)下創(chuàng)建接口視圖,源數(shù)據(jù)根據(jù)中間庫(kù)抽取數(shù)據(jù)到大數(shù)據(jù)平臺(tái)基礎(chǔ)庫(kù)(Hive),或從Hive推送數(shù)據(jù)到應(yīng)用業(yè)務(wù)庫(kù)(MySQL)。

3.3 特征工程與關(guān)聯(lián)分析

重過(guò)載現(xiàn)象受到臺(tái)區(qū)下用戶(hù)數(shù)量和用電行為的直接影響。但用戶(hù)數(shù)量和用電行為會(huì)隨著外界環(huán)境動(dòng)態(tài)變化。而各項(xiàng)環(huán)境因素之間常常存在內(nèi)部橫向關(guān)聯(lián)。因此在設(shè)計(jì)特征變量時(shí),要保證特征變量之間的獨(dú)立性。基于數(shù)據(jù)現(xiàn)狀和特征獨(dú)立性,選擇部分原始數(shù)據(jù)字段設(shè)計(jì)以下三大類(lèi)特征。

● 靜態(tài)特征:額定容量、設(shè)備型號(hào)、臺(tái)區(qū)類(lèi)型、用戶(hù)構(gòu)成比例。主要用于分析以上各維度下的重過(guò)載配變分布規(guī)律。

● 時(shí)序特征:重要節(jié)假日標(biāo)志、溫度、濕度、空氣質(zhì)量指數(shù)等氣象指標(biāo)。主要用于分析期間各項(xiàng)指標(biāo)下的重過(guò)載臺(tái)區(qū)隨時(shí)間變化的趨勢(shì)。

● 衍生特征:從負(fù)荷曲線(xiàn)中提取的短期用電特征,用于分析短期用電特征與重過(guò)載的相關(guān)性。

具體的特征定義見(jiàn)表1。

表1 關(guān)聯(lián)特征含義

即包含頻繁模式p的樣本數(shù)目在整個(gè)關(guān)聯(lián)樣本集中的百分比。頻繁模式要滿(mǎn)足最小支持度min:surpport的要求。

頻繁模式體現(xiàn)了某些關(guān)聯(lián)特征在特定的取值范圍下出現(xiàn)在重過(guò)載事件中的頻率。但這些特征與重過(guò)載事件的關(guān)聯(lián)關(guān)系需要進(jìn)一步通過(guò)計(jì)算置信度和相關(guān)度確定。

置信度為:

按照上述特征定義,每一次重過(guò)載事件都可以形成一條關(guān)聯(lián)特征向量。關(guān)聯(lián)分析的操作對(duì)象是由關(guān)聯(lián)特征向量構(gòu)成的關(guān)聯(lián)樣本集。由于關(guān)聯(lián)特征中同時(shí)存在離散型和連續(xù)型變量,為了盡量降低數(shù)據(jù)泛化對(duì)分析結(jié)果的影響,選擇HotSpot算法對(duì)關(guān)聯(lián)樣本集進(jìn)行頻繁模式挖掘。

頻繁模式p形式如下:

相關(guān)度為:

在滿(mǎn)足支持度閾值的前提下,同時(shí)滿(mǎn)足最小置信度min:confidence和最小相關(guān)度min:co的頻繁模式稱(chēng)為關(guān)聯(lián)規(guī)則。

3.4 模型訓(xùn)練

其中,ai∈Ri為謂詞,表示特征項(xiàng)ai的取值屬于某一取值空間Ri;b表示某重過(guò)載事件類(lèi)型標(biāo)號(hào)。surpport表示支持度,定義如下:

通過(guò)關(guān)聯(lián)規(guī)則確定影響重過(guò)載發(fā)生的主要因素后,對(duì)重過(guò)載事件的預(yù)測(cè)就可以看作數(shù)據(jù)挖掘中的預(yù)測(cè)問(wèn)題,即通過(guò)若干條件綜合判斷某一類(lèi)型重過(guò)載事件是否發(fā)生。為了降低關(guān)聯(lián)規(guī)則中各特征之間可能存在的共線(xiàn)性對(duì)模型預(yù)測(cè)效果的影響,同時(shí)防止對(duì)數(shù)據(jù)的過(guò)度擬合,選用深度邏輯網(wǎng)絡(luò)(deep logical network,DLN)模型。模型結(jié)構(gòu)如下:

k1,k2,…,ki各項(xiàng)系數(shù)反映了該項(xiàng)特征對(duì)預(yù)測(cè)目標(biāo)的影響程度,通過(guò)樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練自動(dòng)獲得。f(y)為對(duì)數(shù)函數(shù),取值范圍為(0,1),表示該樣本發(fā)生重過(guò)載的概率。

對(duì)于DLN模型,最大化似然函數(shù)和最小化損失函數(shù)實(shí)際上是等價(jià)的。因此在參數(shù)訓(xùn)練方法上,為了進(jìn)一步降低邏輯項(xiàng)之間可能存在的共線(xiàn)性影響,采用了基于不完全數(shù)據(jù)的混合最大似然估計(jì)(maximum likelihood estimation,MLE)方法。

在模型驗(yàn)證方面,采用柯?tīng)柲陕宸颉姑茁宸颍↘olmogorov-Smirnov,K-S)校驗(yàn)方法,比較樣本數(shù)據(jù)的累計(jì)頻數(shù)分布與理論分布,若兩者間的差距很小,則推論該樣本取自某該類(lèi)重過(guò)載樣本集。

方法整體流程如圖4所示。

圖4 重過(guò)載預(yù)測(cè)方法整體流程

4 算例分析

以某地市供電公司實(shí)際數(shù)據(jù)為例,對(duì)本文提出的關(guān)聯(lián)分析以及預(yù)測(cè)方法進(jìn)行驗(yàn)證。

4.1 數(shù)據(jù)質(zhì)量診斷與預(yù)處理

本文運(yùn)用的數(shù)據(jù)覆蓋近14 000臺(tái)配變近3年每天00:00的負(fù)荷曲線(xiàn)數(shù)據(jù)、相應(yīng)的配變?cè)O(shè)備臺(tái)賬(型號(hào)、容量、運(yùn)行年限、升級(jí)改造記錄)、臺(tái)區(qū)類(lèi)型以及用戶(hù)數(shù)量、每日最高氣溫、每日最低氣溫、每日濕度、每日降雨量、當(dāng)日星期類(lèi)型、節(jié)假日標(biāo)簽等。

4.1.1 臺(tái)賬數(shù)據(jù)

設(shè)備臺(tái)賬方面,共收集配變?cè)O(shè)備臺(tái)賬記錄14 904條,數(shù)據(jù)情況見(jiàn)表2。

● 設(shè)備型號(hào)字段中存在包含中文字符的無(wú)效記錄共246條,其中222條記錄可通過(guò)自動(dòng)修正處理為有效數(shù)據(jù);另外,在共計(jì)1 342種型號(hào)中,保留其中166種主要型號(hào),對(duì)應(yīng)設(shè)備數(shù)量占總數(shù)的99.5%。

● 額定容量字段中有464條記錄不符合標(biāo)準(zhǔn)容量,占設(shè)備總數(shù)量的3%;生產(chǎn)廠(chǎng)商字段存在552條無(wú)效記錄,另外保留其中239個(gè)主要廠(chǎng)商,對(duì)應(yīng)設(shè)備數(shù)量占總數(shù)的91.3%;區(qū)域特征字段存在306條空值記錄。以上各項(xiàng)字段中的空值記錄和無(wú)效記錄不納入本次分析范圍。

● 其他字段數(shù)據(jù)情況良好可用。

表2 臺(tái)賬數(shù)據(jù)情況

4.1.2 負(fù)荷數(shù)據(jù)

歷史負(fù)荷數(shù)據(jù)方面,獲得2014—2016年共3年的每天00:00的負(fù)荷曲線(xiàn)數(shù)據(jù),數(shù)據(jù)情況見(jiàn)表3。

表3 負(fù)荷曲線(xiàn)數(shù)據(jù)情況

從負(fù)荷曲線(xiàn)中對(duì)重過(guò)載事件進(jìn)行識(shí)別,需要盡量確保數(shù)據(jù)的連續(xù)性,按照以下規(guī)則對(duì)負(fù)荷曲線(xiàn)數(shù)據(jù)進(jìn)行插補(bǔ)。

● 數(shù)據(jù)連續(xù)缺失在兩個(gè)點(diǎn)(包括兩個(gè)點(diǎn))以?xún)?nèi)的按照插值法進(jìn)行補(bǔ)齊。

● 在數(shù)據(jù)連續(xù)缺失2個(gè)點(diǎn)以上、6個(gè)點(diǎn)以下的情況,若缺失區(qū)間兩端時(shí)刻的負(fù)載率為重過(guò)載,則節(jié)假日在該端采用移動(dòng)平均法進(jìn)行補(bǔ)齊,時(shí)期數(shù)N=3;非節(jié)假日,按照前5日(相同類(lèi)型)同一時(shí)刻的負(fù)載率均值計(jì)算。對(duì)于僅有一個(gè)端點(diǎn)負(fù)載率在重過(guò)載區(qū)間(節(jié)假日)的情況,在該端采用移動(dòng)平均法進(jìn)行補(bǔ)齊,時(shí)期數(shù)N=3。

● 其他情況一律不做補(bǔ)齊處理。

4.1.3 用戶(hù)信息數(shù)據(jù)

用戶(hù)信息數(shù)據(jù)方面,共獲得低壓用戶(hù)檔案記錄4 947 519條,數(shù)據(jù)情況見(jiàn)表4。

● 13 697條用戶(hù)檔案記錄無(wú)法與相應(yīng)臺(tái)區(qū)進(jìn)行匹配,屬于無(wú)效數(shù)據(jù)。

● 戶(hù)均容量方面,由于存在多臺(tái)配變器劃歸同一臺(tái)區(qū)的情況,因此戶(hù)均容量記錄條數(shù)少于配變?cè)O(shè)備數(shù)量。臺(tái)區(qū)戶(hù)均容量為空的記錄共6 453條,其中存在無(wú)法與相應(yīng)用戶(hù)進(jìn)行匹配的臺(tái)區(qū)3個(gè),其他空值可以根據(jù)現(xiàn)有臺(tái)區(qū)域用戶(hù)匹配關(guān)系進(jìn)行補(bǔ)充。

● 原始數(shù)據(jù)中包含410個(gè)行業(yè)類(lèi)別,按照《2015年行業(yè)用電分類(lèi)標(biāo)準(zhǔn)》進(jìn)行泛化處理后,共保留47類(lèi)。

4.1.4 氣象指標(biāo)數(shù)據(jù)

對(duì)氣象類(lèi)信息進(jìn)行排查,選用了溫度、濕度、降水量和風(fēng)速信息,數(shù)據(jù)粒度為小時(shí)。在進(jìn)行后續(xù)分析之前,需要對(duì)壞數(shù)據(jù)進(jìn)行處理,剔除無(wú)效數(shù)據(jù)。

表4 用戶(hù)信息數(shù)據(jù)情況

4.2 重過(guò)載關(guān)聯(lián)因素

為了保證能夠獲得足夠多的頻繁模式,同時(shí)基于頻繁模式產(chǎn)生的關(guān)聯(lián)規(guī)則能夠反映樣本整體規(guī)律,一方面可以嘗試多組支持度、置信度和相關(guān)度閾值,另一方面,也可以對(duì)部分關(guān)聯(lián)特征進(jìn)行適當(dāng)?shù)念A(yù)處理。根據(jù)特征數(shù)值類(lèi)型,相應(yīng)的預(yù)處理方式見(jiàn)表5。

表5 數(shù)據(jù)預(yù)處理方式

共155 768個(gè)重過(guò)載事件生成重過(guò)載事件樣本。采用R語(yǔ)言中的Hotspot包對(duì)樣本集進(jìn)行分類(lèi)。支持度support、置信度confidence和相關(guān)度co閾值分別設(shè)置為0.3、0.7、0.4。關(guān)聯(lián)分析結(jié)果見(jiàn)表6。

表6中每條關(guān)聯(lián)規(guī)則的謂詞都表示了一種影響重過(guò)載事件最主要的條件組合,分別如下:

● 臺(tái)區(qū)屬于城網(wǎng)類(lèi)型,當(dāng)日平均溫度低于6℃,近5日內(nèi)每天00:00負(fù)載率超過(guò)80%的次數(shù)大于20次且小于45次;

● 當(dāng)日平均溫度大于26℃,平均濕度小于60%;

● 近5日內(nèi)00:00負(fù)載率平均值大于45%;

表6 關(guān)聯(lián)規(guī)則

● 近5日內(nèi)每天00:00負(fù)載率平均值大于30%且小于45%,近5日內(nèi)每天最大負(fù)載率連續(xù)上升天數(shù)為0,日期為周一或周二;

● 近5日內(nèi)每天最大負(fù)載率連續(xù)上升天數(shù)大于1天且小于4天,近5日內(nèi)每天00:00負(fù)載率超過(guò)80%的次數(shù)大于45次。

整體上看,外部氣象和配變的短期負(fù)載特征與重過(guò)載事件具有較強(qiáng)的相關(guān)性。從指標(biāo)上看,關(guān)聯(lián)規(guī)則2、關(guān)聯(lián)規(guī)則3具有較高的確定性,其中關(guān)聯(lián)規(guī)則2中的關(guān)聯(lián)因素與重過(guò)載事件相關(guān)度最高。而用戶(hù)特征和設(shè)備臺(tái)賬特征對(duì)重過(guò)載事件無(wú)明顯影響。

4.3 重過(guò)載預(yù)測(cè)模型訓(xùn)練

根據(jù)第4.2節(jié)獲得的關(guān)聯(lián)規(guī)則,模型涉及當(dāng)日平均溫度、濕度、臺(tái)區(qū)類(lèi)型、日期類(lèi)型以及短期負(fù)載特征等共7項(xiàng)指標(biāo),采用11項(xiàng)關(guān)聯(lián)規(guī)則中的謂詞作為模型參數(shù),其結(jié)構(gòu)如式(7)所示。

其中,y=k0+k1×ldrate_aver_d5_1+k2×ldrate_aver_d5_2+k3×cnt80_d5_1+k4×cnt80_d5_2+k5×tf_loadrate_1+k6×tf_loadrate_3+k7×mean_humidity_1+k8×min_tem_1+k9×min_tem_3+k10×trans_type+k11×weektype_1。

模型中各項(xiàng)參數(shù)意義見(jiàn)表7。

表7 參數(shù)描述

每組訓(xùn)練集的樣本總量為2 000,按照正負(fù)3:1的比例共分割訓(xùn)練集103組,對(duì)參數(shù)權(quán)值進(jìn)行多次訓(xùn)練,最終結(jié)果見(jiàn)表8。

模型的最終輸出需要給出對(duì)重過(guò)載事件是否發(fā)生的邏輯判斷。在確定模型參數(shù)和權(quán)重取值后,按照K-S準(zhǔn)則對(duì)y值進(jìn)行區(qū)間劃分,結(jié)果如圖5所示。在y值為3%時(shí),K-S值達(dá)到最大值95%,以此作為判斷重過(guò)載事件是否發(fā)生的分界點(diǎn)。

在剩余的1 268個(gè)重過(guò)載樣本中抽取20%樣本(256條重過(guò)載樣本),并加入150條非重過(guò)載樣本作為檢測(cè)集,對(duì)模型效果進(jìn)行驗(yàn)證,結(jié)果見(jiàn)表9。

根據(jù)表9可以得到該模型準(zhǔn)確率(ac_rate)和命中率(tar_rate)分別為:

預(yù)測(cè)結(jié)果中實(shí)際發(fā)生重過(guò)載的臺(tái)區(qū)數(shù)量決定了準(zhǔn)確率,預(yù)測(cè)結(jié)果中沒(méi)有包含但實(shí)際發(fā)生重過(guò)載的臺(tái)區(qū)數(shù)量決定了命中率。實(shí)際業(yè)務(wù)中考慮到運(yùn)維和搶修資源配置,當(dāng)兩項(xiàng)指標(biāo)不能達(dá)到業(yè)務(wù)要求時(shí),需要對(duì)以上兩項(xiàng)指標(biāo)進(jìn)行取舍。在模型訓(xùn)練過(guò)程中,通常采取“優(yōu)先保證準(zhǔn)確率,盡量提高命中率”的策略保證預(yù)測(cè)結(jié)果。

對(duì)于業(yè)務(wù)人員感興趣的其他類(lèi)型過(guò)載事件,同樣可以按照上述過(guò)程建立相應(yīng)的重過(guò)載預(yù)測(cè)模型。所有的重過(guò)載模型構(gòu)成完整的重過(guò)載模型庫(kù),能夠?qū)崿F(xiàn)對(duì)重過(guò)載事件的綜合判斷。

特別地,對(duì)于同一個(gè)臺(tái)區(qū)預(yù)測(cè)出現(xiàn)多類(lèi)重過(guò)載事件的情況,可以通過(guò)對(duì)各預(yù)測(cè)模型給出的y值進(jìn)行統(tǒng)一標(biāo)準(zhǔn)化后,取其中最大值代表的重過(guò)載類(lèi)型作為對(duì)該臺(tái)區(qū)的最終預(yù)測(cè)結(jié)果。

表8 參數(shù)權(quán)重

圖5 K-S檢驗(yàn)

表9 模型效果驗(yàn)證結(jié)果

5 結(jié)束語(yǔ)

本文針對(duì)配網(wǎng)重過(guò)載管理中存在的難題和業(yè)務(wù)空白,結(jié)合大數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù)提出了重過(guò)載分類(lèi)、重過(guò)載關(guān)聯(lián)分析以及重過(guò)載預(yù)測(cè)方法,基于實(shí)際數(shù)據(jù)對(duì)方法進(jìn)行驗(yàn)證,效果達(dá)到了預(yù)期目標(biāo)。

隨著智能配電網(wǎng)的深化推進(jìn),未來(lái)電網(wǎng)的大數(shù)據(jù)特征必將更加明顯,大數(shù)據(jù)技術(shù)在處理海量數(shù)據(jù)、揭示事物間隱藏關(guān)聯(lián)等方面的天然優(yōu)勢(shì),能夠成為解決電網(wǎng)業(yè)務(wù)問(wèn)題、提升電網(wǎng)運(yùn)營(yíng)水平的重要技術(shù)手段。

[1] 王繼業(yè). 智能電網(wǎng)大數(shù)據(jù)[M]. 北京: 中國(guó)電力出版社, 2017.WANG J Y. Big data in smart grid[M].Beijing: China Electric Power Press, 2017.

[2] 賀建章, 王海波, 季知祥, 等. 面向智能電網(wǎng)的配電變壓器重過(guò)載影響因素分析[J]. 電網(wǎng)技術(shù), 2017, 41(1): 279-284.H E J Z, WA N G H B, J I Z X, e t a l.Analysis of factors affecting distribution transformer overload in smart grid[J].Power System Technology, 2017, 41(1):279-284.

[3] 賀建章, 王海波, 季知祥, 等. 基于隨機(jī)森林理論的配電變壓器重過(guò)載預(yù)測(cè)[J]. 電網(wǎng)技術(shù),2017, 41(8): 2594-2597.HE J Z, WANG H B, JI Z X, et al. Heavy overload forecasting of distribution transformers based on random forest theory[J]. Power System Technology,2017, 41(8): 2594-2597.

[4] LI M, ZHOU Q. Distribution transformer mid-term heavy and over load pre-warning based on logistic regression[C]//2015 IEEE Eindhoven Powertech, June 29-July 2,2015, Eindhoven, Netherlands. [S.l.:s.n.],2015: 1-5.

[5] 史常凱, 閆文棋, 張?bào)慊? 等. 基于BP網(wǎng)絡(luò)和灰色模型的春節(jié)配變重過(guò)載預(yù)測(cè)[J]. 電力科學(xué)與技術(shù)學(xué)報(bào), 2016, 31(1): 140-145.SHI C K, YAN W Q, ZHANG X H, et al.Heavy overload forecasting of distribution transformer during the spring festival based on BP network and grey model[J].Journal of Electric Power Science and Technology, 2016, 31(1): 140-145.

[6] P A D M A N A B H K, S I N G H M J.Load forecasting at distribution transformer using IoT based smart meter data[C]//2016 IEEE International Conference on Contemporary Computing and Informatics, December 14-17, 2016,Noida, India. New York: IEEE Press,2016: 758-763.

[7] C A M P E Z I D O U S I, G R I J A L V A S.Dsitribution transformer short-term load forecasting models[J]. IEEE Transactions on Power System, 2016(19): 267-273.

[8] N G O V C, W U W C, Z H A N G B M.Ultra-short-term load forecasting using robust exponentially weighted method in distribution networks[J]. Journal of Information, Control and Management Systems, 2015(9): 301-308.

[9] SU N X R, LU H P B, CH EU N G K W.Efficient approach to short-term load forecasting[J]. IEEE Transactions on Power Systems, 2016(3): 301-307.

[10] 趙宇, 董莉麗. 基于運(yùn)監(jiān)大數(shù)據(jù)挖掘的公變臺(tái)區(qū)重過(guò)載監(jiān)測(cè)分析[J]. 企業(yè)管理, 2016 S(2):276-277.ZHAO Y, DONG L L. Heavy and over load analysis on distribution transformer using operative and monitoring data[J]. Enterprise Management, 2016(S2): 276-277.

[11] 王山林, 林正祥. 國(guó)網(wǎng)福建電力應(yīng)用大數(shù)據(jù)預(yù)測(cè)重過(guò)載臺(tái)區(qū)[N]. 國(guó)家電網(wǎng)報(bào), 2016-08-19.WANG S L, LIN Z X. Practise of big data on heavy and over load forecasting[N].State Grid News, 2016-08-19.

猜你喜歡
臺(tái)區(qū)關(guān)聯(lián)負(fù)荷
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
奇趣搭配
降低臺(tái)區(qū)實(shí)時(shí)線(xiàn)損整治工作方法
電子制作(2017年2期)2017-05-17 03:55:22
智趣
讀者(2017年5期)2017-02-15 18:04:18
防止過(guò)負(fù)荷時(shí)距離保護(hù)誤動(dòng)新判據(jù)
主動(dòng)降負(fù)荷才是正經(jīng)事
負(fù)荷跟蹤運(yùn)行下反應(yīng)堆一回路控制系統(tǒng)仿真與驗(yàn)證
三合一集中器作為臺(tái)區(qū)線(xiàn)損考核表計(jì)的探討
多功能低壓臺(tái)區(qū)識(shí)別設(shè)備的研制
Savitzky-Golay在含沖擊負(fù)荷短期負(fù)荷預(yù)測(cè)中的應(yīng)用
黎平县| 绿春县| 南汇区| 亳州市| 阜南县| 嘉义市| 龙陵县| 曲沃县| 凤庆县| 上饶市| 勐海县| 土默特右旗| 林芝县| 石楼县| 灵璧县| 东兴市| 宁城县| 彰武县| 朝阳区| 怀来县| 长宁区| 卢湾区| 喀喇| 正宁县| 呼伦贝尔市| 长丰县| 即墨市| 双辽市| 昌都县| 龙南县| 平定县| 仙游县| 白玉县| 西乌珠穆沁旗| 噶尔县| 鄂托克旗| 简阳市| 岳普湖县| 密云县| 柏乡县| 溆浦县|