国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)間特性的電力用戶行為意圖挖掘方法

2024-12-21 00:00:00張宏偉
中國新技術(shù)新產(chǎn)品 2024年16期

摘 要:電力用戶行為數(shù)據(jù)具有復(fù)雜性和多樣性,因此用戶行為數(shù)據(jù)呈現(xiàn)出極大的差異性和不確定性,導(dǎo)致電力用戶行為意圖挖掘難度增加、挖掘率較低。本文針對上述現(xiàn)象,提出基于時(shí)間特性的電力用戶行為意圖挖掘方法。通過預(yù)處理和降維方式處理電力用戶行為負(fù)荷數(shù)據(jù),利用先進(jìn)的特征提取技術(shù),在處理后的數(shù)據(jù)中提取電力用戶行為意圖特征,考慮時(shí)間特性,揭示電力用戶行為背后的意圖和規(guī)律,以達(dá)到挖掘電力用戶行為意圖的目的。試驗(yàn)結(jié)果表明,本文方法能夠?qū)?fù)雜的電力用戶行為負(fù)荷數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的意圖特征,挖掘率較高,有助于理解用戶的日常用電模式,為電力系統(tǒng)的優(yōu)化調(diào)度和資源配置提供有力支持。

關(guān)鍵詞:時(shí)間特性;電力用戶;用戶行為意圖;挖掘方法

中圖分類號(hào):TM 714" " " " " 文獻(xiàn)標(biāo)志碼:A

基于時(shí)間特性的電力用戶行為意圖挖掘方法是在電力大數(shù)據(jù)背景下深入分析用戶用電行為的重要手段。在電力大數(shù)據(jù)中,用戶用電數(shù)據(jù)占較大比例,對理解用戶行為、優(yōu)化電力資源配置等方面具有重要價(jià)值。但是電力消費(fèi)數(shù)據(jù)具有規(guī)模大、維度高、來源多、時(shí)效特征強(qiáng)和價(jià)值密度低等特點(diǎn),與海量的社會(huì)經(jīng)濟(jì)環(huán)境數(shù)據(jù)有緊密關(guān)聯(lián)[1],現(xiàn)有的研究手段很難有效解決這一問題,也不能挖掘其中的有用信息。因此,本文提出基于時(shí)間特性的電力用戶行為意圖挖掘方法。該方法分析了用戶用電負(fù)荷數(shù)據(jù)的時(shí)間序列,結(jié)合用戶的用電信息,挖掘用戶的用電行為意圖,可幫助電力企業(yè)更好地了解用戶的用電行為規(guī)律,優(yōu)化電力資源配置,提高電力供應(yīng)的可靠性和經(jīng)濟(jì)性。綜上所述,本文基于時(shí)間特性的電力用戶行為意圖挖掘方法旨在提高電力數(shù)據(jù)的應(yīng)用質(zhì)量,為電力企業(yè)的決策支持、資源配置和市場營銷等方面提供有力支持。

1 處理電力用戶行為負(fù)荷數(shù)據(jù)

采用預(yù)處理和降維處理方式對用戶電力負(fù)荷數(shù)據(jù)進(jìn)行處理。在預(yù)處理階段,設(shè)定異常值規(guī)則,將任何距離平均值超過3倍標(biāo)準(zhǔn)差的數(shù)據(jù)點(diǎn)均視為異常值,并從數(shù)據(jù)集中移除。在此基礎(chǔ)上,本文提出一種基于Z標(biāo)準(zhǔn)化的方法,即將原始數(shù)據(jù)轉(zhuǎn)換成一個(gè)均值為0且標(biāo)準(zhǔn)偏差為1的新的數(shù)據(jù)集合[2]。具體過程如下所示。

假定原來的每日負(fù)載數(shù)據(jù)是X={x1,x2,…,xn},從原日負(fù)荷數(shù)據(jù)中剔除離群點(diǎn),Z標(biāo)準(zhǔn)化后得到X={x'1,x'2,…,x'n},如公式(1)所示。

(1)

式中:xi和x'i分別為第i個(gè)時(shí)間的實(shí)際用電負(fù)荷和歸一化后的用電負(fù)荷;n為一天中的負(fù)荷取樣點(diǎn)數(shù);μ和σ分別為每日負(fù)荷數(shù)據(jù)的平均值與標(biāo)準(zhǔn)偏差;i為時(shí)刻。

采用分段聚合近似法降維處理數(shù)據(jù)[3],采用降維處理,可得精簡的日負(fù)荷數(shù)據(jù)為={,,…,},如公式(2)所示。

(2)

式中:w為負(fù)荷曲線PAA表示的分段數(shù);為該段中數(shù)據(jù)的值;x'j為未簡化前的日負(fù)荷數(shù)據(jù)。

由此完成電力用戶行為負(fù)荷數(shù)據(jù)處理。

2 提取電力用戶行為意圖特征

為了更有效地提取電力用戶行為意圖的特征,在處理電力用戶行為負(fù)荷數(shù)據(jù)的基礎(chǔ)上,本文提出一種基于堆棧自編碼器和無監(jiān)督學(xué)習(xí)的自適應(yīng)特征選擇算法[4]。AE模型結(jié)構(gòu)如圖1所示。

編碼器將x從輸入層投射到隱藏層h=[h(1),h(2),…,h(m)],其中m為隱藏層可變矢量的維數(shù)。映射函數(shù)f(x)=sf(Wx+b),其中W為n×m維權(quán)重矩陣,b為偏差向量。在解碼器中,通過映射函數(shù)f將隱藏層表示的h映射到輸出層x,映射函數(shù)為f(h)=sg(Wh+),為平均偏差向量[5]。

利用公式(3)將平均重建誤差以最小的方式進(jìn)行重建,求出自編碼器的模型參數(shù),并采用梯度下降法更新自編碼的參數(shù),在滿足|x-x|無限逼近于0的條件下,將當(dāng)前自編碼器的參數(shù)保存為訓(xùn)練好的自編碼器參數(shù)[6]。

(3)

式中:J為損失函數(shù);xi為輸入自編碼器中的原始數(shù)據(jù)樣本;xi為自編碼器通過編碼和解碼過程后重構(gòu)出的數(shù)據(jù)樣本;N為數(shù)據(jù)樣本的總數(shù);為平均偏差向量;b為偏差向量;?為權(quán)重矩陣。

堆棧自編碼器由多個(gè)自編碼器逐層連接而成,第i個(gè)編碼器將原始數(shù)據(jù)映射到第i個(gè)隱藏層,再將第i個(gè)隱藏層數(shù)據(jù)作為第i+1個(gè)自編碼器的輸入,訓(xùn)練第i+1層隱藏層得到參數(shù){Wi+1,bi+1},并把該隱藏層數(shù)據(jù)作為下一個(gè)AE的輸入。采用這種方式逐層訓(xùn)練整個(gè)堆棧自編碼器。多個(gè)自編碼器堆疊起來后結(jié)構(gòu)如圖2所示。

圖2所示的自編碼器屬于無監(jiān)督學(xué)習(xí)方法。自編碼器通…過最小化損函數(shù)多次迭代來使輸出與輸入的誤差盡可能接近于0。訓(xùn)練好的自編碼器隱藏層數(shù)據(jù)被視為降維后的特征數(shù)據(jù)[7]。在上述基礎(chǔ)上,為了更好地自適應(yīng)選擇用戶行為意圖數(shù)據(jù)的特征,本文提出基于K-Means聚類算法的用戶行為特征自適應(yīng)選擇方法,整體框架如圖3所示。

利用K-Means聚類算法聚類分析降維后的特征值,通過聚類,將具有相似行為意圖的用戶進(jìn)行分組,進(jìn)一步提取能夠代表不同行為意圖的特征。根據(jù)K-Means聚類的結(jié)果,提取每個(gè)聚類中心的特征向量,將這些電力用戶行為意圖特征的時(shí)間序列記作A=[a1,a2,…,am],代表不同行為意圖用戶的典型特征。

3 基于時(shí)間特性挖掘電力用戶行為意圖

為了更全面、深入地理解用戶行為的動(dòng)態(tài)特性和演變模式,本文基于這些時(shí)間序列的電力用戶行為意圖特征進(jìn)行聚類分析。

分析時(shí)間序列時(shí),需要度量相似性,為了精確衡量2個(gè)時(shí)間序列間的相似程度,采用互相關(guān)的方法。將2個(gè)電力用戶行為意圖特征時(shí)間序列分別記作序列A=[a1,a2,…,am]和序列B=[b1,b2,…,bm]。為了全面比較這2個(gè)序列的全局特征,設(shè)定一個(gè)平移窗口,逐步移動(dòng)序列A,如公式(4)所示。

(4)

式中:As為由序列A時(shí)間窗平移s個(gè)單位;am為時(shí)間序列元素;s為時(shí)間窗平移單位個(gè)數(shù)。

根據(jù)公式(4)得出A、B的互相關(guān)序列,如公式(5)所示。

Eω(A,B)=[e1,e2,…,eω,…,e2m-1] (5)

式中:ω和m為移動(dòng)位次。

進(jìn)一步得出基于時(shí)間特性的電力用戶行為意圖相似性度量函數(shù)R,如公式(6)所示。

(6)

式中:L0(A,A)、L0(B,B)分別為序列A、B相對位移0的相關(guān)值;R(A,B)為0時(shí),表示序列A、B完全相似[8]。

相似性度量的提取目標(biāo)為序列A、B間的相似性,而非差異性,將斯坦納樹優(yōu)化問題轉(zhuǎn)化為求解相似性最大化問題,可得公式(7)。

(7)

式中:Pk為第k類聚類數(shù)據(jù)集合;n為聚類總數(shù);ui為電力用戶行為意圖聚類數(shù)據(jù)集合中第i條聚類數(shù)據(jù);uk*為矩陣M最大特征值對應(yīng)的特征向量,即電力用戶行為意圖各類聚類中心曲線;uk為矩陣M最小特征值對應(yīng)的特征向量。

聚類流程如圖4所示。1) 輸入聚類數(shù)k,指定零向量作為初始化聚類中心。2) 利用時(shí)序相似性度量函數(shù)計(jì)算時(shí)序數(shù)據(jù)集U中各時(shí)間序列ui到各聚類中心R的距離c,同時(shí)把ui歸類到與零向量距離最小的第i類中[9]。3) 提取每類聚類形態(tài)的聚類中心曲線。4) 重復(fù)步驟2、3,當(dāng)聚類中心不再變化時(shí)停止迭代,聚類完成,得到電力用戶行為意圖,如公式(8)所示。

(8)

式中:ε為距離閾值;c為時(shí)序數(shù)據(jù)集U中各時(shí)間序列ui到各聚類中心R的距離。

通過觀察每個(gè)聚類的中心曲線和特征分布,揭示不同用戶群體的行為模式、動(dòng)態(tài)特性和演變規(guī)律。結(jié)合其他相關(guān)信息和背景知識(shí),深入挖掘用戶行為意圖的深層含義。

4 試驗(yàn)

4.1 試驗(yàn)準(zhǔn)備

為了驗(yàn)證本文方法的有效性,進(jìn)行電力用戶行為意圖挖掘試驗(yàn)。首先,選擇適當(dāng)?shù)挠布Y源,CPU型號(hào)為Intel Xeon Gold 6248R,GPU型號(hào)為NVIDIA GeForce RTX3090,配置256GB的內(nèi)存和SSD存儲(chǔ)類型,以滿足大數(shù)據(jù)處理的需求。其次,對軟件環(huán)境的相關(guān)配置,本文選擇Ubuntu20.04的操作系統(tǒng),編程語言采用Python3.8。最后,對于數(shù)據(jù)處理和可視化工具,本文將Pandas和NumPy庫作為數(shù)據(jù)處理庫,將Matplotlib和Seaborn工具作為可視化工具。具體試驗(yàn)環(huán)境參數(shù)見表1。

進(jìn)而收集電力用戶用電數(shù)據(jù),需要考慮不同地域的用電習(xí)慣和模式差異,保證數(shù)據(jù)能反映不同地區(qū)的獨(dú)特行為。收集到的數(shù)據(jù)見表2。

這些數(shù)據(jù)反映了不同用戶在總用電量、高峰和低谷時(shí)段用電量的差異,有助于進(jìn)一步分析用戶的用電行為模式和特點(diǎn)。將收集到的數(shù)據(jù)進(jìn)行預(yù)處理,提取與用戶行為意圖相關(guān)的特征,按照設(shè)計(jì)部分內(nèi)容挖掘電力用戶行為意圖。保證試驗(yàn)覆蓋的用戶群體具有足夠的多樣性,包括不同年齡、職業(yè)和收入水平等,以反映不同用戶群體的獨(dú)特用電意圖。

4.2 試驗(yàn)結(jié)果和分析

為了驗(yàn)證本文方法在電力用戶行為意圖挖掘中的優(yōu)越性,將其與基于事件驅(qū)動(dòng)的挖掘方法和基于用戶畫像的挖掘方法進(jìn)行比較,得到電力用戶行為意圖挖掘率的比較結(jié)果,見表3。

由上述試驗(yàn)結(jié)果的比較數(shù)據(jù)可知,在所有試驗(yàn)條件下,本文方法的行為意圖挖掘率均高于基于事件驅(qū)動(dòng)的方法和基于用戶畫像的方法。表明使用本文方法處理電力用戶行為意圖挖掘任務(wù)時(shí)精度更高,特別是在條件2和條件6下,本文方法的挖掘率分別為92.45%和91.56%,顯著領(lǐng)先于其他2種方法?;谑录?qū)動(dòng)的挖掘方法需要對特定事件進(jìn)行檢測和分析,在事件定義和檢測方面可能存在一定的主觀性和局限性,從而影響了挖掘率的準(zhǔn)確性?;谟脩舢嬒竦耐诰蚍椒m然能夠綜合考慮用戶的多個(gè)維度信息,但是構(gòu)建用戶畫像時(shí)可能面臨數(shù)據(jù)稀疏性和用戶行為多樣性的挑戰(zhàn),導(dǎo)致挖掘率受限。本文方法基于時(shí)間特性,自動(dòng)學(xué)習(xí)并捕捉用戶行為模式與意圖間的復(fù)雜關(guān)系,從而提高了挖掘的準(zhǔn)確性,可為電力公司提供更準(zhǔn)確的用戶行為分析,優(yōu)化電力資源配置,提高運(yùn)營效率。

5 結(jié)語

本文對電力用戶用電負(fù)荷數(shù)據(jù)進(jìn)行了深入剖析,揭示了用戶用電行為的時(shí)間特性及其背后的意圖。該方法能夠更精準(zhǔn)地把握用戶的用電需求,為電力資源的優(yōu)化配置和電力服務(wù)的個(gè)性化提供有力支持。但是,本文研究仍存在一些不足之處。例如在數(shù)據(jù)處理和分析過程中,可能受數(shù)據(jù)質(zhì)量、數(shù)據(jù)完整性等因素的影響,導(dǎo)致分析結(jié)果存在一定偏差。后續(xù)研究將致力于提高數(shù)據(jù)處理的精度和效率,減少數(shù)據(jù)質(zhì)量對分析結(jié)果的影響。

參考文獻(xiàn)

[1]練琳,盧萬平,黃家寶.基于MESCM算法的電網(wǎng)用電行為智能識(shí)別[J].電子設(shè)計(jì)工程,2024,32(5):127-130,135.

[2]吳昀烔,趙健,宣羿,等.基于多維負(fù)荷特性挖掘的電力特殊用戶用電行為分析[J].電力建設(shè),2024,45(3):116-125.

[3]費(fèi)飛,翁利國,壽挺,等.基于數(shù)據(jù)挖掘的電力用戶行為特征分類研究[J].自動(dòng)化技術(shù)與應(yīng)用,2023,42(11):101-104,117.

[4]洪居華,洪蘭秀,李源非,等.基于自適應(yīng)權(quán)重特征聚類的用戶用電行為分析[J].計(jì)算機(jī)應(yīng)用與軟件,2023,40(11):341-349.

[5]萬偉,劉紅旗,杜單單,等.考慮負(fù)荷季節(jié)特性的電力用戶用電行為畫像[J].哈爾濱理工大學(xué)學(xué)報(bào),2023,28(3):45-55.

[6]李冀,趙成,羨慧竹,等.基于k均值聚類算法的用電數(shù)據(jù)行為分析[J].電子技術(shù),2023,52(4):319-321.

[7]武靈耀,郭賀宏,趙慶生,等.基于MACD指標(biāo)與聚類算法的電力用戶用電行為分析[J].上海電力大學(xué)學(xué)報(bào),2023,39(2):105-111.

[8]趙爽,阮俊梟,支剛,等.考慮尖峰負(fù)荷特性指標(biāo)的用戶用電行為分析[J].內(nèi)蒙古電力技術(shù),2022,40(5):39-45.

[9]張潔,夏飛,袁博,等.基于特征優(yōu)選策略的居民用電行為聚類方法[J].電力系統(tǒng)自動(dòng)化,2022,46(6):153-159.

铁力市| 柯坪县| 白朗县| 洪雅县| 西华县| 呼图壁县| 西昌市| 和政县| 华宁县| 清苑县| 凭祥市| 琼中| 西乌珠穆沁旗| 宁化县| 萨迦县| 青冈县| 青河县| 阿拉善左旗| 郑州市| 周口市| 大渡口区| 元阳县| 双峰县| 建阳市| 枞阳县| 方山县| 宽城| 比如县| 夹江县| 库伦旗| 鲁山县| 栾城县| 驻马店市| 武邑县| 剑阁县| 专栏| 隆回县| 长春市| 阿尔山市| 苏尼特左旗| 沈阳市|