国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征標簽的電力計量大數(shù)據(jù)深度挖掘技術研究

2024-12-05 00:00:00王鑫尹振龍
科技資訊 2024年21期

摘要:基于特征標簽的電力計量大數(shù)據(jù)深度挖掘技術是一種先進的數(shù)據(jù)分析方法,旨在從海量電力計量數(shù)據(jù)中提取有價值的信息。這種技術結合了特征標簽、大數(shù)據(jù)分析和深度挖掘等多種方法,以實現(xiàn)對電力計量數(shù)據(jù)的全面理解和有效利用。采用模糊C-均值聚類算法實現(xiàn)特征標簽的生成,借助特征標簽改善電力計量大數(shù)據(jù),通過云計算平臺建設特征標簽下的電力計量大數(shù)據(jù)挖掘架構。研究結果表明,特征標簽下的電力計量大數(shù)據(jù)深挖技術具有良好穩(wěn)定性、較高的挖掘準確率,可在電網運行中廣泛應用。

關鍵詞:電力計量大數(shù)據(jù)深度挖掘特征標簽

ResearchonDeepMiningTechnologyofPowerMeteringBigDataBasedonFeatureTags

WANGXinYINZhenlong*

QingdaoTopscommCommunicationCo.,Ltd.,Qingdao,ShandongProvince,266000China

Abstract:DeepMiningtechnologyofpowermeteringbigdatabasedonfeaturetagsisanadvanceddataanalysismethodaimedatextractingvaluableinformationfrommassivepowermeteringdata.Thistechnologycombinesmultiplemethodssuchasfeaturetags,bigdataanalysis,anddeepmining toachieveacomprehensiveunderstandingandeffectiveutilizationofpowermeteringdata.ItusestheFuzzyC-MeansClusteringalgorithmtogeneratefeaturetags,improvespowermeteringbigdatawithfeaturetags,andconstructsapowermeteringbigdataminingarchitectureunderfeaturetagsthroughcloudcomputingplatforms.TheresearchresultsindicatethatDeepMiningtechnologyofpowermeteringbigdataunderfeaturetagshasgoodstability,highminingaccuracy,andcanbewidelyappliedinpowergridoperation.

KeyWords:Powermetering;Bigdata;Deepmining;Featuretags

在電網運行期間,電力系統(tǒng)中儲存了海量的數(shù)據(jù),而數(shù)據(jù)挖掘作為一種較為普遍的數(shù)據(jù)分析和處理方式,在配電網故障辨識、火電廠運行優(yōu)化等方面得到了越來越多的運用。隨著電網數(shù)據(jù)的不斷增長,對數(shù)據(jù)挖掘的需求也越來越高,因此,電網企業(yè)逐步將注意力集中到數(shù)據(jù)挖掘層面。本文采用模糊C-均值聚類算法生成特征標簽,借助特征標簽改善電力計量大數(shù)據(jù),通過云計算平臺建設特征標簽下的電力計量大數(shù)據(jù)挖掘架構。

1電力計量大數(shù)據(jù)的特征標簽

為深層分析電能測量大數(shù)據(jù),必須對其進行處理,并將其置于高層服務應用和大數(shù)據(jù)平臺之間,作為中間層的核心部件。采用模糊C-均值聚類算法生成一個類別的特征標記,若簇內有K個類別,則以m表達其隸屬系數(shù),其中,U為初始化的矩陣,繼而得到公式:

在這個方程中,通過求解一個模糊C的平均值,得出C的迭代函數(shù),即:

根據(jù)該算法,得到各屬性的隸屬系數(shù)和簇的中心,并展開收斂性判定。當目標函數(shù)的值小于預定門限時,則對簇的結果進行輸出,公式為

(3)

用該方法來計算簇的迭代值,進而選取電能測量數(shù)據(jù)的運算平臺,構成一個專用標記。這個運算平臺可以分布運算海量數(shù)據(jù),并進行數(shù)據(jù)庫檢索。構建具有3層(標記層、分析層和數(shù)據(jù)層)的大數(shù)據(jù)管理構件[1]。在此基礎上,利用大數(shù)據(jù)管理構件對其進行初步的特性標記。圖1為電力計量大數(shù)據(jù)的特征標簽產生流程。

根據(jù)圖1顯示,在對電能計算進行深度挖掘過程中,需要建立多個特征標簽,所以把規(guī)則引擎當作特征標簽的生產機器,繼而生成大量特征標簽,借助標簽識別中心管理和規(guī)劃特征標簽[2]。

所謂特征標簽業(yè)務化,其實就是由使用者設定一個特定的屬性標記,并給予該屬性標記檢視、修正等作用,并對該屬性標記進行檢驗,其生成條件主要依照電力計量大數(shù)據(jù)內部所挖掘的數(shù)據(jù)制訂,每天只需要對這些特性標記進行管理和維護就可以了。規(guī)則引擎是一種特性標記制造機,它在特性標記的設計過程中實現(xiàn)了圖形的控制和規(guī)則的制訂,并可以設置特性標記的規(guī)則,根據(jù)生成規(guī)則觸發(fā)生成條件,從而制作多種特征標簽。

標記辨識中心可以對特性標記的派生組合進行邏輯計算,在完成設定操作后,工作人員可以更新原始的特性標記,使之成為更有價值和更高級的特性標記。在此基礎上,利用智能算法對海量數(shù)據(jù)進行屬性標注,實現(xiàn)對海量數(shù)據(jù)的分類。在做完特性標記之后,還要判斷標簽價值。如果特征標簽價值過低,無法挖掘電力計量數(shù)據(jù),則必須創(chuàng)建價值函數(shù),以此對特征標簽價值進行判斷。

2電力計量大數(shù)據(jù)的深度挖掘

生成特殊標簽后,通過該特殊標簽深度挖掘電力計量大數(shù)據(jù)。在對電能測量大數(shù)據(jù)進行深度挖掘的同時,利用云處理平臺上的分布式信息超文本傳輸協(xié)議(HyperTextTransferProtocol,HTTP),構建了一個由數(shù)據(jù)預處理、云分類建模和云聚類編輯3個模塊組成的大數(shù)據(jù)挖掘框架[3],圖2為具體挖掘過程。

如圖2所示,USB異步收發(fā)傳輸器與電平轉換達到數(shù)據(jù)預處理目標,通過微控制單元進行數(shù)據(jù)分類,內容配置可編程,并按照CK算法的最優(yōu)原理對電能測量的海量數(shù)據(jù)進行分類和整理,確定中心點,在該中心點之下的數(shù)據(jù)是有效的,并對失效的數(shù)據(jù)進行過濾,公式為

式中,u是判定對象的,m是中心點的值。

所謂云聚類編輯,就是將預處理后的數(shù)據(jù)實施聚類編輯,依照數(shù)據(jù)價值從高到低排列。針對電能測量大數(shù)據(jù)的深度挖掘需求,對其進行聚類分類,并將其轉化為數(shù)據(jù)挖掘框架。云分類建模與預處理后數(shù)據(jù)相結合,將數(shù)據(jù)的分類結果傳遞到數(shù)據(jù)挖掘框架中,將聚類數(shù)據(jù)與分類模型進行數(shù)據(jù)融合,生成挖掘模型,將挖掘模型轉移到一個挖掘點,然后再進行深層挖掘[4]。

本項目以電能測量大數(shù)據(jù)為研究對象,采用基于特征標注的方法進行電能測量大數(shù)據(jù)的深度分析。具體流程如下。首先,識別出深層挖掘的目標,并通過數(shù)據(jù)提取獲得需要的深層信息,并決定其使用方法。然后,進行資料的前處理,對從基礎的電能測量中抽取出的資料進行預處理,利用CK算法篩選出誤差和無用的數(shù)據(jù),利用特征標記的信息變換作用,生成誤差標記,保證數(shù)據(jù)準確性。最后,實施云分類建模,采用最佳建模方式來調整、改善大數(shù)據(jù)模型,實現(xiàn)挖掘效率和精確度的提升[5]。

3實驗驗證

為了對特征標簽下的電力計量大數(shù)據(jù)深挖應用效果進行驗證,通過實驗方式,比較該技術和蟻群算法下的大數(shù)據(jù)深挖方法、企業(yè)資源計劃(EnterpriseResourcePlanning,ERP)下的大數(shù)據(jù)深挖方法。此次所用主機操作系統(tǒng)是Linux系統(tǒng),有效配置信息,系統(tǒng)內存選擇16GB,硬盤內存選擇2TB,所用編程語言是C++語言,以Hadoop環(huán)境為開發(fā)環(huán)境[6]。

3種數(shù)據(jù)深度挖掘方法的實驗結果為:實驗10min時,蟻群算法、特征標簽算法和ERP挖掘算法的挖掘數(shù)據(jù)量分別為10.26MB、20.25MB和5.87MB;實驗30min時,蟻群算法、特征標簽算法和ERP挖掘算法的挖掘數(shù)據(jù)量分別為21.37MB、60.95MB和15.48MB;實驗40min時,蟻群算法、特征標簽算法和ERP挖掘算法的挖掘數(shù)據(jù)量分別為29.34MB、104.37MB和26.97MB;實驗60min時,蟻群算法、特征標簽算法和ERP挖掘算法的挖掘數(shù)據(jù)量分別為35.37MB、122.45MB和30.45MB。

從以上結果可以看出,在挖掘時間持續(xù)延長的情況下,不同方法的數(shù)據(jù)挖掘量呈現(xiàn)持續(xù)增加狀態(tài),且特征標簽下的電力計量大數(shù)據(jù)挖掘數(shù)據(jù)量明顯比傳統(tǒng)方法高。由于在利用特征標記對數(shù)據(jù)進行挖掘時,能夠對其進行高效的分類,并對其進行加工,從而實現(xiàn)高信息量和低代價的數(shù)據(jù)挖掘目的[7]。

本項目采用的基于特征標記的數(shù)據(jù)挖掘算法具有良好穩(wěn)定性,且信息處理結果也較為準確。這主要是因為基于特征標記大數(shù)據(jù)挖掘方法能夠對數(shù)據(jù)進行處理,從而有效地解決了“信息孤島”問題。通過對海量數(shù)據(jù)的實時采集和分析,實現(xiàn)對海量數(shù)據(jù)的準確和穩(wěn)定的獲取。表1是針各種方式的挖掘準確率的試驗數(shù)據(jù)。

分析表1可以看出,特征標簽下的電力計量大數(shù)據(jù)挖掘技術具有更高的準確率,且挖掘能力高于其他方法。

4結語

總而言之,特征標簽的生成是電力計量大數(shù)據(jù)挖掘技術的關鍵步驟。通過利用模糊C-均值聚類算法等方法,可以生成能夠反映數(shù)據(jù)特性和模式的特征標簽,這些標簽不僅有助于對電力計量數(shù)據(jù)進行有效地分類和表示,還能提高后續(xù)數(shù)據(jù)挖掘的準確性和效率。基于特征標簽,可以對電力計量大數(shù)據(jù)進行深度挖掘,這包括利用云計算平臺搭建的數(shù)據(jù)挖掘架構對預處理后的數(shù)據(jù)進行建模和分析[8]。在實際應用中,基于特征標簽的電力計量大數(shù)據(jù)深度挖掘技術可以被廣泛應用于電力系統(tǒng)的各個領域。例如:該技術能有效地實現(xiàn)電網的最優(yōu)配置,從而改善電網的整體效益。同時,該方法還能對電網的負荷進行預報,為電網的規(guī)劃與管理提供重要的支撐。

綜上所述,基于特征標簽的電力計量大數(shù)據(jù)深度挖掘技術是一種具有廣泛應用前景和重要意義的數(shù)據(jù)分析方法,該技術將會在今后的電網建設中發(fā)揮越來越大的作用。

(4)

參考文獻

[1]王奕萱,李翼銘,徐二強,等.基于特征標簽的電力計量大數(shù)據(jù)深度挖掘研究[J].電子設計工程,2023,31(24):186-189,195.

[2]田萍.大數(shù)據(jù)深度挖掘技術下的數(shù)字資源推送平臺設計應用[J].信息通信,2019(10):133-135.

[3]萬金金,文屹,呂黔蘇,等.基于大數(shù)據(jù)深度挖掘電網設備缺陷體外循環(huán)的模型研制與應用[J].電力大數(shù)據(jù),2023,26(3):61-68.

[4]金欣.基于蟻群算法的非結構化大數(shù)據(jù)深度挖掘仿真[J].計算機仿真,2020,37(11):329-333.

[5]王倩.基于深度學習技術的教育大數(shù)據(jù)挖掘領域運用探究[J].數(shù)字通信世界,2023(11):112-114.

[6]左仁廣,彭勇,李童,等.基于深度學習的地質找礦大數(shù)據(jù)挖掘與集成的挑戰(zhàn)[J].地球科學,2021,46(1):350-358.

[7]呂田.面向大數(shù)據(jù)挖掘的自然資源云平臺設計實現(xiàn)研究[J].科技資訊,2023,21(23):36-39.

[8]王文中,孔亞鑫.面向科技咨詢的大數(shù)據(jù)服務平臺基礎架構設計與實現(xiàn)[J].科技資訊,2023,21(24):32-35.

新和县| 泸州市| 祁连县| 三河市| 枣强县| 广西| 绥宁县| 正镶白旗| 凯里市| 隆尧县| 太康县| 千阳县| 芒康县| 唐山市| 长乐市| 永福县| 寻甸| 临洮县| 日喀则市| 天全县| 金湖县| 赞皇县| 儋州市| 安陆市| 满洲里市| 克什克腾旗| 黄山市| 永寿县| 县级市| 南丰县| 洛川县| 阜南县| 水城县| 尼勒克县| 理塘县| 清河县| 井冈山市| 都匀市| 遵义市| 隆子县| 云浮市|