国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機器學習算法的電機運行數(shù)據(jù)挖掘

2024-10-30 00:00:00張兆波劉昱垚林炯勛劉震吳佩純彭保
企業(yè)科技與發(fā)展 2024年8期
關(guān)鍵詞:機器學習數(shù)據(jù)挖掘聚類

摘要:文章以永磁電機的運行數(shù)據(jù)為研究對象,探討基于數(shù)據(jù)挖掘與機器學習算法的電機狀態(tài)分析與預測方法。首先,運用K均值聚類算法對采集的電機電壓、電流、扭矩、轉(zhuǎn)速等多種數(shù)據(jù)進行分類,揭示數(shù)據(jù)之間的潛在聯(lián)系。其次,采用K近鄰(KNN)算法對電機運行功率和繞組溫度進行回歸預測,結(jié)果表明該方法具有較高的預測精度。最后,通過構(gòu)建和訓練神經(jīng)網(wǎng)絡模型,對電機狀態(tài)進行更精確的預測,進一步驗證神經(jīng)網(wǎng)絡在電機故障預警中的有效性。該研究為電機智能維護提供了技術(shù)支持,同時為工業(yè)領(lǐng)域的設(shè)備管理與優(yōu)化奠定了基礎(chǔ)。

關(guān)鍵詞:電機;機器學習;數(shù)據(jù)挖掘;聚類;預測精度

中圖分類號:TP311;TM3" " " "文獻標識碼:A" " " 文章編號:1674-0688(2024)08-0066-04

0 引言

隨著永磁材料性能的持續(xù)改進及電力電子技術(shù)的飛速發(fā)展,永磁電機的應用范圍越來越廣,已滲透至軍工與民用領(lǐng)域,覆蓋從特殊到常規(guī)的各種應用場景,不僅在微特電機中占有優(yōu)勢,還在電力推進系統(tǒng)中顯示出強大的生命力[1]。 鑒于工業(yè)生產(chǎn)環(huán)境中存在安全隱患,及時排查并消除機械設(shè)備中的潛在隱患和故障,確保工程運行的安全穩(wěn)定與可靠,已成為一項至關(guān)重要的任務[2]。 電機作為工程機械的核心動力,其運行狀態(tài)直接影響整個系統(tǒng)的穩(wěn)定性和生產(chǎn)效率,因此對其進行監(jiān)測與分析顯得尤為重要。然而,傳統(tǒng)的電機狀態(tài)監(jiān)測與故障診斷方法主要依賴于物理模型和經(jīng)驗規(guī)則,解決思路是強化標準化安裝或是出了問題再維修,例如蘇紀陽[3] 和郭海濤[4]針對水利泵站機電設(shè)備的不同部件進行了詳細分析,為水利泵站機電設(shè)備的安裝與故障檢修提供了全面的技術(shù)指導和參考;郭露丹[5] 圍繞水利泵站設(shè)備的常見故障進行探討,根據(jù)故障類型與誘發(fā)原因,制定針對性的故障檢修措施。這些解決方案雖然在一定程度上取得了成效,但是在面對復雜多變的工業(yè)環(huán)境時,往往難以應對多維度、非線性的運行數(shù)據(jù),從而影響診斷的準確性和實時性,并且可能延誤工期。近年來,隨著大數(shù)據(jù)技術(shù)和人工智能的發(fā)展,機器學習算法在數(shù)據(jù)挖掘與模式識別領(lǐng)域顯示出了強大的潛力。由于電機運行狀態(tài)數(shù)據(jù)稀缺且很少公開,因此國內(nèi)針對工程設(shè)備電機數(shù)據(jù)挖掘的研究較少,主要停留在理論構(gòu)想階段,如構(gòu)建演示性數(shù)據(jù)挖掘信息平臺等[6],鑒于此,本文基于實際工程電機數(shù)據(jù)的收集與分析,開展數(shù)據(jù)挖掘的初步研究。通過結(jié)合算法模型,對電機運行數(shù)據(jù)進行分析,提出一套有效的故障診斷和預測方法,為電機的智能化運行管理提供理論支持和實踐指導。

1 相關(guān)理論及算法

1.1 數(shù)據(jù)預處理

采用歸一化方法進行數(shù)據(jù)預處理,將每項分數(shù)除以總分,得到[0,1]區(qū)間內(nèi)的小數(shù)值。歸一化常用于機器學習的預處理階段,當數(shù)據(jù)集的特征之間具有不同的取值范圍時,對數(shù)據(jù)進行歸一化是非常有必要的,其目的是統(tǒng)一各特征的度量尺度。歸一化公式如下。

[Xnorm=X?XminXmax?Xmin]," " " " " " " " " " "(1)

其中:[Xnorm]是歸一化后的數(shù)據(jù),X為原始數(shù)據(jù),[Xmax]是最大數(shù)據(jù),[Xmin]是最小數(shù)據(jù)。

1.2 K均值聚類算法

起初,K均值聚類算法在不同科學研究領(lǐng)域被獨立地提出,直到1967年,由James MacQueen教授提出“K-Means”這一術(shù)語,標志著該算法被廣泛認知、推廣和應用,并發(fā)展出眾多不同的改進算法。K均值算法流程如下。

(1)根據(jù)設(shè)定的聚類數(shù),隨機選擇K個Cluster Centroid(聚類中心)。

(2)評估各個樣本到聚類中心的距離,如果樣本距離第K個聚類中心更近,則認為其屬于第K簇。

(3)計算每個簇中樣本的平均位置,將聚類中心移動至該位置。

(4)重復以上步驟直至各個聚類中心的位置不再發(fā)生改變。

1.3 K近鄰分類算法

K近鄰分類算法(K-Nearest Neighbor,KNN)是一種被廣泛使用的監(jiān)督學習算法,其核心原理如下:對于任一給定的測試樣本,利用某種距離度量機制找到訓練集中最接近的K個樣本(即“鄰居”),隨后基于這些鄰居的信息進行預測。在分類任務中,通常采用“投票法”確定預測類別,即選取K個樣本中出現(xiàn)頻率最高的類別作為預測結(jié)果;而在回歸任務中,則采用“平均法”計算預測值,即取這些樣本的實際輸出值的平均值作為預測輸出。此外,還可根據(jù)樣本之間的距離進行加權(quán)平均或加權(quán)投票,其中距離較近的樣本會被賦予更高的權(quán)重。

對于給定的測試樣本[x],如果其最近的鄰居樣本為[z],那么最近鄰分類器的出錯概率表示為

[Perr=1?c∈yPc|xPc|z] ," " " " " " "(2)

其中:P(err)代表出錯概率,P(c|x)、P(c|z)分別表示x和z同屬類c的概率,y表示所有類別。出錯概率等于1減去不出錯的概率。

假設(shè)樣本是獨立同分布的,并且對于任意x和任意小正數(shù)δ都能在δ的距離范圍內(nèi)找到訓練樣本,即在每個測試樣本中總能在非常近的范圍內(nèi)找到公式中的訓練樣本z。假設(shè)[c?=argmaxc∈yPc|x]表示貝葉斯最優(yōu)分類器的結(jié)果,則有

[Perr=" 1?c∈yP(c|x)P(c|z)" " " " "?1?c∈yP2(c|x)" " " " "≤1?P2c?|x" " " " "=(1+P(c?|x))(1?(Pc?|x))" " " " "≤2(1?P(c?|x))。]" " " " " (3)

盡管最近鄰分類器的實現(xiàn)較為簡單,但其泛化誤差率不會超過貝葉斯最優(yōu)分類器誤差率的兩倍,因此效果良好。

KNN能同時解決分類問題和回歸問題,本文采用分類的思路解決電機數(shù)據(jù)的回歸問題。KNN回歸問題的算法主要包括以下幾個步驟。

(1)準備數(shù)據(jù)集:將已知結(jié)果的樣本集合表示為向量形式,并且確定每個樣本的數(shù)值。

(2)選擇K值:確定用于劃分樣本空間的鄰居數(shù)量K,一般通過交叉驗證或經(jīng)驗選擇一個合適的值。

(3)計算距離:對于待回歸樣本,計算其與所有已知樣本之間的距離。

(4)找到最近鄰:根據(jù)計算得到的距離,找到與待分類樣本距離最近的K個樣本。

(5)確定結(jié)果:根據(jù)最近鄰樣本的結(jié)果,通過求取K個近鄰樣本均值的方式確定待回歸樣本的數(shù)值。

(6)輸出結(jié)果:將計算的待回歸樣本的數(shù)值作為預測結(jié)果。

在K均值和K近鄰這兩種算法中,距離的度量都是核心要素,它直接決定了所選定的K個鄰近點,進而影響最終的預測結(jié)果。常用的距離度量方法有歐氏距離、曼哈頓距離等,本文主要采用歐式距離作為距離計算的依據(jù),其公式如下:

[DX1, X2=x11?x212+x12?x222+···+x1n?x2n2]," "(4)

其中:[DX1, X2]是距離,x是X中的每維數(shù)據(jù)。

1.4 神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)絡由多個人工神經(jīng)元組合而成,可以解決各種非線性問題,模型越復雜,解決非線性問題的能力越強。本文采用多層全連接神經(jīng)網(wǎng)絡架構(gòu),該網(wǎng)絡包含3個隱含層(第一層神經(jīng)元為256個,第二層為128個,第三層為128個),激活函數(shù)為ReLU;輸出層為單個神經(jīng)元,激活函數(shù)為Sigmoid。神經(jīng)網(wǎng)絡結(jié)構(gòu)見圖1。

模型采用的損失函數(shù)為binary-crossentropy,損失函數(shù)公式如下:

[BCE(x)i=?[yilogfix+(1?yi)log (1?fix)]], (5)

[BCE(x)final=i=1NBCE(x)iN]," " " " " " " " (6)

其中:[BCE(x)i]為單個輸出單元的損失;[BCE(x)] final表示最終輸出損失;yi表示真實值,[fi(x)]表示實際輸出,N表示輸出的個數(shù),本文中N=1。

2 電機數(shù)據(jù)挖掘

2.1 數(shù)據(jù)集

基于實際運行場景,采集永磁電機的運行數(shù)據(jù),涵蓋電機的進線電壓、直流母線電壓、電機電壓、電機電流、電機扭矩、電機轉(zhuǎn)速、電機功率等參數(shù),以及柜內(nèi)濕度、柜內(nèi)溫度、傳感張力、輸出張力、繞組溫度、前軸溫度、后軸溫度等環(huán)境與機械狀態(tài)信息,同時記錄運行狀態(tài),共收集8 272條數(shù)據(jù)。

2.2 基于聚類算法的數(shù)據(jù)挖掘

科學建立于因果關(guān)系之上,在客觀事物產(chǎn)生的歷史數(shù)據(jù)中,各元素之間必然存在一定的聯(lián)系。隨著人工智能算法和大數(shù)據(jù)技術(shù)的出現(xiàn),數(shù)據(jù)挖掘策略由傳統(tǒng)的明確路徑逐漸轉(zhuǎn)向融合機器學習等不明確的方法,從另一個角度發(fā)掘數(shù)據(jù)背后的聯(lián)系。通過解析數(shù)據(jù)之間的聯(lián)系,可透視現(xiàn)象背后的本質(zhì)規(guī)律,并運用數(shù)據(jù)對系統(tǒng)運行進行可視化展示、實時監(jiān)控和精準預測。本文采用K均值算法對既有數(shù)據(jù)進行聚類,從而挖掘數(shù)據(jù)之間的聯(lián)系。

2.3 基于KNN的數(shù)據(jù)預測

KNN作為一種簡單而有效的監(jiān)督學習方法,已被廣泛應用于分類和回歸問題中。KNN通過基于距離的相似性進行預測,其直觀性和易于實現(xiàn)的特點使其在處理電機運行數(shù)據(jù)時具有顯著的優(yōu)勢。通過詳盡分析電機運行數(shù)據(jù),運用KNN對電機的未來狀態(tài)進行預測。研究將包括KNN的基本原理、參數(shù)選擇及其在電機數(shù)據(jù)中的應用實例。通過實驗驗證,可展示KNN在電機狀態(tài)預測中的有效性和優(yōu)勢,并為電機的智能維護和故障預警提供有力的工具和方法。本文使用現(xiàn)有電機數(shù)據(jù)作為數(shù)據(jù)集進行KNN運算,并通過其他數(shù)據(jù)預測運行功率和運行溫度,從而實現(xiàn)對潛在電機故障的預警。

2.4 基于神經(jīng)網(wǎng)絡的數(shù)據(jù)預測

神經(jīng)網(wǎng)絡作為一種強大的機器學習技術(shù),已經(jīng)在許多領(lǐng)域展現(xiàn)出卓越的預測能力。特別是在處理非線性、高維數(shù)據(jù)方面,神經(jīng)網(wǎng)絡能夠通過學習復雜的數(shù)據(jù)模式,提供更準確的預測結(jié)果。近年來,深度學習和神經(jīng)網(wǎng)絡的快速發(fā)展為電機數(shù)據(jù)預測提供了新的視角和方法。通過構(gòu)建和訓練神經(jīng)網(wǎng)絡模型,可以有效地從電機運行數(shù)據(jù)中挖掘出潛在的規(guī)律,進而實現(xiàn)對電機未來狀態(tài)的準確預測。通過實驗驗證,神經(jīng)網(wǎng)絡學習方法適用于電機狀態(tài)的預測,能幫助應用方解決電機智能維護和故障預警中存在的故障數(shù)據(jù)無法追溯、故障報警不及時等問題。與KNN相同,該部分的實驗也是選擇通過其他數(shù)據(jù)預測當前電機運行功率和運行溫度,利用數(shù)據(jù)集對神經(jīng)網(wǎng)絡模型進行訓練,從而對電機故障進行預警。

3 實驗結(jié)果

3.1 實驗環(huán)境

編程使用Python3.9.13下的Anaconda解釋器并鏈接PyCharm IDE完成。使用的核心庫包括numpy 1.21.5,pandas 1.4.4,scikit-learn 1.0.2,TensorFlow 2.6.0,matplotlib 3.5.2,等等。電腦配置為CPU Intel(R) Core(TM) i7-10510U,RAM 16GB。

3.2 數(shù)據(jù)預處理

本實驗采集的數(shù)據(jù)種類較多且量綱各不相同。因此,為避免數(shù)據(jù)尺度影響算法,采用歸一化的方法對數(shù)據(jù)進行預處理,首先求得數(shù)據(jù)的最大值和最小值,通過歸一化映射公式將數(shù)據(jù)映射到0~1。

3.3 基于聚類算法的數(shù)據(jù)挖掘結(jié)果

本實驗使用K均值算法對預處理后的歸一化數(shù)據(jù)進行聚類處理,具體設(shè)定聚類數(shù)目K為5,并使用t-SNE(t-distributed Stochastic Neighbor Embedding)降維方法進行降維,以便進行可視化處理。聚類和可視化的結(jié)果見圖2。

同時,為了更好地挖掘數(shù)據(jù)之間的關(guān)系,在實驗中對K值進行調(diào)整,并計算了不同K值下的FMI(Fowlkes-Mallows Index)值(見圖3)。

實驗結(jié)果表明,數(shù)據(jù)之間具有一定的關(guān)聯(lián)性,同類數(shù)據(jù)內(nèi)部具有一定的共同性,而不同類數(shù)據(jù)之間呈現(xiàn)明顯的差異性。這說明數(shù)據(jù)存在一定的聯(lián)系,可以進行深度挖掘。

3.4 基于KNN的數(shù)據(jù)預測結(jié)果

本文利用KNN解決了兩個回歸問題:一是基于進線電壓、直流母線電壓、電機電壓、電機電流、電機扭矩、電機轉(zhuǎn)速、柜內(nèi)濕度、柜內(nèi)溫度、傳感張力、輸出張力等特征數(shù)據(jù),預測電機的功率;二是利用上述多維特征數(shù)據(jù),預測電機的繞組溫度。首先將初始數(shù)據(jù)歸一化,然后將數(shù)據(jù)按照8∶2的比例劃分為訓練集和測試集,并且選擇K值完成數(shù)值的預測。實驗表明,采用KNN進行數(shù)據(jù)預測具有一定的準確性,整體均方誤差很小,并且K值越小,準確度越高。K值與MSE(均方誤差)表見表1。

3.5 基于神經(jīng)網(wǎng)絡的數(shù)據(jù)預測結(jié)果

神經(jīng)網(wǎng)絡作為一種多功能的機器學習模型,與KNN一樣,能夠解決分類、回歸問題乃至生成問題。本研究運用神經(jīng)網(wǎng)絡解決回歸問題,用以預測電機的功率和繞組溫度。首先將初始數(shù)據(jù)進行歸一化處理,然后按照8∶2的比例將數(shù)據(jù)集劃分為訓練集和測試集,前者用于訓練,后者用于模型測試。網(wǎng)絡架構(gòu)設(shè)計方面,采用了1個多層全連接神經(jīng)網(wǎng)絡。訓練過程中,設(shè)定學習率為0.000 01,迭代次數(shù)為100次,每次迭代處理50個樣本。經(jīng)過上述訓練,所構(gòu)建的神經(jīng)網(wǎng)絡模型在測試集上展現(xiàn)出了良好的預測性能,準確率可以達到90%以上。

4 結(jié)語

本文基于K均值聚類算法、KNN分類算法和神經(jīng)網(wǎng)絡等多種方法對電機運行數(shù)據(jù)的挖掘與預測展開了深入研究。實驗結(jié)果顯示,K均值聚類算法有效地揭示了數(shù)據(jù)之間的潛在聯(lián)系,KNN分類算法和神經(jīng)網(wǎng)絡則在電機運行功率和溫度的預測中展示了較高的準確性。實驗結(jié)果驗證了使用機器學習技術(shù)對電機數(shù)據(jù)進行分析和預測,不僅能提高電機的運行效率,還為智能維護和故障預警提供了可靠的技術(shù)支持。未來,隨著算法的進一步優(yōu)化和數(shù)據(jù)量的持續(xù)增長,電機數(shù)據(jù)挖掘技術(shù)將在工業(yè)領(lǐng)域發(fā)揮更為重要的作用。本文雖然采用了神經(jīng)網(wǎng)絡對電機運行數(shù)據(jù)進行挖掘與預測,但是模型結(jié)構(gòu)相對簡單。下一步可以引入更復雜的深度學習架構(gòu),如卷積神經(jīng)網(wǎng)絡、長短期記憶網(wǎng)絡等,進一步提升預測性能。同時,可以探索自適應學習率和自動超參數(shù)調(diào)整等優(yōu)化方法,以提高模型的訓練效率。

5 參考文獻

[1]李玲玉.永磁電機在水利大型低揚程水泵上的適用性[J].水利技術(shù)監(jiān)督,2021(5):149-152.

[2]賈豐收.水利工程機械安裝與維護策略分析[J].地下水,2019,41(1):226-228.

[3]蘇紀陽.水利泵站機電設(shè)備安裝及檢修技術(shù)分析[J].現(xiàn)代制造技術(shù)與裝備,2023,59(12):134-136.

[4]郭海濤.大型水利泵站機電設(shè)備安裝與檢修分析[J].工程技術(shù)研究,2022,7(14):111-113.

[5]郭露丹.水利泵站設(shè)備故障分析與管理維護措施探究[J].中國設(shè)備工程,2023(17):64-66.

[6]吳建蓉,楊濤.數(shù)據(jù)挖掘技術(shù)在水利水電工程中的應用[J].水利水電科技進展,2022,42(5):129.

猜你喜歡
機器學習數(shù)據(jù)挖掘聚類
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
基于機器學習的圖像特征提取技術(shù)在圖像版權(quán)保護中的應用
基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數(shù)據(jù)分析研究
基于改進的遺傳算法的模糊聚類算法
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
一種層次初始的聚類個數(shù)自適應的聚類方法研究
泗洪县| 五台县| 崇明县| 高雄市| 合川市| 安溪县| 大城县| 龙里县| 无为县| 连州市| 康马县| 长子县| 会同县| 沾益县| 夹江县| 新平| 徐汇区| 沂水县| 南岸区| 定边县| 铜川市| 呼图壁县| 兴和县| 拉孜县| 阜康市| 合阳县| 孝昌县| 灌南县| 同德县| 孝感市| 武安市| 韶山市| 新宾| 汤原县| 牟定县| 西平县| 广河县| 广昌县| 乐清市| 汽车| 南郑县|