徐紅霞
摘要:數(shù)據(jù)挖掘技術可以從海量收集來的數(shù)據(jù)中找到有用的數(shù)據(jù)并進行有效分析,對日益復雜的各種機械設備故障診斷提供了技術支持。該文就數(shù)據(jù)挖掘技術在機械設備故障診斷中的應用進行詳細分析,給出了機械設備故障診斷的方法及實現(xiàn)過程,對提高經(jīng)濟效益具有十分重要的意義。
關鍵詞:數(shù)據(jù)挖掘;機械設備;故障診斷
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)30-0005-02
新時代經(jīng)濟發(fā)展需要社會工業(yè)生產(chǎn)必須向規(guī)?;⒓夯?、智能化方向發(fā)展和提升,在工業(yè)生產(chǎn)實踐中,普遍使用到的機械設備發(fā)生故障的原因更加復雜,提高機械設備的故障診斷技術成為保證工業(yè)發(fā)展的重要手段之一。故障診斷需要通過收集相關數(shù)據(jù)并進行分析才能夠得出精確的結果。信息技術高速發(fā)展的今天,數(shù)據(jù)挖掘技術應運而生,它能夠幫助人們從海量的數(shù)據(jù)中找到一條正確的方案來實施。隨著電子計算機技術的飛速發(fā)展和提升,數(shù)據(jù)收集效率和質量顯著提升,人工智能識別技術、模態(tài)識別技術、統(tǒng)計學基本理論、人工智能等相關領域及技術的發(fā)展實現(xiàn)了機械設備故障的快速、精準識別及判定,且故障智能診斷技術已經(jīng)被廣泛使用在工業(yè)化生產(chǎn)領域及金融服務行業(yè)中。
1 數(shù)據(jù)挖掘技術概念
數(shù)據(jù)分析及采集技術就是從廣泛、海量的信息中獲取真實、有效、可用的數(shù)據(jù)信息,在數(shù)據(jù)收集實踐中,部分未降噪、模糊的數(shù)據(jù)類型隱含在海量數(shù)據(jù)中,為了實現(xiàn)數(shù)據(jù)的精準提取和判定,必須將其從海量數(shù)據(jù)中剔除,以保證數(shù)據(jù)提取的高效性。
1.1 問題定義
海量的數(shù)據(jù)信息在總體較為細微的層面上出現(xiàn)極其微小的浮動和變化,數(shù)據(jù)信息專家在海量的數(shù)據(jù)信息中借助人工采集技術難以快速甄選鑒別,數(shù)據(jù)挖掘技術高效地解決了上述粗存在的問題,并提出了更加高效可用的數(shù)據(jù)挖掘技術。例如,設備操作人員及日常維修保養(yǎng)人樣對設備的性能及參數(shù)較為了解,但是,對系統(tǒng)中各個組件的性能及系統(tǒng)的集成問題的研究較為深入,可以敏銳、快速判定出不同零部件的變化及在具體運轉過程中出現(xiàn)的變動,但是上述問題難以被快速獲取,這同時表明實際理論經(jīng)驗同具體知識細則之間的變化情況。
1.2 數(shù)據(jù)準備
檢測系統(tǒng)可以快速、高效地獲取數(shù)據(jù)信息,且采集到的信息類型具有顯著的復雜性、系統(tǒng)性、多樣性及集群性等特點,在具體的使用過程中控制難度較高。所以,為了徹底解決數(shù)據(jù)挖掘階段的挖掘目標定位精度,實現(xiàn)數(shù)據(jù)挖掘目標的快速定位,可以先對數(shù)據(jù)信息進行預處理和轉化分析。但是,數(shù)據(jù)信息挖掘的最終質量直接影響到數(shù)據(jù)挖掘的整體結果,因此,提升數(shù)據(jù)挖掘的精度及質量就顯得極其重要。
1.3 數(shù)據(jù)挖掘
可以使用規(guī)則學習或決策樹等多種方法來進行分析統(tǒng)計,不斷重復,從而不斷發(fā)現(xiàn)一些潛藏的信息。
1.4 結果分析和評估
在滿足持續(xù)檢測的要求下,獲取的數(shù)據(jù)信息也出現(xiàn)不同程度的變化和發(fā)展,海量的數(shù)據(jù)信息分析必須借助數(shù)據(jù)建模技術,只有通過反復建模論證,才可以保證新獲取的信息及設備在具體執(zhí)行階段的可靠性分,保證在較短時間內(nèi)可以獲取滿意的診斷結果。
2 數(shù)據(jù)挖掘的常用技術
選用的數(shù)據(jù)挖掘技術的質量直接影響到挖掘的信息的總體質量高低,當前,在具體的技術研究領域,絕大多數(shù)的研究資源集中在算法研究方面,常用的算法技術主要基于以下幾個基本理論:
2.1 粗糙集理論
粗糙度集是典型的應用在研究不確定性及模糊數(shù)學中的常用理論之一,是一款性價比較高的計算及分析工具。其中,粗糙度集的基本理論具有以下顯著優(yōu)勢:可以不提供大量的精準信息,分析成本較低;分析流程及步驟得到顯著簡化;算法構成簡單,便于操作。粗糙集基本理論的研究方式與二維關系下的信息表較為相似。但是,基于粗糙集的研究方式及理論難以體現(xiàn)數(shù)據(jù)及信息處理的聯(lián)系性,但是,在具體的信息表中羅列的屬性均是連續(xù)且客觀的。所以,具有離散屬性的粗糙度集基本理論的實用化是后續(xù)繼續(xù)深入研究的重點問題。
2.2 決策樹技術
決策樹法是一種常用的預測模型算法,其可以實現(xiàn)大量數(shù)據(jù)的實時、快速分類,并快速從海量的信息中獲取可用信息類型,提升了信息處理的效率。決策樹分析法的優(yōu)勢在于功能簡單、類型劃分速率快,滿足集群化數(shù)據(jù)處理的實際要求。
2.3 人工神經(jīng)元網(wǎng)絡技術
基于神經(jīng)網(wǎng)絡分析法是當前數(shù)據(jù)分析及挖掘的關鍵技術之一,也是當前使用最為廣泛的分析法之一,人工神經(jīng)網(wǎng)絡分析技術的原理借助仿生學基本原理,模仿人工神經(jīng)系統(tǒng)建立相應的數(shù)據(jù)信息庫,實行對數(shù)據(jù)信息庫的數(shù)據(jù)實時采集和遴選。同上述分析方式存在差異的是,神經(jīng)網(wǎng)絡分析法在出現(xiàn)機械故障的情況下開可以實現(xiàn)精準預判,所以,在處理某些連續(xù)故障及變量的問題上適用性較好,但是,對于維度較高的數(shù)據(jù)分析及處理不適用。根本原因是內(nèi)部結構不透明問題,神經(jīng)網(wǎng)絡分析法比較適用于結構形式相對復雜的數(shù)據(jù)結構中,例如典型的聚類分析模式。圖1為常見的三層前端反饋神經(jīng)網(wǎng)絡分析模型。
2.4 遺傳算法
遺傳分析法和神經(jīng)網(wǎng)絡分析法存在某些相似性,遺傳分析法基于生物學基本理論,借鑒了自然選擇法則和遺傳學中的隨機搜尋基本理論。遺傳分析法具備顯著的隱藏性及并行特點,其分析模型可以較好地應用在數(shù)據(jù)挖掘及分析實踐中。
3 數(shù)據(jù)挖掘技術在工業(yè)優(yōu)化中的應用
量化分析及預測分析技術主要應用在非線性分析實踐中,選用滿足數(shù)據(jù)要求的模式識別技術快速收集數(shù)據(jù)信息,建立相應的數(shù)據(jù)分析信息,根據(jù)數(shù)據(jù)反映出的數(shù)據(jù)特點,建立相應的數(shù)據(jù)結構形式,建立滿足非線性特點的回歸方程,并最終進行非線性回歸分析,但是上述分析存在顯著的缺陷,就是在具體非線性回歸分析過程中回歸方程是主觀確定的。非線性分析法滿足繼續(xù)推廣的特點及要求,滿足多種分析法的聯(lián)合分析使用,建立滿足實際需要的數(shù)據(jù)搜尋及獲取方式。
4 數(shù)據(jù)挖掘技術在機械設備故障診斷中的實現(xiàn)步驟
4.1 基本原理
數(shù)據(jù)挖掘方式主要是借助數(shù)據(jù)記錄值實現(xiàn)對機械設備故障及類型的實時診斷,并獲取對應的數(shù)據(jù)分析解決途徑,對于后期可能出現(xiàn)的多種故障及故障類型進行合理預判。機械設備故障類型的本質特點就是模態(tài)識別,涉及的具體診斷方式就是內(nèi)部數(shù)據(jù)自我匹配的過程。
4.2 故障診斷的數(shù)據(jù)挖掘方法建模
涉及機械設備的故障及診斷分析,首先應該重視的是數(shù)據(jù)的采集及收集,設備在具體使用過程中涉及大量的數(shù)據(jù)信息,上述數(shù)據(jù)類型中,既要涵蓋正常運轉的參數(shù)還應該涵蓋故障數(shù)據(jù)值,保證設備在出現(xiàn)故障后可以通過采集到的數(shù)據(jù)信息實現(xiàn)準確分析及定位。目前,已經(jīng)使用到的檢測系統(tǒng)及工具的精度較高,且可以實現(xiàn)對數(shù)據(jù)信息的實時定位和分析,提升數(shù)據(jù)采集及收集的便捷性和效率。
當前,較為成熟的數(shù)據(jù)分析及識別技術中常用的基本理論和方法主要有關聯(lián)關系法則,上述數(shù)據(jù)關系主要依靠內(nèi)部數(shù)據(jù)的實時分類,實現(xiàn)數(shù)據(jù)快速采集及高效利用的目的,目前,數(shù)據(jù)相關關系中劃分出的主要類別可以實現(xiàn)數(shù)據(jù)及信息的重新定義及歸納,實現(xiàn)故障診斷的實時性,快速定位故障原因。數(shù)據(jù)挖掘體系及策略如圖2。
5 實現(xiàn)過程
機械設備故障診斷數(shù)據(jù)挖掘的開發(fā)平臺如下:
(1)數(shù)據(jù)庫技術 機械設備故障診斷的數(shù)據(jù)倉庫使用Microsoft SQL Server 2012 網(wǎng)絡數(shù)據(jù)庫進行組建;
(2)OLAP技術又稱為關聯(lián)分析技術,主要針對特點問題實現(xiàn)關聯(lián)分析和即時數(shù)據(jù)訪問的一種技術, 它可以根據(jù)要求進行快速、靈活的各種復雜查詢處理;
(3)使用 SQL Server 2012 Analysis Services 和SQL Server 2012 Integration Services 實現(xiàn)多維數(shù)據(jù)集和 ETL 過程;
(4)數(shù)據(jù)挖掘采用的相應的挖掘工具進行數(shù)據(jù)采集,并從中獲取必要的知識體系及模型;
(5)前臺開發(fā)軟件 常用的前臺開發(fā)軟件主要有PHP、ASP.NET、JSP、C# 等,本平臺采用 C# 進行開發(fā)。
6 結束語
文章著重分析和介紹了機械設備故障類型的通用分析及診斷技術——數(shù)據(jù)挖掘法。將數(shù)據(jù)挖掘技術遷移到機械設備故障診斷中,能夠提前預測問題,采取有效措施對設備進行維修或更新從而確保機械設備的正常運行,降低了經(jīng)濟損失,提高了經(jīng)濟效益。
參考文獻:
[1]李洪燕,陳步英,趙美枝. 數(shù)據(jù)挖掘技術在煤礦機械故障診斷中的應用[J]. 煤礦機械,2012.
[2]劉繼清,黃金花.基于改進決策樹算法的設備故障智能診斷模型[J]. 制造業(yè)自動化,2010,33(4):30-33.
[3]張?zhí)烊?,于天彪,趙海峰,王宛山.數(shù)據(jù)挖掘技術在全斷面掘進機故障診斷中的應用.東北大學學報,2015.
【通聯(lián)編輯:王力】