国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)挖掘技術(shù)應(yīng)用于汽輪機(jī)組運(yùn)行性能優(yōu)化的探究

2021-01-11 00:49王春平
今日自動(dòng)化 2021年10期
關(guān)鍵詞:性能優(yōu)化

王春平

[摘? ? 要]許多企業(yè)的汽輪機(jī)組運(yùn)行性能提升是一項(xiàng)重要工作,其主要是通過采集以往機(jī)組運(yùn)行的相關(guān)數(shù)據(jù)來進(jìn)行優(yōu)化,從而完善汽輪機(jī)組的不足,這需要運(yùn)用到大數(shù)據(jù)挖掘技術(shù)。本文通過分析大數(shù)據(jù)挖掘技術(shù)的特點(diǎn),進(jìn)一步分析了該技術(shù)在汽輪機(jī)組運(yùn)行性能優(yōu)化過程中的運(yùn)用。

[關(guān)鍵詞]汽輪機(jī)組;大數(shù)據(jù)挖掘技術(shù);性能優(yōu)化

[中圖分類號(hào)]TM621;TP311.13 [文獻(xiàn)標(biāo)志碼]A [文章編號(hào)]2095–6487(2021)10–00–02

Research on the Application of Big Data Mining Technology to the

Optimization of Steam Turbine Unit Operation Performance

Wang Chun-ping

[Abstract]It is an important task to improve the operating performance of steam turbine units in many enterprises. It is mainly optimized by collecting relevant data of previous unit operation to improve the shortcomings of steam turbine units. This requires the application of big data mining technology. By analyzing the characteristics of big data mining technology, this paper further analyzes the application of this technology in the process of optimization of the operation performance of steam turbine units.

[Keywords]steam turbine; big data mining technology; performance optimization

大數(shù)據(jù)挖掘技術(shù)就是從大量的、模糊的、不完全的,以及隨意性的數(shù)據(jù)當(dāng)中進(jìn)行挖掘提取,獲得隱含性、潛在性的有用信息與知識(shí)的技術(shù)。在當(dāng)前許多企業(yè)自動(dòng)化生產(chǎn)水平不斷提升的情況下,該項(xiàng)技術(shù)的應(yīng)用變得更為廣泛。

1 大數(shù)據(jù)挖掘技術(shù)的特點(diǎn)

(1)適用于大量數(shù)據(jù)的挖掘工作。這也不是說不適用于小數(shù)據(jù)量的挖掘工作,一般的數(shù)據(jù)庫挖掘都可運(yùn)用數(shù)據(jù)挖掘技術(shù),但小數(shù)量的挖掘工作由于數(shù)據(jù)量較少;因此可人工完成,再加上小數(shù)據(jù)量往往反映的特性不夠全面和可靠,因而大數(shù)據(jù)量的挖掘?qū)⒊蔀槲磥戆l(fā)展的必然趨勢(shì)。因此,大數(shù)據(jù)挖掘技術(shù)也是必不可少的。

(2)有隱含性。主要指的是其能夠挖掘數(shù)據(jù)當(dāng)中隱含的核心知識(shí),不是表面就可發(fā)現(xiàn)的數(shù)據(jù)知識(shí),這種知識(shí)具有著較高的運(yùn)用價(jià)值。

(3)新奇性。主要指的是挖掘出的知識(shí)往往是前所未有的未知知識(shí),即全新知識(shí)。但其是通過相關(guān)專業(yè)經(jīng)驗(yàn)獲得,同時(shí)也驗(yàn)證了經(jīng)驗(yàn)的可靠性,只有這樣的知識(shí)能夠提升企業(yè)的洞察力。

(4)價(jià)值性。大數(shù)據(jù)挖掘技術(shù)作用下挖掘的知識(shí)往往會(huì)直接或間接地給企業(yè)帶來效益,具有較高價(jià)值[1]。

2 關(guān)聯(lián)規(guī)則和Apriori算法

2.1 關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則其實(shí)是指在一個(gè)給定的數(shù)據(jù)集合當(dāng)中,對(duì)數(shù)據(jù)項(xiàng)之間關(guān)系進(jìn)行描述且頻繁出現(xiàn)的規(guī)則知識(shí),這種被發(fā)掘的知識(shí)就是關(guān)聯(lián)規(guī)則。其具體的呈現(xiàn)形式為:A→B,(s,c),在該形式當(dāng)中,A表示一個(gè)數(shù)據(jù)集合的子集,B表示同個(gè)數(shù)據(jù)集合的子集,但A與B是不相交的狀態(tài),而s表示該關(guān)聯(lián)規(guī)則當(dāng)中的支持度,c則表示該關(guān)聯(lián)規(guī)則當(dāng)中的置信度,且置信度和支持度能夠表示關(guān)聯(lián)規(guī)則的確定性及有用性。例如:若A集和B集成并集關(guān)系的條件當(dāng)中,就有s比例的數(shù)據(jù)項(xiàng)符合該項(xiàng)條件,而若是在包含A就包含B條件當(dāng)中,就有c比例的數(shù)據(jù)項(xiàng)符合該項(xiàng)條件,也就是說s與c都為概率。當(dāng)給定最小置信度及最小支持度時(shí),假若A集和B集成并集關(guān)系的支持度不小于給定的最小支持度,則其為頻繁項(xiàng)集,若是該關(guān)聯(lián)規(guī)則的支持度不小于最小支持度,同時(shí)其置信度不小于最小置信度,則表示A→B的關(guān)聯(lián)規(guī)則為強(qiáng)關(guān)聯(lián)規(guī)則,這也是數(shù)據(jù)挖掘分析過程中研究關(guān)聯(lián)規(guī)則的關(guān)鍵。

2.2 Apriori算法

Apriori算法是最為典型的關(guān)聯(lián)規(guī)則算法,其具體在進(jìn)行數(shù)據(jù)挖掘過程中主要是包括了兩項(xiàng)程序:①將各項(xiàng)集的支持度與給定的最小支持度進(jìn)行對(duì)比分析,最終獲得所有的頻繁項(xiàng)集;②將各頻繁項(xiàng)集的置信度與給定的最小置信度進(jìn)行對(duì)比分析,最終獲得了強(qiáng)關(guān)聯(lián)規(guī)則。實(shí)際運(yùn)用Apriori算法時(shí),對(duì)頻繁項(xiàng)集的數(shù)據(jù)挖掘主要是依據(jù)迭代法進(jìn)行逐層搜索,一般可以利用前一個(gè)已知的頻繁項(xiàng)集來生成后一個(gè)頻繁項(xiàng)集。

隨著當(dāng)前信息技術(shù)水平的不斷提升,數(shù)據(jù)庫的數(shù)據(jù)量變得越來越大,而Apriori算法在運(yùn)用的過程中也體現(xiàn)出一些不足之處,需要改進(jìn):①Apriori算法本身的運(yùn)用程序影響,其在運(yùn)用時(shí)需要反復(fù)搜索數(shù)據(jù)庫,且會(huì)生產(chǎn)候選集,在數(shù)據(jù)量不斷擴(kuò)大的形勢(shì)下,候選集變得越來越多,其挖掘后的關(guān)聯(lián)規(guī)則會(huì)獲得很多的屬性項(xiàng),但許多屬性項(xiàng)并沒有參與到數(shù)據(jù)挖掘的核心工作當(dāng)中,因此產(chǎn)生許多無效候選集,若是對(duì)這些候選集不斷檢索,則會(huì)造成資源浪費(fèi)的情況;②Apriori算法一般是在單節(jié)點(diǎn)上運(yùn)行,其在應(yīng)當(dāng)數(shù)據(jù)量較大情況時(shí)經(jīng)常會(huì)出現(xiàn)內(nèi)存不足的情況,這也會(huì)影響到實(shí)際的數(shù)據(jù)挖掘工作,如挖掘速度較慢或難以順利完成,當(dāng)前的許多生產(chǎn)數(shù)據(jù)呈爆炸性增長(zhǎng),因而這項(xiàng)缺陷也導(dǎo)致不能夠滿足實(shí)際需求,對(duì)以上兩項(xiàng)不足實(shí)施改進(jìn)措施。針對(duì)第一點(diǎn)不足可以引進(jìn)約簡(jiǎn)理念,即在實(shí)際運(yùn)用該算法之前,對(duì)數(shù)據(jù)庫當(dāng)中的數(shù)據(jù)進(jìn)行屬性約簡(jiǎn),將一些與無關(guān)于關(guān)聯(lián)規(guī)則的屬性項(xiàng)及時(shí)剔除,減輕后續(xù)檢索工作量;而針對(duì)第二點(diǎn)不足的改進(jìn)則可結(jié)合運(yùn)用Hadoop平臺(tái),Hadoop平臺(tái)具有高效性、擴(kuò)展性、可靠性等優(yōu)勢(shì),其能夠進(jìn)行并行運(yùn)算,結(jié)合其對(duì)Apriori算法進(jìn)行優(yōu)化,讓該算法能夠進(jìn)行并行化的計(jì)算操作,同時(shí),并行運(yùn)算還需要依靠于MapReduce框架,提升計(jì)算的效率,以便于處理大量數(shù)據(jù),通過這些改進(jìn)措施可以獲得具有高效性特點(diǎn)的關(guān)聯(lián)規(guī)則新算法[2]。

3 基于大數(shù)據(jù)挖掘技術(shù)的新算法在汽輪機(jī)組優(yōu)化中的應(yīng)用

3.1 關(guān)聯(lián)規(guī)則算法的優(yōu)點(diǎn)

優(yōu)化汽輪機(jī)組運(yùn)行性能主要是研究其目標(biāo)值的優(yōu)化,從含義上來看,目標(biāo)值是決定著汽輪機(jī)組的相關(guān)性能指標(biāo)和運(yùn)行參數(shù),因而優(yōu)化運(yùn)行性能也就是以目標(biāo)值為基礎(chǔ)進(jìn)行優(yōu)化,以便于進(jìn)一步指導(dǎo)汽輪機(jī)組的運(yùn)行。當(dāng)前,在優(yōu)化汽輪機(jī)組目標(biāo)值的過程中,通常是包括確定設(shè)計(jì)值、試驗(yàn)最優(yōu)運(yùn)行操作、進(jìn)行變工況狀態(tài)下的熱力計(jì)算、確定其最優(yōu)值方法等方式。在汽輪機(jī)組的運(yùn)行初期使用試驗(yàn)最優(yōu)運(yùn)行操作和確定設(shè)計(jì)值是效果較好的,但隨著運(yùn)行的時(shí)間不短延長(zhǎng),其目標(biāo)值也會(huì)發(fā)生改變,整個(gè)機(jī)組狀態(tài)發(fā)生變化,與實(shí)際狀態(tài)之間存在著差異,而變工況的熱力計(jì)算獲得的計(jì)算結(jié)果是理想狀態(tài)的值,其與實(shí)際也存在偏差,因此也不適用,確定最優(yōu)值方法的應(yīng)用是比較多的,但其是計(jì)算熱電機(jī)組運(yùn)行時(shí)的相關(guān)參數(shù)數(shù)據(jù),一般是取性能指標(biāo)的最佳值,因而運(yùn)用是比較片面的,因?yàn)樾阅苤笜?biāo)的最佳值也可能由于計(jì)算有誤而產(chǎn)生偏差,以上幾種的缺點(diǎn)導(dǎo)致其實(shí)際運(yùn)用于優(yōu)化汽輪機(jī)組時(shí)也存在問題,因而產(chǎn)生了關(guān)聯(lián)規(guī)則算法這一方式,其主要是基于實(shí)際生產(chǎn)運(yùn)行的數(shù)據(jù),在計(jì)算的過程中具有著較高的邏輯性,且經(jīng)過了嚴(yán)格的驗(yàn)證,最終獲得了可靠的關(guān)聯(lián)規(guī)則,其關(guān)聯(lián)的數(shù)據(jù)項(xiàng)頗為精準(zhǔn),尤其是在海量數(shù)據(jù)當(dāng)中,這種數(shù)據(jù)挖掘算法十分有效,在本次應(yīng)用研究當(dāng)中,算法所應(yīng)用的對(duì)象都是汽輪機(jī)組實(shí)際工作運(yùn)行狀態(tài)中的數(shù)據(jù),其支持度和置信度較高,有利于指導(dǎo)優(yōu)化汽輪機(jī)組的性能[3]。

3.2 數(shù)據(jù)挖掘?qū)ο笈c挖掘目標(biāo)

本次研究的過程中,選擇某電廠規(guī)格為1 000 MW的汽輪機(jī)組分散控制系統(tǒng)作為數(shù)據(jù)挖掘的對(duì)象,從該系統(tǒng)中取1月9號(hào)24:00到3月21號(hào)24:00運(yùn)行的參數(shù)數(shù)據(jù),共計(jì)250個(gè)參數(shù),實(shí)際采樣的周期為30 s,將極少存在的一些缺失值去除,其數(shù)據(jù)總量為204 459條。大量的數(shù)據(jù)信息中包含著機(jī)組性能指標(biāo)、運(yùn)行參數(shù)以及負(fù)荷之間極為復(fù)雜的關(guān)系,這些關(guān)系也是優(yōu)化機(jī)組時(shí)研究的關(guān)鍵,在關(guān)聯(lián)規(guī)則算法作用下,將關(guān)系挖掘出來做定量化處理,即能夠反映該機(jī)組的關(guān)聯(lián)規(guī)則。選擇汽輪機(jī)組研究的性能指標(biāo)時(shí),可選擇熱耗率作為指標(biāo),熱耗率能夠充分反映出汽輪機(jī)組的熱經(jīng)濟(jì)性,而計(jì)算熱耗率還能夠獲得煤耗率與機(jī)組實(shí)際循環(huán)效率。將關(guān)聯(lián)規(guī)則算法應(yīng)用于汽輪機(jī)組目標(biāo)值的優(yōu)化過程中,挖掘出一項(xiàng)強(qiáng)關(guān)聯(lián)規(guī)則,即運(yùn)行參數(shù)和最優(yōu)性能指標(biāo)之間的規(guī)則,進(jìn)一步指導(dǎo)優(yōu)化機(jī)組運(yùn)行,在選擇實(shí)際運(yùn)行參數(shù)的過程中,還需要充分遵循兩項(xiàng)內(nèi)容:①確保參數(shù)與熱耗率之間具有著緊密關(guān)系;②能夠?qū)?shí)際運(yùn)行進(jìn)行指導(dǎo),且在運(yùn)行時(shí)可進(jìn)行調(diào)節(jié),因此,最終確定的運(yùn)行參數(shù)有主蒸汽流量、冷段再熱蒸汽壓力和溫度、熱段再熱蒸汽壓力和溫度、汽輪機(jī)組的功率、主蒸汽壓力和溫度、凝汽器真空、給水溫度以及給水泵出水壓力。

3.3 預(yù)處理數(shù)據(jù)

在預(yù)處理數(shù)據(jù)的環(huán)節(jié),主要操作包括數(shù)據(jù)采集、清洗、集成以及轉(zhuǎn)換。將從系統(tǒng)中提取到的數(shù)據(jù)篩選,依據(jù)上述選擇性能指標(biāo)和運(yùn)行參數(shù)的要求來篩選處理,將一些明顯存在壞點(diǎn)或死點(diǎn)的數(shù)據(jù)及時(shí)剔除,然后獲取一個(gè)參數(shù)由多個(gè)測(cè)點(diǎn)所測(cè)得的一組數(shù)據(jù),對(duì)其進(jìn)行求和再求平均值,最終只獲得一個(gè)可靠、準(zhǔn)確,且能夠反映實(shí)際機(jī)組運(yùn)行狀態(tài)的數(shù)據(jù),這些操作完成后也就基本對(duì)數(shù)據(jù)進(jìn)行了清洗與集成,但這些處理后的數(shù)據(jù)還需要轉(zhuǎn)換為離散數(shù)據(jù),因此還應(yīng)當(dāng)進(jìn)行離散化處理,一般是依據(jù)相關(guān)知識(shí)將連續(xù)值域內(nèi)的數(shù)據(jù)劃分為幾個(gè)不同的區(qū)間,保證分組的過程中不能夠出現(xiàn)區(qū)間重疊,具體分組時(shí)采取兩種常用方法:分位數(shù)分組法和組距分組法。由于組距分組法可能會(huì)因?yàn)榻M距不合適而導(dǎo)致出現(xiàn)樣本量差異性大的情況,從而間接導(dǎo)致后續(xù)算法運(yùn)用與建立模型都會(huì)受到影響,因而一般采用分位數(shù)分組法,這種方法不會(huì)出現(xiàn)樣本量差異性大的問題,其組數(shù)是固定的,且實(shí)際分組時(shí)依據(jù)的原則為各組變量值的總和相近,因而樣本量之間也是相似的[4]。

3.4 Hadoop平臺(tái)配置

在UBUNTU上進(jìn)行JDK的安裝和配置,然后下載一個(gè)Hadoop-1.2.1的開源框架并將其安裝好,再將SHH配置,同時(shí)要確保在平臺(tái)上各節(jié)點(diǎn)進(jìn)行共享訪問的過程中能夠安全,最后再將Hadoop平臺(tái)的環(huán)境配置完成,所有的配置基礎(chǔ)文件完成以后就可布置HDFS和MapReduce。將上述操作全部處理好后格式化處理HDFS,然后將Hadoop平臺(tái)啟動(dòng)運(yùn)行。

3.5 關(guān)聯(lián)規(guī)則算法的應(yīng)用結(jié)果

經(jīng)過數(shù)據(jù)挖掘與數(shù)據(jù)的預(yù)處理后,將其數(shù)據(jù)庫整理為決策集模式,其中決策屬性為熱耗率,而條件屬性則為11個(gè)選擇的運(yùn)行參數(shù),再進(jìn)行過屬性約簡(jiǎn)處理,最后得出結(jié)論.在應(yīng)用的過程中,發(fā)覺冷段再熱蒸汽壓力和溫度的屬性沒有意義,因此可將其剔除,即可獲得9個(gè)運(yùn)行參數(shù),對(duì)該屬性參數(shù)集進(jìn)行約簡(jiǎn)處理,縮小了數(shù)據(jù)規(guī)模。將Hadoop平臺(tái)中的最小置信度設(shè)置為80%,而最小支持度設(shè)置為0.15 %,對(duì)約簡(jiǎn)處理后的數(shù)據(jù)采用該算法流程進(jìn)行挖掘,計(jì)算獲得最優(yōu)熱耗率的強(qiáng)關(guān)聯(lián)規(guī)則,在獲得的規(guī)則當(dāng)中區(qū)間內(nèi),其運(yùn)行參數(shù)的目標(biāo)值就可清晰得知,最后取區(qū)間內(nèi)的中心值并將其作為優(yōu)化的目標(biāo)值即,優(yōu)化后的汽輪機(jī)組運(yùn)行具有節(jié)能減排的效果。

4 結(jié)術(shù)語

在大數(shù)據(jù)挖掘技術(shù)的作用下,汽輪機(jī)組的運(yùn)行性能優(yōu)化機(jī)制更加有效,大量數(shù)據(jù)通過分析獲得隱含知識(shí),再將其運(yùn)用于優(yōu)化汽輪機(jī)組的目標(biāo)值,從而提升其性能水平。由文章分析可知,其具體的優(yōu)化處理過程包括:確定數(shù)據(jù)挖掘?qū)ο笈c挖掘目標(biāo)、預(yù)處理數(shù)據(jù)、Hadoop平臺(tái)配置,以及分析關(guān)聯(lián)規(guī)則算法的應(yīng)用結(jié)果。

參考文獻(xiàn)

[1] 趙鵬程,袁國生,馬素霞.基于數(shù)據(jù)挖掘的汽輪機(jī)組冷端優(yōu)化[J].中國電機(jī)工程學(xué)報(bào),2021,41(2):423-432.

[2] 賀之豪.數(shù)據(jù)驅(qū)動(dòng)的汽輪機(jī)組性能診斷研究[D].北京:華北電力大學(xué)(北京),2019.

[3] 張博倫.基于大數(shù)據(jù)的汽輪機(jī)組狀態(tài)監(jiān)測(cè)[D].大連:大連理工大學(xué),2018.

[4] 胡念蘇,韓鵬飛,張海石.大數(shù)據(jù)挖掘技術(shù)應(yīng)用于汽輪機(jī)組運(yùn)行性能優(yōu)化的研究[J].中國電機(jī)工程學(xué)報(bào),2016,36(2):459-467.

猜你喜歡
性能優(yōu)化
大數(shù)據(jù)環(huán)境下高校選課系統(tǒng)性能優(yōu)化應(yīng)用研究
數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應(yīng)用
SQL Server數(shù)據(jù)庫性能優(yōu)化的幾點(diǎn)分析
Web應(yīng)用的前端性能優(yōu)化
WEB網(wǎng)站緩存性能優(yōu)化
Oracle數(shù)據(jù)庫性能調(diào)整與優(yōu)化分析
基于節(jié)點(diǎn)緩存的Web服務(wù)器性能優(yōu)化研究
基于SQL數(shù)據(jù)庫的性能優(yōu)化的探討
Oracle數(shù)據(jù)庫應(yīng)用系統(tǒng)的性能優(yōu)化