趙長(zhǎng)軍
[摘 要]文章通過(guò)將油氣生產(chǎn)設(shè)備的故障數(shù)據(jù)、配套物聯(lián)網(wǎng)采集的故障期工況數(shù)據(jù)、設(shè)備維修保養(yǎng)記錄數(shù)據(jù)等進(jìn)行多維組合,通過(guò)Hadoop大數(shù)據(jù)分析技術(shù),對(duì)設(shè)備的故障率進(jìn)行分析,生成全面的設(shè)備質(zhì)量參考數(shù)據(jù);并依據(jù)故障率分析結(jié)果與實(shí)時(shí)工況數(shù)據(jù)進(jìn)行大數(shù)據(jù)模型比對(duì)分析,實(shí)現(xiàn)設(shè)備的實(shí)時(shí)故障預(yù)測(cè)。通過(guò)對(duì)輸入的多維數(shù)據(jù)進(jìn)行整合,結(jié)合大數(shù)據(jù)技術(shù)在海量數(shù)據(jù)分析的優(yōu)勢(shì),實(shí)現(xiàn)了對(duì)油氣生產(chǎn)領(lǐng)域設(shè)備全方位的質(zhì)量信息評(píng)估,并可據(jù)此采取針對(duì)性的質(zhì)量改進(jìn)與預(yù)防性措施,提升油氣生產(chǎn)的安全性和經(jīng)營(yíng)效益。
[關(guān)鍵詞]多維分析;故障預(yù)測(cè);大數(shù)據(jù);油氣生產(chǎn)設(shè)備
[DOI]10.13939/j.cnki.zgsc.2017.12.243
1 引 言
油氣生產(chǎn)行業(yè)所采用的各類數(shù)字化設(shè)備較多,隨著行業(yè)的競(jìng)爭(zhēng)加劇,如何減少設(shè)備故障引起的停產(chǎn)時(shí)間,如何優(yōu)化采購(gòu)降低設(shè)備故障率,如何提前對(duì)故障做出預(yù)測(cè)以提前應(yīng)對(duì),是石油企業(yè)所亟須思考和解決的問(wèn)題。
隨著工業(yè)自動(dòng)化技術(shù)、物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)在油氣生產(chǎn)行業(yè)的開(kāi)始應(yīng)用,為解決上述問(wèn)題提供了全新的思路。運(yùn)用大數(shù)據(jù)技術(shù),可高速有效分析多維度的設(shè)備實(shí)時(shí)運(yùn)行數(shù)據(jù),并結(jié)合其他靜態(tài)和動(dòng)態(tài)信息,對(duì)設(shè)備的故障進(jìn)行分析和預(yù)測(cè),分析結(jié)果為生產(chǎn)、經(jīng)營(yíng)和QHSE服務(wù),實(shí)現(xiàn)技術(shù)手段和管理模式的革新,實(shí)現(xiàn)科學(xué)決策、卓越運(yùn)營(yíng)與安全生產(chǎn),最終達(dá)到可持續(xù)的業(yè)務(wù)增長(zhǎng)。例如茂名石化探索如何在不改變已知原料屬性下,實(shí)現(xiàn)在重整裝置上提高汽油收率最高和汽油辛烷值最高的生產(chǎn)目標(biāo)。為解決這個(gè)問(wèn)題,采用大數(shù)據(jù)分析技術(shù),收集了重整裝置近三年的MES、HSE、實(shí)時(shí)數(shù)據(jù)庫(kù)、腐蝕數(shù)據(jù)、ITCC、機(jī)泵監(jiān)測(cè)數(shù)據(jù)、氣象信息等數(shù)據(jù),通過(guò)Hadoop建模,對(duì)重整原料歷史數(shù)據(jù)進(jìn)行主成分聚類分析,形成了典型的原料操作樣本庫(kù),并據(jù)此快速確定每種原料類別下的最優(yōu)操作方案。技術(shù)人員對(duì)近4600個(gè)批次的石油原料進(jìn)行了分析建模,組成了操作樣本庫(kù)。通過(guò)該方法計(jì)算優(yōu)化工藝操作參數(shù),可使汽油收率從89.88%提高到90.10%,是大數(shù)據(jù)在油氣生產(chǎn)行業(yè)應(yīng)用的成功例子。
本文擬通過(guò)將油氣生產(chǎn)設(shè)備故障數(shù)據(jù)、配套物聯(lián)網(wǎng)采集的工況數(shù)據(jù)、維修保養(yǎng)記錄數(shù)據(jù)及工業(yè)自動(dòng)化數(shù)據(jù)組合應(yīng)用于設(shè)備故障大數(shù)據(jù)分析,實(shí)現(xiàn)對(duì)設(shè)備的綜合故障率分析與故障預(yù)測(cè),從而為設(shè)備采購(gòu)的最高性價(jià)比提供數(shù)據(jù)支撐,也為預(yù)防性維修維護(hù)提供決策支持,提升生產(chǎn)運(yùn)行的安全性和企業(yè)經(jīng)營(yíng)效益。
2 大數(shù)據(jù)分析技術(shù)的運(yùn)用
油氣生產(chǎn)行業(yè)設(shè)備數(shù)據(jù)數(shù)量大,并發(fā)處理要求較高,對(duì)數(shù)據(jù)存儲(chǔ)、處理、分析的巨大壓力,要解決海量數(shù)據(jù)處理的問(wèn)題就需要引入大數(shù)據(jù)技術(shù)。
Hadoop是目前最流行和功能最強(qiáng)大的一個(gè)軟件計(jì)算平臺(tái),可以很容易地開(kāi)發(fā)和運(yùn)行處理油氣生產(chǎn)過(guò)程中的海量數(shù)據(jù)的分析模型。其核心部分主要包括—HDFS(Hadoop Distributed File System)和基于MapReduce機(jī)制的并行算法實(shí)現(xiàn)。Hadoop提供的分布式文件系統(tǒng)HDFS是建立在大型集群上可靠存儲(chǔ)大數(shù)據(jù)集的文件系統(tǒng),具有強(qiáng)容錯(cuò)性、流式數(shù)據(jù)訪問(wèn)與大數(shù)據(jù)集、硬件和操作系統(tǒng)的異構(gòu)性的優(yōu)勢(shì)。而MapReduce是一種簡(jiǎn)化的分布式程序設(shè)計(jì)模型,用于處理和生成大量數(shù)據(jù)集。通過(guò)該模型,程序自動(dòng)分布到一個(gè)由普通機(jī)器組成的超大機(jī)群上并發(fā)執(zhí)行。MapReduce通過(guò)把對(duì)數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的每個(gè)節(jié)點(diǎn)來(lái)實(shí)現(xiàn)可靠性,每個(gè)節(jié)點(diǎn)會(huì)周期性地把完成的工作和狀態(tài)信息返回給主節(jié)點(diǎn),實(shí)現(xiàn)大數(shù)據(jù)的并發(fā)處理。
Hadoop的上述優(yōu)點(diǎn)尤其適合于油氣生產(chǎn)行業(yè)的海量數(shù)據(jù)分析應(yīng)用。
3 設(shè)備故障率多維分析
設(shè)備故障率是評(píng)估設(shè)備性能優(yōu)劣的一個(gè)重要指標(biāo)。顧名思義,是設(shè)備故障運(yùn)行與正常運(yùn)行的比率。通過(guò)統(tǒng)計(jì)的方法可以計(jì)算特定個(gè)體、特定型號(hào)、特定類型或特定廠商的設(shè)備的故障信息,對(duì)設(shè)備時(shí)間質(zhì)量進(jìn)行評(píng)估和橫縱向?qū)Ρ取?/p>
在油氣生產(chǎn)中,設(shè)備的故障記錄信息是故障率分析的依據(jù),但因?yàn)閷?shí)際運(yùn)行中各個(gè)井站、礦區(qū)的運(yùn)行情況不同也影響了設(shè)備發(fā)生故障的情況,因此還需要引入配套物聯(lián)網(wǎng)采集的工況數(shù)據(jù),以及日常的維修保養(yǎng)情況記錄數(shù)據(jù),將這些信息進(jìn)行進(jìn)一步組合,在Hadoop大數(shù)據(jù)分析中建模挖掘,得出更精確的設(shè)備綜合故障率結(jié)果。
本文采用的多維故障率分析,基于3個(gè)大類的數(shù)據(jù):
(1)設(shè)備故障信息:包括設(shè)備廠商信息、設(shè)備類型、設(shè)備型號(hào)、設(shè)備壽命、運(yùn)行時(shí)間、故障類型、故障次數(shù)、故障時(shí)長(zhǎng)、故障恢復(fù)時(shí)長(zhǎng)等;
(2)物聯(lián)網(wǎng)采集的工況數(shù)據(jù):油氣生產(chǎn)設(shè)備產(chǎn)量、流量、振動(dòng)、位移,以及運(yùn)行環(huán)境溫度、濕度、處理物質(zhì)腐蝕性等;
(3)維修保養(yǎng)記錄數(shù)據(jù):保養(yǎng)級(jí)別、保養(yǎng)時(shí)間、更換配件比、維修時(shí)間、維修級(jí)別等數(shù)據(jù)。
在Hadoop中,根據(jù)3類數(shù)據(jù)的權(quán)重、優(yōu)先級(jí),以及每個(gè)數(shù)據(jù)項(xiàng)的占比等,進(jìn)行大數(shù)據(jù)分析建模。進(jìn)而將各個(gè)維度的數(shù)據(jù)輸入到Hadoop的MapReduce框架中,在計(jì)算模型中進(jìn)行分析計(jì)算,最后得到分析結(jié)果。多維分析過(guò)程如圖1所示。
如上表所示,基于大數(shù)據(jù)分析的油氣生產(chǎn)設(shè)備故障分析統(tǒng)計(jì)過(guò)程是從油氣生產(chǎn)中產(chǎn)生的多維數(shù)據(jù)(故障相關(guān)、設(shè)備相關(guān)、環(huán)境相關(guān)、操作相關(guān))中獲取在任意時(shí)間間隔內(nèi)的某項(xiàng)故障相關(guān)的統(tǒng)計(jì)結(jié)果。其統(tǒng)計(jì)數(shù)據(jù)源是多維數(shù)據(jù)按一定規(guī)則的組合,同時(shí)獲得相應(yīng)的不同維度的統(tǒng)計(jì)結(jié)果。
下面以例子說(shuō)明分析全過(guò)程。
向MapReduce庫(kù)輸入單個(gè)設(shè)備編號(hào)參數(shù)、時(shí)間區(qū)段參數(shù),向Job Tracker提交統(tǒng)計(jì)任務(wù),MapReduce庫(kù)將設(shè)備故障記錄庫(kù)中的數(shù)據(jù)分為m個(gè)分塊。Map Tracker讀取分塊中的設(shè)備故障記錄,作為map函數(shù)輸入,map函數(shù)按設(shè)備編號(hào)和時(shí)間區(qū)段參數(shù),將該分塊內(nèi)符合條件的設(shè)備故障記錄統(tǒng)計(jì)出來(lái),結(jié)果保存在中間鍵值對(duì)中。Reduce Tracker讀取所有Map Tracker產(chǎn)生的中間鍵值對(duì),將其歸并為一組統(tǒng)計(jì)記錄,從而得到單位時(shí)間內(nèi)指定設(shè)備的故障率,或指定時(shí)間范圍內(nèi)該設(shè)備故障次數(shù)變化趨勢(shì)等信息。
進(jìn)一步,當(dāng)輸入?yún)?shù)為設(shè)備型號(hào)、時(shí)間區(qū)段時(shí),Map Tracker調(diào)用map函數(shù),將分塊文件中的屬于該設(shè)備型號(hào)的所有設(shè)備列出,結(jié)果保存為中間鍵值對(duì),作為下一級(jí)MapReduce過(guò)程的map函數(shù)輸入,在下一級(jí)的MapReduce過(guò)程中,再使用上例中的過(guò)程,過(guò)濾不同編號(hào)設(shè)備在指定時(shí)間段內(nèi)的故障記錄并歸并出相關(guān)統(tǒng)計(jì)信息。整個(gè)過(guò)程如圖2所示。
多維分析數(shù)據(jù)來(lái)源正是應(yīng)用上述MapReduce過(guò)程或多次MapReduce過(guò)程的迭代,得到最終分析結(jié)果。多維數(shù)據(jù)的故障率分析方法,解決了傳統(tǒng)單一數(shù)據(jù)對(duì)比未考慮實(shí)際運(yùn)行環(huán)境、運(yùn)行負(fù)荷、日常維護(hù)頻度等方面的因素,通過(guò)組合計(jì)算達(dá)到分析結(jié)果更全面完整的目的,為設(shè)備管理、設(shè)備采購(gòu)、巡檢維修等日常管理工作提供更準(zhǔn)確的決策輔助。
4 設(shè)備故障預(yù)測(cè)分析
獲得設(shè)備綜合故障率結(jié)果后,可進(jìn)一步實(shí)現(xiàn)設(shè)備的故障預(yù)測(cè)。對(duì)于井口裝置、閥門(mén)等控制設(shè)備的常規(guī)維護(hù)手段多為定期檢修或故障后維修,存在“過(guò)修”和“失修”現(xiàn)象,造成生產(chǎn)設(shè)備損耗和停產(chǎn)減產(chǎn)風(fēng)險(xiǎn)。通過(guò)設(shè)備的故障預(yù)測(cè)預(yù)警,在設(shè)備正常運(yùn)轉(zhuǎn)條件下,能夠分析出潛在故障及原因、實(shí)現(xiàn)預(yù)知性維修,將能有效減少維修成本、降低非計(jì)劃停工風(fēng)險(xiǎn)。
對(duì)設(shè)備的故障預(yù)測(cè)預(yù)警,通過(guò)現(xiàn)場(chǎng)數(shù)據(jù)采集→數(shù)據(jù)傳輸→HDFS的數(shù)據(jù)存儲(chǔ)→對(duì)運(yùn)行狀態(tài)與故障模型進(jìn)行并行計(jì)算大數(shù)據(jù)分析→設(shè)備的故障預(yù)測(cè)幾個(gè)步驟實(shí)現(xiàn),如圖3所示。
通過(guò)現(xiàn)場(chǎng)的各類傳感器,將重點(diǎn)設(shè)備的關(guān)鍵參數(shù)進(jìn)行實(shí)時(shí)采集和傳輸,通過(guò)RTU或者DCS等設(shè)備,傳輸?shù)紿adoop的HDFS分布式文件系統(tǒng)中,按照流文件格式進(jìn)行存儲(chǔ)。
設(shè)計(jì)MapReduce的設(shè)備故障預(yù)測(cè)模型,將幾個(gè)采集上來(lái)的維度數(shù)據(jù)進(jìn)行并行計(jì)算分析,分析算法可以Java程序方式實(shí)現(xiàn)基本的Map函數(shù)和Reduce函數(shù)。
(1)MapReduce庫(kù)先把預(yù)測(cè)算法程序的輸入文件劃分為M份(M為用戶定義),每一份通常有16MB到64MB;然后使用fork將用戶進(jìn)程拷貝到集群內(nèi)其他機(jī)器上。
(2)被分配了Map作業(yè)的Task Tracker,開(kāi)始讀取對(duì)應(yīng)分片的輸入數(shù)據(jù),包括此重點(diǎn)設(shè)備的振動(dòng)、位移、溫度等各個(gè)維度的數(shù)據(jù)。
(3)接著進(jìn)行Reduce作業(yè)。
(4)當(dāng)所有的Map和Reduce作業(yè)都完成了,MapReduce函數(shù)調(diào)用返回預(yù)測(cè)模型程序的代碼。
通過(guò)以上方式,實(shí)時(shí)獲取設(shè)備的振動(dòng)、溫度、壓力、流量等數(shù)據(jù),同時(shí)將數(shù)據(jù)輸入到Hadoop故障預(yù)測(cè)模型進(jìn)行實(shí)時(shí)分析比對(duì),一旦比對(duì)類似,則可預(yù)測(cè)故障的近似發(fā)生時(shí)間,從而合理安排預(yù)防性維護(hù),從而保證了設(shè)備維護(hù)更有針對(duì)性。
5 結(jié) 論
本文通過(guò)將與油氣生產(chǎn)設(shè)備故障相關(guān)的工況數(shù)據(jù)、故障數(shù)據(jù)、維修保養(yǎng)等操作數(shù)據(jù),作為多維數(shù)據(jù)源進(jìn)行組合,輸入到Hadoop大數(shù)據(jù)分析模型中,利用Hadoop的并行處理優(yōu)勢(shì)解決油氣生產(chǎn)設(shè)備運(yùn)行環(huán)境復(fù)雜、實(shí)時(shí)數(shù)據(jù)量大、影響因素眾多的故障分析難點(diǎn),為設(shè)備的優(yōu)化采購(gòu)提供依據(jù);同時(shí)將故障分析結(jié)果進(jìn)一步導(dǎo)入到故障預(yù)測(cè)中,也為預(yù)防性維修維護(hù)提供決策參考,提升油氣生產(chǎn)運(yùn)行安全和綜合運(yùn)營(yíng)效益。
參考文獻(xiàn):
[1]趙慶周,李勇,田世明.基于智能配電網(wǎng)大數(shù)據(jù)分析的狀態(tài)監(jiān)測(cè)與故障處理方法[J].電網(wǎng)技術(shù),2016(3):774-780.
[2]檀朝東,陳見(jiàn)成,劉志海.大數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用前景展望[J].中國(guó)石油和化工,2015(1):49-51.
[3]李金諾.淺談石油行業(yè)大數(shù)據(jù)的發(fā)展趨勢(shì)[J].價(jià)值工程,2013(29):172-174.
[4]張春生,郭長(zhǎng)杰,尹兆濤.大數(shù)據(jù)分析在油氣行業(yè)的應(yīng)用研究[J].微型電腦應(yīng)用,2016,32(7):64-67.
[5]劉剛.Hadoop應(yīng)用開(kāi)發(fā)技術(shù)詳解[M].北京:機(jī)械工業(yè)出版社,2014.