国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Hadoop的電力運(yùn)維審計(jì)系統(tǒng)的設(shè)計(jì)

2020-02-08 02:34:22蘇林萍崔文超張曉良
關(guān)鍵詞:主從運(yùn)維分布式

蘇林萍,安 然,李 為,崔文超,張曉良

(華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院,北京 102206)

0 引 言

隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,國家電網(wǎng)公司對運(yùn)維過程信息化的需求日益增大,運(yùn)維審計(jì)系統(tǒng)擁有越來越重要的地位。但由于目前單機(jī)運(yùn)維審計(jì)系統(tǒng)與其他業(yè)務(wù)系統(tǒng)的交互不斷增加從而產(chǎn)生了海量數(shù)據(jù),面臨的風(fēng)險也越來越高[1]。面對系統(tǒng)所產(chǎn)生的海量數(shù)據(jù)造成系統(tǒng)性能下降,存儲在單個服務(wù)器上顯然不能滿足需求,分布式存儲方式則能解決數(shù)據(jù)存儲分析困難的問題。若服務(wù)器的某個硬件或者軟件發(fā)生故障時,運(yùn)維審計(jì)系統(tǒng)將可能出現(xiàn)服務(wù)中斷、系統(tǒng)癱瘓等現(xiàn)象,對電網(wǎng)造成一定的損失,因此可靠性和穩(wěn)定性的提升是運(yùn)維審計(jì)系統(tǒng)亟需解決的難題。基于Hadoop的處理方法可以對數(shù)據(jù)進(jìn)行分布式管理,將負(fù)載分散到若干個工作節(jié)點(diǎn)上,從而提升系統(tǒng)整體性能。Heartbeat心跳檢測技術(shù)可以有效地避免單一管理節(jié)點(diǎn)崩潰所帶來的一系列問題,從而保障電網(wǎng)運(yùn)維審計(jì)系統(tǒng)安全可靠地運(yùn)行。

1 可行性分析

運(yùn)維審計(jì)系統(tǒng)數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)規(guī)模大、數(shù)據(jù)類型復(fù)雜,且數(shù)據(jù)是由分布在不同區(qū)域的設(shè)備上產(chǎn)生的,需要進(jìn)行分布式管理。Hadoop是一個開源架構(gòu),具有數(shù)據(jù)處理量大、可靠性高等優(yōu)勢,適用于運(yùn)維審計(jì)系統(tǒng)[2]。造成系統(tǒng)故障的原因主要有3種:首先是軟件運(yùn)行故障,其次是硬件運(yùn)行故障,最后是網(wǎng)絡(luò)環(huán)境或機(jī)房環(huán)境所引發(fā)的故障。由于在管理節(jié)點(diǎn)主從切換前后狀態(tài)下,軟件運(yùn)行故障和硬件運(yùn)行故障沒有關(guān)聯(lián),為了有效地避免這2種故障的發(fā)生,采用Heartbeat心跳檢測技術(shù)是完全可行的。網(wǎng)絡(luò)環(huán)境或機(jī)房環(huán)境所引發(fā)的故障在管理節(jié)點(diǎn)主從切換前后是具有一定相關(guān)性的,因此需要通過定量分析來證明Heartbeat心跳檢測技術(shù)對此故障能否有效地解決。

2 系統(tǒng)設(shè)計(jì)

本運(yùn)維審計(jì)系統(tǒng)的架構(gòu)為B/S模式,圖1為系統(tǒng)的架構(gòu)示意圖。系統(tǒng)主要設(shè)有2個管理節(jié)點(diǎn)和3個工作節(jié)點(diǎn),管理節(jié)點(diǎn)通過Hadoop實(shí)現(xiàn)對3個工作節(jié)點(diǎn)的分布式管理,并采用Heartbeat心跳檢測技術(shù)來進(jìn)行服務(wù)監(jiān)測,主服務(wù)器通過發(fā)送實(shí)時的心跳包向從服務(wù)器報告工作狀態(tài),同時也會監(jiān)聽從服務(wù)器的心跳,判斷其是否出現(xiàn)異常[4]。用戶通過虛擬IP網(wǎng)址來對系統(tǒng)進(jìn)行訪問,正常情況下運(yùn)維審計(jì)系統(tǒng)管理節(jié)點(diǎn)服務(wù)是由主服務(wù)器提供的,從服務(wù)器處于備用狀態(tài),若主服務(wù)器出現(xiàn)異常狀況,則進(jìn)行主從切換,從服務(wù)器變?yōu)楣ぷ鳡顟B(tài)[5],以此來保證系統(tǒng)的穩(wěn)定性和可靠性。

此系統(tǒng)中,Hadoop用來實(shí)現(xiàn)管理節(jié)點(diǎn)對工作節(jié)點(diǎn)的分布式數(shù)據(jù)管理;Heartbeat用來提供心跳檢測機(jī)制、托管相關(guān)服務(wù)程序和提供虛擬IP;Tomcat用來提供Web服務(wù);MySQL用來作為數(shù)據(jù)庫管理系統(tǒng)。同時,系統(tǒng)使用一個監(jiān)控腳本對管理節(jié)點(diǎn)主服務(wù)器上的Tomcat和Proxy(運(yùn)維審計(jì)系統(tǒng)主要程序)服務(wù)進(jìn)行實(shí)時監(jiān)聽,判斷其是否正常工作,若出現(xiàn)故障,及時進(jìn)行故障轉(zhuǎn)移。

圖1 運(yùn)維審計(jì)系統(tǒng)架構(gòu)示意圖

其中,Hadoop為數(shù)據(jù)的分布式存儲提供支持,系統(tǒng)產(chǎn)生的數(shù)據(jù)將會被分為若干個小的數(shù)據(jù)塊存儲于每一個工作節(jié)點(diǎn)上,而管理節(jié)點(diǎn)將對這些工作節(jié)點(diǎn)進(jìn)行統(tǒng)一管理。在系統(tǒng)對數(shù)據(jù)進(jìn)行分析時,Hadoop會用Map任務(wù)和Reduce任務(wù)進(jìn)行更細(xì)致的拆分,其啟動、跟蹤和調(diào)度的過程是由工作節(jié)點(diǎn)上的JobTracker來執(zhí)行的[6]。Mapper部分負(fù)責(zé)把海量復(fù)雜的數(shù)據(jù)拆分成若干個任務(wù)來執(zhí)行。Reducer部分負(fù)責(zé)把Mapper部分得到的結(jié)果進(jìn)行歸納匯總整理[7]。

為了滿足運(yùn)維審計(jì)系統(tǒng)Heartbeat心跳檢測的需要,Heartbeat需要具有以下4個功能:1)狀態(tài)檢測功能,用于監(jiān)聽主從服務(wù)器節(jié)點(diǎn)的工作狀態(tài);2)內(nèi)部通信功能,用于規(guī)定主從服務(wù)器節(jié)點(diǎn)的通信規(guī)則;3)共同管理功能,用于管理主從服務(wù)器節(jié)點(diǎn)資源的關(guān)系;4)失效切換功能,用于實(shí)現(xiàn)主從服務(wù)器節(jié)點(diǎn)的主從切換[8]。

3 系統(tǒng)實(shí)現(xiàn)

系統(tǒng)實(shí)現(xiàn)過程按照自頂向下的思路,如圖1所示。為了避免管理節(jié)點(diǎn)單臺服務(wù)器出現(xiàn)故障造成無法訪問的情況,需要對用戶提供一個可訪問的虛擬IP地址,這個地址是由Heartbeat實(shí)現(xiàn)的。

圖2 系統(tǒng)模塊關(guān)系示意圖

如圖2所示,管理節(jié)點(diǎn)主從服務(wù)器用Heartbeat提供一個虛擬IP,正常情況下,主服務(wù)器上綁定該虛擬IP并向外提供服務(wù)。數(shù)據(jù)庫通過drbd來實(shí)現(xiàn)2臺服務(wù)器之間的數(shù)據(jù)同步,主服務(wù)器(Master)數(shù)據(jù)通過網(wǎng)絡(luò)數(shù)據(jù)鏈路實(shí)時同步到從服務(wù)器上(Slave)[9]。Tomcat和Proxy服務(wù)通過監(jiān)控腳本進(jìn)行實(shí)時監(jiān)控,若出現(xiàn)故障則由Heartbeat進(jìn)行主從切換,保證服務(wù)不中斷,系統(tǒng)長期穩(wěn)定運(yùn)行。

3.1 分布式數(shù)據(jù)存儲分析的實(shí)現(xiàn)

在對開源Hadoop分布式文件系統(tǒng)(HDFS)進(jìn)行測試的基礎(chǔ)上,傳統(tǒng)的存儲架構(gòu)不足以滿足系統(tǒng)對數(shù)據(jù)的高效存儲分析需求,因此對其架構(gòu)進(jìn)行了改進(jìn)。數(shù)據(jù)存儲模塊由存儲端、查詢端和訪問鏈路這3個部分組成。運(yùn)維審計(jì)系統(tǒng)實(shí)時產(chǎn)生的海量數(shù)據(jù)由存儲端完成,查詢端提供的是海量數(shù)據(jù)的查詢檢索功能。圖3為運(yùn)維審計(jì)系統(tǒng)設(shè)計(jì)的海量數(shù)據(jù)存儲結(jié)構(gòu)與數(shù)據(jù)訪問關(guān)系。

圖3 系統(tǒng)數(shù)據(jù)存儲結(jié)構(gòu)與數(shù)據(jù)訪問關(guān)系圖

3.2 心跳檢測與服務(wù)切換的實(shí)現(xiàn)

管理節(jié)點(diǎn)主從服務(wù)器安裝完Heartbeat后,需要配置相關(guān)配置文件。首先需要配置ha.cf文件,配置的內(nèi)容如表1所示。

表1 ha.cf文件配置內(nèi)容

配置內(nèi)容說明keepalive 2配置主從服務(wù)器的心跳頻率,2表示2 sdeadtime 15節(jié)點(diǎn)死亡時間,即當(dāng)超過15 s后從服務(wù)器未接收到主服務(wù)器心跳信息時,進(jìn)行主從切換操作ucast eth1用于指定心跳網(wǎng)卡,采用udp單播來通知心跳信息,eth1表示通過該網(wǎng)口進(jìn)行心跳的檢測auto_failback off當(dāng)主從切換后,主服務(wù)器復(fù)原是否進(jìn)行自動切回操作,off表示否node server_master主服務(wù)器名稱,與uname -n顯示必須一致,即server_master

Heartbeat有crc、md5和sha1這3種認(rèn)證方式[10],安全級別逐漸增高,對系統(tǒng)資源的使用也越來越多。authkeys文件對Heartbeat進(jìn)行相應(yīng)的授權(quán),由于運(yùn)維審計(jì)系統(tǒng)大多運(yùn)行在公司內(nèi)網(wǎng)中,主從服務(wù)器之間大多采用網(wǎng)線直連,安全性相對較高,因此采用的認(rèn)證方式為crc。

另外,還需要對Heartbeat接管的資源進(jìn)行配置,文件為haresources,配置的內(nèi)容如表2所示。

表2 haresources文件配置內(nèi)容

配置內(nèi)容說明server_master主服務(wù)器名稱,與uname -n顯示必須一致,即server_master10.0.0.1虛擬IP,對外提供訪問網(wǎng)址drbddisk::r0drbd掛載磁盤節(jié)點(diǎn)名,即r0tomcat proxy托管Tomcat和Proxy服務(wù),由Heartbeat負(fù)責(zé)進(jìn)行開啟和關(guān)閉

4 異常情況處理

基于Hadoop的分布式數(shù)據(jù)存儲和Heartbeat心跳檢測的運(yùn)維審計(jì)系統(tǒng)的工作情況主要分為以下3種:1)正常工作狀態(tài);2)管理節(jié)點(diǎn)主服務(wù)器發(fā)生異常,從服務(wù)器對外提供服務(wù);3)管理節(jié)點(diǎn)主服務(wù)器異?;謴?fù)后變?yōu)閺姆?wù)器[11]。

下面將針對不同情況分別進(jìn)行描述。

1)正常工作狀態(tài)。

正常工作情況下,管理節(jié)點(diǎn)主服務(wù)器處于工作狀態(tài),從服務(wù)器處于待機(jī)狀態(tài)。虛擬IP綁定在主服務(wù)器上來提供對外訪問地址,通過主從服務(wù)器的心跳監(jiān)聽判斷是否進(jìn)行故障轉(zhuǎn)移。Tomcat和Proxy服務(wù)通過監(jiān)控腳本進(jìn)行實(shí)時監(jiān)控,若出現(xiàn)故障則由Heartbeat進(jìn)行主從切換,如圖4所示。

圖4 監(jiān)控腳本工作流程圖

2)管理節(jié)點(diǎn)主服務(wù)器發(fā)生異常,從服務(wù)器對外提供服務(wù)。

若主服務(wù)器出現(xiàn)軟件或者硬件故障無法提供服務(wù),導(dǎo)致2臺服務(wù)器無法監(jiān)聽到對方的心跳包,此時從服務(wù)器對虛擬IP進(jìn)行綁定,并啟動相關(guān)服務(wù)程序(Tomcat、Proxy)來提供對外服務(wù)。Web服務(wù)此時由從服務(wù)器上的Tomcat來提供。同時,監(jiān)控相關(guān)服務(wù)程序的腳本也會在從服務(wù)器上啟動,對服務(wù)進(jìn)行實(shí)時檢測,保證系統(tǒng)穩(wěn)定運(yùn)行。

3)管理節(jié)點(diǎn)主服務(wù)器異?;謴?fù)后變?yōu)閺姆?wù)器。

主服務(wù)器異?;謴?fù)之后自動啟動Heartbeat,把心跳信號發(fā)送給從服務(wù)器,此時主服務(wù)器就變成了從服務(wù)器,正在提供服務(wù)的從服務(wù)器變?yōu)橹鞣?wù)器,二者角色互換。數(shù)據(jù)依然通過網(wǎng)絡(luò)數(shù)據(jù)鏈路同步到共享存儲空間,保證運(yùn)維審計(jì)系統(tǒng)數(shù)據(jù)的完整性。

5 可用性與性能測試

運(yùn)維審計(jì)系統(tǒng)是否可用,主要是通過可靠性和可維護(hù)性這2個指標(biāo)來分析。在實(shí)際工程中,通常使用平均無故障工作時間(MTTF)來度量運(yùn)維審計(jì)系統(tǒng)的可靠性,使用平均修復(fù)時間(MTTR)來度量系統(tǒng)的可維護(hù)性,其中MTTF+MTTR被稱為平均失效時間(MTBF)[12]。

所以,運(yùn)維審計(jì)系統(tǒng)可用性的計(jì)算公式為:

實(shí)際測試結(jié)果如表3所示。

表3 單機(jī)和Hadoop集群的比較

系統(tǒng)MTTF/hMTTR/h可用性As/%單機(jī)5224891.579Hadoop集群19861/6099.999

從表3可以看出,基于Hadoop的分布式數(shù)據(jù)存儲和Heartbeat心跳檢測的運(yùn)維審計(jì)系統(tǒng)故障率大大降低,系統(tǒng)的可用性提高了8.42%。

為了表明Hadoop集群系統(tǒng)相比單機(jī)系統(tǒng)能夠提高系統(tǒng)的數(shù)據(jù)處理能力,本文在不同的并發(fā)用戶數(shù)量下,測試Hadoop集群系統(tǒng)和單機(jī)系統(tǒng)的性能情況,實(shí)驗(yàn)結(jié)果如圖5所示。

圖5 Hadoop集群和單機(jī)系統(tǒng)不同用戶數(shù)下的數(shù)據(jù)處理性能

根據(jù)以上實(shí)驗(yàn)發(fā)現(xiàn),單機(jī)系統(tǒng)在并發(fā)用戶數(shù)量大的情況下,數(shù)據(jù)的處理性能會有明顯的下降;而Hadoop集群在并發(fā)用戶數(shù)量大的情況下受到的影響較小,依然能保持高效的數(shù)據(jù)處理性能。

由此表明Hadoop集群系統(tǒng)能夠減小在并發(fā)用戶數(shù)增大過程中造成的系統(tǒng)性能的損失,同時提高系統(tǒng)可用性。

6 結(jié)束語

本運(yùn)維審計(jì)系統(tǒng)通過Hadoop實(shí)現(xiàn)了海量數(shù)據(jù)的分布式存儲與分析,使用Heartbeat軟件實(shí)現(xiàn)了2個管理節(jié)點(diǎn)之間的心跳檢測。本文設(shè)計(jì)的系統(tǒng)滿足國家電網(wǎng)公司對運(yùn)維審計(jì)系統(tǒng)穩(wěn)定性的需求,能夠在不影響系統(tǒng)性能的情況下處理大量數(shù)據(jù),確保系統(tǒng)高效、穩(wěn)定以及可靠地運(yùn)行,提供良好的用戶體驗(yàn)。

猜你喜歡
主從運(yùn)維分布式
運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
風(fēng)電運(yùn)維困局
能源(2018年8期)2018-09-21 07:57:24
FANUC系統(tǒng)PROFIBUS主從功能應(yīng)用
分布式光伏熱錢洶涌
能源(2017年10期)2017-12-20 05:54:07
雜亂無章的光伏運(yùn)維 百億市場如何成長
能源(2017年11期)2017-12-13 08:12:25
分布式光伏:爆發(fā)還是徘徊
能源(2017年5期)2017-07-06 09:25:54
基于ITIL的運(yùn)維管理創(chuàng)新實(shí)踐淺析
基于主從控制的微電網(wǎng)平滑切換控制策略研究
基于飛行試驗(yàn)數(shù)據(jù)的仿真模型主從一體化檢驗(yàn)
基于DDS的分布式三維協(xié)同仿真研究
凤凰县| 临泉县| 乌兰察布市| 双流县| 资中县| 永川市| 蒙山县| 土默特左旗| 特克斯县| 陇南市| 井冈山市| 阆中市| 丰原市| 昌图县| 凤台县| 吉安市| 上思县| 汝州市| 京山县| 马关县| 贵港市| 揭西县| 平利县| 临高县| 东山县| 永昌县| 高青县| 聂拉木县| 电白县| 平顺县| 和平区| 林周县| 瑞安市| 谷城县| 巧家县| 沁水县| 滁州市| 晋宁县| 澜沧| 绍兴县| 海伦市|