徐 丹,王言國,李 楓
(南京南瑞繼保電氣有限公司,江蘇省南京市 211102)
水力發(fā)電廠建立了大量的監(jiān)控、監(jiān)測和管理系統(tǒng)來滿足日常運行工作需要和解決特定的管理問題。這些系統(tǒng)功能各有側重,管理的信息既有交集,也存在差異和互補的內容。由于建設時間、供應商和采用技術的不同,各系統(tǒng)的信息描述、數據含義等自成體系,雖然系統(tǒng)之間也有一些點對點的數據交互,但總體上形成了信息單獨存放、共享困難、難以綜合分析利用的信息孤島。
隨著水電廠的發(fā)展和管理要求的提高,各個專業(yè)應用之間、水電廠和上級管理部門之間的信息共享和協(xié)作要求越來越高。當前各業(yè)務系統(tǒng)的信息孤島形態(tài)使得數據難以得到綜合利用,無法為多業(yè)務系統(tǒng)數據協(xié)同分析提供支持,也無法為現(xiàn)場一線技術人員提供業(yè)務優(yōu)化的平臺。
計算機領域虛擬化和大數據平臺技術的不斷成熟,為各行各業(yè)數據集成項目提供了技術支撐。虛擬化技術很好地解決了大規(guī)模系統(tǒng)占用機房物理空間問題,并給硬件設備集中運維和服務器動態(tài)遷移等帶來了革命性的改變[1]。大數據平臺滿足了傳統(tǒng)技術無法處理的半結構化和結構化數據,并為后期海量數據的實時分析處理提供了強大的支撐,使得數據中心業(yè)務涵蓋全業(yè)務數據領域[2]。
在此背景下,為適應水電廠運行精細化管理的要求,迫切需要一個能整合水電廠現(xiàn)有各業(yè)務系統(tǒng)的實時數據、歷史數據、圖形、文件等各種信息,滿足水電廠各級部門進行實時綜合監(jiān)視、高效應用分析、支撐各專業(yè)持續(xù)優(yōu)化改進的水電廠一體化數據中心[3][4][5]。
水電站根據總裝機容量有小、中、大之分,水電站與梯級調度、公司級調度職能又不相同,因此水電數據中心建設方案不能一概而論,需要針對不同應用場景具體分析,設計符合實際情況的方案。本文設計了兩種建設模式,既可滿足需要自行數據集成分析的大型水電站要求,又可適應涵蓋中小水電站的區(qū)域集控、梯級調度和公司級數據中心數據匯總要求。
本模式適用于大型水電廠數據中心建設。大型水電廠擁有龐大的生產設備,并分期建設了大量的監(jiān)控、監(jiān)視、分析和管理系統(tǒng)。需要建設一個數據中心來打通相互獨立系統(tǒng)間的數據壁壘,使得不同系統(tǒng)間數據可以共享,協(xié)作完成某些特定的應用分析,評估生產設備的健康狀況,降低全設備維修檢查的工作量。詳細的配置圖如圖1所示。
圖1 大型水電廠數據中心配置圖Fig.1 Configuration diagram of data center for large hydropower plant
數據中心采用目前主流的虛擬化技術,以增加每臺服務器的硬件投入,換取機房物理空間的占用量。同時,虛擬化軟件對所有硬件資源進行統(tǒng)一管理,一體化運維,降低了硬件維護的復雜度。虛擬化的快速部署和動態(tài)遷移技術又為系統(tǒng)帶來了可靠性保證,虛擬機可便捷地將整個系統(tǒng)(包括虛擬硬件、操作系統(tǒng)和配置好的應用程序)在不停機情況下遷移到不同的物理服務器上。
數據中心的數據來源廣泛,有多種組織形態(tài):結構化、半結構化、非結構化等,因此引入混合存儲的方式進行數據存儲?;旌洗鎯Π募掌鳌r序數據庫、關系數據庫和Hadoop數據庫,對上提供統(tǒng)一的封裝接口,做到應用透明;對下根據具體的數據和應用類型,存儲到合適的數據庫中。針對秒級結構化的數據存儲到關系數據庫,便于實時交互的統(tǒng)計查詢;毫秒級的結構化數據存儲到時序數據庫,滿足高并發(fā)大數據量的實時寫入;針對海量結構化和非結構化數據,存入Hadoop平臺,后期做離線分析和數據挖掘使用;文件類的數據存入文件服務器,方便后期快速檢索和獲取。混合存儲平臺中的組件可以根據需要任意組合,方便靈活。
整套系統(tǒng)推薦在Ⅲ區(qū)建設,Ⅰ區(qū)和Ⅱ區(qū)只需部署采集服務器轉發(fā)和緩存采集數據即可。但也有應用場景想把Ⅰ區(qū)、Ⅱ區(qū)的核心數據匯總后先進性分析,方便在Ⅰ區(qū)、Ⅱ區(qū)查看分析結構,再將最終結果轉存到Ⅲ區(qū)數據中心。此時就需要在Ⅱ區(qū)建一個小型的數據中心,保存Ⅰ區(qū)、Ⅱ區(qū)的系統(tǒng)采集數據,并疊加相關的分析應用對數據進行加工處理。Ⅱ區(qū)數據中心單向將數據同步到Ⅲ區(qū)數據中心。
Ⅰ區(qū)、Ⅱ區(qū)和Ⅲ區(qū)之間都通過正反向隔離裝置進行物理隔離,Ⅰ區(qū)、Ⅱ區(qū)數據通過正向隔離裝置單向將數據傳送到Ⅲ區(qū);Ⅲ區(qū)數據只能序列化到文件,放到指定目錄,由反向隔離裝置轉換后傳輸到Ⅰ區(qū)和Ⅱ區(qū)的指定目錄。Ⅰ區(qū)和Ⅱ區(qū)之間通過防火墻隔離,Ⅰ區(qū)的安全級別更高,數據一般都是從Ⅰ區(qū)發(fā)往Ⅱ區(qū),或是Ⅰ區(qū)直接訪問調用Ⅱ區(qū)的數據。
水電廠數據中心最后經過防火墻和窄帶網絡將部分數據上送到區(qū)域和公司級數據中心,以供上級系統(tǒng)做進一步分析和考核。上送的數據可根據用戶需求定制,按需上送,節(jié)省網絡帶寬資源。
本模式適用于水電站集控和公司級數據中心建設。同模式1一樣,采用虛擬化技術降低機房物理空間占用率和提高系統(tǒng)整體冗余性,并通過混合存儲方式來處理多樣性的數據。整個模式遵循安全防護規(guī)定的Ⅰ區(qū)、Ⅱ區(qū)、Ⅲ區(qū)隔離要求。具體配置圖如圖2所示。
本方案的特點在于Ⅲ區(qū)數據中心需要部署前置服務器和前置網,采集下游各個水電廠數據中心上送的數據,存放到集控或公司級數據中心。向下采集的方式可以有兩種,一種是集控或公司級數據中心主動發(fā)送報文請求召喚相關數據;另一種是水電廠數據中心根據規(guī)定,主動上送特定的數據到集控或公司級數據中心。
圖2 水電集控和公司級數據中心配置圖Fig.2 Configuration of hydropower centralized control station and company data center
由于水電集控或公司級下屬的很多水電站都是中小型水電站,數據量小且資金預算不足,沒有建設數據中心的必要。因此根據實際需要,可在Ⅰ區(qū)、Ⅱ區(qū)選配一個集控系統(tǒng),負責采集沒有數據中心的中小型水電廠上送的數據,并將數據匯總后轉發(fā)到三區(qū)的數據中心統(tǒng)一存儲。Ⅰ區(qū)、Ⅱ區(qū)集控系統(tǒng)并不是必須,當沒有下游中小型水電站數據需要采集時,可以在Ⅰ區(qū)、Ⅱ區(qū)各放置一臺采集服務器,負責將集控或公司級Ⅰ區(qū)、二區(qū)系統(tǒng)的數據緩存和轉發(fā)到Ⅲ區(qū)數據中心。
水電集控和公司級數據中心多一個DMZ(Demilitarized Zone)區(qū),該區(qū)主要提供外網Web和手機App訪問。Ⅲ區(qū)和DMZ區(qū)通過防火墻隔離,Ⅲ區(qū)的數據中心將需要外網訪問的歷史數據同步到DMZ區(qū)的歷史數據庫中,供DMZ區(qū)Web和手機App訪問。有的設計方案為了節(jié)約成本,讓DMZ區(qū)應用直接訪問Ⅲ區(qū)的數據中心數據,該方案無法滿足安全防護的等保測評要求,將給三區(qū)數據中心帶來隱含。
本文介紹的水電數據中心融入了眾多自主知識產權的關鍵技術,形成了一個既通用、開放,又完善、高效的解決方案,具體軟件架構圖如圖3所示。
整個軟件架構推薦部署在虛擬化云平臺上,將硬件設備的CPU、內存、磁盤和交換機虛擬化為一個資源池,按需分配,充分利用硬件資源,并很好地發(fā)揮了虛擬化云平臺快速部署和動態(tài)遷移等優(yōu)勢,增強整套系統(tǒng)的可靠性。
圖3中最左側數據源端的應用系統(tǒng)數據,部分數據通過數據獲取層中的抽取模塊進入消息總線和數據緩沖區(qū),另一部分數據通過應用導出的方式,進入數據獲取層的文件獲取模塊。消息總線、數據緩沖區(qū)和文件隊列中的數據經過數據存儲層解析后存入混合存儲平臺對應的數據庫中。數據存儲層中具有通過統(tǒng)一建模工具建的全景數據模型,各個應用系統(tǒng)的每一個設備在全景模型中具有唯一標識。數據存儲層是整個數據中心的核心,匯聚了所有應用系統(tǒng)的模型和數據,有些經過初加工生成報表。有些數據經過智能算法的分析,挖掘出關聯(lián)規(guī)則,形成設備健康評估報告等,反過來指導生產決策。
架構的最上層是元數據信息庫,保存了整個數據中心的元數據單元,包括技術元數據和業(yè)務元數據,是后面建模和數據存儲的基礎,并加入了安全信息單元,滿足越來越嚴格的安防要求。
元數據信息庫下層是數據校驗信息庫,該庫中保存了各種校驗規(guī)則,通過校驗規(guī)則的組合生成新的規(guī)則,并可通過校驗生成結果報告,供上層使用者參考。
圖3 水電數據中心軟件架構圖Fig.3 Software architecture diagram of hydropower data center
由于數據中心復雜的功能結構,后期運維一直是數據中心的痛點。南瑞繼保水電數據中心提供了完善的系統(tǒng)運維工具,包括集建模、數據編輯和統(tǒng)計分析為一體的統(tǒng)一運維平臺、供系統(tǒng)整體災備和災后恢復的備份還原工具、對各種分散系統(tǒng)資源集中監(jiān)視的資源監(jiān)視平臺等。借助這些工具,運維人員可以快速地掌握數據中心的日常運維工作。
云平臺的虛擬化和動態(tài)遷移屬性要求應用系統(tǒng)可以根據需要靈活分布在指定計算機節(jié)點上。分布式系統(tǒng)需要強大的網絡中間件支撐,本方案水電數據中心網絡中間件屏蔽網絡通信的細節(jié),為系統(tǒng)內的所有應用提供統(tǒng)一的透明的靈活易用的網絡支撐平臺,實現(xiàn)實時、高效、可靠的數據傳輸。網絡中間件能夠在運行于冗余配置的網絡之上的程序間形成快速、精確的連接,而不管程序所在的位置。當由于系統(tǒng)故障切換或網絡問題發(fā)生通信故障時,網絡中間件能夠通過其他可選的網絡路徑快速重新建立連接。另外,依據全國電力二次系統(tǒng)安全防護總體框架的“三層四安全區(qū)”,采取整體規(guī)劃設計,保證了電網運行的安全可靠。
一個完整的應用功能在計算機中由多個進程(任務)和實時數據庫組成。分布式系統(tǒng)中完整的應用功能可以被分配到網絡上任意一臺節(jié)點中運行,不管應用功能分布在哪個節(jié)點上,用戶通過外部接口和界面訪問分布式系統(tǒng)都是一樣的,做到對上層使用者透明。靈活的分布式架構設計突破了以往主備服務器概念,按應用特點進行分布,實現(xiàn)了一主多熱備,提高了系統(tǒng)可靠性,同時廣泛適應不同類型的應用需求,提高集成系統(tǒng)整體運行效率。
數據中心分布在各個節(jié)點的實時數據庫通過和值班機進行版本校核保證數據一致性,徹底解決了分布式系統(tǒng)數據不一致問題。具體而言,實時數據庫的一致性處理分兩個階段:數據庫啟動時和運行過程中。啟動時采用文件同步方式,根據版本對不一致的分區(qū)實施一致性處理;運行過程中的同步問題發(fā)生在更新操作后,更新操作先對主本進行,發(fā)出同步事件,各復本的數據庫服務器接受并處理同步事件,完成數據的一致性處理。分布式系統(tǒng)支持服務器/客戶端訪問模式,避免了傳統(tǒng)分布式系統(tǒng)需要把數據庫分布到所有節(jié)點造成的同步負載過高的問題。分布式客戶端節(jié)點優(yōu)先訪問本機資源,當本機沒有應用時自動連接負載較輕的服務器節(jié)點。靈活分布式系統(tǒng)架構可以滿足系統(tǒng)集成規(guī)模不斷擴大的需要,獨立子系統(tǒng)構成集群運行,同時保證共享信息的同步效率。
水電數據中心實時數據庫是一個面向對象的分布式實時數據庫產品。它采用面向對象的數據模型,支持類之間的繼承、聚集關系以及對象標識等面向對象的特性,能夠構造復雜的結構模型,支持用戶自定義數據類型和方法。面向對象的數據模型,不僅易于描述水電相關系統(tǒng)及其拓撲關系,更能直接定義類結構,不需要任何映射,是最容易接納標準,并適應其版本變化的數據模型。采用面向對象模型可以免去模型轉換和數據映射的麻煩,既可以遵循國際標準,又能保持實時庫的高訪問效率。具有開放性和實時性的完美統(tǒng)一。
在面向對象數據模型中,每個對象都有一個在系統(tǒng)內唯一不變的標識符,稱為對象標識符,簡稱OID。OID的生成和管理既是面向對象數據庫不可缺少的重要組成部分,也是開放系統(tǒng)中數據交換的需要。對于實時應用,導航查詢占查詢的主要部分,必須保證OID 定位到相應的對象的速度。實時數據庫的OID采用物理對象標識符與邏輯對象標識符相結合的表示方法,OID結構及其索引是高效的對象訪問基礎。
采用面向對象的數據模型,為實時數據庫實現(xiàn)可擴展性提供了堅實的基礎。實時數據庫允許應用利用模式定義工具自定義數據類型,具體有結構類型、數組類型和枚舉類型。
實時數據庫支持不同程序對數據庫內的同一數據集進行并發(fā)訪問。其中與數據庫的連接對應用而言是透明的,應用通過連接管理可以與分布于系統(tǒng)中任何結點的數據庫建立連接,從而實現(xiàn)了對數據庫的透明訪問。并采用先進的連接池技術對連接進行動態(tài)管理,實現(xiàn)了數據庫連接的復用,大大降低系統(tǒng)的開銷。在數據庫服務器故障情況下,系統(tǒng)將根據連接分發(fā)策略自動重連到負載較輕的服務器;一旦本地服務器恢復可用,連接又將轉至本地,保持高的數據訪問速度。在以上技術的支撐下,單個實時庫的數據處理能力達到100萬條每秒,通過分布式擴展方式,最多可支持1000萬條/s。
水電數據中心中需要存儲的類型包括標準化編碼后的全景模型數據、各業(yè)務系統(tǒng)抽取的結構化低頻數據(秒和分鐘級數據)、業(yè)務系統(tǒng)直接轉發(fā)的結構化高頻數據(毫秒級數據)、經過統(tǒng)計分析后結果數據、視頻和文件等非結構化數據。水電數據中心綜合考慮各種數據類型的特性和數據量,設計了數據混合存儲框架,用于滿足不同業(yè)務數據的存儲要求,如圖4所示。
元數據和模型數據相對穩(wěn)定,后期數據增、刪、改等操作較少,且沒有實時更新和改寫的要求,但是對數據的可靠性要求較高,數據都是結構化類型,因此傳統(tǒng)的關系型數據庫更適合,能滿足性能和可靠性要求。
各業(yè)務系統(tǒng)抽取的生產數據,變化大、實時性要求高(秒級和分鐘級),且隨著業(yè)務發(fā)生量的不斷增加而增大。用戶需要實時的對這部分數據進行交互查詢和統(tǒng)計分析,因此數據處理的響應時間需要在秒級以內,在數據量不超過PB級別的情況下,傳統(tǒng)關系型數據庫集群就可以滿足存儲和查詢要求;但如果數據量增長到PB級以上時,關系型數據庫就有些力不從心了,需要引入大數據平臺技術來解決海量數據的存儲、查詢、統(tǒng)計和分析等工作。
特殊業(yè)務系統(tǒng)的毫秒級采樣數據結構簡單,對精度和速度的要求非常高,關系數據庫和大數據平臺無法支持如此高頻的數據插入,需引入時間序列數據庫針對性處理。時間序列數據庫省去了關系庫的復雜校驗和關聯(lián)性檢查,大大縮短了具有時間序列數據的處理時間,且通過壓縮技術降低了所需的存儲空間。
對于文件和視頻類非結構化數據,例如序列化記錄文件、報表、報告、結算單等,文件數量巨大,需要引入Redis等高速緩存數據庫來解決數據量大、實時性強的數據文件檢索功能,通過將索引信息存儲在高速緩存中,通過索引快速定位文件存儲路徑,從而達到快速獲取文件的要求。
圖4 混合存儲平臺數據類型圖Fig.4 Data type diagram of mixed storage platform
每種數據庫都有各自的特性和適用范圍,對于水電數據中心這類數據類型復雜的系統(tǒng),沒有哪種數據庫可以通吃,因此我們設計了混合存儲平臺,時序庫、關系庫、大數據平臺、文件服務器等組件可以通過自由組合的方式,部署所需的組件,滿足水電各類數據中心的建設要求。
水電廠數據中心以統(tǒng)一的方式全面采集各類業(yè)務數據,為各類應用提供信息支撐。以靈活的分布式數據采集技術實現(xiàn)全廠監(jiān)控信息、二次設備運行信息、電能計量等的采集與交換,通過統(tǒng)一的服務總線為上層應用提供數據支撐。
水電廠數據中心前置采集采用分布式擴展設計,可以根據數據特點和規(guī)模為第三方系統(tǒng)接入建立獨立前置采集應用,采集進程啟動時傳入第三方系統(tǒng)應用名稱。前置與第三方接入應用采用多對多設計,例如:一套振擺在線監(jiān)測系統(tǒng)應用,可以部署兩個數據中心前置應用,提高處理效率;也可以用兩個前置應用,對應兩套振擺在線監(jiān)測系統(tǒng)應用。靈活分布式采集,可以有效解決跨安全區(qū)采集和不同通道性質的數據統(tǒng)一采集問題。
水電數據中心支持CDT、IEC60870、TASE.2、Modbus TCP等各類通信規(guī)約庫,并可以根據需求進行自定義擴充。添加新的規(guī)約插件不需要修改原有程序架構,只需開發(fā)新的規(guī)約插件庫即可,新的規(guī)約插件即插即用。
水電廠運行駕駛艙是數據中心的人機交互層,以水電廠關鍵運行指標為主線,依托數據中心匯集和萃取的各類運行信息,綜合運用大數據分析、機器學習、態(tài)勢感知等技術,提供面向用戶的指標監(jiān)視、預警、信息挖掘、決策分析和控制功能,為運維人員駕馭電廠提供一個綜合、直觀、閉環(huán)的友好環(huán)境。
水電數據中心運行駕駛艙提供統(tǒng)一的展示層,對外提供展示服務,可以支持桌面終端、移動終端和Web終端的瀏覽,方便用戶進行跨終端監(jiān)視。水電廠內現(xiàn)有系統(tǒng)眾多,數據中心也相應集成了多種類型的數據,對于不同的數據,駕駛艙采用曲線、表格、儀表盤、水位計、餅圖、棒圖等多種展示方式,并結合報表進行數據的統(tǒng)計、查詢和可視化展示。
運行駕駛艙圍繞電廠關鍵指標,能夠直觀反映電廠運行各環(huán)節(jié)的狀態(tài),支持領導管理決策,提升關鍵運行崗位人員監(jiān)視與控制的效率,增強管理者的態(tài)勢感知能力,并提供輔助決策。廠內關鍵指標的制定遵循統(tǒng)一的運行指標體系,提供指標管理、監(jiān)視及預警功能,其展示采用智能告警和可視化結合的方式,方便用戶快速、有效定位異常、輔助決策、控制。通過對關鍵指標的監(jiān)視能夠實時反映電廠運行中的隱患或異常,支持快速定位具體的異常指標,并通過自動或手動方式觸發(fā)預定義的輔助分析決策功能,為用戶及時干預系統(tǒng)運行提供決策依據。
水電數據中心通過全廠數據整合,實現(xiàn)了物理設備的模型化、數字化,為電廠運行人員提供了數據共享、知識流動的平臺,完善了綜合運用數據提升工作效率的機制。通過多個系統(tǒng)的數據綜合分析,從而解決單系統(tǒng)分析無法完成的任務,借助數據中心將優(yōu)秀技術人員的經驗固化為數據中心的專家?guī)?,從而提升全廠人員水平,實現(xiàn)全員高效。
以抽水蓄能電站靜止變頻器(SFC)的綜合分析為例:SFC啟動機組時,首先要準確檢測發(fā)電電動機的初始轉子位置,從而為SFC輸出初始啟動力矩提供大小及方向依據。SFC進行轉子初始位置檢測時,通過機組勵磁系統(tǒng)控制轉子電壓突變,根據電磁感應原理,電機定子將感應三相電壓,SFC根據該電壓信號計算轉子靜止時的位置。而SFC設備運行中,因為轉子初始位置檢測不準確引起的啟動失敗時有發(fā)生,卻缺乏有效的監(jiān)測和分析手段。
SFC設備轉子位置檢測算法依賴監(jiān)控、勵磁及SFC設備之間的時間配合,來進行轉子位置檢測時的啟動檢測、施加勵磁階躍、開啟感應電壓采集窗口及轉子位置計算等。當初始啟動階段發(fā)生啟動失敗時,由于SFC及勵磁設備錄波及事件記錄配置不完善、各系統(tǒng)相互獨立,加上各系統(tǒng)不在同一時標下,無法對各系統(tǒng)的行為時序進行比對,難以快速實現(xiàn)故障分析及定位。
水電數據中心集成了包括SFC本體、各機組勵磁、監(jiān)控系統(tǒng)(包括同期)故障前后的運行信息,統(tǒng)一時標,能快速明確故障發(fā)生時的各系統(tǒng)時序是否正常,實現(xiàn)故障原因快速定位。日常運行中也可以對多次轉子位置檢測時各系統(tǒng)的時序及時間差進行比對,實現(xiàn)對信號繼電器、勵磁電流反饋回路及勵磁電流上升情況、感應電壓情況的監(jiān)測。如圖5所示,將啟動令、勵磁狀態(tài)、勵磁電流給定指令、勵磁電流測量反饋及機端感應電壓等與轉子初始位置檢測相關信息集中收集、統(tǒng)一時標,以實現(xiàn)故障時快速定位問題原因。
圖5 SFC綜合信息展示圖Fig.5 SFC comprehensive information display
本文結合水電站數據集成的應用背景,提出了基于云平臺的水電數據中心總體架構和技術方案,可經濟、有效地整合水電廠各類業(yè)務系統(tǒng)數據,通過云平臺、大數據、人工智能、數據建模、駕駛艙等技術提供標準化、開放性的智能應用開發(fā)平臺?;谝陨霞夹g方案研制了南瑞繼保水電數據中心產品,將為“智能電廠”“智慧電廠”建設提供數據基礎,通過數據驅動電廠運行和管理水平提升,具有良好應用前景。