貴州電網(wǎng)有限責(zé)任公司信息中心 龍玉江 甘潤東 王 策 方心科技股份有限公司 劉 珺 粟海斌
隨著電力行業(yè)規(guī)模的不斷擴(kuò)大和電力市場的不斷變化,電力企業(yè)對電力系統(tǒng)的規(guī)劃、運(yùn)行、監(jiān)測和分析等方面的要求也越來越高。電力行業(yè)需要處理大量的實(shí)時數(shù)據(jù)和歷史數(shù)據(jù),并進(jìn)行大規(guī)模的計(jì)算來提高電力系統(tǒng)的效率和可靠性。然而,傳統(tǒng)的計(jì)算資源已不能滿足電力行業(yè)大規(guī)模計(jì)算的需求,超算系統(tǒng)的出現(xiàn)為電力行業(yè)提供了新的機(jī)會。面向電力行業(yè)的超算平臺構(gòu)建與應(yīng)用技術(shù)研究具有以下幾方面重要意義。
在電力行業(yè)中,對電力系統(tǒng)進(jìn)行仿真、預(yù)測和優(yōu)化需要大量的計(jì)算資源。超算平臺將大幅提升電力行業(yè)的計(jì)算效率,從而加快市場反應(yīng)速度,提高電力系統(tǒng)的效率。
電力系統(tǒng)的穩(wěn)定性和可靠性對于電力供應(yīng)的保障至關(guān)重要。超算系統(tǒng)能夠進(jìn)行精細(xì)耗時的模擬和穩(wěn)態(tài)分析,從而提高電力系統(tǒng)的可靠性,減少因電力系統(tǒng)故障引發(fā)的損失。
智能電網(wǎng)、智能電力調(diào)度是電力行業(yè)智能化發(fā)展的重要組成部分,而這些領(lǐng)域的計(jì)算需求量也會隨著技術(shù)和應(yīng)用模式的不斷拓展快速增長。超算平臺可以實(shí)現(xiàn)智能電網(wǎng)規(guī)劃和運(yùn)營方面的優(yōu)化和智能決策,實(shí)現(xiàn)電力系統(tǒng)的智能化發(fā)展。
電力行業(yè)的超算平臺構(gòu)建與應(yīng)用技術(shù)研究在國內(nèi)外都受到了廣泛關(guān)注。其中,國外電力行業(yè)超算系統(tǒng)的建設(shè)和應(yīng)用情況相對領(lǐng)先,在硬件架構(gòu)方面,美國能源部的超級計(jì)算機(jī)“Summit”以及“Frontier”均采用了高性能的CPU/GPU異構(gòu)結(jié)構(gòu);在軟件架構(gòu)方面,各加強(qiáng)了高性能計(jì)算平臺與數(shù)據(jù)中心的深度整合,為應(yīng)用提供更高效的支持。具有代表性的國外電力行業(yè)超算系統(tǒng)建設(shè)和應(yīng)用情況包括[1-2]。
一是美國能源部國家實(shí)驗(yàn)室與技術(shù)中心:該中心擁有多款高性能計(jì)算系統(tǒng),包括頂級的“Summit”以及“Frontier”超算系統(tǒng),主要應(yīng)用于能源和電力行業(yè),用于模擬和優(yōu)化復(fù)雜的能源系統(tǒng),幫助電力系統(tǒng)規(guī)劃和運(yùn)營決策。
二是歐洲核子研究組織(CERN):CERN的計(jì)算中心擁有多套高性能計(jì)算系統(tǒng),主要用于模擬物理實(shí)驗(yàn)和處理大規(guī)模數(shù)據(jù)集,同時也廣泛應(yīng)用于其他領(lǐng)域的研究,其中主要包括電力行業(yè)的能源預(yù)測和電力網(wǎng)優(yōu)化等問題。
三是日本電力公司:該公司擁有包括“京”在內(nèi)的多款高性能計(jì)算系統(tǒng),廣泛用于電力行業(yè)和其他領(lǐng)域的各種研究和工作中,為政策制定者提供技術(shù)支持和數(shù)據(jù)分析,不僅可以提高電力系統(tǒng)的業(yè)務(wù)性能,而且也可以為幫助更好地服務(wù)電力行業(yè)和用戶需求。
在國內(nèi),高性能計(jì)算領(lǐng)域的技術(shù)進(jìn)步以及國家加強(qiáng)超算研究與發(fā)展的政策支持,為電力行業(yè)超算平臺的發(fā)展提供了有利條件[3-4]。在硬件架構(gòu)方面,國內(nèi)超算平臺的發(fā)展主要依靠自主研發(fā),如我國的“天河三號”和“神威”等超算系統(tǒng),采用了國產(chǎn)CPU架構(gòu)體系;在軟件架構(gòu)方面,國內(nèi)高性能計(jì)算領(lǐng)域的應(yīng)用也在不斷擴(kuò)展和創(chuàng)新,如能源大數(shù)據(jù)分析、電力系統(tǒng)傳輸規(guī)劃和調(diào)度優(yōu)化等,為電力行業(yè)的超算平臺應(yīng)用提供了技術(shù)基礎(chǔ)[5]。目前,我國電力行業(yè)已經(jīng)建立起了多個超算平臺,以應(yīng)對不斷增長的數(shù)據(jù)和計(jì)算需求。
電力行業(yè)對超算平臺的需求十分復(fù)雜和多樣化。超算平臺不僅需要具備高性能計(jì)算和仿真能力,還需要具備高度的可靠性和穩(wěn)定性,利用超算平臺為電力系統(tǒng)提供高效的管理和決策支持,同時能夠支持多個行業(yè)和領(lǐng)域的應(yīng)用需求。電力行業(yè)對超算平臺的需求主要包括以下幾個方面。
一是超算平臺需要具備高效的大規(guī)模數(shù)據(jù)處理和計(jì)算能力,包括支持海量數(shù)據(jù)的存儲和管理,以及大規(guī)模分布式并行計(jì)算。二是超算平臺需要支持各種典型電力行業(yè)應(yīng)用,不僅能夠支持電力系統(tǒng)的規(guī)劃、運(yùn)行和管理等領(lǐng)域,還需要能夠支持電力市場、環(huán)保和能源保障等多個領(lǐng)域的應(yīng)用。三是超算平臺需要支持實(shí)時或準(zhǔn)實(shí)時計(jì)算,需要立即響應(yīng)電力系統(tǒng)的各種請求,包括實(shí)時監(jiān)控設(shè)備狀態(tài)、數(shù)據(jù)采集、風(fēng)險(xiǎn)預(yù)警等。四是超算平臺需要具備高可靠性、高可用性和高穩(wěn)定性,具有良好的糾錯和容錯能力,在硬件或軟件故障時可以快速切換到備份系統(tǒng)。五是超算平臺需要具備安全性,通過用戶身份認(rèn)證、數(shù)據(jù)加密、網(wǎng)絡(luò)流量篩查、漏洞掃描、入侵檢測等多種系統(tǒng)安全解決方案等確保數(shù)據(jù)的安全。
電力行業(yè)超算平臺構(gòu)建技術(shù)應(yīng)該面向?qū)嶋H的電力業(yè)務(wù)應(yīng)用需求和計(jì)算特征,同時考慮超算技術(shù)的可行性和電力行業(yè)的技術(shù)需求的特殊性。超算平臺的設(shè)計(jì)要圍繞實(shí)際的業(yè)務(wù)需求展開,以滿足不同程度的計(jì)算和數(shù)據(jù)處理需求,具體包括以下幾個方面。
一是計(jì)算系統(tǒng):超算平臺通過高性能計(jì)算節(jié)點(diǎn)支持電力行業(yè)各種復(fù)雜的數(shù)據(jù)計(jì)算和處理需求。其中,高性能通用處理器是高性能計(jì)算節(jié)點(diǎn)的核心部件,需要根據(jù)應(yīng)用的計(jì)算特征,選配相應(yīng)的CPU,以滿足通用計(jì)算和處理性能要求;算法加速器方面,通過選用GPU或FPGA等專用計(jì)算部件,對于計(jì)算密集型任務(wù)等能夠大幅提升計(jì)算速度和處理效率;內(nèi)存方面,應(yīng)該選用大容量高帶寬的ECC內(nèi)存,以提升計(jì)算和處理效率;容錯方面,通過實(shí)現(xiàn)熱備/冷備技術(shù)、資源動態(tài)管理等操作,確保平臺在出現(xiàn)故障時能夠自動恢復(fù),支持負(fù)載平衡和故障轉(zhuǎn)移,以保證超算平臺的穩(wěn)定性和可用性。
二是存儲系統(tǒng):電力行業(yè)超算平臺的存儲系統(tǒng)是高性能計(jì)算中較為重要的一部分,需要采用特殊的設(shè)計(jì)方法和配置。其中,存儲設(shè)備方面應(yīng)選用高速存儲器,如SSD、NVMe、SAS等,以提供更快的存儲訪問速度和更高的IOPS;存儲策略方面,需要對數(shù)據(jù)進(jìn)行分層存儲,對于經(jīng)常訪問和分析的數(shù)據(jù),應(yīng)使用高速存儲設(shè)備,對于不經(jīng)常訪問的數(shù)據(jù)則可以使用較慢的存儲設(shè)備;文件系統(tǒng)方面,應(yīng)使用高效且可擴(kuò)展的大數(shù)據(jù)文件系統(tǒng),如Lustre、GPFS等,以滿足電力行業(yè)海量數(shù)據(jù)的存儲和管理需求,并且支持多客戶端的并行訪問;數(shù)據(jù)管理方面,需采用RAID和冗余容錯等技術(shù)以提高數(shù)據(jù)可靠性;安全方面,需要實(shí)現(xiàn)安全與數(shù)據(jù)隔離策略,包括數(shù)據(jù)隔離、數(shù)據(jù)加密等保護(hù)措施,確保存儲子系統(tǒng)互相獨(dú)立,且其中任一子系統(tǒng)出現(xiàn)異常不會影響到整體系統(tǒng)的穩(wěn)定性和安全性。
三是網(wǎng)絡(luò)系統(tǒng):電力行業(yè)超算平臺的互聯(lián)網(wǎng)絡(luò)應(yīng)該具備高速、低延遲和高帶寬等特點(diǎn),以實(shí)現(xiàn)計(jì)算節(jié)點(diǎn)的高效通信,同時能夠滿足電力行業(yè)海量數(shù)據(jù)交互和傳輸需求。網(wǎng)絡(luò)拓?fù)浞矫?,網(wǎng)絡(luò)需要考慮可靠性和可用性,應(yīng)選用可以實(shí)現(xiàn)冗余和故障恢復(fù)的拓?fù)浣Y(jié)構(gòu),例如星形、環(huán)形或多重路徑,需要支持可擴(kuò)展性,能夠容納更多節(jié)點(diǎn);網(wǎng)絡(luò)設(shè)備方面,需要使用高速網(wǎng)絡(luò)交換設(shè)備,如InfiniBand、Ethernet等,以便實(shí)現(xiàn)快速傳輸大型數(shù)據(jù)文件和低延遲數(shù)據(jù)交互;安全防護(hù)方面,需要采取建立防火墻、使用虛擬專用網(wǎng)(VPN)和加密技術(shù)、配置網(wǎng)關(guān)安全協(xié)議等多種防御措施,以保障數(shù)據(jù)和系統(tǒng)安全;網(wǎng)絡(luò)監(jiān)測方面,需要借助網(wǎng)絡(luò)流量分析器和網(wǎng)絡(luò)監(jiān)控系統(tǒng)網(wǎng)絡(luò)監(jiān)測工具,以幫助快速定位問題所在,并及時采取措施。
電力行業(yè)超算平臺應(yīng)用技術(shù)領(lǐng)域非常廣泛,涉及電力網(wǎng)絡(luò)規(guī)劃、新能源開發(fā)、電力市場分析等方面,為電力行業(yè)提供了強(qiáng)大的信息分析和決策支持。通過超算平臺的運(yùn)用,可以提高電力行業(yè)的效率、降低成本、優(yōu)化管理,有效地推動電力行業(yè)的可持續(xù)發(fā)展。典型應(yīng)用場景包括以下幾點(diǎn)。
一是電網(wǎng)建設(shè)規(guī)劃:超算平臺可以利用高精度的數(shù)據(jù)模擬和分析,幫助電力行業(yè)管理人員設(shè)計(jì)出更加準(zhǔn)確、高效和可持續(xù)的電網(wǎng)建設(shè)方案。二是電力負(fù)荷預(yù)測:超算平臺可以預(yù)測電力負(fù)荷的峰值和谷值,協(xié)助電力行業(yè)制定負(fù)載均衡策略,提高電網(wǎng)效率。三是電網(wǎng)安全評估:通過使用超算平臺,可以對電網(wǎng)進(jìn)行安全評估和遙感監(jiān)測,及時發(fā)現(xiàn)潛在的安全隱患,并針對性地解決問題。四是新型能源開發(fā):超算平臺可以模擬和預(yù)測新能源的生產(chǎn)、負(fù)荷和儲存情況,為新能源的開發(fā)提供科學(xué)依據(jù)和市場準(zhǔn)備工作。五是輸電能力計(jì)算:超算平臺可以通過數(shù)值模擬、優(yōu)化算法等技術(shù),計(jì)算超高壓輸電線路的輸電能力,為電力行業(yè)提供技術(shù)支撐。六是氣象數(shù)據(jù)處理:超算平臺可用于氣象數(shù)據(jù)模擬、分析、預(yù)測和預(yù)報(bào),幫助電力行業(yè)監(jiān)控氣象變化,并作出相應(yīng)決策,減少氣象災(zāi)害對電力系統(tǒng)的影響。七是電力市場分析:超算平臺可以模擬和數(shù)據(jù)分析市場行情,幫助電力行業(yè)決策者制定更為精準(zhǔn)的市場策略和決策。
電力行業(yè)超算平臺是利用高性能計(jì)算技術(shù),為電力行業(yè)的各種應(yīng)用場景提供強(qiáng)大的計(jì)算能力和數(shù)據(jù)處理能力,從而為電力行業(yè)的可持續(xù)發(fā)展提供決策支持和技術(shù)保障。為了最大限度發(fā)揮超算平臺的效益,電力行業(yè)超算平臺應(yīng)用技術(shù)包括以下幾個方面。
第一,應(yīng)用場景和算法優(yōu)化:要結(jié)合不同的應(yīng)用場景,運(yùn)用高效的算法和優(yōu)化方法來解決各種電力行業(yè)應(yīng)用問題,利用模擬和數(shù)據(jù)分析技術(shù),通過基于各種電力行業(yè)應(yīng)用場景的算法優(yōu)化或算法重設(shè)計(jì),可以更好地提高應(yīng)用系統(tǒng)與超算系統(tǒng)的適配性,從而有效提高系統(tǒng)性能。
第二,系統(tǒng)運(yùn)維和管理:需要采取科學(xué)的運(yùn)維和管理手段,及時檢測和修復(fù)系統(tǒng)中出現(xiàn)的問題,保證系統(tǒng)的穩(wěn)定性和可靠性。同時,要保證超算平臺的安全性和管理精度,避免故障發(fā)生,需要為系統(tǒng)提供維護(hù)、更新和定期的性能監(jiān)測方案,定期維護(hù)硬件和軟件資源。
當(dāng)前,電力行業(yè)的超算平臺構(gòu)建與應(yīng)用技術(shù)正在不斷地發(fā)展創(chuàng)新,國內(nèi)外基于硬件、軟件以及應(yīng)用等方面的研究成果不斷豐富。隨著新技術(shù)的出現(xiàn)和應(yīng)用范圍的擴(kuò)展,電力行業(yè)超算平臺的應(yīng)用將會越來越廣泛深入,并對電力行業(yè)的智能化轉(zhuǎn)型發(fā)揮越來越重要的推動作用。電力行業(yè)的超算系統(tǒng)在未來的應(yīng)用和發(fā)展方向上有以下幾個趨勢。
一是大數(shù)據(jù)應(yīng)用的全面普及:隨著電力行業(yè)數(shù)據(jù)量的不斷增長,數(shù)據(jù)應(yīng)用已經(jīng)成為電力行業(yè)超算系統(tǒng)應(yīng)用的重要方向之一。在未來,電力行業(yè)超算系統(tǒng)將會更加普及數(shù)據(jù)采集、分析、挖掘和建模等方面的技術(shù),使其更好地應(yīng)用于電力行業(yè)中的網(wǎng)絡(luò)規(guī)劃、調(diào)度管理、市場分析和用戶服務(wù)等領(lǐng)域。二是智能化應(yīng)用的快速發(fā)展:隨著人工智能領(lǐng)域技術(shù)的不斷進(jìn)步,電力行業(yè)超算系統(tǒng)將具備更加智能化的應(yīng)用,例如在電力設(shè)備故障診斷、預(yù)測和預(yù)警等方面的應(yīng)用,從而為電力行業(yè)提供更加智能、安全和高效的服務(wù)。三是能源互聯(lián)網(wǎng)的廣泛應(yīng)用:隨著能源互聯(lián)網(wǎng)的逐漸成形,電力行業(yè)超算系統(tǒng)的應(yīng)用也將會廣泛涉及能源互聯(lián)網(wǎng)建設(shè)、能源孿生、物聯(lián)網(wǎng)終端設(shè)備測試驗(yàn)證等方面。電力行業(yè)超算系統(tǒng)將對能源互聯(lián)網(wǎng)技術(shù)架構(gòu)、管理和安全等方面提供強(qiáng)有力的技術(shù)支持。
綜上所述,未來電力行業(yè)超算系統(tǒng)的應(yīng)用領(lǐng)域和技術(shù)水平將會不斷拓展,同時也將進(jìn)一步推動電力行業(yè)的科技創(chuàng)新和可持續(xù)發(fā)展。