禹富偲 王玉杰 徐新華
(1.重慶市軌道交通(集團)有限公司 重慶 400000;2.華中科技大學(xué)建筑環(huán)境與能源應(yīng)用工程系 武漢 430074)
2030 年前碳達峰和2060 年前碳中和是我國重大發(fā)展戰(zhàn)略。全球建筑能源消耗占總能源消耗的三分之一以上,并且是二氧化碳排放的重要組成部分[1]。在建筑能耗中,空調(diào)系統(tǒng)運行能耗占比可達40%,減少空調(diào)系統(tǒng)的能耗是建筑節(jié)能中的重要工作[2-4]。在目前的空調(diào)系統(tǒng)運行中,制冷機和水泵等常處于部分負載狀態(tài)下,運行效率低[5,6]。近年來,隨著物聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展和建筑自動化水平的提高,專業(yè)人員可以獲得大量的空調(diào)系統(tǒng)運行數(shù)據(jù),如何從大數(shù)據(jù)中獲得有用的知識,用于指導(dǎo)空調(diào)系統(tǒng)的運行,引起了學(xué)者們的關(guān)注[7]。數(shù)據(jù)挖掘技術(shù)快速發(fā)展,為處理海量數(shù)據(jù)并從中發(fā)現(xiàn)有價值的信息提供了新的方法,比如通過構(gòu)建建筑自動化數(shù)據(jù)知識挖掘框架實現(xiàn)非正常工況識別與故障識別[8]、基于人工智能的故障檢測[9]、基于BP神經(jīng)網(wǎng)絡(luò)的故障診斷[10]和基于數(shù)據(jù)挖掘的空調(diào)系統(tǒng)控制方法[11]等。關(guān)聯(lián)準則是數(shù)據(jù)挖掘技術(shù)中的一種,主要用于發(fā)現(xiàn)數(shù)據(jù)中頻繁出現(xiàn)的模式[12]。數(shù)據(jù)挖掘在空調(diào)領(lǐng)域也有許多應(yīng)用。王炳文[13]采用Apriori算法[12]對冷源系統(tǒng)各種運行模式下的典型工況的歷史運行數(shù)據(jù)進行了強關(guān)聯(lián)規(guī)則挖掘,結(jié)果表明關(guān)聯(lián)準則可以提升冷源系統(tǒng)的整體能效,而且不需建模,實用性強。李冠男[14]提出一種基于聚類分析與關(guān)聯(lián)準則挖掘相結(jié)合的方法,將能耗數(shù)據(jù)劃分成了幾個簇,識別出幾種可以解釋的系統(tǒng)能耗模式,并且在各個能耗模式下利用Apriori算法進行關(guān)聯(lián)準則分析,可以識別出異常用能模式。王玉杰等[15]采用關(guān)聯(lián)準則方法對空調(diào)水系統(tǒng)的運行參數(shù)進行了挖掘,獲得在不同室外空氣溫濕度與建筑冷量需求條件下高效運行的空調(diào)系統(tǒng)運行參數(shù),以指導(dǎo)實際空調(diào)系統(tǒng)的運行。
利用關(guān)聯(lián)準則對空調(diào)水系統(tǒng)運行數(shù)據(jù)進行挖掘,可以得到在不同的工況條件下,能夠保證系統(tǒng)高效運行的水系統(tǒng)參數(shù),比如,冷凍水供水溫度、供回水溫差、冷卻水回水溫度和供回水溫差等。但是,采用關(guān)聯(lián)準則進行數(shù)據(jù)挖掘時,會對運行數(shù)據(jù)集進行清洗與篩選,在此過程中,一些工況會被剔除。另一方面,在實際運行中采集的工況不可能涵蓋系統(tǒng)在全生命周期內(nèi)的所有工況。因此,在采用關(guān)聯(lián)準則進行準則集的挖掘時,如何獲得關(guān)聯(lián)準則集中的工況(常規(guī)工況)外的其他工況(非常規(guī)工況)的運行設(shè)定值,對于實際工程的運行應(yīng)用非常重要。因此,本文提出一種基于歐幾里得距離最小化的非常規(guī)工況的空調(diào)水系統(tǒng)運行關(guān)聯(lián)準則的挖掘方法。
Apriori算法是常用的一種關(guān)聯(lián)準則的數(shù)據(jù)挖掘算法[14],該算法使用頻繁項集性質(zhì)。Apriori算法采用支持度、置信度及提升度來描述獲得的準則的質(zhì)量。支持度是代表同時包含A,B的集合在所有事務(wù)中出現(xiàn)的頻率,即支持度乘總數(shù)據(jù)量為該準則所使用的數(shù)據(jù)量,如式(1)。置信度是AB同時出現(xiàn)的事項占A事項的比例,如式(2)。提升度是用于評估關(guān)聯(lián)準則有效性的指標(biāo),如式(3)。定義支持度為:
其中,P(A∪B)代表事務(wù)包含集合A和B的并(即包含A和B中的每個項)的概率。
定義置信度為:
定義提升度為:
提升度表示在含有A的條件下,同時含有B的概率,與B同時發(fā)生的概率之比。
滿足最小支持度和最小置信度的規(guī)則叫做強關(guān)聯(lián)準則,但是強關(guān)聯(lián)準則也是有有效和無效之分的,如果提升度lift(A→B)>1,那么規(guī)則就是有效的規(guī)則,如果提升度lift(A→B)<1,那么規(guī)則就是無效的規(guī)則,特別的,當(dāng)lift=1 的時候,代表A和B是相互獨立的。
關(guān)聯(lián)準則算法步驟流程如圖1 所示。首先對給定邊界條件下的數(shù)據(jù)項的支持度、置信度以及提升度進行計算,再按照算法得到頻繁集,根據(jù)規(guī)則等級的原則對得到的規(guī)則標(biāo)簽進行排序,并剔除冗雜規(guī)則。采用類別規(guī)則標(biāo)簽CARs(CategoryAssociation Rules)按照等級進行排列,并且經(jīng)過篩選,保留等級更高的規(guī)則。重復(fù)上述過程,遍歷給定的所有邊界條件下的數(shù)據(jù)項處理與篩選,最后獲得所有的給定邊界條件下的關(guān)聯(lián)準則。
圖1 關(guān)聯(lián)準則算法步驟流程示意圖Fig.1 Schematics of the procedure of the associated rule algorithmm
本文以一實際建筑的中央空調(diào)系統(tǒng)為研究對象,在TRNSYS 軟件中對建筑的傳熱與空調(diào)系統(tǒng)進行了建模。通過模擬,獲得在不同的冷凍水供水溫度和不同的冷卻水泵運行頻率等眾多工況下的空調(diào)系統(tǒng)運行數(shù)據(jù)[17]。其中,冷凍水供水溫度設(shè)定值為7℃-18℃,1℃間隔;冷卻水泵頻率為24Hz至50Hz,2Hz 間隔;通過控制冷凍水供水流量控制室內(nèi)溫度在26 至28℃之間;模擬數(shù)據(jù)以分鐘計,初步得到的數(shù)據(jù)量共計約8830 萬條。對數(shù)據(jù)進行預(yù)處理,舍棄了室內(nèi)溫度不達標(biāo)的數(shù)據(jù),得到了五千余萬條可用數(shù)據(jù)。
選取了與空調(diào)水系統(tǒng)運行有關(guān)的參數(shù),對應(yīng)第1 節(jié)中的A 事項包括冷凍水供水溫度、冷凍水供回水溫差、冷卻水回水溫度和冷卻水供水溫差,B 事項為COP,然后運用關(guān)聯(lián)準則數(shù)據(jù)挖掘方法,獲得了在不同的室外空氣溫濕度和系統(tǒng)冷量需求的范圍內(nèi),系統(tǒng)的最佳運行參數(shù),即獲得了該空調(diào)系統(tǒng)在不同工況下的高效運行關(guān)聯(lián)準則[16]。支持度代表的是一條關(guān)聯(lián)準則的邊界條件下,所使用的數(shù)據(jù)量占總數(shù)據(jù)的比例。在本文研究案例中,以分鐘為單位,數(shù)據(jù)量為幾千萬條,支持度大于1%以上時,在進行關(guān)聯(lián)準則挖掘時,有幾十萬條以上的數(shù)據(jù)量,數(shù)據(jù)量及代表性足夠。在大數(shù)據(jù)挖掘領(lǐng)域中,一般的置信度設(shè)置為70%以上[13,14]。在本研究中,最小支持度取1%,最小置信度取70%,最小提升度取1%。表1 是部分工況下的關(guān)聯(lián)準則。
表1 關(guān)聯(lián)準則表(常規(guī)工況)Table 1 Table for associated rules(Conventional conditions)
在進行關(guān)聯(lián)準則挖掘過程中,在某些工況下,未能找到滿足支持度和置信度的關(guān)聯(lián)準則,即在該冷量需求、室外溫度和濕度條件下,未有對應(yīng)的關(guān)聯(lián)準則可用。在實際運行中采集的工況不可能涵蓋系統(tǒng)在全生命周期內(nèi)的所有工況,并且可能會出現(xiàn)極端工況,所以需要對關(guān)聯(lián)準則進行補充。本研究采用最近距離原則進行關(guān)聯(lián)準則補充,距離采用歐幾里德距離。
歐氏距離是歐幾里德距離的簡稱,指的是在m維空間中的兩個點之間的距離,如式(4)。當(dāng)考慮三維空間時,兩點之間歐氏距離表示為式(5)。
其中,(x1,x2,x3)為點x的坐標(biāo)值,(y1,y2,y3)為點y的坐標(biāo)值,d(x,y)為兩點之間的距離。
歐氏距離進一步推廣到加權(quán)歐氏距離,用來處理各個維度分布不一樣的情況,如式(6)。
其中,wi為第i維分量的權(quán)重。
將邊界條件中的冷量需求以50kW 為單位分成12 個區(qū)間,分別是[0,50)、[50,100)、[100,150)、[150,200)、[200,250)、[250,300)、[300,350)、[350,400)、[400,450)、[450,500)、[500,550)和[550,+∞),從前往后依次定義區(qū)間為01 到12;將邊界條件中的室外空氣溫度分成[0,15)、[15,20)、[20,25)、[25,30)、[30,35)、[35,40)和[40,+∞]七個區(qū)間,從前往后依次定義區(qū)間為1 到7;將邊界條件中的室外空氣濕度分為[0,40)、[40,60)、[60,80)和[80,100]四個區(qū)間,從前往后依次定義區(qū)間為從1 到4,所以經(jīng)過排列組合一共可能有12×7×4=336 條關(guān)聯(lián)準則。把這三個因素對應(yīng)的區(qū)間的序號連接起來,定義為一個四位數(shù)的編號,冷量需求、室外空氣溫度和室外空氣濕度分別是三維空間的三個坐標(biāo)軸,編號代表其在三維空間中的位置點。比如,需求冷量區(qū)間[0,50),室外空氣溫度區(qū)間[0,15),室外空氣濕度區(qū)間[0,40)對應(yīng)的三維空間的位置點為0111,如圖2 所示。判斷三維空間中的位置點是否有關(guān)聯(lián)準則對應(yīng),如果沒有,與它距離最短的有關(guān)聯(lián)準則的點所在的關(guān)聯(lián)準則作為該位置點的關(guān)聯(lián)準則。對于沒有關(guān)聯(lián)準則的空間位置點,可能有不同的有關(guān)聯(lián)準則的空間位置點與其距離相等,比如0332 在三維空間中與之距離最短即為1 的點有0232、0331、0232 等??紤]到需求冷量因素、室外空氣溫度因素、及室外空氣濕度因素的權(quán)重不同,點0332 與點0232、0331、0232 的距離是不一樣的。
圖2 三維空間位置點示意圖Fig.2 Schematics of the point position in three-dimension space
本研究中定義三個因素,即需求冷量、室外空氣溫度、室外空氣濕度的權(quán)重,以考慮這些影響因素對系統(tǒng)能效即能耗的影響作用。直接的影響是需求冷量,而室外空氣溫度是通過圍護結(jié)構(gòu)即新風(fēng)影響需求冷量的,室外的空氣濕度主要是通過冷卻系統(tǒng)影響冷卻水的回水溫度進而影響系統(tǒng)的能耗。對這三個因素對空調(diào)系統(tǒng)能效與能耗的影響作用進行定性的分析,應(yīng)該需求冷量影響最大,室外空氣溫度次之,濕度影響最小,具體的量化很難確定。在本算例中,需求冷量因素的權(quán)重取為50%,室外空氣溫度因素的權(quán)重取為30%,室外空氣濕度因素的權(quán)重取為20%。
冷量需求在350kW-400kW 范圍內(nèi)、溫度在25℃-30℃范圍內(nèi)以及相對濕度在80%-100%范圍,與冷量需求在450kW-500kW 范圍內(nèi)、溫度在20℃-25℃范圍內(nèi)以及相對濕度在40%-60%范圍,使用模擬得到的數(shù)據(jù)未能找到在此邊界條件下,滿足支持度和置信度范圍的關(guān)聯(lián)準則。使用上述方法找到與之距離最近的關(guān)聯(lián)準則,同時也取次近及第三近的關(guān)聯(lián)準則,如表2 所示。取另外兩個相近的準則,只是為了分析在采用不同準則時系統(tǒng)的能效情況,詳細比較分析見下一節(jié)。
表2 關(guān)聯(lián)準則表(非常規(guī)工況)Table 2 Table for associated rules(Non-conventional conditions)
根據(jù)上述方法補充非常規(guī)工況的關(guān)聯(lián)準則,可得到在所有邊界條件下的關(guān)聯(lián)準則,關(guān)聯(lián)準則的應(yīng)用流程如圖3 所示。在模型中,關(guān)聯(lián)準則的應(yīng)用流程是:讀取建筑物冷量需求、空氣溫度與濕度數(shù)據(jù),模型平臺中的關(guān)聯(lián)準則應(yīng)用策略模塊經(jīng)過判斷可以尋找該邊界條件下的最優(yōu)參數(shù)值,即冷凍水供水溫度設(shè)定值、冷卻水供回水溫差設(shè)定值、冷卻水回水溫度設(shè)定值、冷凍水供回水溫差設(shè)定值。通過PID 控制器控制冷卻水泵、冷凍水泵的運行頻率從而控制冷卻水供回水溫差、冷凍水供回水溫差,通過PID 控制器控制冷卻塔風(fēng)機轉(zhuǎn)速從而控制冷卻水回水溫度,使得系統(tǒng)按照關(guān)聯(lián)準則表中的最優(yōu)參數(shù)來運行。在進行運行效果比較分析時,以采用既有模式運行的結(jié)果作為參考。既有模式是指空調(diào)水系統(tǒng)中制冷機冷凍水供水溫度設(shè)定為7℃,水泵與冷卻塔風(fēng)機以工頻運行。關(guān)聯(lián)準則運行模式,就是采用關(guān)聯(lián)準則表中的最優(yōu)參數(shù)進行系統(tǒng)運行,即按照冷凍水出水溫度設(shè)定值、冷卻水回水溫度設(shè)定值、冷凍水泵運行頻率設(shè)定(即改變冷凍水供回水溫差)、冷卻水泵運行頻率設(shè)定(即改變冷卻水供回水溫差)進行系統(tǒng)的運行。
圖3 關(guān)聯(lián)準則運用流程圖Fig.3 Flowchart of the application of associated rule
如表2 所示,冷量需求在350kW-400kW 范圍內(nèi)、溫度在25℃-30℃范圍內(nèi)以及相對濕度在80%-100%范圍(即工況1)時沒有對應(yīng)的關(guān)聯(lián)規(guī)則。此時采用與該工況點距離相近的工況點的關(guān)聯(lián)準則進行系統(tǒng)的運行。分別用與該工況點相近的工況點的關(guān)聯(lián)準則與既有運行模式對該系統(tǒng)在該邊界條件下的運行進行模擬,得到結(jié)果如圖4 所示。在此需要說明的,空調(diào)系統(tǒng)的需求冷量隨時間不斷變化,而且室外的空氣溫度與濕度也不斷變化,對于一個采用冷卻塔冷卻的空調(diào)水系統(tǒng)而言,其COP是不斷變化的。在這里給出的是在冷量需求在350kW-400kW 范圍內(nèi)、溫度在25℃-30℃范圍內(nèi)以及相對濕度在80%-100%范圍的不同的狀態(tài)點。COP 平均值為不同狀態(tài)點的COP 的平均值。
圖4 采用不同距離工況點的關(guān)聯(lián)準則運行COP 對比(工況1)Fig.4 Comparison of COP when using associated rule at different condition points(Condition 1)
圖4 結(jié)果表明,第一近、第二近、第三近距離的工況點的關(guān)聯(lián)準則和既有模式運行的平均COP分別為5.72、5.63、5.46 和4.26。既有運行模式指的是空調(diào)水系統(tǒng)中制冷機冷凍水供水溫度恒定,水泵與冷卻塔風(fēng)機以工頻運行。采用第一近距離的工況點的關(guān)聯(lián)準則對該系統(tǒng)運行,系統(tǒng)COP 比既有模式運行時的COP 提高1.46。在圖中部分狀態(tài)點出現(xiàn)按照第三近距離準則運行的能效超過了按照第二近與第一近距離準則運行的能效,有可能是在設(shè)置需求冷量、室外空氣溫度、室外空氣濕度的影響權(quán)重不是最優(yōu)的。但是,在非常規(guī)工況下,采用歐式距離獲得了該工況下的運行關(guān)聯(lián)準則,而且采用該關(guān)聯(lián)準則運行的能效要始終高于既有模式的運行能效。
冷量需求在450kW-500kW 范圍內(nèi)、溫度在20℃-25℃范圍內(nèi)以及相對濕度在40%-60%范圍(即工況2)時,也沒有對應(yīng)的關(guān)聯(lián)準則。分別用與之最近的工況點的關(guān)聯(lián)準則與既有運行模式模擬該邊界條件下的運行,得到結(jié)果如圖5 所示。第一近、第二近、第三近關(guān)聯(lián)準則和既有模式運行的平均COP 分別為5.71、5.53、5.04 和4.00。采用第一近距離的工況點的關(guān)聯(lián)準則對該系統(tǒng)運行,能效也有明顯的提升。從上述實例可以看出,對未能挖掘得到的關(guān)聯(lián)準則的工況,采用歐幾里得距離方法補充的關(guān)聯(lián)準則能夠保證系統(tǒng)高效運行,而且在大部分狀態(tài)點中,距離越近,COP 越高,運行效果越好。
圖5 采用不同距離工況點的關(guān)聯(lián)準則運行效果對比(工況2)Fig.5 Comparison of COP when using associated rule at different condition points(Condition 2)
在上述給出的兩個案例中,都出現(xiàn)了按照第三近距離準則運行的能效超過了按照第二近與第一近距離準則運行的能效,但是都顯著高于既有運行模式的能效。在這里需要指出的是,在采用關(guān)聯(lián)準則進行挖掘時,由于數(shù)據(jù)的過濾與刪除,以及用于關(guān)聯(lián)準則挖掘的數(shù)據(jù)不可能涵蓋所有的運行工況。因此在關(guān)聯(lián)準則挖掘完后,可能出現(xiàn)一些新的運行工況(本文稱為非常規(guī)工況)找不到關(guān)聯(lián)準則,本文的目的就是提供一種方法,以獲得非常規(guī)工況的運行關(guān)聯(lián)準則。而且這一關(guān)聯(lián)準則可能不是最優(yōu)的,但是提供了一個關(guān)聯(lián)準則,按照該準則運行,可以比既有運行模式的能效要高。
本文利用關(guān)聯(lián)準則的數(shù)據(jù)挖掘方法,對空調(diào)系統(tǒng)運行數(shù)據(jù)進行挖掘,獲得了能夠保證空調(diào)系統(tǒng)高效運行的參數(shù)(冷凍水供水溫度設(shè)定值、冷凍水供回水溫差設(shè)定值、冷卻水供回水溫差設(shè)定值和冷卻水回水溫度設(shè)定值)。挖掘得到的關(guān)聯(lián)準則不一定涵蓋所有運行工況,在部分工況(即非常規(guī)工況)下沒有對應(yīng)的關(guān)聯(lián)準則。針對這種情況,本文提出了一種基于歐氏距離最小化的非常規(guī)工況關(guān)聯(lián)準則補充方法,通過對關(guān)聯(lián)準則中的邊界條件進行編號,定義各個關(guān)聯(lián)準則對應(yīng)工況在空間中的位置,將最近距離的有關(guān)聯(lián)準則的空間點的關(guān)聯(lián)準則作為非常規(guī)工況位置的關(guān)聯(lián)準則。本文以兩個實例對采用這種方法補充的關(guān)聯(lián)準則的可靠性進行了模擬分析。與既有模式相比,兩實例采用從近到遠的歐氏距離補充的關(guān)聯(lián)準則運行的系統(tǒng)能效分別提升了1.4 與1.7。采用歐氏距離最小化的方法補充的關(guān)聯(lián)準則能夠很好地保證系統(tǒng)的高效運行。