姜淏予, 王沛?zhèn)悾?葛泉波, 徐今強, 羅 朋, 姚 剛
(1. 廣東海洋大學 電子與信息工程學院,廣東 湛江 524088; 2. 上海海事大學 物流工程學院,上海 200135; 3. 南京信息工程大學 自動化學院,南京 210044)
近年來,中國連續(xù)提出海洋發(fā)展戰(zhàn)略,在廣東省西部地區(qū)主要表現(xiàn)在海洋農(nóng)業(yè)向遠海區(qū)域的開發(fā)利用.但海上突發(fā)氣象變化往往對養(yǎng)殖業(yè)造成不利影響,且由于遠海監(jiān)測條件有限,海上氣象環(huán)境更為復雜多變,使得有關系統(tǒng)對局部極端天氣的預測能力不足.如果不能提前估計海上天氣變化并做出保護反應,有可能會對產(chǎn)量造成頻繁沖擊甚至絕收[1].因此需要依托海上相關工程,在邊緣層實現(xiàn)海上氣象的自動化智能感知,進而依托無人系統(tǒng)開展保護與管控.對無人系統(tǒng)尤其是遠海條件無人系統(tǒng)供給能量,主要依托海上可再生能源,包括風能、太陽能、波浪能、潮汐能等[2].漂浮式光伏系統(tǒng)作為近年來高速發(fā)展的一種可再生能源發(fā)電技術,具有技術相對成熟、施工難度較低的優(yōu)勢.
傳統(tǒng)漂浮式光伏發(fā)電系統(tǒng)最早應用于美國、日本等發(fā)達國家[3],主要用于緩解光伏建造工程占地面積大導致的成本過高問題.作為最早的研究國家之一,日本在漂浮式光伏系統(tǒng)應用方面保持著世界領先地位,先后在Hyogo、Higashira、Yamakura、Aichi、Okinawa、Umenoki、Furugori等地建設有示范工程,發(fā)電功率最大達到了13.4 MW[4].我國于2015年在湖北棗陽建成首個水面漂浮式光伏發(fā)電站試驗項目,裝機200 kW[5],隨后裝機容量不斷擴大,直到近些年多個項目達到100 MW的規(guī)模并成功并網(wǎng).然而,當前漂浮式光伏系統(tǒng)在海上的應用較少,原因在于以上漂浮式光伏系統(tǒng)主要以大型發(fā)電建設為主要目標.考慮到海底電纜的施工技術要求以及海洋水下環(huán)境的復雜性,在地上優(yōu)質水面資源沒有完全開發(fā)之前,漂浮式光伏的商業(yè)應用不會優(yōu)先在海上開展.
采用漂浮式光伏作為能源系統(tǒng)對海上邊緣側的無人系統(tǒng)供電避免了通過海底電纜傳輸回陸地的主要矛盾,因此,結合近年來已有研究[6],海洋漂浮式光伏發(fā)電作為海上無人系統(tǒng)電源是可行的.由于光伏出力極易受到輻照度、環(huán)境溫度、風速等因素的干擾,所以其非連續(xù)、隨機的特點吸引了大量的相關研究.文獻[7]通過將氣象條件相似的天氣進行分類后選擇相似日,對每個相似日的光伏出力進行建模并預測.文獻[8]在選擇相似日后探討建模過程并由神經(jīng)網(wǎng)絡進行構建;文獻[9]在選擇相似日后,進一步對由光伏電站空間分布造成的區(qū)域氣象變化進行分類,以期取得更好的建模條件.文獻[10]進一步指明通過聚類與數(shù)據(jù)挖掘能夠預測某些系統(tǒng),即人工智能方法對于功率預測具有實踐意義.目前,多數(shù)研究都在采用人工智能方法的基礎上結合數(shù)據(jù)挖掘等技術從光伏功率出力角度進行建模,這種統(tǒng)計學習方法雖然避開了復雜的物理機理研究,但需要較多歷史數(shù)據(jù),在光伏電站預測的效果上仍存在泛化性能較差等問題.但是,這種由于氣象強相關性而導致的光伏出力預測性的難點卻可以用來感知海上氣象環(huán)境的高度突發(fā)性與不確定性,且有助于利用相關性來融合估計目標光伏出力,從而避免采用端到端過度復雜的模型以及傳統(tǒng)方法過擬合的風險.本文主要討論該漂浮式光伏系統(tǒng),在針對海上牧場網(wǎng)格化建設后,通過對其出力狀態(tài)的分析,判斷該系統(tǒng)是否可以感知氣象條件的突變.
采用固定式浮筒安裝方式,浮筒之間采用螺栓剛性連接,并在外圍布置減震器.部分采用活動鉸接裝置,將浮體、連接桿和陸地等固定物串聯(lián)在一起,或用纜繩錨固于岸上,部分水域采用打鋼樁、預制樁固定.以上安裝方式使得海上光伏的U-I機理模型從理論上更接近陸地的理想狀態(tài),主要因為海上環(huán)境內(nèi)的灰塵更少,使得組件不會因為灰塵附著而減少功率輸出,且水對光伏陣列的冷卻作用可以提高輸出電量[11].根據(jù)光生伏特效應,通過光伏電池將光能轉化為太陽能,其U-I特性[12]為
(1)
式中:I為太陽能電池的輸出電流;Iph為光伏電池的光生電流;Id為反向飽和電流;q為電荷常數(shù);U為光伏電池電壓;Rs為內(nèi)部串聯(lián)損耗;A為二極管品質因子;K為玻爾茲曼常數(shù);T為光伏電池溫度;Rsh為光伏電池等效并聯(lián)電阻.Iph與Id是隨環(huán)境變化的量,需要根據(jù)光照強度和溫度確定,其計算式為
(2)
(3)
式中:Isco為標準日照和標準溫度時的短路電流;ht為溫度系數(shù);Tref為標準溫度,數(shù)值為25 ℃;S為當前輻照強度;額定太陽輻射強度Sref=1 000 W/m2;系數(shù)a1=1.336×104,b1=225.最后考慮光伏電池浮體在海面受到海浪影響的擺動作用[13],根據(jù)六自由度的水動力分析,在規(guī)則波影響下可認為海浪中浮體的角度擺動為簡諧運動.對于輕浪與中浪的海況條件,根據(jù)線性波理論可知浮體質點的運動近似于圓周運動:
(4)
(5)
式中:α為海浪中浮體的角度;αmax為浮體擺動的最大角度;γ為浮體擺動周期;α0為初始相位;XA、YA為在一個規(guī)則海浪作用下質點在二維平面兩個基方向的運動軌跡;R為波高的一半;θ為近似圓周運動的角度;υ為波速;τ為時間.
總體而言,在一個擺動周期內(nèi)海上光伏電池接收輻射能約為陸地最佳條件的87%,但這主要針對小規(guī)模的漂浮體、4級以上海況而言.對于水上漂浮式光伏面積較大、海況等級較低的情況,可以認為海上光伏的實際出力與陸地接近.根據(jù)物理法對光伏出力的預測模型,光伏陣列由多個光伏電池串并聯(lián)而成,由于客觀上存在的串聯(lián)限制電流與并聯(lián)限制電壓的作用,N塊光伏組件的組合的光伏出力并不是單個光伏組件的N倍.描述光伏陣列U-I特性的5參數(shù)模型[14]如下:
(6)
式中:Vpv、Ipv分別為光伏陣列輸出電壓、電流;Npp為光伏組件串的并聯(lián)數(shù);光電流IL、二極管反向電流IO、理想因子ε、串聯(lián)電阻R1和并聯(lián)電阻R2為模型的5個參數(shù);Ns為單個光伏組件中光伏電池的串聯(lián)數(shù);Nss為光伏組件串的串聯(lián)數(shù).只要已知未來時刻的5個參數(shù),即可通過模型進行預測.物理法具有不需要大量歷史數(shù)據(jù)、結構清晰等特點,缺點在于實時的氣象條件數(shù)據(jù)難以獲得,電站的精確建模困難.對海上問題而言,由于光伏電池表面的輻射能由直射輻射、散射輻射和反射輻射3部分組成,所以式(1)中的Iph與式(6)中的IL作為一個電流源實際上是與海面反射率與大氣透明系數(shù)有關的函數(shù),影響作用如下:
(7)
(8)
式中:Is、Ig分別為散射輻射與反射輻射;In為地表總輻射能;h為太陽高度角;p為大氣透明系數(shù);ω為光伏電池安裝夾角;ρ為海面反射率.
可以看到,如果直接采用物理模型方法,則有些參數(shù)不易被實時精確獲取,因此考慮引入數(shù)據(jù)統(tǒng)計法.統(tǒng)計法使用的模型方式較多,通常是對不同天氣情況下的數(shù)據(jù)分類后尋找規(guī)律,構建模型.常用的方法有灰度模型、時間序列分析中的差分整合移動平均自回歸(ARIMA)模型等,包括人工智能算法先對數(shù)據(jù)進行數(shù)據(jù)聚類分析改進的神經(jīng)網(wǎng)絡構建模型[15]等方式.統(tǒng)計法的優(yōu)點在于從歷史數(shù)據(jù)中找尋規(guī)律,從而無需獲得實時的氣象數(shù)據(jù).本質上,統(tǒng)計法的依據(jù)是氣象條件的相似性以及氣象情況在時空間上的連續(xù)性.這些變化會客觀地反映在數(shù)據(jù)之中,尋找出數(shù)據(jù)規(guī)律即可創(chuàng)建模型.以上兩種方法的結合如圖1所示,其重點放在氣象條件的分析處理上,通常使用相關性分析、主元分析法等方法篩選出對光伏出力數(shù)據(jù)影響最大的因素,將這些氣象因素作為神經(jīng)網(wǎng)絡等其他人工智能方法的輸入[16-17],訓練模型后進行預測,結合法的目的為選定對光伏功率出力影響最大的氣象因素,通過建模手段預測得出未來的氣象因素狀況,代入至光伏陣列的物理模型中得到預測結果,該預測結果包括對天氣的預警信息.
圖1 物理法與統(tǒng)計法流程Fig.1 Process of physical method and statistical method
圖2所示為光伏發(fā)電流程與影響因素,由于氣象條件與光伏電站的輸入高度相關,所以各種預測方法要直接或間接考慮氣象條件的影響[18].例如傳統(tǒng)物理方法基于太陽輻照傳遞方程、光伏組件運行方程等物理方程進行預測,需要光伏電站詳細的地理信息以及氣象和太陽輻照數(shù)據(jù),對于分布式光伏電站建模過程復雜,且難以模擬一些極端異常天氣情況和環(huán)境及光伏組件參數(shù)隨時間發(fā)生的緩慢變化,模型抗干擾能力較差,魯棒性不強,這種特點在海上漂浮式光伏網(wǎng)格系統(tǒng)中尤其明顯,可以視為分布式光伏問題.采用純粹的統(tǒng)計學方法,基于預測模型輸入、輸出因素之間的統(tǒng)計規(guī)律進行預測,目前缺少準確的甚至可遷移的歷史運行數(shù)據(jù).因此在實際應用中大概率會出現(xiàn)過擬合問題,使得建立的模型復雜且不具有通用性.
圖2 光伏發(fā)電流程與影響因素Fig.2 Photovoltaic power generation process and influencing factors
在結合法思想基礎上,針對上述光伏出力預測思路中存在的問題,對海上光伏系統(tǒng)有關問題提出以下改進思路:① 基于云層移動帶來的客觀變化特點,進一步分析選取相似電站的影響因素,并提出一種改進密度聚類方法以精確選擇相似電站;② 由光伏功率能量來源有限的特點引入物理法中的光照輻射強度模型與光伏陣列模型以約束預測值;③ 設計一種簡單的方法給出光伏功率預測范圍,并采用長短時神經(jīng)網(wǎng)絡擬合各環(huán)節(jié)中忽略的因素造成的誤差,修正后給出預測值,進而等效于給出氣象問題中云層移動變化的追蹤預警結果.
相似電站[19]即功率曲線相似的電站,常常用以補全異常數(shù)據(jù)或擴大數(shù)據(jù)集.對相似電站的選取,通常使用斯皮爾曼相關系數(shù)或時序相關性分析.從海上氣象感知問題出發(fā),主要分析相似電站過程的時空影響因素.
由1.1節(jié)討論的光伏陣列模型相對復雜,工程上一般從能量的角度給出模型.光伏陣列輸出功率計算公式[20]如下:
(9)
式中:PG為裝機容量;S0為輻照強度;T0為環(huán)境溫度;0.036[1-(T0-25)]為溫度T0造成的影響項.輻射照度為光伏功率的能量來源,其對光伏功率的影響不言而喻.電站的裝機容量為系統(tǒng)建立時即可確定的參數(shù),決定了電站能夠接受能量的大小.其他因素如積灰、傾角、溫度等造成的影響相較于輻射照度與裝機容量影響不大.在預測工作中,裝機容量數(shù)據(jù)易于獲得,而經(jīng)云層遮擋的光伏陣列表面輻射照度數(shù)據(jù)難以獲得,對預測工作造成極大困擾,因此統(tǒng)計法期望尋找云層移動反映在數(shù)據(jù)上的規(guī)律并建模.但光伏發(fā)電數(shù)據(jù)波動的來源有兩部分:輻射照度的時間變化和云層遮擋造成照度變化.這使得使用數(shù)據(jù)訓練建模的過程變得復雜,由于晴朗天氣下的光照強度模型簡單,將其引入至統(tǒng)計法的流程中以更好地探尋由云層遮擋帶來的變化.
在相似電站的選取過程中,通常會顯現(xiàn)距離相近的電站出力結果相似的現(xiàn)象.如圖3所示,圖中數(shù)字1~7為電站編號,7個電站間距離最遠的兩個電站間距為1.5 km,裝機容量皆為15 kW.7個電站在同一天的功率曲線如圖4所示,圖中k為時刻.
圖3 電站分布位置Fig.3 Distribution location of power stations
圖4 電站出力功率曲線Fig.4 Output power curves of power stations
可以看出,處在相同區(qū)域內(nèi)的光伏電站的出力功率曲線高度相似性,以5號電站為目標電站,分析其他電站日出力曲線對該電站的時間序列相關系數(shù),在一個月的數(shù)據(jù)中,相關系數(shù)最小為0.76,最大為0.99,從而認為距離相近的電站有相似性.
為了探尋相似電站選取與距離的關系,選用一個更大區(qū)域內(nèi)分布的電站,分別使用時序相關性與聚類方法選擇相似電站.截取區(qū)域內(nèi)的46個電站,裝機容量皆為15 kW,電站空間分布位置如圖5所示.仍然選擇5號電站為目標電站,將其余45個電站與5號電站做相關性系數(shù)計算,數(shù)據(jù)量為29 d內(nèi)8:00—18:00的數(shù)據(jù),時間間隔為15 min.計算45個待選電站相對目標電站的相關系數(shù)平均值與方差,45個待選電站29 d內(nèi)相關系數(shù)的方差均小于0.01,將45個電站相對目標電站的距離和相關系數(shù)平均值做線性回歸,得到如圖6所示的曲線.回歸方程為R′=-0.003 3L+0.901 8,L為距離,R′為相關系數(shù).決定系數(shù)R2為 0.562 8,通常,R2在 0.5~0.75時,認為存在良好的關聯(lián)性.綜合數(shù)據(jù)與線性回歸方程,可以認為相似電站的選取與距離有關,并且對于某一個電站,距離其越遠的電站相關性越弱.在本文實驗數(shù)據(jù)中,對于任意電站,其1 km以內(nèi)的電站的相關性均高于0.98,功率出力曲線十分相似.
圖5 電站位置分布(大區(qū)域)Fig.5 Location distribution of power stations in large area
圖6 距離與相關性均值的線性回歸Fig.6 Linear regression of distance and mean value of correlation
為了進一步論證以上結論,使用了K-均值聚類算法對圖5中46個電站29 d內(nèi)的光伏出力數(shù)據(jù)進行聚類.聚類結果顯示,距離為1 km內(nèi)電站聚為一類的頻率極高,再次驗證了距離與相似電站選取的關系.綜上,空間位置在1 km以內(nèi)的電站出力變化不大, 在后續(xù)預測過程中對1 km以內(nèi)的電站只取1個電站分析,減少算法接受的重復信息,以幫助運算.1 km為本文數(shù)據(jù)集運算的中間結果,在其他數(shù)據(jù)集上的運算結果可以不同.
在距離與相關性的分析過程中,出現(xiàn)距離目標電站較遠的電站仍有很好相關性的現(xiàn)象,聚類分析過程中同樣出現(xiàn)某些電站與目標電站出力聚為一類的情況.為了探究其原因,仍以5號電站為目標電站,對某日功率曲線做相關性分析,距5號電站最遠的電站距離為16.3 km,最近為0.4 km;46個電站間的相關系數(shù)最小為0.87,最大為0.99,具有足夠高的相關性.選取其中3個電站的出力作為對比,其相對于5號電站的相關系數(shù)為0.87、0.91、0.96,功率曲線如圖7所示.圖中黑色曲線為目標電站的光伏功率曲線,紅色曲線對比黑色曲線在時間尺度上有超前,藍色曲線對比黑色曲線有滯后.考慮時間序列的延遲相關性,時間序列的延遲相關性關系[21]如下:
(10)
分析區(qū)域內(nèi)的所有備選電站對目標電站間的時間相關性,綜合相關性的變化情況選擇延遲時間長度為1 h,對應圖7中時間序列的4個時間點.首先對數(shù)據(jù)集中的所有時間(29 d)均做了延時相關性分析,以相關性大于0.8作為選擇依據(jù),統(tǒng)計出各個電站在每天相對于目標電站的延時常數(shù)后取平均值.距離與平均延時做線性回歸后如圖8所示,圖中T1為平均時延.從圖中看出,距離與延遲時間具有一定線性關系,線性回歸得圖中紅色曲線,曲線方程為T1=0.581L+1.310 9,計算所得相關性系數(shù)為 0.685 1,認為兩者間存在相關關系.計算按最優(yōu)延遲或超前時間做延遲后各備選電站與目標電站間的相關性.重新做距離與相關性平均值線性回歸, 得到圖9所示結果.與圖6相比,圖9在距離較遠處的相關系數(shù)有微小提升.圖中線性回歸所得曲線仍與圖5中曲線一致,相關性系數(shù)下降至 0.357 9, 認為存在弱關系.結合距離與平均延時間的關系來看,在光伏電站的相關性分析中,由距離導致的電站功率出力存在的時間差異是距離對不同光伏電站間相關性存在差異的部分原因.
圖7 4個電站的出力曲線Fig.7 Output curves of four power stations
圖8 距離與平均延時的線性回歸Fig.8 Linear regression of distance and average delay
圖9 距離與修正相關性均值的線性回歸Fig.9 Linear regression of distance and modified correlation mean
在時序分析的過程中,距離在1 km以內(nèi)的電站計算所得的延遲時間基本為0.其余相似電站的延遲時間并不相同,本文中的延遲時間是相對概念,包括超前與滯后.例如時序上超前1 h與滯后1 h均認為延遲1 h,這是因為多數(shù)電站既有超前時刻也有滯后時刻.電站間的功率出力時間序列存在延遲能夠很好地幫助預測,若能找到在時序上超前目標電站的相似電站,顯然會使預測工作難度下降.
光伏功率產(chǎn)生波動的主要原因是氣象條件的不確定性,而其中主要影響為云層移動及遮擋帶來的空間輻射照度變化,其他如懸浮顆粒、光伏電站安裝位置及朝向、逆變器等參數(shù)的影響相對固定,在1 d內(nèi)造成的變化不大.為探究云層移動帶來的功率變化,選擇了某日的出力回歸數(shù)據(jù),將1 km2區(qū)域作為最小單元,研究光伏電站分布位置與出力值,如圖10所示,圖中δ′為光伏出力占比.不同時刻的出力情況變化顯示出了光伏功率出力隨時間與空間位置不同而存在的差異,說明了不同位置光照強度的變化.這種差異來自于云層遮擋效應,一定程度上能夠為光伏功率的預測提供幫助.由于區(qū)域內(nèi)整體出力良好且有向西變化的趨勢,所以可推測西南角部分(左下)接下來時刻的功率出力出現(xiàn)在0.6~0.8 之間.圖11所示為13:15─13:30時段內(nèi)區(qū)域出力變化情況.西南角部分光伏電站的出力承接了圖8的變化趨勢.事實上,西南角部分的電站出力情況對應圖7中藍色曲線,12:15─13:30對應該曲線中的 13:00—14:45時刻.圖10和11網(wǎng)格為研究圈定的一個空間區(qū)域,一小格約為1 km,但由于存在一定的投影偏差,所以不做定量標度.由以上分析可知,不同位置電站功率存在的出力時間延遲或超前現(xiàn)象主要由云層移動造成,并且相同云層在不同時刻對太陽輻射照度的折損基本相同,從而進一步認為在相對目標電站有延時關系的相似電站中,存在著與目標電站受相同云層影響的電站.
圖10 12:00─13:00時段內(nèi)區(qū)域出力變化情況Fig.10 Changes of regional output from 12:00 to 13:00
圖11 13:15─13:30時段內(nèi)區(qū)域出力變化情況Fig.11 Changes of regional output from 13:15 to 13:30
圖10中,隨時間推移,自東向西的出力情況變得良好,與之對應的是區(qū)域中時間延遲特性中的分析,位于目標電站西邊的電站呈現(xiàn)出延遲,位于東邊的電站呈現(xiàn)出超前.這種情況出現(xiàn)的原因與氣象條件有關,選擇超前于目標電站的相似電站對于預測工作是有意義的,因此在選擇相似電站的過程中要考慮與目標電站的方位.
綜上所述,對相似電站的選取有以下幾個原則:① 距離為1 km以內(nèi)的電站認為其相對目標電站恒為相似電站,其出力值可用于異常值檢測或缺失值補全等過程;② 距離與相似電站的選取并無顯著聯(lián)系,真正影響因素為云層移動隨距離遠近造成時序上存在超前或延遲的特性;③ 做時序處理時,最大限度不超過1 h.特別地,云層在1 h以上的時間飄移出分布式電站所在區(qū)域,或云層發(fā)生變化從而對光資源的影響需要重新考慮.
數(shù)據(jù)因采集、傳輸?shù)冗^程不可避免地存在缺失、重復等問題,或因數(shù)據(jù)間量綱不一致影響分析甚至導致結論錯誤,從而有必要做數(shù)據(jù)異常處理與歸一化.基于位置相近電站出力相似的結論做數(shù)據(jù)異常值出力,基于光伏電站模型做數(shù)據(jù)歸一化處理.結合光伏功率出力特點做數(shù)據(jù)預處理,從而有益于預測工作.
由前文可知,距離1 km以內(nèi)的電站可以認為出力值相似,因此對于某個電站的缺失值進行檢測并確定位置后,可選取距離1 km以內(nèi)的電站將同一時刻的數(shù)據(jù)進行補充.本文中異常值的識別使用兩種方法:① 裝機容量使得光伏電站發(fā)電功率存在上限,檢測是否存在超出裝機容量的出力數(shù)據(jù),若存在則為異常值;② 基于前文分析結論,選取某電站及其 1 km 以內(nèi)的電站做相關性分析,對于相關性明顯較低的電站,再次采用局部離群因子(LOF)算法檢測異常值,并采用相似電站的數(shù)據(jù)替換異常值.相較于傳統(tǒng)的均值增補方法,使用1 km內(nèi)相似電站處理異常值更貼近真實數(shù)據(jù).
晴天時,光伏功率出力曲線呈正弦形狀,客觀上存在的輻照強度變化規(guī)律是導致光伏出力曲線波動的原因之一,使用符合日照強度變化規(guī)律的曲線作為歸一化標準,使得晴天下的光伏功率出力近似為一條直線.由式(9)可知,已知輻照強度與溫度即可計算光伏電站的理論出力值.而HOTTEL晴天模型作為日輻射照度模型中的一種,對于地面所接受到的輻射有著良好的擬合效果,通常誤差控制在5%,包括直接與散射輻射照度兩部分.直接輻射照度Sb(β,α)的計算方法[22]如下:
Sb(β,α)=Smτbcosδ
(11)
cosδ=cosβsinh+
sinβcoshcos(ψ-ω)
(12)
式中:Sm為總輻射;τb為直射輻射透明度系數(shù);δ為太陽光線對傾斜面的入射角;β為電池板傾斜面與水平面間的夾角;ψ為太陽方位角,從正南算起,向西為正,向東為負.式(11)適用于晴朗無云的情況,與電池板所在海拔高低相關.τb計算式為
(13)
式中:A0、A1、Ak為方程的特征系數(shù).式(13)適用于大氣能見度23 km, 海拔低于 2 500 m的情況,系數(shù)由海拔與氣候類型相關,在中緯度夏季時:
A0=0.419 719-0.007 963 7(6-A*)2
A1=0.495 39+0.005 831(6.5-A*)2
Ak=0.276 522+0.018 951 6(6-A*)2
其中:A*為海拔高度.
散射輻射照度可以用下式計算:
(14)
式中:系數(shù)τd的經(jīng)驗公式為
τd=0.271-0.294τb
(15)
由此可由經(jīng)緯度、海拔、日期和時間計算得到任意時刻某個傾斜角度時太陽能電池板水平面上的總輻射能St=Sd+Sm.值得一提的是,太陽能電池板具有傾斜角度,且依據(jù)最大功率追蹤原則該傾斜角度是變化的,該數(shù)據(jù)難以獲得,此處認為電池板為水平的.本文中的光伏電站出力數(shù)據(jù)為 8:00-18:00 時間段內(nèi)的數(shù)據(jù),每15 min采集一次,光伏電站分布位置在東經(jīng) 119.4 °~ 119.56 °和北緯 30.12 °~30.16 ° 內(nèi),東西距離24 km,南北距離 17 km,可以認為該范圍經(jīng)大氣層衰減后的光照強度一致.由2.1和2.2節(jié)計算所得的理論曲線如圖12所示.
圖12 理想晴天出力曲線Fig.12 Output curve of an ideal sunny day
事實上,使用HOTTLE晴天日照輻射模型所得到的光伏出力曲線在17:00─18:00的理想出力曲線在某些情況下略低于實際光伏出力曲線,可能原因有:① 模型本身的誤差;② 現(xiàn)實中散射輻射照度并不是各向均勻同性;③ 模型本身忽略了地面反射輻射;④ 存在其他光源.其中因素②和③在直射輻射強度較大的時段可以忽略,但在直射輻射強度很小的傍晚時刻影響較大.盡管存在一定誤差,但使用HOTTEL模型與光伏陣列模型做歸一化方法相較于傳統(tǒng)歸一化方法在由云層移動造成的數(shù)據(jù)波動上更為精準.
基于前文分析,提出一種改進的密度聚類方法,尋找存在時間空間特性的相似電站,以此為基礎設計了一種光伏功率預測算法.相似電站選取需要注意幾個特性,并且認為某個電站距離較遠的電站因云層移動而在時序上有前后關系.本質原因是相同的云層對太陽輻射強度的遮擋情況一致,當云層在分布式光伏發(fā)電所在的區(qū)域內(nèi)移動時,當前受其遮擋效應影響的電站的功率與之前受影響的電站間的光伏功率出力會有相同的下降幅度,而在云層移開時有相同的上升幅度.基于這種特性,結合前文分析論證結果,綜合設計了一種尋找時序上對于目標電站有先后順序的電站,進而通過出力狀態(tài)的預測反推出天氣可能的變化.
歸一化后的數(shù)據(jù)最大限度反映了云層移動對各位置電站功率出力的影響,相同的云層經(jīng)過造成的上升與下降的幅度大致相等,云層遮擋時出力降低,云層移開時出力上升,呈倒三角狀.目標電站的出力波動在過往時間段內(nèi)出現(xiàn)在周圍電站上,期望尋找到有延時的相似電站,將其作為預測依據(jù).由此提出一種改進的密度聚類方法.聚類算法中用數(shù)據(jù)間的距離為聚類提供依據(jù),常用的距離有曼哈頓距離、歐氏距離、余弦距離等,基于相同云層造成出力波動相似結論,要求聚類所得曲線在距離、輪廓上均要相近.余弦相似度是評價向量間輪廓相似度的有效工具,提出引入余弦相似度改進向量A、B間的距離公式:
(16)
式中:Ai、Bi為向量A、B的元素;b為偏置量,本文取0.1.
改進距離公式做聚類的結果相較于歐氏、曼哈頓距離有效剔除了輪廓不相似的結果,縮小了相似電站的選取范圍.選用密度聚類的原因[23]在于找到整個區(qū)域內(nèi)與目標電站出力相似的電站群,概率上大范圍的相似電站群預測更為精確,對于其中與目標電站相似很高的離群點電站,仍可進一步考慮,從而改進密度聚類算法流程(掃描半徑Eps為聚類算法中需要設置的一個閾值).
(1) 選定目標電站A,截取當前時刻t至t-4時刻值為At,其余備選電站截取t-1時刻至t-5時刻為Bt.
(2) 設定最小包含點數(shù)(Minpts)與Eps為密度聚類算法提供參數(shù), Minpts由空間電站分布決定, Eps考慮HOTTEL模型5%誤差,留出裕度選取為0.15.
(3)At作為聚類中心在Bt中尋找小于Eps的電站集合E.
(4) 采用密度聚類算法對這些電站進一步聚類分析,在原有的改進距離公式上進一步加入權重值:
(17)
式中:D為當前聚類點與其余聚類點之間的距離.
(5) 經(jīng)過密度聚類算法,綜合計算相對電站的均值,選取均值最小的類作為一組相似電站.在預測算法中將對目標電站改進距離最近的電站的t時刻功率出力作為目標電站t+1時刻的功率預測值.
如圖13 所示,改進密度聚類選擇時間上有延遲特性的相似電站做預測,預測的精確程度取決于所選擇的相似電站在現(xiàn)實上是否真正與目標電站受相同云層影響,并在時間上有先后順序,僅使用改進密度聚類算法很難確定.例如空間上存在的云層在短時間內(nèi)發(fā)生形變、重疊等變化,使得不存在Eps小于0.15的電站.為了解決以上問題,可適度擴大閾值Eps,并設立上限以保證精度.本文取Eps上限為0.4.此時仍無法選擇電站時,取上一時刻目標電站周圍電站出力的均值作為預測值.因此算法中部分點不可避免的存在誤差,盡管在Eps選用0.4時少有無法選擇電站的情況,然而增大閾值的方式會難以獲得真正的相似電站,從而進一步增大了誤差.
圖13 基于時空間特性的光伏出力預測方法Fig.13 Photovoltaic output prediction method based on time and space characteristics
長短期記憶(LSTM)神經(jīng)網(wǎng)絡[24]是一種基于循環(huán)神經(jīng)網(wǎng)絡(RNN)改進的深度學習算法,尤其對處理時序數(shù)據(jù)有很好的效果.LSTM繼承了RNN的遞歸屬性,充分利用時序數(shù)據(jù)的同時,也彌補了RNN 梯度消失和梯度爆炸以及長期記憶能力不足的缺點.使用考慮時空特性的目標電站預測算法后,將每日得到的預測值作為數(shù)據(jù)輸入,實際值作為輸出,使用LSTM去除由HOTTEL模型、溫度等其他隨時間變化因素帶來的誤差.基于前文分析,提出了一種依據(jù)時空間特性選擇相似電站的方法,并進一步提出一種光伏功率預測算法,相較于同模式的其他光伏功率預測算法,本方法的創(chuàng)新之處在于:① 引入了輻照模型與電站模型,提出更適合光伏功率出力的歸一化方法;② 提出了一種改進的聚類距離公式,公式兼顧了聚類向量間的歐氏距離與輪廓相似度,縮小了相似電站的選取范圍;③ 采用延遲時間方式選取得到相似電站的時空間特性明確,有利于預測工作進行;④能夠在一定程度上給出預測是否精確的提示,為調度安排提供準備時間.
鑒于國內(nèi)目前海上漂浮式光伏工程的缺失,驗證數(shù)據(jù)由浙江國家電網(wǎng)合作提供,包含浙江省杭州某地區(qū)幾百平方千米一個月內(nèi)的分布式光伏電站的功率數(shù)據(jù)及其電站的裝機容量.數(shù)據(jù)中的信息時間段為08:00─18:00的功率數(shù)據(jù),每15 min采集一次,故1 d內(nèi)數(shù)據(jù)點為40個.經(jīng)由異常處理后,2018年6月3日因數(shù)據(jù)缺失嚴重不予使用,從而數(shù)據(jù)集共有29 d的115個電站數(shù)據(jù).此外查詢了2018年6月份的天氣情況,全部為陰雨或多云天氣,每日溫差最高為11 ℃.
如圖14所示,在選定目標At與時間上相差為 15 min 后的Bt,即不做歸一化,以歐氏距離使用K-means聚類得到聚類段,以期尋找在不同時間段內(nèi)受相同云層影響的電站作為相似電站.聚類段4相對目標段更符合云層在不同位置移動造成的變化,但功率大小有明顯差異,這是因為當前時刻t為 13:00,此時輻射強度氏于聚類段所在的12:45時刻,造成了距離上的差異.此外,聚類段4所在電站可作為有時序特性的相似電站,然而在歐氏距離上聚類段1卻是最近的,這體現(xiàn)出僅使用歐氏距離選擇有時序特性的相似電站有極大困難.表1所示為其距離與電站標號對應的聚類段.
表1 未歸一化聚類算法所得聚類段Tab.1 Clustering paragraphs obtained by unnormalized clustering algorithm
如圖14所示,未經(jīng)歸一化使得因輻射照度變化在聚類過程中影響著歐氏距離的計算,同時干擾特征匹配的精準度.在圖15中的最優(yōu)聚類段對應的電站標號為14,在表2以及圖15中同樣聚類得到了14號電站.這體現(xiàn)了使用歸一化方法能夠很好地消除輻照強度隨時間變化帶來的因素,并且還得出更符合特征匹配要求的16號電站.在形狀上,聚類段1與目標段有良好的對應關系,且其在時序上超前目標15 min.改進距離公式客觀上增大了形狀不相似間向量的距離,從而更為有效地選取受相同云層影響的電站.選定某個電站,使用圖13中基于時空間特性的光伏功率預測算法對數(shù)據(jù)集中的29 d做光伏功率預測,圖16所示為其中2 d的功率值以及對應預測結果.
表2 歸一化后改進聚類所得聚類段Tab.2 Clustered paragraphs obtained by improved normalization clustering algorithm
圖14 某時間段K-means聚類效果圖Fig.14 Effect of K-means clustering in a certain period
圖15 改進聚類效果圖Fig.15 Improved clustering effect diagram
29 d內(nèi)全部預測值與實際值間的均方根誤差(RMSE)如圖17所示,經(jīng)由LSTM神經(jīng)網(wǎng)絡優(yōu)化的部分結果如圖18所示.圖16~18預測結果在大部分時間段內(nèi)的預測值精度較高,但在部分時序的預測仍有差別,這些誤差的來源是:① 在建模過程中所使用的光伏電站模型僅考慮輻射照度造成的差別,忽略了溫度、電池板傾角等其他因素,所使用的太陽輻射照度計算模型本身有5%誤差,且不計最大功率跟蹤問題;② 算法中Minpts、Eps參數(shù)的不合適選取, 使得難以聚類到相似電站,并且本身區(qū)域內(nèi)有多個對光資源有相同影響的云層移動,使得相似電站難以確定;③ 區(qū)域內(nèi)氣象變化過于劇烈,在一個采樣點15 min內(nèi)該區(qū)域氣象完全發(fā)生變化;④ 電站與電站間地處海拔、周邊環(huán)境、板面積灰等其余因素造成的誤差.LSTM神經(jīng)網(wǎng)絡在一定程度上具有優(yōu)化功能,但對于優(yōu)化前預測精度較高的情況優(yōu)化結果十分有限,表3所示為部分日優(yōu)化對比.
圖16 第8日及第14日預測結果Fig.16 Forecast results of the 8th and 14th day
圖17 29 d的RMSE分布情況Fig.17 RMSE distribution at 29 days
圖18 第5日和第13日優(yōu)化結果Fig.18 Optimization results of the 5th and 13th day
如表3所示,第16日預測結果為23.14%,誤差在15%以上,優(yōu)化后為14.35%,幅度為8.79%,預測優(yōu)化幅度在7%~9%之間.但是對于原本預測結果在8%以下的情況優(yōu)化幅度有限.要進一步開展優(yōu)化需要從更為完整的數(shù)據(jù)集入手, 同時從時空特性出發(fā)研究更為精確的機理模型來針對部分氣象變化劇烈的情況.同時本方法對分布式光伏電站的分布提出一定要求,目標電站的周圍各個方位在一定距離內(nèi)均需要有足夠數(shù)量的電站才能夠使得預測精準,這對于海上漂浮式光伏網(wǎng)格系統(tǒng)是完全可行的.但對于定性的氣象突變感知及預警,已經(jīng)達到要求.
表3 LSTM優(yōu)化前后RMSE對比Tab.3 Comparison of RMSE before and after LSTM optimization
建設海上光伏系統(tǒng)并實現(xiàn)網(wǎng)格化有利于實現(xiàn)海上牧場等場景的無人化管理,不僅表現(xiàn)在有關機器人的電力供給,還可以作為傳感器感知海上復雜的氣象變化,讓系統(tǒng)及時針對性地作做出預警保護反應.本文通過基于時空間相關性的相似電站研究,采用信息融合得到目標位置的預測出力,首先通過因素分析以及數(shù)據(jù)統(tǒng)計得出待預測區(qū)域內(nèi)的一般規(guī)律,針對因客觀云層移動帶來不同位置間電站功率出力的變化,設計了一種改進距離的密度聚類算法,并依舊算法設計出一種預測方法.通過仿真算例驗證了基于時空間相關性的目標電站預測方法在預測精度上有良好表現(xiàn),進而可以完成突變天氣預警要求的感知任務.所提研究思路可以在一定程度上克服傳統(tǒng)基于數(shù)據(jù)驅動的光伏預測算法的黑箱-過擬合缺點,且面向的海上突變天氣的感知-預警問題要比可再生能源并網(wǎng)對電力系統(tǒng)的沖擊問題有更高的誤差裕度.這種預警在時間上的提前量主要是由應用場景的最低要求決定的,可以由光伏網(wǎng)格規(guī)模等因素充分調節(jié).主要結論在面向4級及以下海況條件有效,更復雜的風浪條件有待驗證.