李夢娜, 呂承澤, 王 蕾, 李春輝
(1.中國計量科學研究院,北京 100029; 2.中國計量大學,浙江 杭州 310018)
近年來,超聲流量計由于準確度高、無移動部件、無壓力損失等特點,越來越廣泛地應用在油氣、天然氣等貿(mào)易交接計量中[1]。在大口徑氣體流量測量中,主要采用時差法多聲道超聲流量計[2,3]。天然氣是一種低碳的化石類一次能源,隨著我國能源結(jié)構(gòu)的調(diào)整,天然氣行業(yè)得到了快速發(fā)展。廣泛應用于貿(mào)易交接計量的超聲流量計的檢定和校準需求與日俱增。天然氣是易燃氣體,運行中涉及到高壓,因此,流量計的拆卸及安裝需消耗大量人力并存在安全隱患;此外,受限于天然氣計量站的檢測能力,目前流量計檢定和校準周期較長,嚴重影響生產(chǎn)運行。
依據(jù)JJG 1030—2007《超聲流量計》檢定規(guī)程,超聲流量計使用中的檢驗用于在實流裝置上檢定完成后,在檢定周期內(nèi)對流量計計量性能可靠性的檢查。開展使用中檢驗,可將超聲流量計的檢定周期由2年延長到6年[4]。采用使用中檢驗可顯著降低生產(chǎn)運行成本,有效緩解送檢的供需矛盾。機器學習算法作為一門人工智能科學,是對通過經(jīng)驗能夠自動改進的計算機算法的研究[5]。目前已有一些機器學習算法在超聲流量計檢驗領域的研究,然而模型的準確度等還難以滿足實際應用的需求[6~9]。
本文采用隨機森林機器學習算法,結(jié)合超聲流量計使用中檢驗的具體問題,建立流量偏差預測分析模型,并對影響超聲流量計準確度的特征變量進行分析,實現(xiàn)超聲流量計的使用中檢驗。主要工作包括2個方面:1) 研究超聲流量計使用中檢驗程序,通過獲取流量計的信號質(zhì)量、流態(tài)指標、計量性能等變量,對流量計各項性能開展診斷。2) 采用隨機森林算法模型對超聲流量計的流量測量偏差進行預測;并對模型結(jié)果進行不確定度評估,分析影響超聲流量計使用中測量準確度的變量,實現(xiàn)對超聲流量計使用中檢驗方法的完整評估。
時差法超聲流量計利用通過相同行程內(nèi)超聲波在順流和逆流中的時間差,計算得到流動氣體的平均流速[10]。流量計以測量聲波在流動介質(zhì)中傳播的時間與流量的關(guān)系為原理。通常認為聲波在流體中的實際傳播速度是由介質(zhì)靜止狀態(tài)下聲波的傳播速度和流體軸向平均流速在聲波傳播方向上的分量組成,順流傳播時間td和逆流傳播時間tu與各量間的關(guān)系為:
(1)
式中:cf為聲波在流體中的傳播速度;vm為流體的軸向平均流速;φ為聲道角;L為聲道長度。
利用式(1)可計算得到流體流速和聲波的傳播速度:
(2)
(3)
(4)
依據(jù)JJG 1030—2007《超聲流量計》,超聲流量計使用中檢驗的方法主要有2種,分別是標準表串聯(lián)法和聲速檢驗法[4]。但現(xiàn)場設備、安裝管路等因素往往限制了標準表串聯(lián)法的使用,因此多采用聲速檢驗法。
GB/T 30500—2014《氣體超聲流量計使用中檢驗-聲速檢驗法》對聲速檢驗法的評判方法和指標進行具體規(guī)定[11]:基于超聲流量計不同聲道的聲速測量結(jié)果計算得到工況條件下的測量聲速;基于熱力學關(guān)系計算得到工況條件下的理論聲速。將測量聲速與理論聲速間的差異作為超聲流量計的核查參數(shù),可確定超聲流量計的狀態(tài)。
由于沒有具體可實施的使用中檢驗方法,超聲流量計普遍的檢定周期為2年。為形成1種可實施的超聲流量計使用中檢驗方法,需要對影響超聲流量計使用中準確度的全部變量進行監(jiān)測和分析,明確各個變量對于超聲流量計流量偏差的指示意義,從中提取特征變量,建立流量偏差預測模型,確保超聲流量計使用中的準確度。
本文選擇天然氣站場實際運行的不同品牌型號的1臺DN100、1臺DN150及2臺DN200超聲流量計,建立基于機器學習算法超聲流量計使用中檢驗方法。
隨機森林(random forest,RF)算法[12,13]以決策樹為基學習器構(gòu)建自主抽樣集成,并在決策樹訓練過程中引入隨機屬性選擇。在模型訓練階段,隨機森林使用自助采樣法,從輸入的訓練數(shù)據(jù)集中采集多個不同的子訓練數(shù)據(jù)集來依次訓練多個不同決策樹[12]。每輪隨機采樣中,訓練集中大約有36.8%的數(shù)據(jù)沒有參與訓練集模型的擬合,而用于計算袋外誤差(out of bag error,OOB error)。在預測階段,隨機森林將內(nèi)部多個決策樹的預測結(jié)果取平均得到最終的結(jié)果,實現(xiàn)回歸。
為保障實流檢定后超聲流量計使用中的計量性能,實流檢定后可建立一種多變量的高維度數(shù)據(jù)預測模型,實現(xiàn)對使用中流量計測量偏差的高準確度預測。隨機森林機器學習算法在解決此類問題中具有一定的優(yōu)勢。
首先,保證超聲流量計流量偏差預測的準確度。隨機森林采用集成算法,其本身預測準確度比大多數(shù)算法高。在訓練過程中樣本和特征隨機性的引入,使其具備較強的抗過擬合能力,且OOB error的存在可以在模型生成過程中取得真實誤差的無偏估計[14,15]。
其次,可以對影響超聲流量計準確度的高維變量做出快速響應。隨機森林簡單易實現(xiàn),計算量小,訓練速度快,對數(shù)據(jù)集的適應能力強,使得其在處理多特征的高維數(shù)據(jù)方面極具優(yōu)勢。
此外,能夠為分析影響超聲流量計使用中準確度的各個變量的意義提供依據(jù)及驗證。隨機森林在訓練過程中,能夠檢測到特征變量間的相互影響,并由此得到特征的重要性排序,在現(xiàn)實任務中表現(xiàn)出強大的性能[16]。
首先采集基本信息:超聲流量計的品牌、口徑、等級、最大流量點及最小流量點、超聲探頭的布置情況、儀表系數(shù)、檢定信息、現(xiàn)場環(huán)境條件、安裝條件、以及配套儀表(溫度計、壓力計、組分分析儀)的基本信息。
采集超聲流量計使用中的工作數(shù)據(jù)。采集得到的實驗數(shù)據(jù)經(jīng)過計算分析處理,提取得到3類特征變量集,作為超聲流量計流量使用中檢驗模型的輸入變量,如表1所示。
表1 流量偏差預測模型的輸入變量列表Tab.1 List of input features for flow deviation prediction
1) 信號質(zhì)量。依據(jù)JJG 1030—2007,使用中檢驗應進行超聲流量計的信號質(zhì)量檢查,指標包括:信號增益、信噪比等[4]。
2) 流態(tài)指標。JJG 1030—2007規(guī)定每聲道的流速值與通流通量計的平均軸向流速值之比應在合理范圍之內(nèi)[4]。基于超聲流量計的各聲道流速、測量平均流速等,采用的流態(tài)判別指標通常包括剖面系數(shù)、對稱性指標等。
3) 計量性能。主要包括聲速檢驗數(shù)據(jù)、測量流量數(shù)據(jù)。根據(jù)GB/T 30500—2014中的指標的規(guī)定對聲速檢驗數(shù)據(jù)進行評判[11]。聲速檢驗數(shù)據(jù),包括各聲道聲速、測量平均聲速;此外,基于超聲流量計處的工況溫度、壓力、組分數(shù)據(jù),計算得到理論聲速。利用理論聲速和測量平均聲速計算得到聲速偏差。流量測量數(shù)據(jù)主要包括:超聲流量計的測量流量,以及根據(jù)測量流速和橫截面積計算得到的體積流量。
對1臺DN100、1臺DN150及2臺DN200超聲流量計,根據(jù)采集到的實驗數(shù)據(jù),進行輸入變量集的整理。此外,根據(jù)超聲流量計最近一次實流檢定結(jié)果,計算得到流量偏差作為的輸出量,得到可用于擬合輸入變量和流量偏差間關(guān)系模型的測試樣本集。
然后對4臺流量計的測試樣本集,分別抽取得到訓練樣本。研究另外采集實驗數(shù)據(jù),按照輸入變量和輸出變量的要求,得到驗證樣本,從而保證驗證樣本的獨立性。機器學習算法中訓練樣本和測試樣本的比例設置一般在2∶1~4∶1的區(qū)間內(nèi),因此本文研究的4臺流量計的訓練樣本和驗證樣本的數(shù)據(jù)數(shù)量如表2所示。
表2 訓練樣本和驗證樣本數(shù)量Tab.2 Training sample and test sample
利用訓練樣本對隨機森林模型進行訓練,建立基于隨機森林算法的預測模型并得到特征變量的重要性得分。利用建立的隨機森林模型,使用驗證樣本對使用中超聲流量計的流量偏差值進行預測,并對結(jié)果進行評估和分析。
根據(jù)訓練樣本的輸入變量集,利用訓練樣本對隨機森林模型進行訓練,隨機森林的決策樹的總棵數(shù)設置為500,每個節(jié)點的特征數(shù)量設置為輸入特征變量總量的1/3。建立隨機森林模型,得到特征的重要性得分。然后利用建立的隨機森林模型,使用驗證樣本的輸入變量集,完成對超聲流量計使用中的流量偏差值的預測。實驗中4臺流量計流量預測值與真實值的偏差如圖1所示。
圖1 預測結(jié)果與實際值的偏差Fig.1 The deviation of prediction results
由圖1可知,對于超聲流量計DN100的100個實驗點,所有數(shù)據(jù)偏差的絕對值小于0.88%,其中83個數(shù)據(jù)點的偏差值在±0.5%以內(nèi)。對于超聲流量計DN150的50個實驗點,所有數(shù)據(jù)的偏差值的絕對值小于0.26%。對于超聲流量計DN200-1的35個實驗點,所有數(shù)據(jù)的偏差的絕對值小于0.76%,其中31個數(shù)據(jù)點的偏差值在±0.5%以內(nèi)。對于超聲流量計DN200-2的80個實驗點,所有數(shù)據(jù)的偏差的絕對值小于0.12%。
本文研究的RF算法,使用均方誤差(mean square error,MSE)作為不純度函數(shù)的指標,即針對決策樹某1節(jié)點:
(5)
節(jié)點不純度的增加代表了各變量對決策樹各節(jié)點上觀測值異質(zhì)性的影響,該值越大表示變量的重要性越大[17]。節(jié)點的重要性Wi為
Wi=wi×Gi-wL×GL-wR×GR
(6)
式中:wi,wL,wR分別為節(jié)點i以及其左右子節(jié)點中訓練樣本個數(shù)與總訓練樣本數(shù)目的比例;Gi,GL,GR分別為節(jié)點i,以及其左節(jié)點、右節(jié)點的不純度。確定每1個節(jié)點的重要性之后,即可以得到某一特征變量j的重要性得分:
(7)
式中:fj為特征變量j的重要性得分;∑i∈jWi為對于特征變量j的節(jié)點重要性之和;∑i∈JWi對于所有特征變量的節(jié)點重要性之和;J為特征變量節(jié)點數(shù)量。
對每一個特征變量重要性進行歸一化處理,得到各個變量權(quán)重系數(shù)。超聲流量計特征變量重要性得分及權(quán)重系數(shù)如表3所示(流量計型號:DN100)。
表3 特征重要性的得分及權(quán)重系數(shù)Tab.3 The importance score of the features and weight coefficients
圖2 特征變量重要性排序Fig.2 The rank of the feature importance
依據(jù)權(quán)重系數(shù)進行排序,得到排名前10的變量,如圖2(流量計型號:DN100)所示,排名前10的變量的權(quán)重系數(shù)均大于0.02。其中,計量性能數(shù)據(jù)中測量平均流速、計算流量、測量流量對于流量偏差預測的重要性最為顯著。聲速偏差、理論聲速也表現(xiàn)出較高的重要性。此外,各聲道的流速數(shù)據(jù),也在重要性排名前10的特征變量中。
模型預測結(jié)果的評估分為2個方面:模型算法的不確定度評估以及各輸入變量的不確定度評估。
4.3.1 模型算法的不確定度
依據(jù)方差整體解釋率(variance explained)對隨機森林算法的表現(xiàn)進行評估。方差解釋率體現(xiàn)了預測變量對響應變量(所有的輸入特征變量)間的關(guān)系,表示了模型的擬合優(yōu)度,可以理解為模型的擬合的決定系數(shù)[18]。此外,預測值和觀測數(shù)據(jù)殘差是表征模型和真實過程之間差異的最好的定量指標,它們提供有價值的信息,可用于評估模型預的不確定性。通過模型的殘差分布、以及輸入變量和預測變量間的關(guān)系,進而分析預測模型輸出值的不確定度[19,20]。因此,隨機森林算法本身的不確定度ur,fit可以用模型擬合的殘差來表示:
(8)
式中:Qdev,fit為超聲流量計流量偏差預測值;Qdev為流量偏差的觀測值。4臺超聲流量計的擬合優(yōu)度和模型的不確定度如表4所示。
表4 隨機森林模型擬合結(jié)果評估Tab.4 Evaluation of the performance of RF model
4.3.2 模型輸入變量的不確定度
根據(jù)變量的重要性得分和權(quán)重系數(shù)排序,鑒于輸入變量中流態(tài)指標的5個變量的權(quán)重系數(shù)較小,僅對權(quán)重系數(shù)前5的計量性能特征變量進行不確定度分析。
1) 測量流速和體積流量
根據(jù)式(1)~式(4),測量流速和測量聲速的共同參數(shù)包括:各聲道長度、聲波在各聲道的順流傳播和逆流傳播的時間。超聲流量計參與體積計算的參數(shù)包括聲道長度、聲道角、聲波的傳播時間以及流通面積。聲道長度、聲道角以及流通面積均作為流量計內(nèi)置固定參數(shù),因此對于測量流速和體積流量,其影響因素都可歸結(jié)為聲波傳輸時間。因此測量流速、體積流量的不確定度主要來源于理論聲速的不確定度和聲速偏差的不確定度。
2) 理論聲速的不確定度
理論聲速值是基于溫度、壓力、組成等數(shù)據(jù),根據(jù)AGA Report No.10提供的計算公式計算得到理論值[20]。理論聲速的不確定度包括計算方法、溫度、壓力、組分測量的不確定度,因此理論聲速計算方法的不確定度取0.09%。
壓力測量(1 MPa以上)的標準不確定度為:
ur(p)=0.008 2%~0.057 7%
(9)
溫度測量的標準不確定度:
ur(T)=0.005 0%
(10)
組分含量的標準不確定度(參照一級標準氣體):天然氣中各組分含量由色譜分析儀測量得到,其不確定度由色譜分析儀測量結(jié)果的重復性和標準物質(zhì)各組分含量的不確定度量部分組成。
天然氣一級標準氣體中甲烷為平衡氣。天然氣中乙烷、丙烷和二氧化碳含量的相對標準不確定度ur(xm)為0.25%;其他組分的ur(xm)為0.5%。
氣體標準物質(zhì)中甲烷含量x1由氣體總含量(100%)扣除全部少量組分含量后得到:
(11)
式中:x1為甲烷組分含量;xm為天然氣中除甲烷外第m組分含量,m=2~11。
對氣體標準物質(zhì)中甲烷含量的標準不確定度u2(x1)進行評定。根據(jù)不確定度傳播定律,u2(x1)可由各少量組分的標準不確定度u2(xm)分量合成得到:
(12)
式中:u2(x1)為甲烷組分含量的標準不確定度;u2(xm)為天然氣中除甲烷外第m組分含量的標準不確定度?;跇藴饰镔|(zhì)中甲烷含量的標準不確定度及甲烷含量,可計算得到組分測量的相對標準不確定度ur(M)=0.013%。
理論聲速的不確定度計算結(jié)果如表5所示。
表5 理論聲速的不確定度
3) 聲速偏差不確定度
測量聲速是通過測量聲波在已知長度的路徑上傳播時間,計算得到聲波在氣體中的實際傳播速度,與理論聲速的測量原理不同。因此需要評估測量聲速與理論聲速間偏差的不確定度。
超聲流量計各聲道間的偏差不超過0.035%,視其在變化界限內(nèi)為均勻分布,各聲道間聲速測量偏差帶來的不確定度為:
(13)
在10 MPa壓力范圍內(nèi),超聲流量計聲速偏差小于0.06%。認為其在變化界限內(nèi)為均勻分布,測量平均聲速與理論聲速間偏差帶來的不確定度為:
(14)
則聲速偏差帶來的不確定度為:
(15)
理論聲速不確定度和聲速偏差的不確定度合成得到測量流速、體積流量的不確定度為:
(16)
4) 流量測量不確定度
超聲流量計流量測量的不確定度需要考慮被檢表流量測量、測量重復性及溫度、壓力、壓縮因子等的不確定度。
基于質(zhì)量守恒,被檢表處測量得到的體積流量為:
(17)
式中:qv,MUT為被檢表測量得到的體積流量;qf為標準裝置中標準表測量得到的體積流量;p為標準表處的壓力;pMUT為被檢表處的壓力;T為標準表處的溫度;TMUT為被檢表處的溫度;Z為流經(jīng)標準表的介質(zhì)氣體的壓縮因子;ZMUT為流經(jīng)被檢表的介質(zhì)氣體的壓縮因子。
實際計算中,溫度、壓力及壓縮因子帶來的不確定度較小,可以忽略。因此超聲流量計流量測量的不確定度為:
(18)
式中:ur(qv,MUT)為被檢表流量測量的不確定度;uR(qf)為超聲流量計流量測量的重復性。實流標準裝置中被檢表流量測量的擴展不確定度為0.16%,超聲流量計流量測量重復性取最大值0.08%,超聲流量計流量測量的不確定度為:
(19)
4臺超聲流量計的輸入變量的標準不確定度、權(quán)重系數(shù)的范圍如表6所示。結(jié)合特征變量的權(quán)重系數(shù),計算得到模型輸入變量的合成不確定度。
表6 輸入變量標準不確定度及權(quán)重系數(shù)Tab.6 The standard uncertainty and weight coefficient
模型輸入變量的合成標準不確定度為:ur,var=0.093%~0.048%;擴展不確定度為:Ur,var=0.19%~0.10%(k=2)。
4.3.3 預測結(jié)果的不確定度
預測結(jié)果的標準不確定度u包括測量帶來的不確定度,即:輸入變量的不確定度ur,var以及算法模型本身的不確定度ur,fit可表示為:
(20)
計算得到4臺流量計的流量偏差預測結(jié)果的標準不確定度如表7所示。
表7 預測結(jié)果的標準不確定度
根據(jù)4臺超聲流量計的預測結(jié)果,可得到基于機器學習算法的超聲流量計使用中檢驗方法的擴展不確定度范圍為:U=0.92%~0.22%(k=2)。
本文通過建立基于隨機森林算法的超聲流量計流量偏差預測分析模型,保證超聲流量計使用中的準確度,實現(xiàn)了對超聲流量計的使用中檢驗。得到的主要結(jié)論:
1) 建立超聲流量計使用中檢驗程序,通過獲取超聲流量計信號質(zhì)量、流態(tài)指標、計量性能等變量,對超聲流量計使用中的性能進行分析判斷。
2) 建立基于隨機森林算法的超聲流量計的流量偏差預測模型,并分析影響超聲流量計使用中準確度的變量。評估預測結(jié)果的不確定度,完成對超聲流量計使用中檢驗方法的完整評估。
本文的研究結(jié)果能夠為超聲流量使用中檢驗方法的推廣和應用提供依據(jù)。此外,基于隨機森林算法的預測模型建立,不僅能夠保證超聲流量計工作中的準確度,也可為超聲流量計在線校準方法的研究提供支撐。在未來的研究中,將進一步完善超聲流量計使用中檢驗程序,建立具有更強適應性的機器學習算法模型和評估系統(tǒng),保證使用中超聲流量計的準確度。