肖雄亮,陳長明
〈紅外應用〉
乙醇濃度預測的多元線性回歸模型建立及驗證
肖雄亮,陳長明
(湖南信息學院 電子科學與工程學院,湖南 長沙 410151)
設計了由光源、氣室、探測器和控制器等組成的非分散紅外吸收系統(tǒng),往氣室內(nèi)通入不同濃度的多組分氣體(含有乙醇、二氧化碳和水蒸氣),采用紅外光譜儀進行光譜數(shù)據(jù)采集,得到多組分氣體混合光譜圖。根據(jù)數(shù)據(jù)集樣本求解回歸系數(shù),建立了多元線性回歸模型,并進行干擾修正以降低二氧化碳和水蒸氣對乙醇濃度預測的影響。對建立的多元線性回歸模型進行評價,結果表明:模型真實有效且具有良好的線性回歸效果,可以用于預測氣體濃度,乙醇、二氧化碳和水蒸氣濃度預測誤差均在可接受的范圍之內(nèi),其中乙醇濃度預測誤差最小,不超過2.0×10-4。通過干擾修正盡可能排除二氧化碳和水蒸氣的干擾,能夠較準確地預測乙醇濃度。
多元線性回歸模型;乙醇濃度預測;非分散紅外技術;干擾修正
非分散紅外技術(non-dispersive infrared,NDIR)是一種基于氣體吸收理論的檢測手段,具有檢測精度高、穩(wěn)定性好且對待測樣本無損害等優(yōu)點,適用于單一組分氣體和多組分氣體濃度檢測[1-4]。二氧化碳、甲烷等氣體的吸收系數(shù)較高,濃度檢測相對容易,而乙醇的吸收系數(shù)較低且易揮發(fā),其濃度檢測較為困難。不同于其他氣體,乙醇通常與二氧化碳、水蒸氣等混合存在,例如人飲酒后呼出的氣體屬于多組分氣體,含有乙醇、二氧化碳、水蒸氣等單一組分氣體。由于水蒸氣具有紅外全譜吸收的特性,加之二氧化碳的吸收系數(shù)較高,而乙醇的吸收系數(shù)較低,二氧化碳和水蒸氣的吸收特性對乙醇濃度檢測產(chǎn)生干擾,這給乙醇濃度檢測造成很大困難。
乙醇濃度檢測近年來受到較多關注,國內(nèi)外學者針對乙醇的吸收特性開展了一系列的研究,證實了傅里葉光譜分析技術和可調(diào)諧半導體激光吸收光譜技術可以檢測乙醇濃度[5-8]。然而,這兩種技術檢測條件嚴苛且易受干擾。NDIR具有良好的穩(wěn)定性和魯棒性,抗干擾能力相對較強,已被用于一氧化碳、甲烷、二氧化硫、二氧化碳等氣體濃度檢測,并能夠得到較為理想的結果[9-12]。雖然NDIR尚未直接用于乙醇濃度檢測,但相關研究結論表明NDIR檢測乙醇濃度具有良好的可行性。鑒于乙醇濃度易受二氧化碳和水蒸氣等的干擾,單純進行NDIR檢測很難實現(xiàn)較準確的檢測。筆者通過對乙醇與其他干擾組分的濃度檢測數(shù)據(jù)進行分析,結合多元線性回歸(multiple linear regression,MLR)算法建立多元線性回歸模型,然后進行干擾修正和校準以降低干擾組分對乙醇濃度的影響,實現(xiàn)乙醇濃度較準確的預測。
為了實施NDIR,設計了非分散紅外吸收系統(tǒng),由光源、氣室、探測器和控制器等組成,如圖1所示。該系統(tǒng)原理是:光源發(fā)出的紅外光經(jīng)調(diào)制后穿過氣室,氣室內(nèi)充滿多組分氣體(含有乙醇、二氧化碳和水蒸氣)。在此過程中,光強信號被一定程度吸收,吸收后的光強信號穿透特制濾光片,被探測器接收轉(zhuǎn)換為電壓信號。電壓信號的強弱反映了多組分氣體的吸收情況,通過控制器進行數(shù)據(jù)處理后,得到多組分氣體的濃度。
假設多組分氣體中含有種單一組分氣體,根據(jù)紅外吸收特征和吸光度的加和性,采用公式(1)可以得到多組分氣體的總吸光度:
式中:total表示某一波段下多組分氣體的總吸光度;A表示多組分氣體中第種單一組分氣體在此波段的吸光度;表示多組分氣體中第種單一組分氣體在此波段的吸光系數(shù);表示多組分氣體中第種單一組分氣體的濃度;表示多組分氣體吸收光程。
需要說明的是,乙醇的濃度是基于比爾-朗伯紅外吸收理論得到,可以用公式(2)表示:
式中:表示乙醇的吸光度;0表示紅外光源光強;表示吸收后的光強;表示乙醇濃度;表示乙醇吸收光程;為比例常數(shù)。
非分散紅外吸收系統(tǒng)中采用特制濾光片,該濾光片的不同波段用于檢測多組分氣體中的單一組分氣體。假設多組分氣體含有乙醇、二氧化碳和水蒸氣3種單一組分氣體,那么濾光片的不同波段對應不同通道,依次命名為通道0、通道1、通道2。由于每個通道的總吸光度是一系列吸光度的疊加,那么3個通道可建立MLR方程組:
式中:Atotal0、A total1、Atotal2分別表示乙醇、二氧化碳、水蒸氣的總吸光度,可以根據(jù)電壓信號直接得到;Ai0、Ai1、Ai2分別表示乙醇、二氧化碳、水蒸氣在通道i的純吸光度,為待求解的未知量。根據(jù)數(shù)據(jù)集樣本求解回歸系數(shù),進而建立多元線性回歸模型。采用建立的多元線性回歸模型求解方程組得到乙醇、二氧化碳和水蒸氣3種單一組分氣體的濃度,然后進行干擾修正和校準得到準確濃度。圖2所示為MLR算法和干擾修正流程。
往氣室內(nèi)通入3種不同濃度的多組分氣體,采用精密流量計控制氣體濃度,并采用紅外光譜儀進行光譜數(shù)據(jù)采集,其中光譜分辨率為1cm-1,波數(shù)范圍為700~4500 cm-1。實驗時依次通入不同濃度的氣體,實驗后通入氮氣凈化氣室排除殘留氣體干擾。第一種多組分氣體中乙醇所占比重遠高于二氧化碳和水蒸氣,第二種多組分氣體中二氧化碳所占比重遠高于乙醇和水蒸氣,第三種多組分氣體中水蒸氣所占比重遠高于乙醇和二氧化碳。之所以控制多組分氣體中單一組分氣體的濃度,目的是獲取乙醇、二氧化碳和水蒸氣的特征吸收譜圖并對比干擾條件下每種單一組分氣體的吸收狀況,便于信號通道選取。
圖3所示為某濃度下多組分氣體的吸收譜圖,明顯可見乙醇、二氧化碳和水蒸氣的特征吸收峰,參考HITRAN數(shù)據(jù)庫并通過分析吸光度,選取通道0(3.45mm)作為乙醇信號通道,通道1(4.26mm)作為二氧化碳信號通道,通道2(2.70mm)作為水蒸氣信號通道。
在室溫和一個標準大氣壓條件下,分析3種不同濃度的多組分氣體,求解乙醇、二氧化碳和水蒸氣在各個通道的吸收系數(shù),進而得到每種單一組分氣體在通道0、通道1和通道2的響應系數(shù)。在95%置信度條件下,各個通道的響應系數(shù)估值及置信區(qū)間如表1所示。
圖3 某濃度下多組分氣體的吸收譜圖
表1 各個通道的響應系數(shù)估值及置信區(qū)間
對建立的多元線性回歸模型進行評價及回歸方程顯著性檢驗,結果如表2所示。其中,2表示回歸模型決定系數(shù),表示統(tǒng)計量,表示統(tǒng)計量的概率值,2表示誤差方差的估計值。與顯著水平(設定為0.05)比較可知值落在拒絕域,所以回歸方程是顯著的。通道0、通道1和通道2回歸模型決定系數(shù)2分別為0.9932、0.9846、0.9901,都非常接近于1,表明建立的多元線性回歸模型具有良好的線性回歸效果。
表2 回歸模型評價參數(shù)
為了驗證建立的多元線性回歸模型有效性、干擾修正及理論計算的正確性,定量分析干擾條件下每種單一組分氣體的吸收狀況,對3種不同濃度的多組分氣體中乙醇、二氧化碳和水蒸氣濃度分別進行預測。利用濾光片的不同波段對應不同通道干擾修正后的吸光度直接反演氣體濃度,得到乙醇、二氧化碳和水蒸氣濃度預測值,并將預測值與實測值對比得到預測誤差。3種多組分氣體相關成分濃度的預測值與真實值對比、預測誤差情況分別見圖4~圖9。
圖4、圖6、圖8分別為乙醇濃度預測值與實測值對比、二氧化碳濃度預測值與真實值對比、水蒸氣濃度預測值與真實值對比,圖5、圖7、圖9分別為乙醇濃度預測誤差、二氧化碳濃度預測誤差、水蒸氣濃度預測誤差。由圖4、圖6和圖8可知,乙醇濃度預測值、二氧化碳濃度預測值和水蒸氣濃度預測值與實測值都非常接近,這表明理論計算正確并且建立的多元線性回歸模型真實有效,可以用于預測氣體濃度。由圖5、圖7和圖9可知,乙醇濃度預測誤差絕對值不超過2.0×10-4,二氧化碳濃度預測誤差絕對值不超過3.0×10-4,水蒸氣濃度預測誤差絕對值不超過5.0×10-4,均在可接受的范圍之內(nèi),其中乙醇濃度預測誤差最小。這表明通過干擾修正盡可能排除二氧化碳和水蒸氣的干擾,能使乙醇濃度預測誤差控制在合理范圍內(nèi),證實了建立的多元線性回歸模型干擾修正效果良好,預測結果較準確。
圖4 乙醇濃度預測值與實測值對比
圖5 乙醇濃度預測誤差
圖6 二氧化碳濃度預測值與實測值對比
圖7 二氧化碳濃度預測誤差
圖8 水蒸氣濃度預測值與實測值對比
圖9 水蒸氣濃度預測誤差
對乙醇濃度樣本數(shù)據(jù)進行誤差分析,得到誤差評價參數(shù)如表3所示。其中,MSE(mean square error)表示樣本均方誤差,MAE(mean absolute error)表示樣本平均絕對誤差,MAPE(mean absolute percentage error)表示樣本平均絕對百分比誤差,MSPE(mean square percent error)表示樣本均方百分比誤差,RMSE(root mean square error)表示樣本均方根誤差,SSE(the sum of squares due to error)表示樣本誤差平方和。理想的預測模型應具有較低的MSE、MAE、MAPE、MSPE、RMSE和SSE。由表3可知,將干擾修正后的吸光度用于反演乙醇濃度,乙醇濃度預測樣本的誤差評價參數(shù)都較低,進一步證實建立的多元線性回歸模型能夠較準確地預測乙醇濃度。
1)利用自行設計的由光源、氣室、探測器和控制器等組成的非分散紅外吸收系統(tǒng),通過光譜數(shù)據(jù)采集得到多組分氣體混合光譜圖,進而確定了乙醇、二氧化碳和水蒸氣信號通道。并通過分析3種不同濃度的多組分氣體,根據(jù)數(shù)據(jù)集樣本求解回歸系數(shù),建立了多元線性回歸模型。
2)建立的多元線性回歸模型真實有效,乙醇濃度預測值、二氧化碳濃度預測值和水蒸氣濃度預測值與實測值都非常接近,且預測誤差均在可接受的范圍之內(nèi),乙醇濃度預測誤差最小,不超過2.0×10-4。通過干擾修正盡可能排除二氧化碳和水蒸氣的干擾,并將干擾修正后的吸光度用于反演乙醇濃度,能夠較準確地預測乙醇濃度。
[1] 張珅, 王煜, 趙欣, 等. 基于NDIR開放光路CO2濃度測量的標定方法研究[J]. 儀表技術與傳感器, 2020(3): 100-104.
ZHANG Shen, WANG Yu, ZHAO Xin, et al. Research on calibration method of CO2concentration measurement based on NDIR open optical path[J]., 2020(3): 100-104.
[2] Muller M, Graf P, Meyer J, et al. Integration and calibration of non-dispersive infrared (NDIR) CO2low-cost sensors and their operation in a sensor network covering Switzerland[J]., 2020, 13(7): 3815-3834.
[3] Dinh T V, Lee J Y, Ahn J W, et al. Development of a wide-range non-dispersive infrared analyzer for the continuous measurement of CO2in indoor environments[J]., 2020, 11(10): 1024.
[4] 張施令, 李京偉. 基于NDIR技術的高壓組合電器中CF4氣體檢測方法研究[J]. 高壓電器, 2019, 55(7): 158-164.
ZHANG Shiling, LI Jingwei. Research on CF4gas detection method in GIS gas chamber based on NDIR technology[J]., 2019, 55(7): 158-164.
[5] 鄧波, 龐小鋒. 乙醇在靜磁場作用下的傅里葉紅外光譜研究[J]. 激光與紅外, 2008, 38(2): 141-144.
DENG Bo, PANG Xiaofeng. Study on the infrared spectra of ethanol under action of static magnetic field[J]., 2008, 38(2): 141-144.
[6] GENG H, LIU J G, ZHANG Y J, et al. Ethanol vapor measurement based on tunable diode laser absorption spectroscopy[J]., 2014, 63(4): 043301.
[7] GAO H, XIE L, GONG P, et al. Detection of ethanol using a tunable interband cascade laser at 3.345mm[J]., 2018(8): 303-309.
[8] 耿輝, 劉建國, 張玉鈞, 等. 可調(diào)諧半導體激光吸收光譜法測量空氣中乙醇蒸氣[J]. 光學學報, 2014, 34(8): 315-321.
GENG Hui, LIU Jianguo, ZHANG Yujun, et al. Measurement of ethanol vapor in air with tunable diode laser absorption spectroscopy[J]., 2014, 34(8): 315-321.
[9] 孫友文, 劉文清, 汪世美, 等. 非分散紅外多組分氣體檢測技術及其在CEMS中的應用[J]. 紅外, 2011, 32(5): 23-26.
SUN Youwen, LIU Wenqing, WANG Shimei, et al. Non-dispersive infrared multi-component gas analysis technology and its application in CEMS[J]., 2011, 32(5): 23-26.
[10] 凌慧嬌, 陶勝康, 林雨倩, 等. 非分散紅外法測定煙氣中二氧化硫常見問題的探討[J]. 現(xiàn)代鹽化工, 2020(3): 27-28.
LING Huijiao, TAO Shengkang, LIN Yuqian, et al. Discussion of common problems in analyzing sulfur dioxide by non-dispersive infrared method[J]., 2020(3): 27-28.
[11] Mikuta R, Silinskas M, Bourouis R, et al. Characterization of non- dispersive infrared gas detection system for multi gas applications[J]., 2016, 83(7-8): 410-416.
[12] WU Y Z, SHI Z H. The design of the test chamber that offers environmental conditions to detect non-dispersive infrared gas concentration[J]., 2014(602-605): 2285-2289.
Establishment and Verification of Multivariate Linear Regression Model for Prediction of Ethanol Concentration
XIAO Xiongliang,CHEN Changming
(,,410151,)
A non-dispersive infrared absorption system comprising a light source, gas chamber, detector, and controller is designed, and multi-component gases of different concentrations (including ethanol, carbon dioxide, and water vapor) are injected into the chamber. An infrared spectrometer is used to collect the spectral data, and amulti-component gas mixture spectrum isobtained. A multiple linear regression model is established based on the regression coefficients of the dataset samples, and interference correction is performed to reduce the effect of carbon dioxide and water vapor on the concentration of ethanol. The established multiple linear regression model is evaluated, and the results indicate that the model is reliable and effective with a good linear regression effect. The model can be used to predict the gas concentration, and the prediction errors of ethanol, carbon dioxide, and water vapor concentration are within an acceptable range. The prediction error of ethanol concentration is the minimum, which is less than 2.0×10-4. The interference of carbon dioxide and water vapor can be mostly eliminated through interference correction. Importantly, the ethanol concentration can be predicted more accurately.
multiple linear regression model, prediction of ethanol concentration, non-dispersive infrared, interference correction
O432
A
1001-8891(2021)12-1228-06
2021-02-07;
2021-05-01.
肖雄亮(1978-),男,副教授,主要研究方向:機械自動化控制、智能算法等。E-mail:teacher_xiao410@126.com。
湖南省教育廳科學研究重點項目(20A347)。