摘 要:從底層模型框架和約束條件著手,通過對4種常用的大氣源解析受體模型進行了深入分析,得出以下結(jié)論:在源已知的情況下,CMB模型能夠有效地用于監(jiān)測異常情況。在源未知的情況下,PMF模型和Unmix模型展現(xiàn)出優(yōu)于APCA-MLR模型的穩(wěn)健性,因此,PMF模型和Unmix模型成為進行大氣源解析的更佳選擇。由于操作簡便,PMF模型在實際應(yīng)用中獲得了更廣泛的應(yīng)用和認可。此外,合理引入約束性條件和有效地整合更多維度的數(shù)據(jù),對提升受體模型的精確度至關(guān)重要。
關(guān)鍵詞:大氣污染;源解析;受體模型;約束條件
中圖分類號:X51 文獻標志碼:B 文章編號:2095–3305(2024)09–0-03
隨著工業(yè)化和城市化的推進,大氣污染問題日益凸顯。尤其是由PM2.5、SO2、O3和VOCs(揮發(fā)性有機化合物)等污染物導(dǎo)致的霧霾,對公眾生活和健康構(gòu)成了嚴重危險。此外,有機化合物(VOCs)所引起的光化學(xué)污染和近地層臭氧污染日益成為不容忽視的環(huán)境問題。面對復(fù)雜的污染物及其形成機理,對污染源進行精確評價和有效管控顯得尤為迫切,然而這個過程充滿挑戰(zhàn)。
傳統(tǒng)的源模型,如CMAQ和CAMx側(cè)重于預(yù)測和預(yù)警,對污染源排放數(shù)據(jù)與研究者的計算能力要求較高,模型的復(fù)雜性也提高了從業(yè)者的入門門檻,即使在監(jiān)測技術(shù)不斷進步的背景下,源解析工作的進展依然受限。因此,發(fā)展一種基于觀測數(shù)據(jù)、操作簡便的方法,合理分配觀測到的污染物濃度至各污染源成為當(dāng)前的研究重點。這類方法統(tǒng)稱為受體模型,與源模型不同,受體模型更側(cè)重于影響點的環(huán)境行為??偨Y(jié)了幾種常用的大氣源解析受體模型的形成過程和應(yīng)用背景,并介紹了一些近年來提出的受體模型源解析方法,同時展望了未來的研究方向。
1 受體模型的基本框架
在受體模型的早期發(fā)展階段,研究者缺乏明確的原則定律作為指導(dǎo)。因此,為了實現(xiàn)降維,最初的受體模型往往采用簡單的主成分分析(PCA)方法結(jié)合軸旋轉(zhuǎn)進行降維處理。隨后,有學(xué)者基于質(zhì)量守恒定律,提出污染源排放濃度與監(jiān)測濃度之間應(yīng)滿足一定的等式關(guān)系,這一發(fā)現(xiàn)促使傳統(tǒng)的最小二乘法(OLS)被廣泛應(yīng)用于解決相關(guān)方程。由于OLS假設(shè)觀測樣本不存在測量誤差,與實際情況不符合,因此后續(xù)的研究將測量誤差納入目標函數(shù),這一改進成為當(dāng)時的研究重點。
基于這一思想,化學(xué)計量領(lǐng)域的研究者改進了因子模型,開發(fā)了目標轉(zhuǎn)換因子分析法(TTFA)。隨后,為了解決解集過大的問題,研究重心放到非負約束上。至20世紀90年代,基于ALS(交替最小二乘法)設(shè)計了PMF模型(Positive Matrix Factorization,PMF),基于奇異值分解設(shè)計了Unmix模型,且被相關(guān)研究者通過實驗驗證了其準確性,至此受體模型的框架得到了基本確定。
目前,受體模型基于質(zhì)量守恒前提,通過質(zhì)量平衡分析確定和劃分大氣中各污染成分的來源。受體模型的核心在于處理和分析由不同污染源排放所形成的混合大氣樣本,其目標是提取污染特征,即識別各污染源及其對總污染的貢獻,而不是單純對污染樣本進行分組。因此,從現(xiàn)代數(shù)據(jù)處理的視角來看,受體模型在本質(zhì)上屬于一種降維模型。
為了保證受體模型的科學(xué)性和有效性,模型的構(gòu)建必須滿足下述4條約束條件:(1)模型的結(jié)果能為觀測結(jié)果給出準確的解釋;(2)預(yù)測的污染源成分濃度必須是非負的;(3)計算得到的每個污染源對污染物的貢獻應(yīng)當(dāng)是非負的;(4)所有計算出的污染源每種污染物總和必須≤測得的每種污染物的總量。
受體模型的通式如公式(1)和(2)所示。
Xij=Gik·Fkj+Eij=Cij+Eij#(1)
s.t:Gik≥0,F(xiàn)kj≥0,Eij≥0#(2)
其中,Xij是第j種污染物在第i個樣本中的濃度,F(xiàn)kj是第j種污染物在污染源p排放的物質(zhì)中的濃度,Gik是第p個源對樣本的貢獻,Eij是殘差,而Cij是通過模擬的監(jiān)測濃度。通過上述約束,受體模型能夠在保證合理性的前提下,為大氣污染源解析提供一種有效的數(shù)學(xué)工具。通過上述模型表達及其約束條件,受體模型能夠在保證物理合理性的前提下,為大氣污染源解析提供一種有效的數(shù)學(xué)工具,進而為大氣污染防治提供科學(xué)依據(jù)。
2 受體模型的分類
常用的受體模型根據(jù)是否需要輸入已知污染源信息分為兩類:源已知受體模型和源未知受體模型。
2.1 源已知受體模型
在源已知受體模型中,化學(xué)質(zhì)量平衡模型(CMB)較為典型。CMB模型通過構(gòu)建潛在污染源與大氣污染物濃度之間的線性方程組并求解,以獲取污染源因子及其貢獻。CMB模型的原理簡明,類似于簡單的“機器學(xué)習(xí)”過程。在已知污染源信息可靠、準確的情況下,不需要大量的樣本即可得到準確的因子和貢獻,因此適用于識別主要氣象學(xué)條件和當(dāng)?shù)匕l(fā)生的異常狀況(火災(zāi)、沙塵暴等)對分析結(jié)果的影響[1]。
然而,CMB模型對共線性問題較為敏感,同時計算結(jié)果可能包含負值,且CMB模型高度依賴準確的污染源信息,信息準確性或完整性不足將極大影響分析結(jié)果[2]。因此,由于難以獲取完整的污染源信息,CMB模型在大氣源解析領(lǐng)域的應(yīng)用相對受限。
2.2 源未知的受體模型
在源未知的受體模型中,PMF、Unmix和絕對主成分—多元回歸模型(APCA-MIR)等模型得到了廣泛應(yīng)用。APCA-MLR模型是對PCA模型改良后形成的模型,它通過將PCA模型與多元線性回歸結(jié)合,解決了PCA模型計算結(jié)果可能出現(xiàn)負值的問題。雖然嚴格來說,APCA-MLR模型不屬于受體模型,但因其操作簡便,在其他受體模型尚未被封裝成軟件程序前,APCA-MLR模型被廣泛使用。而PMF模型和Unmix模型作為新一代源未知受體模型,因其被美國環(huán)保署(EPA)封為應(yīng)用程序EPA-PMF和EPA-Unmix,操作簡便,成為現(xiàn)階段大氣源解析研究中的主流模型[3]。
在實際研究中,有些研究者同時采用PMF模型和Unmix模型進行分析,以獲取更可信的源分析結(jié)果。相比Unmix模型,盡管PMF模型更能克服降維模型的“取短補長”的弱點,但當(dāng)采集的數(shù)據(jù)質(zhì)量好且數(shù)量足夠時,在不太準確的定量分析方面,兩者差異不大。PMF模型允許研究人員估計每個污染樣本的不確定度,因此,具有良好的穩(wěn)健性。
盡管PMF模型可能引發(fā)旋轉(zhuǎn)模糊度問題,即解的多重性可能導(dǎo)致解釋困難或收斂性差。但在實際應(yīng)用中,因為被分析的污染物種類繁多、樣本數(shù)量充足,難以解釋的情況很少發(fā)生。同時,EPA-PMF開發(fā)得較為完善,不僅提供了BS-DI SPC蒙特卡洛誤差估計區(qū)間(BS,DISP,BS-DISP)評估旋轉(zhuǎn)模糊度,還能添加約束方程以減少解空間,這些優(yōu)勢使得PMF模型在大氣源解析的應(yīng)用更為廣泛。
3 受體模型的應(yīng)用與改進
有研究表明,影響受體模型源解析研究的關(guān)鍵因素包括用于分析大氣污染樣本的標曲里污染物的種類和采樣的時間分辨率。雖然模型選擇和參數(shù)設(shè)置看似并不重要,但這并不意味著受體模型的改進空間有限。目前的研究并不僅限于通過模型得出污染源矩陣的分析,還通過將源解析結(jié)果與其他參數(shù)和模型結(jié)合,以確定污染源并分析其影響。
隨著監(jiān)測技術(shù)的進步和大氣溯源需求的增加,對受體模型的結(jié)果要求更加準確、全面?,F(xiàn)階段,研究方法是將源解析結(jié)果與其他模型耦合,以滿足不同的需求。例如,為了分析污染源的本地空間分布,研究者引入了條件性雙變量概率函數(shù)(CBPF)和非參數(shù)風(fēng)回歸模型。李如梅[4]利用CBPF模型分析得出,太原市VOCs本地排放源主要是機動車尾氣,而工業(yè)源則主要來自城市外圍,這為太原市內(nèi)VOCs的防控提供了重要依據(jù)。
若要挖掘污染源的時序周期性,可耦合Lomb-Scargle譜分解模型進行時序分析,美國研究團隊通過時序分析發(fā)現(xiàn)了硫酸鹽和硝酸銨的季節(jié)性行為在夏季和冬季節(jié)呈現(xiàn)出截然相反的模式,從而揭示了背后的大氣化學(xué)機制。將受體模型的結(jié)果與CMAQ-Chem等源模型結(jié)合,可以得到更加全面的污染影響分析結(jié)果[5]。有學(xué)者將PMF結(jié)果與氣象參數(shù)相結(jié)合,通過Cmaq-Chem模型模擬了采樣期間的O3和NO2濃度,發(fā)現(xiàn)模擬濃度和實際濃度吻合良好,從而驗證了實驗結(jié)果的準確性;韓國相關(guān)研究團隊通過將PMF結(jié)果與Cmaq-wrf耦合,對首爾周邊地區(qū)的VOCs和PM污染進行了區(qū)域性模擬,為當(dāng)?shù)匚廴究刂铺峁└娴馁Y料。
若要進行長距離潛在源的分析,則常將受體模型與PSCF(Potential Source Contribution Function)模型結(jié)合使用[6]。通過對這些模型的統(tǒng)計分析,揭示污染物跨區(qū)域傳輸?shù)穆窂?。有學(xué)者通過PSCF模型得出北京市春季VOCs區(qū)域污染主要來自西北方向的內(nèi)蒙古和山西地區(qū),它們的煤炭燃燒和二次生成是影響城市環(huán)境質(zhì)量的關(guān)鍵因素。
為了評估VOCs污染物對大氣O3濃度的影響可以結(jié)合OBM(Observation Based Model)大氣光化學(xué)模型進行分析[7]。有學(xué)者的研究表明,在北京城區(qū),燃料揮發(fā)和液化石油氣的使用對O3 的形成貢獻相對較小,而汽車尾氣的排放對O3濃度的貢獻較大。
隨著機器學(xué)習(xí)技術(shù)的進步,不少研究開始將受體模型的結(jié)果與機器學(xué)習(xí)方法相結(jié)合,以構(gòu)建低成本且實時的污染溯源系統(tǒng)。例如,浙江大學(xué)團隊通過PMF模型與機器學(xué)習(xí)方法的融合,僅需依據(jù)4種污染物數(shù)據(jù)就能完成污染溯源工作,這極大地提高了大氣污染防控的效率[8]。
這些“耦合式”的改進方法因其易于上手和實用性強,已被廣泛應(yīng)用于大氣污染源解析工作,它們?yōu)榄h(huán)境監(jiān)測及污染控制領(lǐng)域的研究人員提供了強有力的工具。然而,需要注意的是,盡管這些方法有效地擴展了受體模型的應(yīng)用范圍,它們更多的是在現(xiàn)有結(jié)果基礎(chǔ)上進行延伸,并沒有對原始模型結(jié)果進行優(yōu)化或進行根本性的改進。
南開大學(xué)團隊針對這一問題,在將大氣邊界層高度作為PMF的預(yù)處理參數(shù)的基礎(chǔ)上,創(chuàng)新性地構(gòu)建了DN-PMF(Dispersion Normalized PMF)模型。此后,他們還通過預(yù)處理補償?shù)姆绞綄⒐饣瘜W(xué)等參數(shù)納入分析并取得良好的VOCs源解析效果。同時,直接修改受體模型以減少誤差的研究也取得了進展,比如,通過3階張量處理檢測過程中的相關(guān)性誤差,顯著縮小了污染因子和貢獻的誤差范圍。
隨著計算機算力的提升和研究范式的迭代,現(xiàn)代研究更加側(cè)重于計算機和統(tǒng)計學(xué)方法的應(yīng)用[9]。貝葉斯模型框架在新的受體模型建模中得到了較為廣泛的應(yīng)用,主要是因為它允許研究者根據(jù)不同的情況設(shè)計先驗分布,通過先驗參數(shù)估計和蒙特卡洛的模擬生成的DN-PMF和F矩陣,使得結(jié)果更精準且符合實際。Eun Sug Park[10]通過貝葉斯框架設(shè)計的“分位數(shù)分解”模型,以及對誤差的先驗重尾分布設(shè)定,成功識別了污染源的異常排放并排除了異常值的干擾。
不論是“耦合式”還是“改進式”受體模型研究方法的核心目標,皆是通過同化更多維度的數(shù)據(jù)或設(shè)計更多的先驗約束,獲得更加準確、全面的解析結(jié)果。例如,通過提升時間分辨率,增加監(jiān)測物種類和假設(shè)源排放符合正態(tài)分布等手段,旨在豐富結(jié)果所包含的信息維度。這種方法論體現(xiàn)了“沒有免費的午餐定理”,即如果不向模型中引入額外信息,就不可能構(gòu)建出更準確和符合現(xiàn)實的模型。
此外,模型的集合封裝也顯得至關(guān)重要。大多數(shù)研究者可能缺乏足夠的信息技術(shù)背景,這限制了他們對新技術(shù)的應(yīng)用。在此方面,EPA-PMF和EMP-Unmix提供了良好的范例。這些模型通過友好的用戶界面和封裝良好的操作流程,極大地降低了研究者在實際應(yīng)用中的技術(shù)門檻。
4 結(jié)束語
在過去的十年間,我國在受體模型技術(shù)方面取得了顯著的進步,并已廣泛應(yīng)用于源解析領(lǐng)域,這為大氣防治工作帶來了積極成效。隨著對大氣污染控制要求的不斷提升,以及大氣污染源的日益復(fù)雜化,對大氣污染源解析的需求也日益增長。
近年來,隨著大氣污染物采樣技術(shù)的發(fā)展,能夠低成本、高效率地深入了解各受體模型的優(yōu)劣和技術(shù)發(fā)展現(xiàn)狀,推動受體模型技術(shù)的進一步發(fā)展,更精準地識別和量化污染源。同時,機器學(xué)習(xí)領(lǐng)域的飛速進展為數(shù)據(jù)處理提供了新的范式和方法,為受體模型技術(shù)的進一步發(fā)展奠定了堅實的基礎(chǔ)。
未來,受體模型將不再追求簡潔化和“輕量化”,而應(yīng)回歸源模型分析的思路,強調(diào)對污染排放、遷移過程和檢測手段的準確描述。受體模型應(yīng)當(dāng)超越定性分析框架,通過深入刻畫污染傳輸過程細節(jié),同化更多層次的數(shù)據(jù),實現(xiàn)精確的定量溯源。這種方法不僅能夠提供更為全面的分析結(jié)果,還能夠滿足對精準防治的需求,從而為我國的大氣污染防治工作做出更大的貢獻。
參考文獻
[1] 楊妍妍,李金香,梁云平,等.應(yīng)用受體模型(CMB)對北京市大氣PM2.5來源的解析研究[J].環(huán)境科學(xué)學(xué)報,2015,35 (9):2693-2700.
[2] 朱坦,吳琳,畢曉輝,等.大氣顆粒物源解析受體模型優(yōu)化技術(shù)研究[J].中國環(huán)境科學(xué),2010,30(7):865-870.
[3] 蔡美全,常淼,丁萌萌,等.大氣揮發(fā)性有機物受體模型來源解析研究進展[J].環(huán)境科學(xué)與技術(shù),2024,47(2):224-237.
[4] 李如梅,閆雨龍,王成,等.太原市城區(qū)夏季VOCs來源及其對O3生成的貢獻[J].中國環(huán)境科學(xué),2021,41(6):2515-2525.
[5] 張樹憲,李洋,張眾志,等.基于CMAQ/ISAM空氣質(zhì)量模型的北京市夏季臭氧來源解析研究[J].環(huán)境科學(xué)研究, 2022,35(5):1183-1192.
[6] 羅菊英,張儀,劉希文.結(jié)合源解析的大氣污染相關(guān)氣象要素特征分析[J].環(huán)境科學(xué)與技術(shù),2020,43(5):65-73.
[7] 龐曉蝶.關(guān)中平原傳統(tǒng)工業(yè)城市大氣VOCs污染特征及來源解析[D].北京:中國環(huán)境科學(xué)研究院,2023.
[8] 石展宏.典型精細化工園區(qū)基于機器學(xué)習(xí)的VOCs排放特征分析與溯源研究[D].杭州:浙江大學(xué),2024.
[9] 王慶.基于貝葉斯受體模型的排水管網(wǎng)外水來源解析[J].綠色科技,2023,25(10):102-107.
[10] Park E S,Oh M-S. Bayesian quantile multivariate receptor modeling[J]. Chemometrics and intelligent laboratory systems, 2016 (159): 174-180.
收稿日期:2024-06-19
作者簡介:金泉至(1998—),男,湖北武漢人,研究方向為大氣揮發(fā)性有機物來源解析。#通信作者:楊利娟,E-mail:1018788995@qq.com。