皇甫延琦,田瑛澤*,董世豪,戴啟立,史國良,周瀟雨,魏 楨,千 勇,馮銀廠 (南開大學環(huán)境科學與工程學院,國家環(huán)境保護城市空氣顆粒物污染防治重點實驗室,天津 0050;.安徽省環(huán)境監(jiān)測中心站,安徽 合肥 007;.合肥市環(huán)境監(jiān)測中心站,安徽 合肥 00)
隨著我國經濟的高速發(fā)展,環(huán)境問題日益凸顯,尤其是近幾年以霧霾為代表的大氣顆粒物污染問題[1-5].為此 2013年國務院提出了《大氣污染防治計劃》十條措施.利用大氣顆粒物來源解析技術,可以更精確的識別出顆粒物的主要污染源類,同時對其貢獻做出定量的估算,以此更有針對性地展開與大氣顆粒物有關的研究和治理工作[7].
正定矩陣因子分析模型(PMF)作為一種源未知類的受體模型在顆粒物來源解析工作中得到廣泛應用.王蘇蓉等[8],韓力慧等[9],陳剛等[10]利用PMF模型對我國多個大城市的大氣顆粒物進行了來源解析研究.由于PMF模型主要依賴于受體數(shù)據自身變化規(guī)律進行解析,需要基于大量的受體觀測數(shù)據.通常選擇將單一點位的長時間序列數(shù)據納入模型進行解析,數(shù)據量越大,模型結果越穩(wěn)定[11].為了滿足模型需求同時綜合解析區(qū)域大氣污染來源,Escrig等[12],Mooibroek等[13],Larsen等[14],Tian等[15]都嘗試將多點位的受體數(shù)據合并納入PMF模型進行計算,期望獲得更加穩(wěn)定且能在一定程度上反映區(qū)域顆粒物來源狀況的結果.以上這些研究討論了將多點位信息用于來源解析的意義,但是也指出將多點位合并解析會引入更多的不確定性.因此,本研究針對大氣顆粒物多點位數(shù)據在不同情境下合并解析的結果進行了探討.
本課題組之前的研究表明:將多個受體點位的數(shù)據首尾相接合并納入 PMF模型時,點位間源成分譜差異性越小, PMF的解析結果越理想[15].基于之前的研究成果,本文在具有相同源成分譜的兩個點位,研究了源貢獻時間趨勢(各源類的貢獻在一定時間內的變化特征)和樣品量對 PMF結果的影響.考慮到環(huán)境數(shù)據的復雜性和未知性,無法直接得到環(huán)境中各源類的準確貢獻,因而無法對模型的擬合結果進行直接評估,所以本研究使用了模擬試驗的方法,通過設定多個不同情景,對特定情景下的數(shù)據結果分別進行探討,總結初步的規(guī)律.隨后結合合肥市2014年實測PM2.5數(shù)據進行驗證.最終為多點位源解析的研究提供指導和依據.
PMF(正定矩陣因子分解)模型最早于 1994年由Paatero和Tapper發(fā)表論文提出;到了1997年,Paatero進一步在論文中提出基于最小二乘法的運算方法的 PMF模型[11].隨后,Paatero和Hopke又不斷對PMF模型進行改進和完善,最終美國EPA官方網站對EPAPMF軟件進行了推廣.PMF的基本公式如下[16]:
X代表的是受體點位樣品的各組分濃度矩陣;G代表源貢獻矩陣;F代表源成分譜矩陣;E代表殘差.對源成分譜F的各類因子進行識別,判別顆粒物污染源類,而源貢獻矩陣G可以估算各顆粒物排放源對大氣顆粒物的貢獻情況,E可以表示在模型計算過程中的一些不確定性.
本文擬選擇受揚塵、機動車尾氣塵和硫酸鹽共同影響的兩個不同點位進行研究. “真實貢獻值”由人為設定,污染源成分譜的構建參考了張彩艷等的研究[17],利用Matlab函數(shù)基于設定的貢獻值和已構建的源譜生成一系列模擬數(shù)據.考慮了兩點位的源貢獻時間趨勢和受體數(shù)據量大小兩個因素共劃分了三大類八小類情景.默認多點位數(shù)據為同步采集得到的數(shù)據,故兩個點位的受體數(shù)據量同步變化.當受體數(shù)據量為50時認為數(shù)據量較少,數(shù)據量為 100及以上時認為數(shù)據量較多.具體情景分類設置如下:
(1)兩點位間源貢獻時間趨勢完全相同
(1)- a:受體數(shù)據量較少(50條受體);(1)- b:受體數(shù)據量較多(100條受體).
(2)兩點位間源貢獻時間趨勢完全不同
(2)- a:受體數(shù)據量較少(50條受體);(2)- b:受體數(shù)據量較多(100條受體).
(3)兩點位間源貢獻時間趨勢部分相同
(3)- a:有兩種源類的源貢獻時間趨勢相同,且受體數(shù)據量較少(50條受體);(3)- b:有兩種源類的源貢獻時間趨勢相同,且受體數(shù)據量較多(100條受體);
(3)- c:兩點位僅有一種源類的源貢獻時間趨勢相同,且受體數(shù)據量較少(50條受體);
(3)- d:兩點位僅有一種源類的源貢獻時間趨勢相同,且受體數(shù)據量較多(100條受體).
本研究利用平均絕對誤差(average absolute error, AAE)[18]來評估PMF的解析結果,AAE的計算公式如下:
式中:1, 2, …, N表示受體的組數(shù);gnj表示第j類源對第 n個受體的估算貢獻值,μg/m3;j表示第 j類源的真實貢獻值,μg/m3.
AAE值是估算貢獻值與真實值的接近程度,即解析結果的準確性. AAE值越小則表示模型解析結果越準確;同時定義三種源類整體的AAE的均值為 TAAE,以此衡量模型對數(shù)據整體解析效果的穩(wěn)定性,當TAAE值大于50%時可認為未能解析出穩(wěn)定的結果.最終通過模型結果的穩(wěn)定性和準確性來進行綜合評估.
為了評價真實環(huán)境數(shù)據的點位間源貢獻時間趨勢,本文引入了“點位間標識組分的相關性”COR這個指標,用來判斷兩個點位的源貢獻時間趨勢關系. COR的計算公式如下:
式中:gaj和gbj表示第j類源對第a個和第b個點位的估算貢獻值,μg/m3;CORREL代表Pearson相關系數(shù),當點位間標識組分的相關性達到某一閾值(本文取 0.5),認為其標識的源類在兩點位貢獻的時間趨勢較為一致.達到閾值的標識組分越多,說明點位間的源貢獻時間趨勢一致性越好.由于很難找到點位間源貢獻時間趨勢完全一致的數(shù)據,這里選擇將單個點位的真實環(huán)境數(shù)據直接復制然后合并在一起進行解析.
2014年夏、秋和冬季(7月23日~8月18為夏季采樣,10月15日~11月2日為秋季采樣,12月3日~12月16日為冬季采樣)分別于合肥市廬陽區(qū)(市區(qū)北部,工業(yè)聚集區(qū))、包河區(qū)(市區(qū)南部,行政住宅區(qū))和瑤海區(qū)(市區(qū)東部,工業(yè)文教混合區(qū))進行受體樣品采集(如圖 1所示).三個點位均使用武漢天虹公司研發(fā)的四通道采樣器(型號:TH-16A,中國)對 PM2.5樣品進行采集.依據濾膜特性和采樣后用于化學分析的需要,本研究使用了直徑47mm的聚丙烯(分析元素組分)和石英濾膜(分析碳組分和離子組分).共采集樣品 252個,其中有效樣品234個,有效樣品約占總數(shù)93%.采樣過程考慮了氣象等自然因素和污染源排放等人為因素的影響.
重量分析使用電子天平(型號 CP225D,Germany).空白濾膜和采后濾膜稱重前均需在恒溫恒濕環(huán)境中(20 ℃ ± 1 ℃ , 5 0%±5%)平衡24h以上.碳組分分析使用光碳分析儀(DRI Model 2001,USA)對 OC(有機碳)和 EC(元素碳)進行分析.水溶性陰陽離子分析使用安徽省環(huán)境監(jiān)測中心站實驗室的 Dionex-ICS2000型離子色譜儀,具體分析方法可參考文獻[19].無機元素分析使用美國安捷倫公司的Agilent 7700x型電感耦合等離子體質譜儀,分析測定了19種元素(Na, Mg,Al, S, K, Ca, Ti, V, Cr, Mn, Fe, Co, Ni, Cu, Zn, As,Cd, Hg和Pb)的含量.
圖1 合肥市采樣點位Fig.1 Sampling sites in Hefei
三種情境中三類源擬合結果的AAE值如圖2所示,三種情景中PMF模型結果的TAAE值如表1所示.
2.1.1 各點位間源貢獻時間趨勢完全相同 情景(1)中,假設所有點位間源貢獻時間趨勢相同,那么合并后的多點位受體數(shù)據集可以看成是單一點位的受體數(shù)據復制了多次后合并在一起.如果將兩個點位的數(shù)據看成完全一樣的A數(shù)據集,那么A+A則表示兩個源貢獻時間趨勢完全相同的受體點位的數(shù)據的集合.對于情景(1)- a,無論A或者A+A兩種情形,PMF模型都無法解析出穩(wěn)定合理的結果. PMF模型結果中所有源類的AAE均大于50%,且TAAE達到了約80%,甚至沒有識別出合理源類結果.將兩個受體點位的數(shù)據合并在一起納入PMF模型時,解析結果有了一定改善,但仍為未得到穩(wěn)定的結果.情景(1)- b中,數(shù)據集A和A+A均可以得到較好解析結果,且各源類 AAE值以及 TAAE值差異不大,機動車源AAE甚至變差.即當單個受體數(shù)據數(shù)量較多時,將多點位數(shù)據集合納入PMF模型進行解析,解析結果不會變得更好.
圖2 三種情境中各類源擬合結果的AAE值(%)Fig.2 AAE of every source contributions in three scenarios
2.1.2 各點位間源貢獻時間趨勢完全不同 在情景(2)中,假設兩個受體點位的源貢獻時間趨勢情況完全不同,即模型對多點位受體數(shù)據集的解析輸入數(shù)據可以看成是不同點位(A、B)的受體數(shù)據合并在了一起.在情景(2)-a中,數(shù)據集 A和 B單獨解析TAAE達到了80%~90%,即PMF模型無法解析出結果,但合并后的數(shù)據集(A+B)卻能夠解析出較為穩(wěn)定的結果,其TAAE降至約40%,同時各源類的AAE均有所降低,源解析結果穩(wěn)定性和準確性均有所提高;情景(2)-b中,數(shù)據集 A和B以及合并后數(shù)據集(A+B)均能解析出穩(wěn)定的結果,但不同數(shù)據集之間各源類的解析結果存在一定差異.總體來看合并后源解析結果穩(wěn)定性有所提升但并非所有源類的解析結果準確性都有所提升.
2.1.3 各點位間源貢獻時間趨勢部分相同 在情景(3)中,假設所有點位源貢獻時間趨勢僅有部分是相同的.多點位受體數(shù)據集的解析的輸入數(shù)據可以看成是相似點位(A、A’)的受體數(shù)據集合在了一起.情景(3)-a數(shù)據集A和A’單獨解析未都能出穩(wěn)定的解析結果,數(shù)據集A的所有源類解析結果均較差,各源類AAE和TAAE均大于50%;而 A’雖得到了源解析結果,但揚塵源的 AAE明顯偏高達到了約 55%;合并后的數(shù)據集(A+A’)得到了較好解析結果,所有源類的AAE和TAAE均小于 35%,解析結果的穩(wěn)定性和準確性有明顯提高.對于情景(3)- b至情景(3)- d,數(shù)據集A、A’和(A+A’)納入PMF模型均能解析出結果,但是其解析結果的穩(wěn)定性和準確性差異較大.在情景(3)-b中,相較數(shù)據集 A 和 A’合并數(shù)據集(A+A’)的TAAE并未降低,解析出的結果的穩(wěn)定性和準確性并未提高;情景(3)-c中,雖然數(shù)據集 A、A’和(A+A’)的揚塵源AAE均超過了40%,但合并后數(shù)據集(A+A’)TAAE和其他源類AAE均有所降低,解析結果的穩(wěn)定性和準確性相較兩個點位單獨解析均有一定程度的提高.對于情景(3)-d,數(shù)據集(A+A’)TAAE 變化不大.但數(shù)據集(A+A’)機動車源和揚塵源的解析結果相較數(shù)據集A和A’卻變得非常極端,機動車源的AAE下降到5%以內.而揚塵源的AAE增加至55%以上.由此看來合并后的解析結果沒有明顯提高,甚至對某些源類解析變差.
表1 三種情景中PMF模型結果的TAAE值Table 1 TAAE values of PMF in three scenarios
2.1.4 三種情景下擬合結果 TAAE值綜合討論 當各點位間源貢獻時間趨勢完全相同時,受體樣品的數(shù)據量對 PMF模型解析結果影響并不大,合并解析后結果并沒有變好;當各點位間源貢獻時間趨勢差異明顯時,受體樣品的數(shù)據量會對 PMF解析結果產生較大影響.當單個點位受體數(shù)據量較少時,合并解析效果的穩(wěn)定性會明顯提高,整體準確性會有所改善;當單個點位受體數(shù)據量較多時,合并解析可以略微提高模型的穩(wěn)定性,但是各源類準確性不一定會有所升高;當各點位間源貢獻時間趨勢部分相同時,較少受體數(shù)據量的點位進行合并解析會增加結果的穩(wěn)定性,但是不一定會提高結果的準確性.較多受體數(shù)據量的點位合并解析對結果的穩(wěn)定性影響并不明顯,同時部分源類解析結果的準確性可能變差.由此可見隨著各點位的源貢獻時間趨勢差異變大,通過合并多點位受體數(shù)據進行 PMF分析,整體上有助于解析結果穩(wěn)定性的提高,但是對結果準確性影響不大,甚至使部分結果變差.
表2 點位間標識組分的相關系數(shù)Table 2 CORs of tracer components between sampling sites
考慮到真實環(huán)境數(shù)據的不確定性,使用合肥市廬陽區(qū),包河區(qū)和瑤海區(qū)點位2014年4月~12月 PM2.5數(shù)據作進一步探究.研究期間內合肥市廬陽區(qū),包河區(qū)的 PM2.5濃度分別為 87.4μg/m3,90.3μg/m3和 96.2μg/m3,均超過國家二級標準,污染形勢較為嚴峻.3個點位的元素,碳組分以及水溶性離子分別占總濃度的7.4%、27.4%、54.4%,7.7%、25.9%、51.6%和8.8%、23.7%、50.3%.3個站點均體現(xiàn)出水溶性離子最高,碳組分其次,元素占比最低的組分分布特征.
圖3 廬陽區(qū)PM2.5因子譜Fig.3 Source profiles of PM2.5 in Luyang (Hefei)
為了驗證模擬實驗的結論,評價不同源貢獻時間趨勢和不同樣品量下多點位數(shù)據合并解析的適用性.將廬陽區(qū)、包河區(qū)和瑤海區(qū)三個點位數(shù)據以及其兩兩合并的數(shù)據集(含單點位復制然后合并的數(shù)據集)分別納入 PMF模型進行解析,結果廬陽區(qū)單獨解析以及將廬陽區(qū)和瑤海區(qū)合并解析得到了較好的結果,其他數(shù)據集未得到合理結果.對于廬陽區(qū)的解析結果共提取出四個因子.因子譜如圖3所示,因子1中主要包含OC、EC、NO3-,這指示了機動車源;因子 2主要包含SO42-、NO3-、NH4+、OC 等,這指示了二次源;因子 3主要包含 OC、EC、SO42-、NO3-、Al、Si,這指示了燃煤源;因子 4主要包含 SO42-、OC、EC、Al、Si、Ca等,這指示了城市揚塵源.其中,二次源和燃煤源對合肥市的貢獻較高分別占到了 40.9%和 27.1%,其次是城市揚塵源和機動車源分別占到了 19.4%和 11.5%.對于廬陽區(qū)和瑤海區(qū)合并解析也提取了四個因子(圖4).依據標識組分分析可以看出因子1為機動車源,因子2是二次源,因子 3是燃煤源,因子 4是城市揚塵源,其貢獻分別為 16.9%,40.1%,29.7%,11.4%. 這與陳剛等[11]關于合肥城區(qū) PM2.5季節(jié)污染特征及來源解析研究中的結果較為一致.
圖4 廬陽區(qū)&瑤海區(qū)PM2.5因子譜Fig.4 Source profiles of PM2.5 in Luyang & Yaohai(Hefei)
結合點位間標識組分的相關性(表2),可以看出廬陽區(qū)和瑤海區(qū)僅有 SO42-的相關性較好,其整體源類貢獻時間趨勢差異性最大,最終合并解析得到較好的結果.與模擬實驗的結論基本吻合,即隨著各點位的源貢獻時間趨勢差異變大,通過合并多點位受體數(shù)據進行PMF分析,整體上有助于解析結果穩(wěn)定性的提高.此外,可能由于不同點位真實環(huán)境數(shù)據的差異,僅廬陽區(qū)單點位直接解析得到了較好結果.因此選擇將多點位數(shù)據合并納入PMF模型進行解析需要注意使用的前提條件,只有當多個點位受相同源類影響,且點位間源貢獻時間趨勢存在較大差異時,合并解析可以得到較好的結果.
3.1 在各點位間源貢獻時間趨勢完全一致時,無論環(huán)境信息是否充足,通過合并不同點位的受體數(shù)據來增加輸入數(shù)據的數(shù)量都不會令PMF模型的解析準確性有明顯提高.
3.2 當各點位間源貢獻時間趨勢差異明顯時,將不同點位數(shù)據合并解析可以提高模型結果的穩(wěn)定性,但是不一定會提高結果的準確性.
3.3 當各點位間源貢獻時間趨勢部分相同時,雖然解析結果的穩(wěn)定性有所上升,但是結果的準確性不一定變好,甚至變差.
3.4 選擇將多點位數(shù)據合并納入 PMF模型進行解析需要注意使用的前提條件,只有當多個點位受相同源類影響,且點位間源貢獻時間趨勢存在較大差異時,合并解析可以得到較好的結果.
[1]胡 敏,唐 倩,彭劍飛,等.我國大氣顆粒物來源及特征分析[J]. 環(huán)境與可持續(xù)發(fā)展, 2011,36(5):15-19.
[2]Chan C K, Yao X H. Air pollution in mega cities in China [J].Atmospheric Environment, 2008,42:1-42.
[3]Zhang Y H, Hu M, Zhong L J, etl. Regional Integrated Experiments on Air Quality over Pearl River Delta 2004 (PRIDEPRD2004): Overview [J]. Atmospheric Environment 2008,42(25):6157-6173.
[4]Laupsa H, Denby B, Larssen S, et al. Source apportionment of particulate matter (PM2.5) in an urban area using dispersion,receptor and inverse modeling [J]. Atmospheric Environment 2009,43:4733-4744.
[5]Chen D S, Cheng S Y, Liu L, et al. An integrated MM5—CMAQ modeling approach for assessing trans-boundary PM10contribution to the host city of 2008 Olympic summer games—Beijing, China [J]. Atmospheric Environment, 2007,41:1237-1250.
[6]《大氣污染防治行動計劃》[EB/OL]. (2014-09-13) http://www.gov.cn/ zwgk/2013-09/12/content_2486773.htm.
[7]朱 坦.大氣顆粒物來源解析 [M]. 北京:科學出版社, 2012.
[8]王蘇蓉,喻義勇,王勤耕,等.基于PMF模式的南京市大氣細顆粒物源解析 [J]. 中國環(huán)境科學, 2015,35(12):3535-3542.
[9]韓力慧,張 鵬,張海亮,等.北京市大氣細顆粒物污染與來源解析研究 [J]. 中國環(huán)境科學, 2016,36(11):3203-3210.
[10]陳 剛,劉佳媛,皇甫延琦,等.合肥城區(qū) PM10及 PM2.5季節(jié)污染特征及來源解析 [J]. 中國環(huán)境科學, 2016,36(7):1938-1946.
[11]Paatero P. Least squares formulation of robust non-negative factor analysis [J]. Chemometrics and Intelligent Laboratory Systems 1997,37:23-35.
[12]Escrig A, Monfort E, Celades I, et al. Application of optimally scaled target factor analysis for assessing source contribution of ambient PM10[J]. J. Air & Waste Manage, 2009,59:1296—1307.
[13]Mooibroek D, Schaap M, Weijers E P, et al. Source apportionment and spatial variability of PM2.5using measurements at five sites in the Netherlands [J]. Atmospheric Environment, 2011,45(25):4180-4191.
[14]Larsen B R, Gilardoni S, Stenstr?m K, et al. Sources for PM air pollution in the Po Plain, Italy: II. Probabilistic uncertainty characterization and sensitivity analysis of secondary and primary sources [J]. Atmospheric Environment, 2012,50:203-213.
[15]Tian Y Z, Shi G L, Han B, et al. The accuracy of two- and three-way positive matrix factorization models: Applying simulated multisite data sets [J]. Journal of the Air & Waste Management Association, 2014,64(10):1122-1129.
[16]Hopke PK. Recent developments in receptor modeling [J].Journal of chemometrics, 2003,17:255-265.
[17]張彩艷,吳建會,張 普,等.成都市冬季大氣顆粒物組成特征及來源變化趨勢 [J]. 環(huán)境科學研究, 2014,27(7):782-789.
[18]Javitz H S, Watson J G, Robinson N. Performance of the chemical mass balance model with simulated local-scale aerosol [J].Atmospheric Environment, 1988,22:2309—2322.
[19]Zhang T, Cao J J, Tie X X, et al. Water-soluble ions in atmospheric aerosols measured in Xi'an, China: Seasonal variations and sources [J]. Atmospheric Research, 2011,102(1):110-119.