武文培,陳夢舫,韓璐,顧明月,陳雪艷,龔澤瀚,李婧
1.中國科學(xué)院南京土壤研究所,中國科學(xué)院土壤環(huán)境與污染修復(fù)重點實驗室,江蘇南京 210008
2.中國科學(xué)院大學(xué),北京 100049
3.南京凱業(yè)環(huán)境科技有限公司,江蘇南京 210008
4.四川師范大學(xué)化學(xué)與材料科學(xué)學(xué)院,四川成都 610066
隨著我國經(jīng)濟快速發(fā)展和產(chǎn)業(yè)結(jié)構(gòu)的升級調(diào)整,大批高污染、高能耗工業(yè)企業(yè)搬遷,遺留工業(yè)場地的土壤與地下水污染問題突出,對城市及周邊環(huán)境具有較大的健康與環(huán)境風(fēng)險[1-4],污染場地的安全再開發(fā)利用已成為城市高質(zhì)量發(fā)展的瓶頸問題[5-8].針對工業(yè)場地污染狀況不清、污染風(fēng)險不明的問題,我國生態(tài)環(huán)境部已經(jīng)出臺了一系列管理規(guī)范和技術(shù)導(dǎo)則以監(jiān)管工業(yè)污染場地的良性流轉(zhuǎn)和安全開發(fā),同時中國科學(xué)院南京土壤研究所也率先開發(fā)了污染場地土壤與地下水風(fēng)險評估軟件系列(HERA、HERA++、HERA-3D)[9-12]以支持污染場地風(fēng)險評估技術(shù)的實際應(yīng)用和推廣.為提高對工業(yè)污染場地的監(jiān)管效率,我國生態(tài)環(huán)境部于2018年正式頒布了《土壤環(huán)境質(zhì)量建設(shè)用地土壤污染風(fēng)險管控標準(試行)》(GB 36600?2018),用于對場地污染風(fēng)險的初步篩查和管控.當場地土壤中關(guān)注污染物的濃度等于或低于篩選值時,場地污染的健康風(fēng)險可以忽略,場地可直接進入開發(fā)環(huán)節(jié);反之,該場地將進入地方政府環(huán)境監(jiān)管的污染場地名錄,需要對場地開展詳細調(diào)查和風(fēng)險評估工作,評估關(guān)注污染物的健康風(fēng)險并判斷是否需要實施修復(fù)措施.因此,在風(fēng)險初步篩選階段,場地的污染程度往往決定了該場地是否需要進入污染場地名錄的關(guān)鍵要素[7-8].
在污染場地風(fēng)險評估實踐中,依據(jù)我國《建設(shè)用地土壤污染風(fēng)險評估技術(shù)導(dǎo)則》(HJ 25.3?2019),基于污染物單點濃度的篩選比較是一種常用的方法[13-16].但是人類活動的強烈干擾以及場地土壤的非均質(zhì)性,往往導(dǎo)致場地土壤污染存在高度的空間異質(zhì)性[17-18],即使在很小的空間尺度(0.10~1 m)上,不同采樣位置也會導(dǎo)致污染物濃度相差數(shù)倍甚至更高[18].因此,基于單點濃度代表采樣單元或區(qū)域土壤的污染程度具有極大的不確定性,可能導(dǎo)致過高或過低估計場地污染的風(fēng)險水平,難以對污染場地的風(fēng)險管理形成有效支撐.環(huán)境統(tǒng)計學(xué)方法則可以基于對大量樣本數(shù)據(jù)的統(tǒng)計分析結(jié)果,整體反映場地受污染的平均水平,更加接近場地污染的真實狀況,從而降低污染場地風(fēng)險管控決策的不確定性[19].
目前,基于統(tǒng)計方法的污染場地風(fēng)險評估研究在我國尚未受到廣泛關(guān)注和認可,一方面受限于政府部門對統(tǒng)計學(xué)方法的接受程度,另一方面我國尚未針對場地污染風(fēng)險評估工作的環(huán)境統(tǒng)計方法頒布專門的技術(shù)導(dǎo)則.相關(guān)系列導(dǎo)則涉及統(tǒng)計學(xué)方法的描述微乎其微,如HJ 25.3?2019導(dǎo)則僅提及可以利用正態(tài)分布污染物檢測數(shù)據(jù)平均值的置信上限值計算致癌風(fēng)險和危害商;《污染地塊風(fēng)險管控與土壤修復(fù)效果評估技術(shù)導(dǎo)則》(HJ 25.5?2018)指出樣品數(shù)量≥8個,采用樣品平均值的95%的上限值與修復(fù)標準進行比較進而評估修復(fù)效果.但上述導(dǎo)則并未給出正態(tài)分布判別以及置信上限值的計算方法.此外,不同污染物在土壤中賦存和遷移特性的差異導(dǎo)致多數(shù)場地污染數(shù)據(jù)不符合正態(tài)分布特征[19-22],對非正態(tài)分布的污染物濃度的估計及風(fēng)險表征方法亟待研究.
在污染場地風(fēng)險管理中,英美兩國已經(jīng)形成了成熟、系統(tǒng)的統(tǒng)計方法.英國環(huán)境署(UK Environment Agency,UK EA)于2008年頒布的《土壤污染濃度與臨界濃度比較導(dǎo)則》(Guidance on Comparing Soil Contamination Data with a Critical Concentration)[23](簡稱“英國CL:AIRE導(dǎo)則”)中詳細介紹了統(tǒng)計學(xué)方法在臨界濃度(如篩選值、管制值或修復(fù)目標值)與土壤污染濃度比較以及在場地管理決策中的應(yīng)用,其統(tǒng)計方法也在我國HERA系列軟件中得到應(yīng)用[10-12].英國環(huán)境署于2020年更新了該導(dǎo)則,進一步豐富了場地管理決策方法,并強調(diào)全面理解數(shù)據(jù)集的重要性[24];美國環(huán)境保護署(USEnvironmental Protection Agency,USEPA)自1989?2006年先后頒布了多個導(dǎo)則,利用統(tǒng)計學(xué)方法評估或管理污染土壤[25-29],此后又相繼開發(fā)統(tǒng)計學(xué)軟件ProUCL協(xié)助管理決策者做出更加可靠合理的決定[30].經(jīng)多次補充與修正,該軟件于2022年更新至ProUCL 5.2版本,同時發(fā)布了ProUCL技術(shù)導(dǎo)則(ProUCL Technical Guide,Statistical Software for Environmental Applications for Data Sets with and Without Nondetect Observations)(簡稱“美國ProUCL導(dǎo)則”)[30]以協(xié)助相關(guān)人員管理處置污染場地.依據(jù)收集的污染物數(shù)據(jù),英美兩國導(dǎo)則進行風(fēng)險篩選決策的流程大致相同,依次為描述性統(tǒng)計分析、污染數(shù)據(jù)審查、分布類型判別、真實平均濃度估算等,最后對場地風(fēng)險水平進行篩選(見圖1).其中英美兩國導(dǎo)則在分布類型判斷、真實濃度估算及風(fēng)險水平篩選存在區(qū)別.該文以我國某污染場地為研究案例,依據(jù)英美兩國導(dǎo)則,基于統(tǒng)計方法學(xué)估算場地平均濃度進而評估場地的污染程度,并以篩選值作為臨界濃度初步篩選污染風(fēng)險,進而比較上述兩種方法的差異性及優(yōu)缺點,以期為我國建立精細化工業(yè)污染場地土壤的健康風(fēng)險評估方法提供理論依據(jù).
圖1 基于統(tǒng)計方法學(xué)的污染場地風(fēng)險篩選決策框架Fig.1 Framework on risk screening decision of contaminated sites based on the statistical methodology
該研究區(qū)域為某焦化場地,包括生活辦公區(qū)、煤場區(qū)、煉焦區(qū)、制氣區(qū)、焦油精煉區(qū)(見圖2).經(jīng)初步調(diào)查可知場地特征污染物為萘.地層結(jié)構(gòu)自上而下依次為雜填土(0~1 m)、粉質(zhì)黏土/淤泥質(zhì)黏土層(1~2 m)和黏土層(2~4 m).采用系統(tǒng)布點法,在0.2、0.5、1.5 m深度分別采集171個土壤樣品,在3 m處采集103個土壤樣品,累計獲取616個萘污染土壤樣本.
圖2 焦化場地歷史空間布局Fig.2 Historical space layout of coking contaminated land
合理有效的樣本數(shù)據(jù)集是統(tǒng)計學(xué)應(yīng)用的前提,因此在統(tǒng)計分析前需對樣本數(shù)據(jù)集進行審查.數(shù)據(jù)集要求采取簡單隨機、分層隨機或者分層系統(tǒng)采樣方法獲得樣本;樣本均勻分布在整個研究區(qū)域,而不應(yīng)針對疑似污染地塊進行加密布點,避免對某一區(qū)域施以過高的權(quán)重;基于統(tǒng)計分析表征識別場地內(nèi)異常污染區(qū)域;樣本位置應(yīng)處于同一性質(zhì)的地層,即相同的介質(zhì)類型;且樣本量需足夠大以提高統(tǒng)計分析結(jié)果的可靠性[24,30].對于不同分布類型和偏度的數(shù)據(jù)集,樣本量的要求也存在區(qū)別,一般數(shù)據(jù)偏度越大,要求的樣本量越多[30].
此外,場地調(diào)查數(shù)據(jù)中通常含有大量低于檢出限(detection limit,DL)的數(shù)據(jù)[31],即未檢出值(ND).為了保證數(shù)據(jù)樣本的完整性,對未檢出的數(shù)據(jù)也應(yīng)做出處理. ND數(shù)值介于0~DL之間,通常采用0、DL或DL/2替代ND,再對數(shù)據(jù)統(tǒng)計分析,或者只對高于檢出限的數(shù)據(jù)進行統(tǒng)計分析[23,30-31].但是上述ND數(shù)據(jù)的處理方法均會影響統(tǒng)計分析的結(jié)果,例如,如果使用DL替代ND會高估樣本平均值、低估變異系數(shù),而用0代替則產(chǎn)生相反的結(jié)果[19].英國CL:AIRE導(dǎo)則采用DL或DL/2替代ND,但是當ND在數(shù)據(jù)集中的比例大于15%時,則需對ND替代之后的數(shù)據(jù)進行敏感性分析,判斷選擇不同替代值對數(shù)據(jù)統(tǒng)計結(jié)果的影響程度[23].該文采用DL/2替代法處理ND值. 除替代法外,美國ProUCL導(dǎo)則中提供了Kaplan-Meier(K-M)非參數(shù)估計法,也稱為“乘積極限估計法”(product limit estimate,PLE)[32]和次序統(tǒng)計量回歸法估計樣本中ND[33-34].
除ND值外,樣本中可能存在嚴重偏離樣本的異常值,這可能是因為采樣或者分析操作失誤等引起的,也可能是場地真實情況,必須謹慎判斷、識別異常值[19,23,29-30].通常應(yīng)對包含異常值和剔除異常值的樣本分別進行統(tǒng)計分析,判斷異常值對統(tǒng)計結(jié)果的影響程度,然后決定異常值的取舍.英美兩國導(dǎo)則均提供了異常值判別方法,包括Dixon、Rosner、Grubbs和Walsh檢驗等方法[23,30].該研究采用Rosner檢驗方法判斷異常值,該方法要求樣本量大于25,且異常值的個數(shù)小于10個[35].具體判斷步驟如下.
第一步:假定場地污染采樣分析結(jié)果為Xi,按照遞增順序排列得X(1),X(2),···,X(n),確定數(shù)據(jù)中異常值樣本點的最大數(shù)量r0(r0≤10).
第二步:計算n個樣本的平均值x和標準差s,分別記為和s(0).首先確定距最遠的樣本,記為y(0).從數(shù)據(jù)集中剔除y(0),計算剩余樣本點的平均值和標準差,分別記為和s(1);其次確定距離最遠的值,記為y(1). 從數(shù)據(jù)集中剔除y(1),計算剩余樣本點的平均值和標準差,記為x(2).依次類推直到去除r0個異常值.計算完成后,得到數(shù)組如下所示:,s(0),y(0)];,s(1),y(1)]; ···;,s(r0?1),y(r0?1)].
第三步:檢驗數(shù)據(jù)集中是否存在r個異常值,計算檢驗統(tǒng)計量Rr:
將Rr與臨界值λr比較:如果Rr≥λr,則存在r個異常值,否則返回第三步檢驗數(shù)據(jù)是否存在r?1個異常值,直至確定數(shù)據(jù)集中的全部異常值,參數(shù)r從r0開始至1結(jié)束,臨界值λr可參考USEPA相關(guān)導(dǎo)則[29].此外,Rosner異常值檢驗法可與箱尾圖和Q-Q圖結(jié)合使用,幫助決策者確定潛在異常值的數(shù)量[30].
污染數(shù)據(jù)的分布特征與真實平均濃度的估算結(jié)果密切相關(guān),準確分析數(shù)據(jù)分布特征是評估場地污染程度的前提.通常,從數(shù)據(jù)的集中趨勢、離散程度和分布形狀3個方面測度和描述數(shù)據(jù)的分布特征,集中趨勢反映數(shù)據(jù)向中心靠攏的程度;離散程度反映數(shù)據(jù)遠離中心值的趨勢;分布形狀反映數(shù)據(jù)的偏態(tài)和峰態(tài)[36].
美國ProUCL導(dǎo)則首先利用統(tǒng)計直方圖和箱線圖刻畫場地污染數(shù)據(jù),并統(tǒng)計了包括樣本量、平均值、中位數(shù)、標準差、偏度和峰度系數(shù)等測度值分析數(shù)據(jù)分布特征;同時,美國ProUCL導(dǎo)則總結(jié)了場地污染數(shù)據(jù)常見的3種分布類型?正態(tài)分布、對數(shù)正態(tài)分布、伽馬分布,并利用Q-Q圖(quantile-quantile plot)和擬合優(yōu)度(goodnessof fit,GOF)檢驗方法進行判斷.GOF是一種用于判斷檢測數(shù)據(jù)與理論分布預(yù)期值一致性的統(tǒng)計假設(shè)檢驗方法,其中Shapiro-Wilk(S-W)和Lilliesfors GOF檢驗用于判斷數(shù)據(jù)是否服從正態(tài)分布和對數(shù)正態(tài)分布[37-38],而Kolmogorov-Smirnov(K-S)和Anderson-Darling(A-D)GOF檢驗用于判別數(shù)據(jù)與伽馬分布的符合程度[39-40].S-W檢驗屬于P值檢驗法,P值表示原假設(shè)為真時樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率[36].假設(shè)顯著性水平α=0.05,當S-W檢驗P>0.05時,則可接受數(shù)據(jù)呈正態(tài)(對數(shù)正態(tài))分布的假設(shè),否則拒絕原假設(shè).其余檢驗方法屬于臨界值檢驗法,當檢驗統(tǒng)計量小于檢驗臨界值時,可接受數(shù)據(jù)的分布假設(shè),反之則不能接受.
英國CL:AIRE導(dǎo)則同樣采用直方圖和箱線圖刻畫場地數(shù)據(jù),通過分析數(shù)據(jù)的對稱性、離散程度、平均值與中位數(shù)、上四分位數(shù)和下四分位之間的關(guān)系將污染物數(shù)據(jù)歸為3類,分別是對稱數(shù)據(jù)、對數(shù)對稱數(shù)據(jù)和重尾數(shù)據(jù)[24].與美國ProUCL導(dǎo)則采用嚴格的假設(shè)檢驗方法不同,英國CL:AIRE導(dǎo)則依據(jù)經(jīng)驗法則判斷數(shù)據(jù)類型.對稱數(shù)據(jù)特征的判斷依據(jù)為平均值與中位數(shù)接近,且直方圖以中位數(shù)為軸呈鏡像對稱形式.對稱數(shù)據(jù)一般符合正態(tài)分布數(shù)據(jù)類型,該類型污染物通常在土壤中遷移擴散的能力較強,在一定時間內(nèi)可與土壤基質(zhì)充分混合[24].對數(shù)對稱數(shù)據(jù)直方圖明顯不對稱,數(shù)據(jù)平均值大于中位數(shù)且小于上四分位數(shù),取自然對數(shù)后數(shù)據(jù)符合對稱數(shù)據(jù)特征.符合對數(shù)對稱特征的污染物往往不易分解,土壤污染程度較低且空間異質(zhì)性較高[24].重尾數(shù)據(jù)直方圖特征與對數(shù)對稱數(shù)據(jù)相似,但是數(shù)據(jù)平均值是中位數(shù)的10倍以上且大于上四分位數(shù),取自然對數(shù)后直方圖仍呈現(xiàn)非對稱形式.一般而言,如果場地歷史上發(fā)生過污染泄漏事故或存在擴散性污染物間斷性進入土壤環(huán)境,污染物數(shù)據(jù)集往往符合重尾數(shù)據(jù)特征[24].一般而言,對稱數(shù)據(jù)服從正態(tài)分布,對數(shù)對稱數(shù)據(jù)可能服從對數(shù)正態(tài)分布或者伽馬分布,而重尾數(shù)據(jù)由于數(shù)據(jù)尾部存在明顯偏離樣本的極值,通常不服從上述3種分布.
1.4.1 UCL95計算
為降低樣本平均值的不確定性,美國ProUCL導(dǎo)則采用污染物濃度平均值的UCL95(95%upper confidence limit,UCL95)估計場地污染物真實平均濃度,并據(jù)此計算污染物致癌風(fēng)險和非致癌危害商.UCL95的數(shù)學(xué)含義是污染物濃度的實際平均值等于或低于該值的概率為95%[30].當UCL95小于或等于篩選值時,場地風(fēng)險水平可接受,場地適宜開發(fā);反之,則需對場地關(guān)注污染物進行詳細風(fēng)險評估;利用ProUCL軟件,該研究使用參數(shù)法,即學(xué)生t-UCL、H-UCL和近似伽馬-UCL分別計算UCL95估算正態(tài)、對數(shù)正態(tài)和伽馬分布污染物真實平均濃度[30,41-42].如果數(shù)據(jù)不服從上述3種分布類型,則采用非參數(shù)法切比雪夫不等式計算UCL95[43],計算方法如式(4)~(7)所示.
學(xué)生t-UCL:
1.4.2 置信區(qū)間計算
英國CL:AIRE導(dǎo)則最先采用假設(shè)檢驗的方法判別污染物濃度是否超標[23],首先假設(shè)污染物濃度大于或者小于篩選值,通過比較檢驗統(tǒng)計量與對應(yīng)檢驗臨界值的大小來判斷污染物濃度是否超標.當檢驗統(tǒng)計量在臨界值一側(cè)時,假設(shè)為真,在另一側(cè)時假設(shè)為假.該方法利用機械的“明線”方法判斷污染物濃度是否超標,這可能導(dǎo)致錯誤的風(fēng)險管控決策[44].2020年修訂后的英國CL:AIRE導(dǎo)則摒棄了對上述單一檢驗方法的依賴,強調(diào)全面理解數(shù)據(jù)集的重要性[24].修訂后的統(tǒng)計方法基于中心極限定理(central limit theory,CLT),計算不同置信水平下污染數(shù)據(jù)的雙側(cè)置信區(qū)間.該定理指出當樣本量n趨于無窮大時,樣本平均值的漸近分布服從平均值為μ和方差為的正態(tài)分布[36].其中,置信下限(LCL)和置信上限(UCL)的具體計算過程如式(8)(9)所示.最后,通過刻畫污染物空間分布特征,分析不同點位污染物濃度之間是否存在關(guān)聯(lián),從而分析污染物可能的來源.
與美國ProUCL導(dǎo)則僅使用UCL與臨界濃度進行比較不同,英國CL:AIRE導(dǎo)則針對污染場地的未來用途,分別在開發(fā)(Planning Scenario)和監(jiān)管(Part 2A Scenario)兩種情景下進行污染場地管控決策[23-24].開發(fā)情景判斷場地是否適宜開發(fā),該情景下需判斷“場地土壤的污染風(fēng)險是否可接受”,如果UCL低于篩選值,則場地適宜開發(fā)的可能性更大;而監(jiān)管情景判斷場地是否需要監(jiān)管,該情景下需判斷“場地土壤的污染風(fēng)險是否超出可接受水平”,如果LCL高于篩選值,則場地有必要納入監(jiān)管.
2.1.1 描述性統(tǒng)計分析
該場地未來用地類型為居住用地,基于場地一類用地規(guī)劃下,萘篩選值為25 mg/kg.根據(jù)地層結(jié)構(gòu),該研究將采樣深度為0.2和0.5 m的土壤樣品代表第1層土壤污染狀況,將采樣深度為1.5和3.0 m的樣品分別代表第2層和第3層土壤污染狀況.對土壤樣品中萘濃度的初步統(tǒng)計分析結(jié)果如表1所示,所有深度土壤樣品中,萘的濃度平均值均小于篩選值(25 mg/kg),但其最大值均高于篩選值.不同深度采集樣本濃度的偏度表現(xiàn)為0~1 m<2~4 m<1~2 m(偏度依次為0.60、1.53、3.45),離散程度表現(xiàn)為0~1 m<2~4 m<1~2 m(標準偏差依次為4.62、8.37、13.26)(見表1).此外,從萘的污染數(shù)據(jù)直方圖(見圖3)中也可以清晰觀察到數(shù)據(jù)的分布特征:0~1 m土壤中,數(shù)據(jù)直方圖大致呈現(xiàn)以中位數(shù)為軸的對稱圖形,屬于正態(tài)分布;而1~2 m和2~4 m土壤的數(shù)據(jù)則呈現(xiàn)右偏分布,數(shù)據(jù)主要集中在坐標軸左側(cè).
表1 土壤樣品中萘濃度統(tǒng)計描述Table1 Statistical description on naphthalenecontaminated soil samples
2.1.2 ND和異常值處理
該研究采用污染物濃度的DL/2代替數(shù)據(jù)樣本中的ND值,由于ND樣本量所占總樣本量的比例不到1%,遠小于需對ND值進行敏感性分析的閾值(比例為15%),因此不考慮ND值對統(tǒng)計量的影響.根據(jù)直方圖數(shù)據(jù)的分布特征(見圖3)可知,0~1、1~2和2~4 m數(shù)據(jù)集中分別存在2、3和1個明顯偏離數(shù)據(jù)集中其他樣本的觀測值.假設(shè)上述明顯偏離的觀測值為異常值,基于5%的顯著性水平,經(jīng)Rosner檢驗(見表2)可知,檢驗統(tǒng)計量Rr均大于對應(yīng)的臨界值λr,因此0~1、1~2和2~4 m數(shù)據(jù)集中分別存在2、3和1個潛在異常值.異常值的取舍會影響UCL95和置信區(qū)間的計算結(jié)果,進而影響場地風(fēng)險篩選的決策結(jié)果.
表2 萘濃度數(shù)據(jù)潛在異常值評估結(jié)果Table2 Evaluation of potential outliers for naphthalene concentration dataset
圖3 不同土壤深度下萘濃度分布直方圖Fig.3 Histogram of naphthalene concentration dataset at different depths
2.1.3 萘數(shù)據(jù)分布類型
美國ProUCL導(dǎo)則采用嚴格的統(tǒng)計學(xué)方法并結(jié)合Q-Q圖示法判斷污染數(shù)據(jù)的分布類型.Q-Q圖示法是數(shù)據(jù)分布假設(shè)檢驗的一種直觀方法,使用分位數(shù)坐標反映樣本檢測值與理論分位數(shù)預(yù)測值之間的關(guān)系.一般來說,如果Q-Q圖中數(shù)據(jù)點越靠近回歸線y=x兩側(cè)并均勻分布,則表示數(shù)據(jù)服從檢驗的分布形態(tài).該場地不同土壤深度萘濃度數(shù)據(jù)的Q-Q圖如圖4所示,根據(jù)萘濃度數(shù)據(jù)與回歸線的吻合程度可知,0~1 m土壤中萘的濃度近似服從于伽馬分布;1~2 m土壤中3種分布預(yù)測的數(shù)據(jù)點與回歸線均存在較大偏離,因此1~2 m數(shù)據(jù)不符合這3種分布;2~4 m土壤中除存在1個明顯偏離的數(shù)據(jù)點外,對數(shù)正態(tài)分布預(yù)測的數(shù)據(jù)點最貼合回歸線,因此數(shù)據(jù)可能近似服從對數(shù)正態(tài)分布.此外,Q-Q圖也可直觀識別異常值,從圖4可以看出,0~1、1~2和2~4 m數(shù)據(jù)集中分別存在2、3和1個明顯偏離的異常值點,這與上述異常值檢驗結(jié)果一致.
圖4 萘濃度數(shù)據(jù)的Q-Q圖檢驗結(jié)果Fig.4 Quantile-Quantile plot of naphthalene concentration dataset
由于Q-Q圖僅是一種直觀的圖示法,需采用更嚴格的GOF檢驗法判斷萘數(shù)據(jù)的分布類型.假設(shè)顯著性水平為0.5,檢驗結(jié)果如表3所示.根據(jù)近似S-W和Lilliefors檢驗以及K-S和A-D檢驗可知,2~4 m土壤中萘濃度數(shù)據(jù)對數(shù)正態(tài)分布和伽馬分布的檢驗統(tǒng)計量(TS)均小于檢驗臨界值(CV),表明該數(shù)據(jù)集符合對數(shù)正態(tài)分布和伽馬分布,而其余兩個深度的萘濃度數(shù)據(jù)不符合上述3種常見的分布形態(tài).
表3 萘濃度數(shù)據(jù)擬合優(yōu)度假設(shè)檢驗結(jié)果Table 3 Statistical hypothesis testing for naphthalene concentration dataset
英國CL:AIRE導(dǎo)則利用箱線圖中統(tǒng)計量之間的關(guān)系來定性判斷數(shù)據(jù)的分布類型.如圖5所示,0~1 m土壤中,萘濃度的上四分位數(shù)到中位數(shù)的距離近似等于下四分位數(shù)到中位數(shù)的距離,箱線圖以中位數(shù)為對稱軸近似鏡像對稱;最大值到上四分位數(shù)的枝干長度與最小值到下四分位數(shù)的枝干長度接近,并且樣本的中位數(shù)平均值近似相等,因此0~1 m土壤中萘的濃度數(shù)據(jù)為對稱數(shù)據(jù).1~2 m 和2~4 m土壤中萘濃度數(shù)據(jù)的箱線圖則呈現(xiàn)非對稱形態(tài),其平均值均大于中位數(shù)但小于上四分位數(shù),且最大值到上四分位數(shù)的枝干長度顯著大于最小值到下四分位數(shù)的枝干長度,因此萘的濃度數(shù)據(jù)符合對數(shù)對稱數(shù)據(jù)特征.通過對比英美兩國導(dǎo)則可知,美國ProUCL導(dǎo)則嚴格依據(jù)GOF檢驗的結(jié)果判斷數(shù)據(jù)分布類型,而英國CL:AIRE導(dǎo)則相對寬松,更利于對數(shù)據(jù)整體特征的掌握.
圖5 不同土壤深度萘污染物箱線圖Fig.5 Box-plot of naphthalene concentrations at different depths
2.2.1 單側(cè)上限值UCL95
美國ProUCL導(dǎo)則根據(jù)數(shù)據(jù)分布類型、偏度和樣本量選擇最適宜的方法計算UCL95.正態(tài)GOF檢驗結(jié)果(見表3)表明0~1 m土壤的數(shù)據(jù)嚴格意義上并不服從正態(tài)分布,但數(shù)據(jù)具有較小的數(shù)據(jù)偏度(0.60)(見表1)和良好的對稱性(見圖3),因此認為數(shù)據(jù)近似服從正態(tài)分布,仍可以選擇學(xué)生t-UCL估計真實平均濃度.1~2 m土壤數(shù)據(jù)不符合美國ProUCL導(dǎo)則中已知的污染數(shù)據(jù)分布類型,因此使用非參數(shù)法切比雪夫不等式計算UCL95估算真實平均濃度.2~4 m土壤數(shù)據(jù)同時符合對數(shù)正態(tài)和伽馬兩種分布類型,針對同時滿足這兩種分布的數(shù)據(jù),依據(jù)美國ProUCL導(dǎo)則選擇基于伽馬分布UCL估計真實平均濃度以提高統(tǒng)計結(jié)果的可靠性[30]. UCL95計算結(jié)果如表4所示,0~1m土壤中萘濃度為15.18 mg/kg(小于篩選值),而1~2 m和2~4 m土壤中萘的濃度分別為27.34和25.40 mg/kg,略高于篩選值(25 mg/kg),需進一步考慮異常值對UCL95計算結(jié)果的影響.將異常值剔除后,不同深度土壤萘濃度的UCL均減小且都低于篩選值.針對此種情形,需仔細審查異常值樣本在采樣、處理分析以及數(shù)據(jù)轉(zhuǎn)錄過程中的規(guī)范性和準確性,判斷異常值的來源.如果條件允許,需對該采樣點進行重復(fù)取樣,分析污染來源.如果異常值對應(yīng)的采樣點位存在污染的可能,基于保守原則選擇保留異常值的UCL95代表場地污染物真實平均濃度,該污染場地存在風(fēng)險.
表4 美國ProUCL導(dǎo)則計算的萘濃度置信上限值Table 4 The calculated UCL of naphthalene concentrations based on USstatistical methods
2.2.2 雙側(cè)置信區(qū)間
英國CL:AIRE導(dǎo)則采用雙側(cè)置信區(qū)間估計場地萘真實濃度值.置信水平為0.80、0.90、0.95、0.99時萘污染濃度置信區(qū)間如表5所以.以0~1 m為例,萘濃度為14.37~15.01 mg/kg的可能性為80%,為14.28~15.10 mg/kg的可能性為90%,為14.20~15.18 mg/kg的可能性為95%,以此類推.隨置信水平的增加,LCL逐漸減小,UCL逐漸增大,置信區(qū)間的范圍逐漸增大.為了降低決策風(fēng)險的不確定性,英國CL:AIRE導(dǎo)則建議至少選擇兩個置信區(qū)間進行判斷.由表5可見,在開發(fā)情景下,即使在0.99的置信水平下0~1 m土壤中萘的UCL(15.34 mg/kg)也小于篩選值,因此萘未超標,不需要修復(fù);1~2 m土壤中,雖然0.95置信水平下萘的UCL(24.93 mg/kg)小于篩選值,但是當置信水平為0.99,UCL增至25.56 mg/kg,因此該場地萘濃度仍有很小的可能高于篩選值,需重點關(guān)注1~2 m深度的超標點位,尤其是異常值所在點位.2~4 m土壤萘濃度UCL均大于篩選值,綜合以上各深度萘濃度估算結(jié)果,場地不滿足開發(fā)條件.當剔除異常值后,0~1和1~2 m土壤中萘濃度在所有置信水平下的UCL均低于篩選值,但是2~4 m土壤萘濃度的UCL在0.90的置信水平下(24.36 mg/kg)低于篩選值,而在0.95的置信水平時UCL(25.10 mg/kg)略高于篩選值,因此開發(fā)場地仍具有一定的風(fēng)險.如果在監(jiān)管情景下,由于所有深度萘濃度的LCL均顯著低于篩選值,因此無需將場地納入環(huán)境監(jiān)管名錄,即使剔除異常值后所有深度土壤萘濃度LCL也都低于篩選值.因此,在監(jiān)管情景下,異常值的取舍對場地的最終決策無影響,場地均不需要納入監(jiān)管.
表5 基于中心極限定理的不同土壤深度萘濃度的置信區(qū)間Table 5 CLT theory-based confidence interval of naphthalene concentrationsat different depths
此外,針對非正態(tài)污染數(shù)據(jù)集,相同置信水平下英美兩國導(dǎo)則計算的UCL相差較大,如在0.95的置信水平下美國ProUCL導(dǎo)則計算1~2 m土壤中萘濃度的UCL(27.34 mg/kg)大于其依據(jù)英國CL:AIRE導(dǎo)則的計算值(24.93 mg/kg);而2~4 m深度則相反(英國CL:AIRE導(dǎo)則計算的UCL=25.70 mg/kg,大于美國ProUCL導(dǎo)則計算的UCL=25.40 mg/kg).由此可知,UCL計算方法的選擇對污染濃度的估算影響較大,甚至導(dǎo)致相反的結(jié)論.一般而言,對于非正態(tài)數(shù)據(jù)集,美國ProUCL導(dǎo)則推薦的UCL更接近污染物真實值,但是英國CL:AIRE導(dǎo)則可以通過調(diào)整置信水平或增加樣本量的方法降低污染物濃度估計值與真實值之間差距,提高風(fēng)險決策的可靠程度.
此外,英國CL:AIRE導(dǎo)則提供了污染場地空間分布圖的繪制方法,用于判斷不同采樣點位污染物濃度是否存在相關(guān)性.根據(jù)箱線圖上四分位數(shù)(QU)、中位數(shù)(Me)和下四分位數(shù)(QL)將污染物濃度(Ci)劃分為4個區(qū)間,即Ci≤QL、QL
圖6 污染場地不同土壤深度土壤中萘濃度的空間分布Fig.6 Spatial naphthalene distribution for a contaminated site
a)基于英美兩國導(dǎo)則對某萘污染場地進行估計,0~1 m土壤中萘的真實平均濃度小于《土壤環(huán)境質(zhì)量建設(shè)用地土壤污染風(fēng)險管控標準(試行)》(GB 36600?2018)第一類建設(shè)用地的篩選值,而1~2 m和2~4 m土壤中萘的濃度大于篩選值,基于場地一類用地規(guī)劃下,污染場地存在不可接受風(fēng)險,需進行詳細風(fēng)險評估.
b)基于收集的樣本數(shù)據(jù),英美兩國導(dǎo)則篩選污染場地風(fēng)險的流程基本相同,均依次進行描述統(tǒng)計分析、污染數(shù)據(jù)審查、分布類型判別、真實平均濃度估算,最后進行風(fēng)險水平篩選.異常值會影響污染物真實濃度的估計,當估計污染物濃度接近于篩選值時,異常值取舍顯著影響污染場地風(fēng)險篩選的決策,需要重新審查數(shù)據(jù)判斷導(dǎo)致數(shù)據(jù)異常的原因.
c)美國ProUCL導(dǎo)則采用嚴格統(tǒng)計學(xué)方法識別數(shù)據(jù)的分布類型并采用與之相應(yīng)的UCL95方法計算污染物的真實平均濃度,該方法決策結(jié)果更加可靠,但要求相關(guān)從業(yè)人員熟練掌握統(tǒng)計學(xué)方法;相反,英國CL:AIRE導(dǎo)則對數(shù)據(jù)的分布沒有要求,均采用基于中心極限定理的方法計算置信區(qū)間估算真實平均濃度,方法簡單易于操作.
d)針對國內(nèi)污染場地統(tǒng)計學(xué)應(yīng)用缺乏的現(xiàn)狀,綜合考慮英美兩國導(dǎo)則的優(yōu)缺點,建議我國優(yōu)先推廣相對簡單的英國CL:AIRE導(dǎo)則中的統(tǒng)計學(xué)方法,逐步融入美國ProUCL導(dǎo)則中的統(tǒng)計學(xué)方法以提高風(fēng)險決策水平,以期實現(xiàn)統(tǒng)計學(xué)方法在我國的污染場地風(fēng)險管控中的重要作用.