国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

江蘇省環(huán)境空氣質量監(jiān)測數(shù)據(jù)的本福特檢驗

2021-04-16 10:47:36張義祥
河北環(huán)境工程學院學報 2021年2期
關鍵詞:監(jiān)測數(shù)據(jù)定律福特

張義祥

(安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院, 安徽 蚌埠 233000)

隨著中國經(jīng)濟的高質量發(fā)展,生態(tài)環(huán)境問題日益成為了不可忽視的關鍵問題。根據(jù)《江蘇省環(huán)境質量報告(2019年上半年)》,江蘇省的環(huán)境空氣質量整體優(yōu)于2018年同期。2019年上半年,江蘇省酸雨平均發(fā)生率為21.3%,遠遠高于2018年同期全省酸雨發(fā)生率,降水酸度和酸雨酸度也明顯增強。而SO2作為酸雨的主要成分,其排放應受到嚴格的管控。據(jù)不完全統(tǒng)計,全球每年人為排放SO2約1.5億t,其中,煤、石油等礦物質燃燒釋放了70%以上;由自然活動產生的SO2主要來源于生物腐爛,但數(shù)量很少。

工業(yè)企業(yè)是SO2的主要排放源,政府部門對工業(yè)企業(yè)的有效監(jiān)管是保證環(huán)境治理工作順利開展的重要環(huán)節(jié)。雖然我國2015年開始實施的《中華人民共和國環(huán)境保護法》中有多條對違規(guī)排放污染物者進行懲處的規(guī)定,但是污染物的處理成本很高,仍然存在企業(yè)為了自身利益,對環(huán)境空氣監(jiān)測數(shù)據(jù)進行造假的現(xiàn)象。而現(xiàn)行的政府監(jiān)管機制并不能有效地杜絕企業(yè)對環(huán)境空氣數(shù)據(jù)造假,主要是因為企業(yè)對環(huán)境空氣監(jiān)測數(shù)據(jù)造假十分方便;此外,政府部門實地調查所消耗的人力資本過高。為了保證環(huán)境治理有序進行,亟需一種新的手段來對企業(yè)排放污染物進行監(jiān)督。

1 國內外研究現(xiàn)狀

1.1 本福特定律的定義

1881年,Simon Newcomb[1]發(fā)現(xiàn)對數(shù)表中靠前的頁數(shù)比靠后的頁數(shù)損壞得更加嚴重。通過大量的研究,Newcomb提出自然數(shù)首位有效數(shù)字出現(xiàn)的頻率可能并不相同,并給出了自然數(shù)前兩位有效數(shù)字的頻率分布,但是,Newcomb的發(fā)現(xiàn)并沒有引起關注。直到1938年,美國物理學家Frank Benford[2]也發(fā)現(xiàn)這一分布規(guī)律,Benford通過對20 000多個樣本數(shù)據(jù)進行分析,給出了自然數(shù)首位有效數(shù)字分布的規(guī)律,如(1)式所示:

Benford的研究引起了廣泛的關注,這個規(guī)律也被稱為本福特定律。1995年,Hill[3]給出了本

福特定律的數(shù)學證明,并給出了第二位有效數(shù)字d2的頻率分布規(guī)律,如(2)式所示:

根據(jù)(1)和(2)式,表1中給出了前兩位有效數(shù)字的頻率分布。

表1 本福特定律前兩位有效數(shù)字頻率分布

1.2 國內外研究現(xiàn)狀

本福特定律在國外的應用較早,許多學者將該定律應用到大數(shù)據(jù)準確性檢驗中,涉及面十分廣泛。Sowby[4]認為美國大多用水數(shù)據(jù)都是采用自我報告形式,因此其準確性很難評估,通過研究發(fā)現(xiàn),本福特定律可以用于美國供水數(shù)據(jù)的觀察。Vries等[5]通過研究發(fā)現(xiàn),本福特定律在生態(tài)毒理學數(shù)據(jù)的可靠性分析具有良好的應用前景。Orita等[6]通過研究發(fā)現(xiàn)藥物領域的多個數(shù)據(jù)集都遵循本福特定律,并根據(jù)本福特定律提出了一個用于評估數(shù)據(jù)質量的指標。Hales等[7]運用本福特定律為供應鏈管理者提供一種將可疑數(shù)據(jù)隔離的方法。

近年來,本福特定律逐漸被國內學者廣泛應用于大數(shù)據(jù)分析。龐新生等[8]運用本福特定律對我國市縣層面住戶調查收支匯總數(shù)據(jù)進行準確性評估,來判斷是否存在造假嫌疑。白東杰等[9]通過研究發(fā)現(xiàn),社會消費品零售總額數(shù)據(jù)分布與本福特定律的期望頻率偏差有縮小趨勢,由此認為調查數(shù)據(jù)質量是可靠的。馮華英[10]通過研究發(fā)現(xiàn)本福特定律對煤礦安全數(shù)據(jù)真實性判定具有科學性和有效性。米子川等[11]運用本福特定律驗證了我國宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)的真實性和客觀性,提高了我國統(tǒng)計數(shù)據(jù)的質量。

目前,國內外學者已經(jīng)對本福特定律進行了大量的研究,但是本福特定律在環(huán)境數(shù)據(jù)方面的應用卻很少,能夠搜索到的只有余云峰等[12]將本福特定律應用到水文數(shù)據(jù)質量研究以及胡友兵等[13]運用本福特定律對水文徑流序列數(shù)據(jù)的分析。因此,本研究運用本福特定律探索江蘇省SO2監(jiān)測數(shù)據(jù)的分布規(guī)律具有重要的意義。

2 數(shù)據(jù)來源和主要方法

2.1 數(shù)據(jù)來源

本研究所使用的2015—2019年上半年SO2監(jiān)測數(shù)據(jù)均來自江蘇省生態(tài)環(huán)境廳,收集了江蘇省13個地級市的SO2監(jiān)測數(shù)據(jù)(部分站點存在缺失值,但是不影響數(shù)據(jù)分布的整體趨勢)。數(shù)據(jù)不僅符合巨量特征,也具有良好的時效性。

2.2 主要理論方法

本研究驗證SO2的數(shù)據(jù)分布特征是否與本福特定律一致,可以使用的方法有卡方擬合度檢驗、Kolmogorov-Smirnov擬合優(yōu)度檢驗以及優(yōu)化Kuiper檢驗,但是,SO2數(shù)據(jù)量太大,上述這些方法的檢驗統(tǒng)計量隨著樣本量的增大增加過快,臨界值過于保守,因此不能應用于本研究的擬合情況檢驗[14]。本研究擬采用Pearson相關系數(shù)檢測法來驗證SO2數(shù)據(jù)的分布規(guī)律與本福特定律的擬合程度,通過計算二者之間的Pearson相關系數(shù)r,作為判斷樣本數(shù)據(jù)擬合程度的標準。

3 實證分析

本研究為了驗證江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字的頻率分布與本福特定律是否存在顯著性差異,分別計算了江蘇省13個地級市SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字的頻率分布,并給出了它們與本福特定律理論分布之間的相關系數(shù)r,相關結果如表2所示:

表2 各地級市SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布及其擬合程度

由表2可知,江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字的頻率分布與本福特定律理論分布十分接近,二者的Pearson相關系數(shù)達到了0.968,說明二者的擬合程度很高。二者都呈現(xiàn)出了首位有效數(shù)字“1”出現(xiàn)的頻率最高,首位有效數(shù)字越大其出現(xiàn)的頻率相對較低的規(guī)律。但是,江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字的頻率分布與本福特定律依然存在一定的差異。整體來看,江蘇省首位有效數(shù)字“1”出現(xiàn)的頻率接近40%,顯著高于理論值,有效數(shù)字“2”~“7”出現(xiàn)的頻率低于理論值,有效數(shù)字“8”和“9”出現(xiàn)的頻率高于理論值;從各個地級市來看,雖然各個地級市與本福特定律的Pearson相關系數(shù)較高,但是各個有效數(shù)字出現(xiàn)的頻率與理論值相差較大。

為了進一步探究江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字的分布規(guī)律,表3給出了13個地級市首位有效數(shù)字頻率分布之間的Pearson相關系數(shù)。

表3 各個地級市SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布之間的相關系數(shù)

由表3可知,江蘇省13個地級市SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字分布的Pearson相關系數(shù)基本都大于0.98,各個地級市SO2監(jiān)測數(shù)據(jù)的首位有效數(shù)字分布十分相似,這表明,江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布在不同地區(qū)之間非常穩(wěn)定。在江蘇省內,SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布受到地區(qū)的影響較小,但是,其分布又不完全服從于本福特定律。本研究認為,SO2數(shù)據(jù)自身的特殊性,導致其分布規(guī)律與本福特定律不完全吻合,但是,綜合上面的分析可以得到,江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字的分布可能服從于一種類似于本福特定律的分布規(guī)律。

基于上述分析,本研究將江蘇省13個地級市SO2監(jiān)測數(shù)據(jù)匯總,得到江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布,用于監(jiān)管SO2監(jiān)測數(shù)據(jù)非自然異常波動,結果如表4所示:

表4 江蘇省SO2監(jiān)測數(shù)據(jù)的首位有效數(shù)字頻率分布

從表4可以看出,江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布與本福特定律十分相似,首位有效數(shù)字“1”出現(xiàn)的頻率最大,并且整體呈現(xiàn)出一種隨著有效數(shù)字增大,頻率下降的趨勢,經(jīng)過計算,二者的Pearson相關系數(shù)為0.968,盡管Pearson相關系數(shù)較高,但是二者之間的差異不可忽視,這也說明了SO2監(jiān)測數(shù)據(jù)自身的特殊性。為了進一步說明江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布規(guī)律與本福特定律的差異,圖1給出了二者的折線圖,可以看出江蘇省SO2監(jiān)測收據(jù)首位有效數(shù)字“1”出現(xiàn)的頻率較高,當有效數(shù)字處在較低水平時,江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字出現(xiàn)的頻率下降較快,整體來看,二者都呈現(xiàn)著下降的趨勢。

圖1 江蘇省SO2監(jiān)測數(shù)據(jù)分布與本福特定律的比較

4 結論

目前,環(huán)境污染問題成為我國發(fā)展道路上的嚴重阻礙,尤其是環(huán)境空氣污染,與人民的生活質量息息相關。一方面要求政府積極采取環(huán)境污染防治措施,切實改善人民的生存環(huán)境和生活質量;另一方面,需要一種基于非監(jiān)督式的算法,來探索數(shù)據(jù)的內在特征和波動規(guī)律,從數(shù)據(jù)的自身條件來甄別可疑數(shù)據(jù)。本研究通過對江蘇省13個地級市70多萬條SO2監(jiān)測數(shù)據(jù)進行分析,得到了江蘇省SO2監(jiān)測數(shù)據(jù)的分布規(guī)律,這種規(guī)律受到地區(qū)因素的影響較小,在各個地區(qū)間的分布十分穩(wěn)定,這說明江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布確實呈現(xiàn)出某種規(guī)律性特征。

本研究具有一定的政策含義,文章利用大數(shù)據(jù)分析技術得到了江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率的分布規(guī)律,可以為政府部門提供一種甄別可疑SO2監(jiān)測數(shù)據(jù)的方法。將本研究得到的江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布規(guī)律作為理論分布,通過計算Pearson相關系數(shù),來判斷地方數(shù)據(jù)、企業(yè)數(shù)據(jù)是否存在顯著性差異。如果存在顯著性差異,則需要重點審查。

但是,將本福特定律應用到SO2監(jiān)測數(shù)據(jù)的可疑甄別中,還存在一定局限性。筆者僅僅研究了江蘇省SO2監(jiān)測數(shù)據(jù)首位有效數(shù)字頻率分布規(guī)律,在江蘇省范圍內的受到地域因素影響較小,對其他省或者其他環(huán)境空氣質量數(shù)據(jù)尚未討論,未來需要更多的數(shù)據(jù)來對本研究的結果進行穩(wěn)健性檢驗;對SO2監(jiān)測數(shù)據(jù)的造假檢驗,缺乏政府官方的造假案例數(shù)據(jù)支持,在理論上具有可行性,但是,實際操作依然存在較大的困難。這些不足,仍然需要進一步討論。

猜你喜歡
監(jiān)測數(shù)據(jù)定律福特
探索未知——2022款福特BRONCO EVERGLADES
世界汽車(2022年3期)2022-05-23 13:42:10
福特領裕
汽車觀察(2021年11期)2021-04-24 20:47:38
福特EVOS
汽車觀察(2021年11期)2021-04-24 20:47:38
多一盎司定律和多一圈定律
倒霉定律
GSM-R接口監(jiān)測數(shù)據(jù)精確地理化方法及應用
萬有引力定律
GPS異常監(jiān)測數(shù)據(jù)的關聯(lián)負選擇分步識別算法
基于小波函數(shù)對GNSS監(jiān)測數(shù)據(jù)降噪的應用研究
耐人尋味的定律
延长县| 玉树县| 葫芦岛市| 义乌市| 广平县| 时尚| 宜章县| 迁西县| 舒城县| 泾川县| 介休市| 松溪县| 桃源县| 雅江县| 甘孜| 镶黄旗| 洪泽县| 平湖市| 临猗县| 类乌齐县| 淳化县| 阳江市| 潜山县| 赞皇县| 册亨县| 旌德县| 张家口市| 晋宁县| 西峡县| 崇礼县| 新余市| 静海县| 绥化市| 灵川县| 昔阳县| 乐陵市| 松潘县| 陇南市| 乌鲁木齐市| 无锡市| 元氏县|