国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于PSO-SVM算法的空氣質(zhì)量分類研究

2023-06-13 05:46:28胡榮華趙春生白寧波
環(huán)境科學(xué)導(dǎo)刊 2023年3期
關(guān)鍵詞:正確率空氣質(zhì)量粒子

龐 曦,胡榮華,趙春生,白寧波

(1.永城煤電控股集團有限公司,城郊煤礦,河南 永城 476600;2. 中國地質(zhì)大學(xué),湖北 武漢 430074)

0 引言

目前,人們在生產(chǎn)生活中對空氣污染的預(yù)防以及城市管理層出臺治理空氣污染的有關(guān)政策均是依據(jù)氣象部門給予的空氣污染等級,因此對空氣質(zhì)量等級進行精準劃分對當(dāng)今社會的安全發(fā)展有著重要的現(xiàn)實性意義[1-2]。

為了精確地對空氣質(zhì)量進行分類預(yù)測,很多學(xué)者對此做了深入研究。例如:邱晨提出了基于BP神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量模型分類研究方法[3];常麗娜提出了基于K-均值聚類和貝葉斯判別的城市空氣質(zhì)量等級分類及預(yù)測方法[4];王琛提出了哈夫曼樹SVM在空氣質(zhì)量等級分類中的應(yīng)用方法[5]等。上述方法均能對空氣質(zhì)量進行有效分類,但受限于算法本身的局限性,其分類效果還有待提升。例如:BP神經(jīng)網(wǎng)絡(luò)收斂速度慢,其算法精度依賴于大量的訓(xùn)練樣本并在訓(xùn)練過程中極易陷入局部最優(yōu)解[6];K-均值聚類預(yù)測法需要事先給定聚類的種類數(shù)即K的取值,K值在實際應(yīng)用中是難以估計的,K值偏大或者偏小都嚴重影響分類的精確度。本文通過分析空氣質(zhì)量分類的特點和現(xiàn)有分類方法的不足,提出了粒子群優(yōu)化支持向量機算法的空氣質(zhì)量分類方法[7]。

選用某礦區(qū)全年在空氣中測量得到的PM2.5、PM10、SO2、NO2、CO、O3數(shù)值指標組成六維輸入向量,以空氣質(zhì)量的指標優(yōu)良、輕度污染、中度污染和重度污染作為輸出向量,結(jié)合PSO優(yōu)化算法在分類模型訓(xùn)練中全局搜尋SVM的最佳參數(shù)c和gamma,然后將最佳參數(shù)應(yīng)用到空氣質(zhì)量的分類預(yù)測中,能夠大大增加分類預(yù)測的準確性。

1 SVM算法原理

SVM分為線性可分和非線性可分,其基本原理是將低維空間的樣本訓(xùn)練數(shù)據(jù)映射到高維空間中,使得樣本訓(xùn)練數(shù)據(jù)線性可分,進而對邊界進行線性劃分[8-9]。如果有樣本數(shù)據(jù):其中xi是輸入指標,yi是輸出指標,其分類示意圖如圖1所示。

圖1 SVM二分類示意圖

對于二分類問題實際就是尋找區(qū)分兩類數(shù)據(jù)的最優(yōu)分割超平面,超平面方程如式(1):

選擇合適的w、b使距離超平面最近的樣本滿足得到規(guī)范化超平面,當(dāng)分類間隔達到最大時確定最優(yōu)超平面[10],如式(2):

若要使得所有樣本都分類無誤,根據(jù)約束條件應(yīng)滿足式(3):

在式(3)中引入拉格朗日算子ai構(gòu)建函數(shù),其中ai>0,將有約束的原始目標函數(shù)轉(zhuǎn)換為無約束的拉格朗日目標函數(shù),如式(4):

求L對w、b的偏導(dǎo),令其等于0,得到一個包含ai的函數(shù),如式(5):

求得w、a、b對應(yīng)的最優(yōu)解w*、a*、b*,獲得最優(yōu)分割超平面,如式(6):

確定SVM的分類決策函數(shù)如式(7):

2 PSO-SVM算法原理

2.1 粒子群優(yōu)化算法

粒子群優(yōu)化算法的本質(zhì)就是迭代尋優(yōu),通過撒下的粒子種群更新其位置和運動速度在全局尋找適應(yīng)度函數(shù)的最優(yōu)解[11]。假設(shè)在一維目標搜索空間中,由N個粒子組成群體X的初始位置為得到初始局部最優(yōu)為P1,然后更新粒子的搜尋速度和位置,在時刻t,該種群粒子更新位置至該粒子種群中局部最優(yōu)位置表示為P(t),t時刻的粒子群的局部最優(yōu)位置為與初始局部最優(yōu)位置相比較得到全局最優(yōu)位置g(t),然后繼續(xù)迭代更新粒子的搜尋速度與位置,每更新一步都要對比得到最新的局部最優(yōu)和全局最優(yōu),直至達到最大迭代次數(shù)為止。當(dāng)粒子種群在M維目標搜索空間內(nèi),粒子群的速度與位置更新公式如(10-11):

2.2 PSO-SVM算法流程

SVM在運行前需要手動設(shè)置兩個參數(shù):其中c是懲罰系數(shù),即對誤差的容忍度,c值高說明誤差容忍度小,容易過擬合,c值越小容易欠擬合;gamma是核函數(shù)自帶的一個參數(shù),決定了數(shù)據(jù)映射到新的特征空間后的分布,gamma越大,支持向量越少,gamma值越小,支持向量越多,支持向量的個數(shù)影響訓(xùn)練與預(yù)測的速度[12-13]。

為了消除人為設(shè)置參數(shù)c和gamma對SVM運行的影響,使用PSO算法在全局搜尋c和gamma的最佳參數(shù)組合,具體的PSO-SVM算法流程見圖2。

圖2 PSO-SVM算法流程圖

3 算例分析

選擇某礦區(qū)一年度在空氣中測得的PM2.5、PM10、SO2、NO2、CO、O3的數(shù)字指標組成六維輸入向量,以空氣質(zhì)量的指標優(yōu)良、輕度污染、中度污染和重度污染作為輸出向量。其中優(yōu)良的標簽為1,輕度污染的標簽為2,中度污染的標簽為3,重度污染的標簽為4。選擇其中150組為訓(xùn)練數(shù)據(jù),分別訓(xùn)練得到SVM分類模型、PSO-SVM分類模型,其余215組為測試數(shù)據(jù),使用測試數(shù)據(jù)的分類準確率來評價分類模型的性能。

3.1 數(shù)據(jù)預(yù)處理

在選擇輸入向量的同時,為消除數(shù)據(jù)物理量綱的不同和盡量壓縮數(shù)據(jù)大小的范圍,以增加運行的速度,需要對數(shù)據(jù)進行歸一化處理,數(shù)據(jù)歸一化公式如(12):

壓縮后典型的輸入、輸出向量如表1所示:

表1 幾種典型的輸入輸出向量

從表1看出,不同空氣質(zhì)量之間的特征向量區(qū)別度非常大,尤其是PM2.5和PM10,隨著空氣質(zhì)量的逐漸劣化其數(shù)值也不斷增加。相比較而言,其余的特征量區(qū)分度雖然沒有這么明顯,但不同的空氣質(zhì)量所對應(yīng)的數(shù)值也有著明顯區(qū)別。

3.2 SVM分類模型建立

針對SVM多分類問題需要設(shè)置核函數(shù),常用的核函數(shù)有四種,分別是線性核函數(shù)、多項式核函數(shù)、RBF核函數(shù)、sigmoid核函數(shù)。使用每個核函數(shù)訓(xùn)練數(shù)據(jù)都會得到不同的分類模型,然后將分類模型的輸出結(jié)果與訓(xùn)練集數(shù)據(jù)原始標簽相比較,表征四種核函數(shù)對輸入數(shù)據(jù)的擬合率,擬合率越高說明此核函數(shù)越適合于此類數(shù)據(jù)的分類預(yù)測。訓(xùn)練數(shù)據(jù)共有150組,其中優(yōu)良、輕度污染、中度污染和重度污染分別為60、60、10、20組,設(shè)置SVM的運行參數(shù)c和gamma為100和10,設(shè)置目標精度為0.001。使用4種核函數(shù)分別對訓(xùn)練數(shù)據(jù)集進行分類模型訓(xùn)練,并對分類模型的輸出結(jié)果與訓(xùn)練集數(shù)據(jù)原始標簽進行對比,得到4種核函數(shù)對應(yīng)的擬合率如表2。

表2 4種核函數(shù)訓(xùn)練模型對應(yīng)的準確率

從表2中的準確率可以看出,對于本次數(shù)據(jù)處理的適用性: RBF核函數(shù)>多項式核函數(shù)>線性核函數(shù)>sigmoid核函數(shù),使用RBF核函數(shù)訓(xùn)練得到的分類模型有著更高的擬合率,接下來的SVM分類模型均采用RBF核函數(shù),RBF核函數(shù)公式如式(13):

3.3 PSO-SVM分類模型建立

PSO-SVM算法的目的就是使用PSO算法在全局進行尋優(yōu),找到最佳的參數(shù)組合c和gamma,然后將最佳參數(shù)組合使用在SVM分類模型訓(xùn)練中,增加SVM分類模型在分類預(yù)測中的準確率,使用PSO算法需要設(shè)置一個適應(yīng)度函數(shù),作為粒子群迭代尋優(yōu)的目標函數(shù)。本文采用分類預(yù)測結(jié)果與測試集數(shù)據(jù)原始標簽的均方誤差作為適應(yīng)度函數(shù)[14-15],均方誤差如式(14):

式中:P—分類預(yù)測結(jié)果,Y—測試集數(shù)據(jù)原始標簽,length(Y)—測試集數(shù)據(jù)原始標簽的長度。均方根誤差值越小說明分類模型的分類預(yù)測準確率越高,PSO算法運行前需要設(shè)置算法的初始參數(shù),設(shè)置粒子種群加速因子C1=C2=1.5、慣性權(quán)重w=0.7、粒子種群規(guī)模為20、最大迭代步數(shù)T=300、粒子搜尋空間范圍為[1, 1000],初始速度v=10,粒子群的迭代尋優(yōu)過程示意如圖3所示。

圖3 粒子群迭代尋優(yōu)示意圖

從圖3中可以看出,粒子群迭代10步之后搜尋到了適應(yīng)度的全局最優(yōu)值,此時MSE=0.088,c=134.25,g=406.73,每步迭代后的平均適應(yīng)度值也一直逼近全局最優(yōu)適應(yīng)度值,說明每次迭代粒子種群都在朝著最優(yōu)的位置運動。

3.4 預(yù)測結(jié)果及分析

使用SVM分類模型和PSO-SVM分類模型分別對215組測試集數(shù)據(jù)進行分類預(yù)測,其中優(yōu)良、輕度污染、中度污染和重度污染分別為120、56、15、24組,分類預(yù)測結(jié)果分別如圖4、圖5所示。

圖4 SVM分類模型輸出結(jié)果

圖5 PSO-SVM分類模型輸出結(jié)果

圖4、圖5顯示,SVM分類模型分類正確188個樣本、錯誤27個樣本,整體分類正確率為87.44%。其中:優(yōu)良樣本分類正確111個,錯誤9個,分類正確率為91.75%;輕度污染分類正確50個,錯誤6個,分類正確率為89.29%;中度污染分類正確8個,錯誤7個,分類正確率為53.33%;重度污染分類正確20個,錯誤4個,分類正確率為83.33%。PSO-SVM分類模型分類正確196個樣本,錯誤19個樣本,整體分類正確率為91.16%。其中:優(yōu)良樣本分類正確111個,錯誤9個,分類正確率為91.75%;輕度污染分類正確53個,錯誤3個,分類正確率為94.64%;中度污染分類正確10個,錯誤5個,分類正確率為67.67%;重度污染分類正確22個,錯誤2個,分類正確率為91.67%。

從分類預(yù)測結(jié)果可以看出,PSO-SVM分類模型與SVM分類模型相比較總體分類正確率提高了3.72%,不同的空氣質(zhì)量樣本正確率也有著較大的提高。其中:輕度污染的分類正確率提高了5.35%,中度污染的分類正確率提高了14.34%,重度污染的分類正確率提高了8.34%。

4 結(jié)論

(1)采用PM2.5、PM10、SO2、NO2、CO、O3的數(shù)值指標組成的六維特征向量,能夠有效的表征空氣質(zhì)量的等級。

(2)通過對SVM分類算法的訓(xùn)練,得到的分類模型能夠?qū)諝赓|(zhì)量等級進行分類,但是分類準確率還有待提高。

(3)PSO優(yōu)化算法能夠以迭代尋優(yōu)的方式在全局搜尋SVM的最佳參數(shù)c和gamma,使得此時的適應(yīng)度函數(shù)達到最優(yōu)。

(4)PSO-SVM算法能夠?qū)諝赓|(zhì)量等級進行分類,且相比較SVM分類算法,其分類正確率有著大幅度的提高。

猜你喜歡
正確率空氣質(zhì)量粒子
門診分診服務(wù)態(tài)度與正確率對護患關(guān)系的影響
基于粒子群優(yōu)化的橋式起重機模糊PID控制
基于粒子群優(yōu)化極點配置的空燃比輸出反饋控制
“空氣質(zhì)量發(fā)布”APP上線
生意
品管圈活動在提高介入手術(shù)安全核查正確率中的應(yīng)用
天津護理(2016年3期)2016-12-01 05:40:01
車內(nèi)空氣質(zhì)量標準進展
汽車與安全(2016年5期)2016-12-01 05:22:14
重視車內(nèi)空氣質(zhì)量工作 制造更環(huán)保、更清潔、更健康的汽車
汽車與安全(2016年5期)2016-12-01 05:22:13
開展“大氣污染執(zhí)法年”行動 加快推動空氣質(zhì)量改善
生意
故事會(2016年15期)2016-08-23 13:48:41
磐安县| 宝应县| 榆林市| 门头沟区| 治多县| 石泉县| 松阳县| 阿拉尔市| 禹州市| 金秀| 太康县| 高台县| 方山县| 闵行区| 泰和县| 晋中市| 象山县| 奉化市| 方山县| 北辰区| 兰坪| 广南县| 龙川县| 邵武市| 栾城县| 平山县| 富宁县| 嘉善县| 基隆市| 尉犁县| 锦州市| 勐海县| 仪征市| 翁源县| 赞皇县| 灌南县| 郑州市| 东平县| 平顶山市| 新兴县| 房产|