彭旭東,夏士明,孫吉明(.解放軍理工大學(xué)氣象海洋學(xué)院,南京,0;.空軍航空大學(xué)航理系,長(zhǎng)春,300)
基于視頻的天氣類別識(shí)別分類器設(shè)計(jì)
彭旭東1,夏士明1,孫吉明2
(1.解放軍理工大學(xué)氣象海洋學(xué)院,南京,211101;2.空軍航空大學(xué)航理系,長(zhǎng)春,130022)
通過實(shí)驗(yàn)發(fā)現(xiàn)SVM多分類(導(dǎo)向無環(huán)圖)對(duì)于不同場(chǎng)景的天氣類別識(shí)別能力較弱,而以隨機(jī)森林為弱分類器構(gòu)成的AdaBoost強(qiáng)分類器能有效提高對(duì)不同場(chǎng)景的識(shí)別能力?;诖?,本文最終提出了基于視頻的天氣類別自動(dòng)識(shí)別分類器的設(shè)計(jì)。
天氣類別;AdaBoost;SVM
天氣類別識(shí)別屬于有監(jiān)督的學(xué)習(xí)問題。常用的有監(jiān)督分類器有支持向量機(jī)(SVM)和AdaBoost。常見的天氣類別包括晴、多云、陰、霧、雨、雪等,因此本文的基于視頻的天氣類別識(shí)別是一個(gè)有監(jiān)督的多分類問題。
目前,基于視覺的天氣類別研究主要采用SVM作為分類器。但SVM對(duì)于不同場(chǎng)景的天氣類別識(shí)別能力較弱。而以隨機(jī)森林為弱分類器構(gòu)成的AdaBoost強(qiáng)分類器能提高對(duì)不同場(chǎng)景的識(shí)別能力。
AdaBoost強(qiáng)分類器是由多個(gè)弱分類器構(gòu)成,每個(gè)弱分類器會(huì)按照既定規(guī)則選擇部分樣本構(gòu)成訓(xùn)練集進(jìn)行訓(xùn)練,因此每個(gè)訓(xùn)練樣本都被賦予權(quán)重,以表明它被某個(gè)弱分類器選入訓(xùn)練集的概率。如果某樣本點(diǎn)已經(jīng)被準(zhǔn)確地分類,那么在構(gòu)造下一個(gè)訓(xùn)練集時(shí),它被選中的概率將降低;相反,如果某樣本點(diǎn)沒有被正確分類,那么它的權(quán)重就將提高。通過該種方式,AdaBoost方法能夠聚焦于那些較難區(qū)分的樣本上。
為了驗(yàn)證方法的正確性,本文在主頻為2.9GHz,內(nèi)存為8GB 的PC機(jī)上,采用Matlab2009a進(jìn)行了分類識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)為本文采集的視頻數(shù)據(jù),通過對(duì)視頻數(shù)據(jù)進(jìn)行采樣得到圖像序列。每組圖像序列包含時(shí)間、天氣類別、場(chǎng)景信息以及氣象要素信息。
在進(jìn)行學(xué)習(xí)訓(xùn)練的過程中,將數(shù)據(jù)集按時(shí)間劃分,即將每類天氣下的數(shù)據(jù)按時(shí)間排序好,選擇前面部分樣本作為訓(xùn)練樣本,將剩下的部分?jǐn)?shù)據(jù)作為測(cè)試樣本,主要是為了研究不同時(shí)段下的分類識(shí)別。因此本文的實(shí)驗(yàn)主要是研究不同分類器對(duì)相同場(chǎng)景的數(shù)據(jù)的區(qū)分能力。
表1 SVM多分類的識(shí)別結(jié)果
首先直接采用SVM多分類器對(duì)天氣類別進(jìn)行分類。將訓(xùn)練樣本集按時(shí)間排列,選擇前一半采用不同核函數(shù)進(jìn)行學(xué)習(xí),后一半用于測(cè)試,從而找出效果最好的核函數(shù)。SVM多分類結(jié)果如表1所示,分別為SVM一對(duì)多、SVM一對(duì)一、SVM導(dǎo)向無環(huán)圖和SVM二叉樹的分類效果,可以看出SVM一對(duì)一和SVM導(dǎo)向無環(huán)圖的方法要明顯優(yōu)于SVM一對(duì)多的方法。一對(duì)一與導(dǎo)向無環(huán)圖在本質(zhì)上是一致的。導(dǎo)向無環(huán)圖是在一對(duì)一的基礎(chǔ)上,讓所有的兩分類器按照一定方向進(jìn)行排列,這樣可以使得判別結(jié)果更公正。一對(duì)一是通過對(duì)所有兩分類器進(jìn)行判斷,統(tǒng)計(jì)哪個(gè)類別出現(xiàn)的次數(shù)最多,有可能出現(xiàn)多個(gè)類別出現(xiàn)次數(shù)相同,這樣就很難判斷屬于哪一類天氣類別,而導(dǎo)向無環(huán)圖可以克服這個(gè)不足。由于二叉樹的性能取決如何構(gòu)造二叉樹,而二叉樹的構(gòu)造可人為設(shè)定也可以根據(jù)距離最大或最小原則構(gòu)造,人為設(shè)定缺乏客觀性,根據(jù)距離最大或最小原理穩(wěn)定性較差,因此本文重點(diǎn)研究導(dǎo)向無環(huán)圖。
為了比較SVM多分類(重點(diǎn)研究導(dǎo)向無環(huán)圖)與AdaBoost強(qiáng)分類器的效果,以及AdaBoost強(qiáng)分類器(多棵決策樹)是否的確比單棵決策樹(CART)的效果要好。分別采用SVM導(dǎo)向無環(huán)圖、CART(單棵決策樹)和AdaBoost RF(隨機(jī)森林為弱分類器,由很多棵決策樹構(gòu)成)作為分類器對(duì)相同場(chǎng)景進(jìn)行學(xué)習(xí)訓(xùn)練,識(shí)別結(jié)果如表2所示??梢钥闯鯯VM導(dǎo)向無環(huán)圖的識(shí)別率最高,另外AdaBoost RF的分類效果比CART多分類效果要好,表明對(duì)于本文的數(shù)據(jù),強(qiáng)分類器的效果要優(yōu)于弱分類器。因此,對(duì)于相同場(chǎng)景,本文采用SVM導(dǎo)向無環(huán)圖作為分類器,可提高識(shí)別準(zhǔn)確率。
文獻(xiàn)[2]中采用wild數(shù)據(jù)庫(kù)進(jìn)行單一場(chǎng)景的分類實(shí)驗(yàn),實(shí)驗(yàn)中只有一個(gè)場(chǎng)景。wild天氣類別數(shù)據(jù)庫(kù)包含白天夜晚各個(gè)整點(diǎn)的圖像數(shù)據(jù),圖像數(shù)據(jù)中涵蓋不同天氣、不同季節(jié)的數(shù)據(jù),每個(gè)圖像數(shù)據(jù)有對(duì)應(yīng)的時(shí)間、天氣類別、光照條件、風(fēng)向風(fēng)速、能見度、溫度、相對(duì)濕度等信息,共錄制了一年的數(shù)據(jù)。文獻(xiàn)[2]采用wild圖像數(shù)據(jù)庫(kù),對(duì)常見的天氣類別進(jìn)行自動(dòng)識(shí)別研究,其識(shí)別結(jié)果如表3所示。
本文場(chǎng)景較多,訓(xùn)練樣本和測(cè)試樣本都包含相同數(shù)目的場(chǎng)景,采用SVM導(dǎo)向無環(huán)圖進(jìn)行識(shí)別結(jié)果如表4所示。與表3相比,可以看出本文場(chǎng)景較多(訓(xùn)練分類都采用多個(gè)相同場(chǎng)景),識(shí)別類別較多(可以對(duì)五類天氣類別進(jìn)行識(shí)別),準(zhǔn)確率較高(每類天氣類別的識(shí)別率都可達(dá)90%以上)。因此,如果測(cè)試樣本的場(chǎng)景與訓(xùn)練樣本場(chǎng)景相同,采用SVM多分類器(導(dǎo)向無環(huán)圖)進(jìn)行測(cè)試的效果較好。
通過實(shí)驗(yàn)發(fā)現(xiàn)SVM多分類對(duì)于不同場(chǎng)景的天氣類別識(shí)別能力較弱,而以隨機(jī)森林為弱分類器構(gòu)成的AdaBoost強(qiáng)分類器能有效提高對(duì)不同場(chǎng)景的識(shí)別能力?;诖耍疚淖罱K提出了基于視頻的天氣類別自動(dòng)識(shí)別分類器的設(shè)計(jì)。
[1] Wu X, Kumar V, Quinlan J R, et al.Top 10 algorithms in data mining[J].Knowledge and information systems,2008, 14(1): 1-37.
[2] Li Q, Kong Y, Xia S.A method of weather recognition based on outdoor images[C]//Computer Vision Theory and Applications (VISAPP), 2014 International Conference on.IEEE, 2014, 2: 510-516.
[3] Burton G J, Moorhead I R.Color and spatial structure in natural scenarios[J].Applied Optics, 1987, 26(1): 157-170.
Development of A Video-based Weather Category Automatic Recognition Classifier
Peng Xudong1,Xia Shiming1,Sun Jiming2
(1.Institute of Meteorology and Oceanography,PLA University of Science and Technology,Nanjing,211101;2.Department of Aviation Theory,Aviation University Air Force,Changchun,130022)
It was found that the skill of SVM multi-classification (directed acyclic graph)for different scenarios of weather categories was weak,but AdaBoost strong classifier based on random forest weak classifier can effectively improve the ability to recognize different scenarios.Above all,this paper proposed a video-based weather category automatic recognition classifier.
Weather recognition;AdaBoost;SVM
表2 相同場(chǎng)景下各分類器識(shí)別結(jié)果
表3 文獻(xiàn)[2]采用wild數(shù)據(jù)庫(kù)識(shí)別結(jié)果
表4 本文數(shù)據(jù)識(shí)別結(jié)果