李明俊 張正豪 宋曉琳 曹昊天 易濱林
摘? ?要:基于駕駛模擬平臺設(shè)計實驗方案,同步采集駕駛員的駕駛操作信息和車輛狀態(tài)信息,選取6個表征駕駛風(fēng)格的特征參數(shù),采用主成分分析(Principal Component Analysis,PCA)算法對多元特征參數(shù)進(jìn)行特征提取,將前3個主成分作為駕駛風(fēng)格識別模型的特征輸入. 利用K-means聚類完成樣本標(biāo)記工作. 基于有監(jiān)督支持向量機(jī)(Support Vector Machine,SVM)與多分類半監(jiān)督學(xué)習(xí)算法(iMLCU)的原理,分別建立SVM與iMLCU駕駛風(fēng)格識別模型,通過調(diào)節(jié)標(biāo)記樣本與未標(biāo)記樣本比例,對比使用不同樣本比例訓(xùn)練的SVM和iMLCU模型的駕駛風(fēng)格識別準(zhǔn)確率. 結(jié)果表明:相比于SVM,iMLCU表現(xiàn)出了更優(yōu)異的駕駛風(fēng)格識別能力,由此可知半監(jiān)督iMLCU模型可以利用未標(biāo)記樣本提高模型對駕駛風(fēng)格的識別能力.
關(guān)鍵詞:駕駛風(fēng)格;主成分分析;K-means聚類;支持向量機(jī);多分類半監(jiān)督學(xué)習(xí)算法
中圖分類號:TP391.41 ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A
Abstract:This paper designs an experimental scheme based on the driving simulation platform and collects driver's operation information and vehicle status information synchronously.? ?Six? characteristic parameters are selected to recognize the driving style. The principal component analysis (PCA) algorithm is used to extract the multi-feature parameters and the first three principal components are used as the input features of the driving style recognition model. The K-means method is used for data labeling. Based on the principles of supervised support vector machine (SVM) method and inductive multi-label classification with unlabeled data (iMLCU) approach, the driving style recognition models of SVM and iMLCU are established, respectively. By adjusting the trained dataset ratios between the labeled and the unlabeled data, the accuracy of driving style recognition between the two models is compared. The results show that iMLCU has better driving style recognition than SVM. The semi-supervised iMLCU model can improve the recognition ability of driving style by using unlabeled samples.
Key words:driving style;principal component analysis;K-means clustering;support vector machines;multi-label semi-supervised classification with unlabeled data
近年來,自動駕駛汽車因其安全、節(jié)能、環(huán)保等特點而受到了廣泛關(guān)注.[1-3]駕駛風(fēng)格與道路交通安全密切相關(guān). Carsten等[4]研究發(fā)現(xiàn),激進(jìn)型駕駛風(fēng)格的駕駛員容易出現(xiàn)急加速、急減速、近距離跟馳、頻繁換道等不良駕駛行為,易造成道路交通安全問題. 曾誠等[5]研究表明,通過規(guī)范激進(jìn)型駕駛員的不良駕駛行為,可以提高車輛行駛安全性. 因此,對駕駛風(fēng)格進(jìn)行有效識別,有利于增強(qiáng)駕駛安全性.
目前,國內(nèi)外學(xué)者對駕駛風(fēng)格識別進(jìn)行了多方面的研究,歸納起來主要為兩方面:1)駕駛風(fēng)格特征參數(shù)的選取. Wang等[6]對制動/節(jié)氣門踏板位置、方向盤角度等駕駛數(shù)據(jù)取其平均值、標(biāo)準(zhǔn)差、最大值、最小值作為特征參數(shù)用以評價駕駛風(fēng)格;Chu等[7]采用速度超過60 km/h所占的時間比為駕駛風(fēng)格識別特征參數(shù);文獻(xiàn)[8-9]基于沖擊度(加速度的變化率)提出了駕駛風(fēng)格識別系數(shù)Rdriver、沖擊度的累計量等概念[8-9];Shi等[10]將能量譜密度作為激進(jìn)型駕駛風(fēng)格的評價指標(biāo). 上述研究大多基于一個或幾個特征參數(shù)對駕駛風(fēng)格進(jìn)行識別,不能全面反映駕駛風(fēng)格. 2)駕駛風(fēng)格識別算法. 基于實驗駕駛數(shù)據(jù),Wang等[11]使用模式分類技術(shù)直接分析駕駛風(fēng)格;Koh等[12]利用高斯混合模型(GMM)對駕駛風(fēng)格進(jìn)行梯度分類;金輝等[13]采用GMM聚類算法對起步工況下的駕駛數(shù)據(jù)進(jìn)行分析,以駕駛風(fēng)格聚類分析結(jié)果為基礎(chǔ)建立了基于Fisher判別的駕駛風(fēng)格識別方法模型,運用經(jīng)典和改進(jìn)Fisher判別對駕駛風(fēng)格數(shù)據(jù)的測試集進(jìn)行識別;文獻(xiàn)[14]通過結(jié)合序列分割算法的貝葉斯多元線性模型,從自然駕駛數(shù)據(jù)推斷出駕駛行為;Guardiola等[15]利用馬爾科夫(MC)結(jié)合蒙特卡洛提高了駕駛風(fēng)格識別精度. Aoude等[16]使用支持向量機(jī)-貝葉斯濾波器(SVM-BF)和隱馬爾可夫模型(HMM)相結(jié)合的方法訓(xùn)練分類器,顯著提高了分類效率;Karginova等[17]對K鄰近算法(KNN)、神經(jīng)網(wǎng)絡(luò)(NN)、決策樹和隨機(jī)森林等方法進(jìn)行了比較,在仿真環(huán)境中發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)具有最好的駕駛風(fēng)格識別能力;文獻(xiàn)[12-14]中的無監(jiān)督學(xué)習(xí)算法直接通過對未標(biāo)記樣本的學(xué)習(xí)對駕駛風(fēng)格進(jìn)行分類,但是需要對樣本進(jìn)行大量分析處理,才能得到可靠的分類結(jié)果;文獻(xiàn)[15-17]中的有監(jiān)督學(xué)習(xí)算法被廣泛應(yīng)用于駕駛風(fēng)格識別且取得了較好的效果,但該算法需要大量的標(biāo)記樣本作為數(shù)據(jù)支持,而現(xiàn)實生活中標(biāo)記樣本十分稀缺,未標(biāo)記的樣本獲取卻極容易. 手動標(biāo)記的訓(xùn)練數(shù)據(jù)需要花費大量精力,并且手動標(biāo)記駕駛行為數(shù)據(jù)會導(dǎo)致主觀標(biāo)簽問題.
為了克服上述不足,提高駕駛風(fēng)格分類的性能并減少標(biāo)記工作量,本文結(jié)合有監(jiān)督和無監(jiān)督方法的優(yōu)點,選擇一種半監(jiān)督學(xué)習(xí)方法iMLCU對駕駛風(fēng)格進(jìn)行分類. 基于駕駛模擬器,同步采集駕駛員的駕駛操作信息和車輛狀態(tài)信息,選取表征駕駛風(fēng)格的多元特征參數(shù),并通過無監(jiān)督學(xué)習(xí)算法對特征參數(shù)進(jìn)行聚類,完成樣本標(biāo)記工作. 采用PCA算法進(jìn)行特征降維,提取特征作為SVM與iMLCU的輸入,分別建立有監(jiān)督SVM與半監(jiān)督iMLCU駕駛風(fēng)格識別模型,對比兩模型的駕駛風(fēng)格識別準(zhǔn)確率.
1? ?實驗設(shè)計與數(shù)據(jù)采集
本文基于駕駛模擬平臺(如圖1所示)設(shè)計實驗方案,同步采集駕駛過程中的駕駛操作信息和車輛狀態(tài)信息,選取駕駛風(fēng)格特征參數(shù),完成特征提取,之后進(jìn)行樣本標(biāo)記,為駕駛風(fēng)格識別模型的構(gòu)建提供數(shù)據(jù)支持.
1.1? ?實驗設(shè)計
實驗道路模型如圖2所示,實驗道路由前6段直道+彎道[18](曲率半徑為50 m、100 m、200 m,圓心角為45°、90°)、避障道路、S型彎道3個駕駛場景組成,每個彎道前50 m處都設(shè)置了限速60 km/h的標(biāo)志牌.
實驗共招募20位持有有效駕駛證件的志愿者(12名男性和8名女性駕駛員). 在正式實驗前,每位駕駛員需熟悉習(xí)慣駕駛模擬器的操作. 根據(jù)駕駛?cè)蝿?wù),每位駕駛員需要進(jìn)行10次數(shù)據(jù)采集實驗,以采集駕駛過程中的駕駛操作信息和車輛狀態(tài)信息. 若在實驗過程中發(fā)生車輛失控或偏離駕駛道路,則此次實驗數(shù)據(jù)無效. 為了確保實驗數(shù)據(jù)的一致性,駕駛員需遵循以下規(guī)則:
1)所有駕駛員均處于正常駕駛狀態(tài),不允許酒后駕駛或疲勞駕駛;
2)每位駕駛員除完成實驗駕駛?cè)蝿?wù)外,不允許執(zhí)行與駕駛無關(guān)的其他活動,如與他人交談、打電話、聽音樂等;
3)兩次實驗間休息1~2 min.
1.2? ?特征參數(shù)的提取
車速可以反映駕駛員的縱向駕駛行為. 如激進(jìn)型駕駛員在彎曲的道路上行駛時偏愛較高的車速,而謹(jǐn)慎型駕駛員行駛速度較低. 節(jié)氣門開度由駕駛員直接控制,因此與加速/減速直接相關(guān)[10]. 車輛的縱向和橫向加速度也可以反映駕駛風(fēng)格. 偏好較大縱向加速度/減速度的駕駛員駕駛更為激進(jìn). 為了研究駕駛員的駕駛風(fēng)格,使用速度和加速/減速來捕獲駕駛員特征[19]. Shi等[10]發(fā)現(xiàn)制動信號不足以區(qū)分激進(jìn)型和正常型駕駛員. 因此,在這項工作中,沒有設(shè)置制動踏板功能. 基于以上討論,本文選取了6個駕駛風(fēng)格特征參數(shù),包括速度均值及標(biāo)準(zhǔn)差、縱向加速度均值及標(biāo)準(zhǔn)差、節(jié)氣門開度的均值和標(biāo)準(zhǔn)差. 如表1所示.
由表2可知,節(jié)氣門開度的均值和標(biāo)準(zhǔn)差與第一個主成分具有較強(qiáng)的相關(guān)性,因此,第一個主成分稱為“節(jié)氣門開度特征變量”. 第二個主成分與加速度的均值和標(biāo)準(zhǔn)差有較強(qiáng)相關(guān)性,第二個主成分稱為“加速度特征變量”. 與前兩個主成分不同,第三個主成分與速度的均值和標(biāo)準(zhǔn)差有較強(qiáng)相關(guān)性,第三個主成分稱為“速度特征變量”. 如圖3所示,根據(jù)累積貢獻(xiàn)率不小于90%對應(yīng)的主成分為選擇依據(jù)[20],前3個主成分可以表征所選擇的6個變量的特征. 因此,本實驗選取前3個主成分(PC1~PC3)作為駕駛風(fēng)格識別模型的特征輸入.
1.3? ?樣本標(biāo)記
實驗共收集了20個駕駛員的600個數(shù)據(jù)集,每個數(shù)據(jù)集包含約2 000個數(shù)據(jù)點(200 s×10 Hz =2 000). 基于K-means聚類在駕駛風(fēng)格識別及樣本標(biāo)記中有著廣泛應(yīng)用[21-23],為了簡化樣本標(biāo)注工作,本文基于這種方式對駕駛模擬實驗中的上述特征參數(shù)進(jìn)行聚類,以激進(jìn)程度打標(biāo)簽. 將駕駛員的駕駛風(fēng)格分為3個類型,“1”表示謹(jǐn)慎型;“2”表示正常型;“3”表示激進(jìn)型.
1.4? ?訓(xùn)練和測試過程
將寬度為6 s[24]的移動窗口應(yīng)用于訓(xùn)練集和測試集所有需要訓(xùn)練的數(shù)據(jù)中. 位于指定窗口內(nèi)的所有特征數(shù)據(jù)都被聚集到一條數(shù)據(jù)記錄中(即6 s內(nèi)這段數(shù)據(jù)中,特征參數(shù)的均值和標(biāo)準(zhǔn)差). 這些數(shù)據(jù)包括車速、加速度和節(jié)氣門開度. 對所有測試數(shù)據(jù)也進(jìn)行了與訓(xùn)練數(shù)據(jù)相同的處理.
2? ?駕駛風(fēng)格識別模型的構(gòu)建
基于SVM與iMLCU的原理,分別建立有監(jiān)督SVM與半監(jiān)督iMLCU駕駛風(fēng)格識別模型.
2.1? ?支持向量機(jī)(SVM)
將每位駕駛員對應(yīng)的前3個主成分和駕駛風(fēng)格類型形成實驗數(shù)據(jù)樣本,將駕駛風(fēng)格識別模型的訓(xùn)練樣本分為標(biāo)記樣本Dl = {(X1,Y1),(X2,Y2),…,(Xl,Yl)}和未標(biāo)記樣本Du = {Xl+1,…,Xl+u},其中X_i = (x_1,x_2,x_3)為主成分因素,Yi ∈(y1,y2,y3)為駕駛風(fēng)格類型標(biāo)簽.
為了解決上述最優(yōu)化問題,SVM采用拉格朗日對偶變換對模型進(jìn)行凸優(yōu)化,求解最優(yōu)超平面,得到SVM駕駛風(fēng)格多分類模型.
2.2? ?多分類半監(jiān)督學(xué)習(xí)算法(iMLCU)
多分類半監(jiān)督學(xué)習(xí)算法 (inductive Multi-Label Classification with Unlabeled data,iMLCU)利用已標(biāo)記樣本的標(biāo)記相關(guān)性,將未標(biāo)記樣本的正則項納入目標(biāo)函數(shù),使用CCCP(ConCave Convex Procedure)算法優(yōu)化目標(biāo)函數(shù),得到iMLCU駕駛風(fēng)格多分類半監(jiān)督模型.
iMLCU模型基于SVM分類原理利用已標(biāo)記樣本的標(biāo)記相關(guān)性得到目標(biāo)函數(shù)(2). 為了在模型訓(xùn)練過程中有效利用未標(biāo)記樣本,借鑒二分類半監(jiān)督支持向量機(jī)(Semi-Supervised Support Vector Machine,S3VM)使用未標(biāo)記樣本的思想[20],將其應(yīng)用于駕駛風(fēng)格多分類模型的建立. iMLCU將未標(biāo)記樣本X利用式(1)預(yù)測其駕駛風(fēng)格類型作為“假定標(biāo)記集合”,并使用鏈?zhǔn)綋p失計算X在第i個類型y_i上的損失,? 求解上述優(yōu)化問題得到iMLCU駕駛風(fēng)格多分類半監(jiān)督模型.
3? ?結(jié)果分析
本文基于駕駛模擬實驗共獲得了600組數(shù)據(jù)樣本,采用無放回的方式隨機(jī)選取10%~50%的樣本(以10%遞增)作為已標(biāo)記樣本Dl,將剩余的50%作為未標(biāo)記樣本Du,從Du中隨機(jī)選取30%的未標(biāo)記樣本作為測試樣本T. 有監(jiān)督SVM模型與半監(jiān)督iMLCU模型之間的不同之處在于:SVM只使用Dl訓(xùn)練模型,而iMLCU同時使用Dl與Du訓(xùn)練模型. 之后使用相同的測試樣本T檢驗并對比SVM與iMLCU兩模型的駕駛風(fēng)格識別準(zhǔn)確率. 此外,為了消除訓(xùn)練數(shù)據(jù)過擬合問題和提高iMLCU模型的識別準(zhǔn)確率,研究采用基于網(wǎng)格搜索法進(jìn)行交叉驗證[25],確定模型最佳懲罰系數(shù)C1與C2,結(jié)果為C1 = 6,C2 = 0.05.
表3和圖4為SVM與iMLCU兩模型的駕駛風(fēng)格識別準(zhǔn)確率,結(jié)果表明:在相同標(biāo)記樣本比例的情況下,相較于SVM,iMLCU表現(xiàn)出了更優(yōu)異的駕駛風(fēng)格識別能力. 在10%標(biāo)記樣本比例條件下,iMLCU的駕駛風(fēng)格識別準(zhǔn)確率比在50%標(biāo)記樣本比例的SVM模型識別準(zhǔn)確率高(分別為81.04% 、 79.16%). 由此可知半監(jiān)督iMLCU模型可以利用未標(biāo)記樣本,提高模型對駕駛風(fēng)格的識別能力. 此外,增加了55%標(biāo)記樣本比例和60%標(biāo)記樣本比例,發(fā)現(xiàn)在標(biāo)記樣本比例大于40%時,半監(jiān)督iMLCU駕駛風(fēng)格識別模型趨于收斂[23],且準(zhǔn)確率收斂于87%. 增加標(biāo)記樣本比例會大大增加iMLCU模型訓(xùn)練時間[25]. 因此,綜合考慮訓(xùn)練時間和識別準(zhǔn)確率,基于iMLCU駕駛風(fēng)格分類識別模型最佳標(biāo)記樣本比例為40%.
4? ?結(jié)? ?論
本文基于駕駛模擬平臺設(shè)計實驗方案,同步采集駕駛員的駕駛操作信息和車輛狀態(tài)信息,選取6個表征駕駛風(fēng)格的特征參數(shù),采用PCA算法進(jìn)行特征提取,將前3個主成分作為駕駛風(fēng)格識別模型的特征輸入. 利用K-means聚類完成樣本標(biāo)記工作,為駕駛風(fēng)格識別模型的構(gòu)建提供數(shù)據(jù)支持. 基于SVM與iMLCU的原理,分別建立有監(jiān)督SVM與半監(jiān)督iMLCU駕駛風(fēng)格識別模型,通過調(diào)節(jié)標(biāo)記樣本比例,對比SVM與iMLCU兩模型的駕駛風(fēng)格識別準(zhǔn)確率. 結(jié)果表明,使用iMLCU可以減少訓(xùn)練分類器標(biāo)記工作,提高識別準(zhǔn)確率.
參考文獻(xiàn)
[1]? ? 蘭鳳崇,李詩成,陳吉清,等. 考慮操縱穩(wěn)定性的自動駕駛汽車軌跡綜合優(yōu)化方法[J]. 湖南大學(xué)學(xué)報(自然科學(xué)版),2019,46(10):36—45.
LAN F C,LI S C,CHEN J Q,et al. Comprehensive approach for trajectory optimization of autopilot vehicles considering handling stability [J]. Journal of Hunan University (Natural Sciences),2019,46(10):36—45.(In Chinese)
[2]? ?CAO H T,ZHAO S,SONG X L,et al. An optimal hierarchical framework of the trajectory following by convex optimization for highly automated driving vehicles [J]. Vehicle System Dynamics,2019,57(9):1287—1317.
[3]? ? 宋曉琳,周南,黃正瑜,等.改進(jìn)RRT在汽車避障局部路徑規(guī)劃中的應(yīng)用[J].湖南大學(xué)學(xué)報(自然科學(xué)版),2017,44(4):30—37.
SONG X L,ZHOU N,HUANG Z Y,et al. An improved RRT algorithm of local path planning for vehicle collision avoidance[J].Journal of Hunan University(Natural Sciences),2017,44(4):30—37. (In Chinese)
[4]? ?CARSTEN O,KIRCHER K,JAMSON S. Vehicle-based studies of driving in the real world:the hard truth [J]. Accident Analysis & Prevention,2013,58:162—174.
[5]? ? 曾誠,蔡鳳田,劉莉,等. 不同駕駛操作方法下的汽車運行燃料消耗量分析[J]. 交通節(jié)能與環(huán)保,2011(1):31—34.
ZENG C,CAI F T,LIU L,et al. Analysis of vehicle fuel consumption under different driving methods [J]. Traffic Energy Saving and Environmental Protection,2011 (1):31—34. (In Chinese)
[6]? ? WANG W S,XI J Q,CHEN H Y. Modeling and recognizing driver behavior based on driving data:a survey [J]. Mathematical Problems in Engineering,2014(1):1—20.
[7]? ? CHU D F,DENG Z J,HE Y,et al. Curve speed model for driver assistance based on driving style classification[J]. IET Intelligent Transport Systems,2017,11(8):501—510.
[8]? ? 秦大同,詹森,曾育平,等. 基于駕駛風(fēng)格識別的混合動力汽車能量管理策略[J]. 機(jī)械工程學(xué)報,2016,52(8):162—169.
QIN D T,ZHAN S,ZENG Y P,et al. Hybrid vehicle energy management strategy based on driving style recognition [J]. Journal of Mechanical Engineering,2016,52 (8):162—169. (In Chinese)
[9]? ? 陳鏡任,吳業(yè)福,吳冰. 基于車輛行駛數(shù)據(jù)的駕駛?cè)诵袨樽V分析方法[J]. 計算機(jī)應(yīng)用,2018,38(7):92—98.
CHEN J R,WU Y F,WU B. Driver behavior spectrum analysis method based on vehicle driving data [J]. Computer Applications,2018,38 (7):92—98. (In Chinese)
[10]? SHI B,XU L,HU J,et al. Evaluating driving styles by normalizing driving behavior based on personalized driver modeling[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2015,45(12):1502—1508.
[11]? WANG W S,XI J Q. A rapid pattern-recognition method for driving styles using clustering-based support vector machines[C]// IEEE 2016 American Control Conference (ACC).Boston:IEEE,2016:5270—5275.
[12]? KOH D W,KANG H B. Smartphone-based modeling and detection of aggressiveness reactions in senior drivers [C]//2015 IEEE Intelligent Vehicles Symposium (IV). Seoul,South Korea:IEEE,2015:12—17.
[13]? 金輝,呂明.基于改進(jìn)Fisher判別的起步工況駕駛風(fēng)格研究[J].北京理工大學(xué)學(xué)報,2020,40(3):262—266.
JIN H,L? M. A study on the driving style recognition in the vehicle starting condition based on the modified Fisher discrimination [J]. Journal of Beijing Institute of Technology,2020,40(3):262—266. (In Chinese)
[14]? BENDER A,AGAMENNONI G,WARD J R,et al. An unsupervised approach for inferring driver behavior from naturalistic driving data [J]. IEEE Transactions on Intelligent Transportation Systems,2015,16(6):3325—3336.
[15]? GUARDIOLA C,PLA B,REIG A. Modelling driving behavior and its impact on the energy management problem in hybrid electric vehicles[J]. International Journal of Computer Mathematics,2014,91(1):147—156.
[16]? AOUDE G S,DESARAJU V R,STEPHENS L H,et al. Driver behavior classification at intersections and validation on large naturalistic data set [J]. IEEE Transactions on Intelligent Transportation Systems,2012,13(2):724—736.
[17]? KARGINOVA N,BYTTNER S,SVENSSON M. Data-driven methods for classification of driving styles in buses [J]. SAE Technical Paper,2012-01-0744.
[18]? CHANDRASIRI N P,NAWA K,ISHII A. Driving skill classification in curve driving scenes using machine learning [J]. Journal of Modern Transportation,2016,24(3):196—206.
[19]? WU J P,DU Y M,QI G Q,et al. Leveraging longitudinal driving behavior data with data mining techniques for driving style analysis [J]. IET Intelligent Transport Systems,2015,9(8):792—801.
[20]? DEUTSCH H P. Principle component analysis: derivatives and internal models[M]. Basingstroke:Palgrave Macmillan,2004:793-804.
[21] MARTINEZ C M,HEUCKE M,WANG F Y,et al. Driving style recognition for intelligent vehicle control and advanced driver assistance:a survey[J]. IEEE Transactions on Intelligent Transportation Systems,2018,19(3):666—676.
[22]? 郝景賢,余卓平,趙治國,等. 混合動力汽車駕駛風(fēng)格識別的研究[J]. 汽車工程,2017,39(12):1444—1450.
HAO J X,YU Z P,ZHAO Z G,et al. A study on the driving style recognition of hybrid electric vehicle [J]. Automotive Engineering,2017,39(12):1444—1450. (In Chinese)
[23]? WANG W S,XI J Q. Driving style classification using a semi-supervised support vector machine [J]. IEEE Transactions on Human-machine System,2017,47(5):2168—2291.
[24]? MURPHEY Y L,MILTON R,KILIARIS L. Drivers style classification using jerk analysis [C]//2009 Computational Intelligence in Vehicles and Vehicular Systems(CIVV). Nashville,TN,USA:IEEE,2009:23—28.
[25]? WU L,ZHANG M L. Multi-Label classification with unlabeled data:an inductive approach [J]. Journalof Machine Learning Research,2013,29:197—212.