屈新懷, 馬文強(qiáng), 丁必榮, 牛 乾
(合肥工業(yè)大學(xué) 機(jī)械工程學(xué)院,安徽 合肥 230009)
經(jīng)銷商銷售渠道是整車營(yíng)銷的核心環(huán)節(jié)之一。由于大部分經(jīng)銷商屬于中小企業(yè),汽車整車廠商對(duì)于汽車的銷售主要采取信用賒銷的形式。因此建立經(jīng)銷商的信用模型,對(duì)汽車整車廠商減小應(yīng)收賬款風(fēng)險(xiǎn)、保證信貸資金安全具有重要的現(xiàn)實(shí)意義[1]。
在信用評(píng)價(jià)模型方面,傳統(tǒng)的信用評(píng)價(jià)模型常使用統(tǒng)計(jì)學(xué)方面的知識(shí)。文獻(xiàn)[2-3]使用層次分析法和模糊評(píng)價(jià)法的組合模型;文獻(xiàn)[4]通過(guò)將統(tǒng)計(jì)抽樣理論中分層思想與邏輯回歸模型相結(jié)合,構(gòu)造基于分層邏輯回歸的小企業(yè)信用評(píng)價(jià)模型。隨著智能算法的發(fā)展,決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等算法逐漸運(yùn)用于信用評(píng)價(jià)領(lǐng)域。文獻(xiàn)[5]使用反向傳播(back-propagation,BP)神經(jīng)網(wǎng)絡(luò)建立信用度的基本概率分配函數(shù),為信用風(fēng)險(xiǎn)的決策提供依據(jù);文獻(xiàn)[6]提出了一種結(jié)合遺傳規(guī)劃(genetic programming,GP)和BP神經(jīng)網(wǎng)絡(luò)的信用評(píng)估模型,對(duì)受評(píng)目標(biāo)的信用分類具有較高的準(zhǔn)確度;文獻(xiàn)[7]使用正交支持向量機(jī)解決信用評(píng)分中數(shù)據(jù)維度災(zāi)難問(wèn)題。針對(duì)信用數(shù)據(jù)的連續(xù)性、信用狀態(tài)的動(dòng)態(tài)性情況,文獻(xiàn)[8-9]基于多維時(shí)間序列數(shù)據(jù)觀察受評(píng)目標(biāo)信用等級(jí)的狀態(tài)趨勢(shì)及“波動(dòng)”情況,但未從定量的角度考慮受評(píng)目標(biāo)的信用情況。
考慮到經(jīng)銷商信用數(shù)據(jù)樣本少以及數(shù)據(jù)的連續(xù)性特點(diǎn),本文從受評(píng)經(jīng)銷商的歷史業(yè)務(wù)數(shù)據(jù)出發(fā),使用多維時(shí)間序列數(shù)據(jù)建立支持向量回歸(support vector regression,SVR)模型,動(dòng)態(tài)地預(yù)測(cè)經(jīng)銷商對(duì)應(yīng)的信用額度,為更好地管理經(jīng)銷商提供一定的依據(jù)。
(1) 相空間重構(gòu)原理。記有m維時(shí)間序列{X1,X2,…,Xm},其中Xi=[xi,1xi,2…xi,n],i=1,2,…,m,變量n為時(shí)間序列的長(zhǎng)度,m為時(shí)間序列的個(gè)數(shù)。
Vi=[v1,iv2,i…vm,i]
(1)
其中,i=1,2,…,L;j=1,2,…,m;vj, i=[xj,ixj,i+τj…xj,i+(dj-1)τj],τj、dj分別為第j個(gè)變量時(shí)間序列的延遲時(shí)間和嵌入維數(shù),xj,i為數(shù)據(jù)序列中第j個(gè)變量在序列中第i個(gè)位置上的數(shù)值。
(2) 延遲時(shí)間和嵌入維數(shù)的確定。選擇延遲時(shí)間τ一般使用自相關(guān)法,即通過(guò)計(jì)算變量的自相關(guān)函數(shù),選擇自相關(guān)函數(shù)第1次為0時(shí)所對(duì)應(yīng)的τ為相空間重構(gòu)的延遲時(shí)間。確定嵌入維數(shù)使用飽和關(guān)聯(lián)維數(shù)法,且嵌入維數(shù)d和飽和關(guān)聯(lián)維數(shù)D滿足d≥2D+1。
關(guān)聯(lián)維數(shù)Dd定義為:
(2)
(3)
其中,‖Xi-Xj‖為兩時(shí)間序列向量的歐氏距離;r為介于歐氏距離最大值和最小值之間的變量;H(x)為:
(4)
通過(guò)適當(dāng)調(diào)整r,可計(jì)算出一組lnr、lnC(r)的值,從而根據(jù)(2)式計(jì)算關(guān)聯(lián)維數(shù)Dd。隨著嵌入維數(shù)d增加到一定程度,關(guān)聯(lián)維數(shù)Dd趨于穩(wěn)定。取飽和值D作為飽和關(guān)聯(lián)維數(shù),根據(jù)公式d≥2D+1確定合適的相空間嵌入維數(shù)d。
(1) SVR原理。SVR是從建立在統(tǒng)計(jì)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小理論的基礎(chǔ)上發(fā)展的分類支持向量機(jī)拓展而來(lái)的[11]。對(duì)n維空間Rn上線性數(shù)據(jù)回歸的基本思路如下:給定一組訓(xùn)練數(shù)據(jù)集D={(x1,y1),(x2,y2),…,(xn,yn)},在數(shù)據(jù)集中xi∈Rn,yi∈R,求解Rn中的超平面線性函數(shù)為g(x)=ω·x+b,使用函數(shù)y=g(x)對(duì)任一輸入x預(yù)估對(duì)應(yīng)的輸出值y。
根據(jù)對(duì)偶理論并引入Lagrange函數(shù),對(duì)于線性ε-支持向量回歸機(jī),使回歸問(wèn)題轉(zhuǎn)化為凸二次規(guī)劃問(wèn)題,即
(5)
i=1,2,…,n
(6)
(7)
從而構(gòu)造的決策函數(shù)如下:
(8)
對(duì)非線性數(shù)據(jù),SVR處理的基本思路是通過(guò)引入核函數(shù)代替(8)式中的內(nèi)積運(yùn)算,即將樣本空間中非線性低維數(shù)據(jù)映射為特征空間中的高維線性數(shù)據(jù),即
(9)
其中,K(xi,x)為核函數(shù)。
(2) 預(yù)測(cè)方法。從整車廠商的經(jīng)銷商管理系統(tǒng)(dealer management system,DMS)中獲取有關(guān)數(shù)據(jù):① 按月份匯總數(shù)據(jù),整理成多維時(shí)間序列的形式;② 根據(jù)1.1節(jié)所述對(duì)經(jīng)銷商多維時(shí)間序列信用數(shù)據(jù)進(jìn)行相空間重構(gòu),對(duì)于確定的經(jīng)銷商信用數(shù)據(jù)序列,其相空間重構(gòu)的參數(shù)一般比較穩(wěn)定,不必每次預(yù)測(cè)都進(jìn)行更新計(jì)算,可以根據(jù)實(shí)際應(yīng)用需要按照季度進(jìn)行更新;③ 選取相空間中的相點(diǎn)與對(duì)應(yīng)的信用額度組成SVR模型的訓(xùn)練樣本,進(jìn)行SVR模型參數(shù)的尋優(yōu);④ 選取剩余的相點(diǎn)與對(duì)應(yīng)的信用額度組成預(yù)測(cè)樣本,利用訓(xùn)練好的SVR模型進(jìn)行預(yù)測(cè);⑤ 根據(jù)預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)的均方根誤差ERMES來(lái)評(píng)價(jià)模型的預(yù)測(cè)效果。
均方根誤差形式如下:
(10)
預(yù)測(cè)流程如圖1所示。
圖1 信用額度預(yù)測(cè)流程
本文選取某經(jīng)銷商業(yè)務(wù)數(shù)據(jù)中影響信用額度較大的2個(gè)變量,即開(kāi)票金額和回款金額。根據(jù)其業(yè)務(wù)情況,選取2013—2017年的記錄數(shù)據(jù),時(shí)間間隔為1個(gè)月,共計(jì)60個(gè)月,即n=60。
現(xiàn)給出某經(jīng)銷商在2017年的業(yè)務(wù)數(shù)據(jù)以及整車廠商給予經(jīng)銷商的信用額度數(shù)值,具體見(jiàn)表1所列。
表1 某經(jīng)銷商2017年業(yè)務(wù)數(shù)據(jù)與信用額度 萬(wàn)元
因?yàn)椴煌路蓍g的數(shù)據(jù)變化較大,為減少誤差,分別對(duì)原數(shù)據(jù)的各變量進(jìn)行0-1歸一化處理,即
(11)
其中,X*為映射后的數(shù)據(jù);x為原始數(shù)據(jù);xmax、xmin為原始數(shù)據(jù)中的最大值和最小值。經(jīng)過(guò)預(yù)處理后的數(shù)據(jù)將作為相空間重構(gòu)的來(lái)源。
開(kāi)票金額與回款金額的相關(guān)系數(shù)計(jì)算公式為:
ρ=
(12)
其中,n為序列的長(zhǎng)度,n=60;xi、yi分別為歸一化后信用數(shù)據(jù)序列中第i點(diǎn)的開(kāi)票金額和回款金額。
計(jì)算得到ρ=0.892 5,表明2個(gè)變量具有極強(qiáng)的相關(guān)性,因此考慮2個(gè)變量在重構(gòu)相空間時(shí)擁有相同的延遲時(shí)間與嵌入維數(shù)。
在確定合適的延遲時(shí)間τ時(shí),若τ過(guò)大,則會(huì)導(dǎo)致相空間中兩相鄰時(shí)刻的動(dòng)力學(xué)形態(tài)變化劇烈,使系統(tǒng)信號(hào)失真,產(chǎn)生不相關(guān)誤差,因此本文結(jié)合經(jīng)銷商信用數(shù)據(jù)情況,選擇2個(gè)變量的延遲時(shí)間τ1=τ2=1。
根據(jù)1.1節(jié)介紹的飽和關(guān)聯(lián)維數(shù)G-P法,依據(jù)經(jīng)銷商的回款數(shù)據(jù)計(jì)算出在不同維數(shù)下lnr、lnC(r)的值,繪制嵌入維數(shù)d為2~12情況下的曲線,如圖2所示。圖2中曲線從左至右對(duì)應(yīng)的維數(shù)為2~12。
圖2 某經(jīng)銷商回款數(shù)據(jù)ln r -ln C(r)關(guān)系曲線
求取每條曲線所包含的直線區(qū)域斜率,作為各嵌入維數(shù)對(duì)應(yīng)的關(guān)聯(lián)維數(shù),結(jié)果見(jiàn)表2所列。
表2 嵌入維數(shù)與關(guān)聯(lián)維數(shù)的關(guān)系數(shù)值
Vi=[xixi+1…xi+5yiyi+1…yi+5]
(13)
其中,i=1,2,…,55;xi、yi分別為信用時(shí)間序列中第i點(diǎn)的開(kāi)票金額和回款金額。
對(duì)應(yīng)的額度輸出Z=[z1z2…z60],zi為第i個(gè)月的信用額度。根據(jù)嵌入維數(shù)及實(shí)際預(yù)測(cè)情況,本文構(gòu)建的數(shù)據(jù)集為{(V1,z7),(V2,z8),…,(V54,z60)}。
選取數(shù)據(jù)集中的前40個(gè)點(diǎn)作為SVR模型的訓(xùn)練數(shù)據(jù)集{(V1,z7),(V2,z8),…,(V40,z46)},在本例SVR預(yù)測(cè)模型中選用高斯徑向基核函數(shù)(radial basis function,RBF),其核函數(shù)形式如下:
(14)
使用網(wǎng)格搜索和交叉驗(yàn)證法對(duì)(6)式中懲罰參數(shù)C和(14)式中核參數(shù)σ進(jìn)行尋優(yōu),計(jì)算得到C=0.353 5,σ=2.828 4。數(shù)據(jù)集的后14個(gè)點(diǎn)組成預(yù)測(cè)數(shù)據(jù)集{(V41,z47),…,(V54,z60)}。
使用預(yù)測(cè)數(shù)據(jù)集對(duì)模型進(jìn)行效果分析,并采用Matlab進(jìn)行算法仿真,計(jì)算的歸一化后均方根誤差ERMSE=0.91%,預(yù)測(cè)曲線如圖3所示。
圖3 多維時(shí)間序列SVR預(yù)測(cè)模型的預(yù)測(cè)效果
為了驗(yàn)證構(gòu)建的時(shí)間序列信用數(shù)據(jù)在經(jīng)銷商信用額度預(yù)測(cè)中的有效性,使用該經(jīng)銷商在孤立時(shí)間點(diǎn)上的信用數(shù)據(jù)進(jìn)行SVR預(yù)測(cè)信用額度,經(jīng)過(guò)同樣的歸一化預(yù)處理和SVR預(yù)測(cè)后,計(jì)算得到均方根誤差ERMSE=4.98%。通過(guò)對(duì)比均方根誤差ERMSE可知,使用多維時(shí)間序列數(shù)據(jù)進(jìn)行的預(yù)測(cè)效果較好。
針對(duì)整車廠商授予經(jīng)銷商信用額度的問(wèn)題,本文提出了一種基于多維時(shí)間序列支持向量機(jī)的預(yù)測(cè)方法,從時(shí)間序列的角度考察經(jīng)銷商信用額度的變化趨勢(shì),并運(yùn)用SVR算法對(duì)經(jīng)銷商信用額度進(jìn)行預(yù)測(cè)。
本文使用預(yù)測(cè)值與實(shí)際值的均方根誤差作為評(píng)估標(biāo)準(zhǔn),將結(jié)果與孤立時(shí)間下的多維變量信用額度預(yù)測(cè)結(jié)果相比較,驗(yàn)證了本文方法具有較高的預(yù)測(cè)精度。