黃鑫+朱同林
摘 要: 選取影響手機(jī)網(wǎng)民規(guī)模的30個(gè)變量,借助于主成分分析方法進(jìn)行降維,以降維后的5個(gè)主成分變量作為手機(jī)網(wǎng)民規(guī)模預(yù)測(cè)模型的輸入層變量,采用BP和RBF神經(jīng)網(wǎng)絡(luò)分別對(duì)手機(jī)網(wǎng)民規(guī)模進(jìn)行分析和預(yù)測(cè)。研究結(jié)果顯示,采用BP神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)2016年12月與2017年6月的手機(jī)網(wǎng)民規(guī)模分別為69046(萬人)和72359(萬人);采用RBF神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)2016年12月與2017年6月的手機(jī)網(wǎng)民規(guī)模分別為68702(萬人)和71972(萬人)。
關(guān)鍵詞: 移動(dòng)電子商務(wù); 主成分分析; BP神經(jīng)網(wǎng)絡(luò); RBF神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2017)02-09-04
0 引言
移動(dòng)電子商務(wù)已成為電子商務(wù)發(fā)展的主流模式之一,從最初的短訊、語音到如今的視頻聊天、微信、支付寶等[1-2],促使人們傳統(tǒng)的生活方式發(fā)生了較大改變,給人們的各項(xiàng)活動(dòng)帶來了較大的便利[3-7]。移動(dòng)電子商務(wù)的三個(gè)基本條件為手機(jī)、網(wǎng)民和應(yīng)用[8],其中手機(jī)是網(wǎng)民規(guī)模發(fā)展的重要載體,其持有比率持續(xù)上升,網(wǎng)民的規(guī)模也持續(xù)上升,手機(jī)網(wǎng)民規(guī)模綜合反映了手機(jī)和網(wǎng)民的增長(zhǎng)趨勢(shì)。
截至2016年6月,中國網(wǎng)民規(guī)模達(dá)7.10億,半年新增網(wǎng)民2132萬人,半年增長(zhǎng)率3.1%,我國手機(jī)網(wǎng)民規(guī)模達(dá)6.56億,較2015年底增加3656萬人。網(wǎng)民中使用手機(jī)上網(wǎng)的比例由2015年底的90.1%提升至 92.5%,手機(jī)在上網(wǎng)設(shè)備中占據(jù)主導(dǎo)地位。2016年上半年,我國新增網(wǎng)民中手機(jī)網(wǎng)民規(guī)模為 1301萬人,占新增網(wǎng)民的61.0%,其中新增手機(jī)網(wǎng)民中有2355萬人是由原有PC網(wǎng)民中轉(zhuǎn)化而來,這一規(guī)模較2015年底增加了1202萬[9]。
1 原理與方法
1.1 基于主成分分析的影響指標(biāo)降維
在手機(jī)網(wǎng)民規(guī)模預(yù)測(cè)模型中,影響手機(jī)網(wǎng)民規(guī)模變量的因素較多,且各影響指標(biāo)間存在較強(qiáng)的相關(guān)性,部分參數(shù)信息量之間存在一定的重復(fù)。因此,需尋找一種篩選主要影響因素變量和提取關(guān)鍵信息的方法。主成分分析是一種針對(duì)相關(guān)性變量進(jìn)行降維,保障原始數(shù)據(jù)丟失最少的方法,將多個(gè)指標(biāo)變量簡(jiǎn)化成少數(shù)幾個(gè)綜合性指標(biāo),讓簡(jiǎn)化后的指標(biāo)盡可能地反映原始數(shù)據(jù)指標(biāo)的絕大部分信息[10]。
設(shè)影響手機(jī)網(wǎng)民規(guī)模因素變量p,各變量樣本個(gè)數(shù)n,構(gòu)成n×p階的原始數(shù)據(jù)矩陣X,詳細(xì)表示如下:
⑴
式⑴中,當(dāng)p較大時(shí),需要對(duì)原始數(shù)據(jù)矩陣進(jìn)行降維處理,將原始變量指標(biāo)進(jìn)行線性組合,構(gòu)成少數(shù)幾個(gè)綜合指標(biāo),它們相互獨(dú)立。令原始指標(biāo)x1,x2,…,xp,新變量指標(biāo)z1,z2,…,zk(k
⑵
式⑵中,系數(shù)lij表示原變量xi在各新變量指標(biāo)zi上的載荷(i=1,2,…,k;j=1,2,…,p),其計(jì)算需借助于普通最小二乘回歸法[11]。
1.2 基于BP的手機(jī)網(wǎng)民規(guī)模預(yù)測(cè)模型
BP神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前饋神經(jīng)網(wǎng)絡(luò),其三個(gè)基本要素為連接權(quán)、求和單元、傳遞函數(shù)。連接權(quán)反映神經(jīng)元間的連接強(qiáng)度;求和單元用于求取各輸入變量的加權(quán)和;傳遞函數(shù)起非線性映射作用。Sigmoid型函數(shù)是常見的傳遞函數(shù),其表達(dá)式如下:
⑶
式⑶中,λ是函數(shù)增益,決定了函數(shù)非飽和段的斜率。
BP網(wǎng)絡(luò)中的信息是單向傳遞的,同一層中的神經(jīng)元不存在相互聯(lián)系,層與層之間采用全連接方式,連接程度由每層連接權(quán)值表示,隱藏層節(jié)點(diǎn)輸出模型和輸出層節(jié)點(diǎn)輸出模型分別見公式⑷和公式⑸。
⑷
⑸
式⑷-⑸,f(.)為非線性作用函數(shù),是式⑶的一般表達(dá)式,q是神經(jīng)單元閾值。針對(duì)含有m個(gè)訓(xùn)練樣本集,其網(wǎng)絡(luò)模型構(gòu)建按照以下步驟[12]:
⑴ 初始化設(shè)計(jì)合理的網(wǎng)絡(luò)結(jié)構(gòu),將BP網(wǎng)絡(luò)的各個(gè)權(quán)重wij和閾值θj初始化為介于區(qū)間(0,1)中的隨機(jī)數(shù),同時(shí)設(shè)置最大迭代次數(shù)M(M>m)和目標(biāo)誤差,網(wǎng)絡(luò)誤差平方和SSE初值為0;
⑵ 從訓(xùn)練集中隨機(jī)取出樣本輸入向量x和期望輸出向量T;
⑶ 計(jì)算所有隱含層或輸出層各神經(jīng)元相對(duì)上一層i的輸入向量Ij,同時(shí)選定公式⑶中的傳遞函數(shù),將各神經(jīng)元j的輸出向量Oj映射到[0,1]區(qū)間,其中輸入向量表達(dá)式:
⑹
⑷ 檢驗(yàn)網(wǎng)絡(luò)誤差平方和SSE;
⑸ 根據(jù)樣本輸入向量x所對(duì)應(yīng)的期望輸出向量Oj,計(jì)算輸出層各神經(jīng)元的誤差向量:
⑺
⑹ 將網(wǎng)絡(luò)中各權(quán)重wij和閾值θj分別進(jìn)行調(diào)整,其中α為學(xué)習(xí)率,有:
⑻
當(dāng)SSE等于或小于目標(biāo)誤差時(shí),網(wǎng)絡(luò)收斂,否則,重新返回步驟⑵。
1.3 基于RBP的手機(jī)網(wǎng)民規(guī)模預(yù)測(cè)模型
RBF徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)可以任意精度逼近任意的非線性函數(shù),具有全局逼近能力,它包括一個(gè)輸入層、一個(gè)輸出層和一個(gè)隱含層。輸入層節(jié)點(diǎn)將輸入數(shù)據(jù)傳遞到隱含層節(jié)點(diǎn),其激活函數(shù)常采用高斯函數(shù),其表達(dá)式:
⑼
式⑼中,x=(x1,x2,…,x3)是RBF網(wǎng)絡(luò)輸入向量,uj是第j個(gè)隱含層神經(jīng)元輸出,uj∈[0,1],cj是高斯函數(shù)的中心值,σj是高斯函數(shù)的方差,h是隱含層神經(jīng)元數(shù)目。
RBF網(wǎng)絡(luò)模型構(gòu)建按照以下步驟[12]:
⑴ 根據(jù)已知類別個(gè)數(shù)確定隱層節(jié)點(diǎn)數(shù)目k,并分別在各類別中隨機(jī)選取一個(gè)樣本作為該類的中心C,初始化ωij,寬度σ,設(shè)定誤差限ε(ε?0),學(xué)習(xí)率ηω,ηc,ησ,假設(shè)目前可用的最大訓(xùn)練樣本數(shù)為MaxS(MaxS?1),設(shè)定循環(huán)變量t初始為1;
⑵ 輸入第t個(gè)訓(xùn)練樣本,得到網(wǎng)絡(luò)實(shí)際輸出y;
⑶ 計(jì)算實(shí)際輸出與期望輸出間的誤差E;如果誤差,則該樣本不需要調(diào)整網(wǎng)絡(luò)參數(shù),直接跳到第⑹步驟,否則進(jìn)行下一步驟;
⑷ 對(duì)于i=1,2,…,m,j=1,2,…,k,計(jì)算Δωij,ΔCj,Δσj并對(duì)各連接權(quán)值ωij,中心矢量Cj,核函數(shù)寬度σj,其計(jì)算公式分別參考式⑽、⑾、⑿;
⑽
⑾
⑿
⑸ 基于新的網(wǎng)絡(luò)參數(shù)、、,轉(zhuǎn)到步驟⑵;
⑹ t=t+1;如果t>MaxS,即無新樣本,則整個(gè)學(xué)習(xí)過程結(jié)束,否則轉(zhuǎn)到步驟⑵。
2 分析與預(yù)測(cè)
手機(jī)對(duì)移動(dòng)電子商務(wù)發(fā)展影響力巨大,網(wǎng)民中,手機(jī)網(wǎng)民占比達(dá)到92.5%,故分析和預(yù)測(cè)未來手機(jī)網(wǎng)民規(guī)模具有重大意義。數(shù)據(jù)分析可反映現(xiàn)階段網(wǎng)民的增長(zhǎng)趨勢(shì)[9,14],進(jìn)而預(yù)知未來手機(jī)增長(zhǎng)趨勢(shì)。
2.1 手機(jī)網(wǎng)民影響指標(biāo)的選取
模型因變量選取手機(jī)網(wǎng)民規(guī)模,SY(萬人),自變量分別從基礎(chǔ)數(shù)據(jù)、網(wǎng)民規(guī)模、性別年齡、學(xué)歷水平、職業(yè)狀況、收入水平以及上網(wǎng)情況共七大類,30個(gè)自變量[9]??紤]到同類變量指標(biāo)中,各個(gè)指標(biāo)量綱互不相同,為了計(jì)算方便及部分模型使用需要,在后續(xù)模型建立及數(shù)據(jù)分析中,對(duì)已有量綱的變量的輸入進(jìn)行歸一化處理。31個(gè)變量(含因變量,手機(jī)網(wǎng)民規(guī)模)中,部分變量需進(jìn)行歸一化,其余變量均無量綱,無需歸一化處理,歸一化采用式⒀。
設(shè)樣本自變量原始輸入數(shù)據(jù)矩陣為pN×M,則歸一化公式為:
⒀
經(jīng)過歸一化處理后的變量分別為:手機(jī)網(wǎng)民規(guī)模,Y;IPv4,A1;IPv6,A2;網(wǎng)站數(shù)量,A3;國際出口寬帶,A4:農(nóng)村網(wǎng)民規(guī)模,B1;城鎮(zhèn)網(wǎng)民規(guī)模,B2;網(wǎng)民男性,C1;10歲及以下,C2;10-19歲,C3;20-29歲,C4;30-39歲,C5;40-49歲,C6;50-59歲,C7;60歲及以上,C8;小學(xué)及以下,D1;初中,D2;高中/中專/技校,D3;大專,D4;大學(xué)本科及以上,D5;學(xué)生,E1;個(gè)體戶/自由職業(yè)者,E2;其他職業(yè),E3;2000元以下,F(xiàn)1;2001-3000元,F(xiàn)2;3001-5000元,F(xiàn)3;5000元以上比例,F(xiàn)4;手機(jī)上網(wǎng),G1;臺(tái)式電腦上網(wǎng),G2;筆記本上網(wǎng),G3;平均每周上網(wǎng)時(shí)長(zhǎng),G4。
2.2 手機(jī)網(wǎng)民影響指標(biāo)的降維
分析因變量和自變量之間相關(guān)性時(shí),通??刹捎枚嘣€性回歸分析方法進(jìn)行定量描述??紤]模型自變量較多,且預(yù)估數(shù)據(jù)量之間存在一定程度的相關(guān)性,需借助于主成分分析方法對(duì)自變量進(jìn)行降維處理。
考慮數(shù)據(jù)量變量較多,針對(duì)30個(gè)指標(biāo),僅選取其中11個(gè)指標(biāo),A1、A2、B1、C1、C2、D1、D2、E1、F1、G1、G2進(jìn)行相關(guān)性分析,借助于SPSS17.0平臺(tái),采用Pearson相關(guān)性雙尾檢驗(yàn),得到person自變量相關(guān)性,11個(gè)自變量大部分存在較為嚴(yán)重的相關(guān)性,除變量A1與其余部分變量之間不存在相關(guān)性外,其余指標(biāo)之間幾乎均相關(guān)。因此,需要對(duì)自變量指標(biāo)進(jìn)一步處理,針對(duì)變量之間強(qiáng)的相關(guān)性,可采用主成分分析方法。
為方便后續(xù)預(yù)測(cè)模型的建立以及數(shù)據(jù)量簡(jiǎn)化計(jì)算等方面因素,預(yù)測(cè)模型的輸入變量均采用主成分PC1-PC5,目標(biāo)變量為手機(jī)網(wǎng)民規(guī)模Y。
2.3 BP和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
在神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型中,隱含層數(shù)的選擇是一個(gè)難點(diǎn),常用的公式有:
⑴ 隱含層神經(jīng)元數(shù)=輸入層神經(jīng)元數(shù)×2+1;
⑵ 隱含層神經(jīng)元數(shù)=log2n,n為輸入層神經(jīng)元數(shù);
⑶ 隱含層神經(jīng)元數(shù)=(輸入層神經(jīng)元數(shù)×輸出層神經(jīng)元數(shù))1/2。
采用試錯(cuò)法,盡管運(yùn)算量較大,但能較好的保證網(wǎng)絡(luò)學(xué)習(xí)的精度。MATLAB神經(jīng)網(wǎng)絡(luò)工具箱中,隱含層神經(jīng)元個(gè)數(shù)默認(rèn)上限為20個(gè),設(shè)定隱含層神經(jīng)元個(gè)數(shù)在3-20內(nèi),經(jīng)測(cè)試發(fā)現(xiàn),當(dāng)隱含層神經(jīng)元個(gè)數(shù)為13時(shí),網(wǎng)絡(luò)具有較高的訓(xùn)練精度。
從圖1可清晰觀察到BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法的有效性,預(yù)測(cè)結(jié)果與實(shí)際結(jié)果十分接近。采用BP神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)2016年12月與2017年6月的手機(jī)網(wǎng)民規(guī)模分別為69046(萬人)和72359(萬人);采用BP神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)2016年12月與2017年6月的手機(jī)網(wǎng)民規(guī)模分別為68702(萬人)和71972(萬人),具體數(shù)據(jù)結(jié)果見表5。
3 結(jié)束語
本文在手機(jī)網(wǎng)民規(guī)模預(yù)測(cè)模型的建立中,采用主成分分析方法,對(duì)30個(gè)自變量進(jìn)行降維,采用BP和RBF神經(jīng)網(wǎng)絡(luò),分別預(yù)測(cè)2016年12月與2017年6月的手機(jī)網(wǎng)民規(guī)模。本文中數(shù)據(jù)采集和數(shù)據(jù)來源還有待進(jìn)一步完善,由于樣本數(shù)據(jù)量不足,所選擇的數(shù)據(jù)指標(biāo)個(gè)數(shù)會(huì)有一定片面性;此外在預(yù)測(cè)和前瞻性上,需進(jìn)一步提高精度。
參考文獻(xiàn)(References):
[1] 方美琪.電子商務(wù)概論(第3版)[M].清華大學(xué)出版社,2009.
[2] 黃京華.電子商務(wù)教程[M].清華大學(xué)出版社,2010.
[3] 劉電威.我國電子商務(wù)發(fā)展現(xiàn)狀問題與對(duì)策研究[J].特區(qū)經(jīng)
濟(jì),2011.12:233-236
[4] 賈丹陽.電子商務(wù)對(duì)傳統(tǒng)商業(yè)模式的影響[J].電子商務(wù),
2013.1:15-16
[5] 王冠男.3G背景下的電子商務(wù)發(fā)展前景分析[J]. 中國商貿(mào),
2011.17:34-39
[6] 李哲平.“新常態(tài)”下電子商務(wù)發(fā)展戰(zhàn)略與體制保障[D].天津
師范大學(xué),2015.
[7] 牟少霞.基于智能終端的移動(dòng)電子商務(wù)商業(yè)模式研究[D].山
東師范大學(xué),2014.
[8] 彭博.APP視角下的移動(dòng)電子商務(wù)發(fā)展?jié)摿ρ芯縖D].重慶工
商大學(xué),2015.
[9] 中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[C].中國互聯(lián)網(wǎng)絡(luò)信息中
心,2016.7.
[10] S. Weisberg著,王靜龍譯.應(yīng)用回歸分析[M].中國統(tǒng)計(jì)出版
社,2009.
[11] 何曉群,劉文卿.應(yīng)用回歸分析[M].中國人民大學(xué)出版社,
2007.
[12] 葛哲學(xué).神經(jīng)網(wǎng)絡(luò)理論與MATLAB R2007[M].電子工業(yè)出
版社,2007.
[14] 葉新梅.我國移動(dòng)電子商務(wù)發(fā)展研究[J].科技致富向?qū)В?/p>
2011.12:26-29