国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于一元線性回歸模型的電商商品支付轉(zhuǎn)化率預(yù)測(cè)的研究

2018-02-09 09:03郭偉展
卷宗 2018年3期
關(guān)鍵詞:R語(yǔ)言統(tǒng)計(jì)分析

郭偉展

摘 要:電商行業(yè)中,有一類爆款電商的企業(yè),其商品在銷售中,供不應(yīng)求,銷售量很高。這類電商的企業(yè)經(jīng)常采用限時(shí)搶購(gòu)的銷售模式。這樣的前提下,一個(gè)商品在固定時(shí)間內(nèi)下單后的支付率在很大程度上影響著產(chǎn)品銷量,本文采用一元線性回歸模型,通過(guò)區(qū)分不同商品的銷售單價(jià),依據(jù)商品上市時(shí)間來(lái)預(yù)測(cè)最終用戶下單后的支付率,用來(lái)指導(dǎo)商品在銷售時(shí)間內(nèi)應(yīng)該放多少量才能完成銷售指標(biāo),并保證不會(huì)超售。

關(guān)鍵詞:一元線性回歸;統(tǒng)計(jì)分析;電商產(chǎn)品;支付率;R語(yǔ)言

2016年,我國(guó)電子商務(wù)繼續(xù)保持平穩(wěn)發(fā)展態(tài)勢(shì)。國(guó)家統(tǒng)計(jì)局調(diào)查顯示,2016年全國(guó)電子商務(wù)交易額達(dá)26.1萬(wàn)億元,同比增長(zhǎng)19.8%;網(wǎng)上零售交易總額達(dá)5.16萬(wàn)億元,同比增長(zhǎng)26.2%,我國(guó)世界第一大網(wǎng)絡(luò)零售市場(chǎng)地位進(jìn)一步穩(wěn)固;農(nóng)村網(wǎng)絡(luò)零售交易額8945.4億元,已占全國(guó)網(wǎng)絡(luò)零售額的17.4%;移動(dòng)購(gòu)物在網(wǎng)絡(luò)購(gòu)物交易規(guī)模中占比達(dá)到70.7%;電子商務(wù)及相關(guān)產(chǎn)業(yè)直接和間接帶動(dòng)就業(yè)人數(shù)已達(dá)3700萬(wàn)。經(jīng)過(guò)20年的發(fā)展,我國(guó)網(wǎng)絡(luò)購(gòu)物用戶規(guī)模、電子商務(wù)交易額、電子商務(wù)從業(yè)人員數(shù)量穩(wěn)步增長(zhǎng),網(wǎng)上零售交易額、農(nóng)村網(wǎng)絡(luò)零售交易額、電子商務(wù)服務(wù)業(yè)營(yíng)收規(guī)模等快速增長(zhǎng)。一方面,我國(guó)電子商務(wù)交易規(guī)模持續(xù)增長(zhǎng),新模式、新業(yè)態(tài)發(fā)展迅猛,社會(huì)經(jīng)濟(jì)影響不斷深入;另一方面,伴隨網(wǎng)民數(shù)量增長(zhǎng)的趨緩,電子商務(wù)也面臨著總體增速趨緩、市場(chǎng)競(jìng)爭(zhēng)加劇、線上成本攀升的發(fā)展環(huán)境。電商企業(yè)紛紛布局農(nóng)村市場(chǎng)、大力發(fā)展跨境電商、加快走出去步伐,在積極拓展新市場(chǎng)、新空間的同時(shí)加大對(duì)線下實(shí)體資源的整合力度,但在融合發(fā)展過(guò)程中,我國(guó)電子商務(wù)也出現(xiàn)了線上與線下、城市與農(nóng)村、國(guó)內(nèi)與跨境發(fā)展不平衡,政策挑戰(zhàn)日趨明顯等問(wèn)題。[1]

隨著電商的發(fā)展,爆款的商品也越來(lái)越多,大多爆款的商品會(huì)采取限時(shí)搶購(gòu)的銷售模式。即某個(gè)熱銷的商品,供不應(yīng)求,在某個(gè)時(shí)間點(diǎn)上采取先到先得的銷售模式。比較典型的案例如小米手機(jī),每周二早上10點(diǎn)準(zhǔn)點(diǎn)開(kāi)啟搶購(gòu),銷售完了之后會(huì)把銷售接口關(guān)閉,避免出現(xiàn)超售的情況,即銷售出去的商品大于庫(kù)存,導(dǎo)致沒(méi)法準(zhǔn)時(shí)發(fā)貨,會(huì)導(dǎo)致用戶投訴,最終影響口碑;也有可能接口關(guān)閉之后出現(xiàn)支付率過(guò)低,導(dǎo)致商品少賣(mài)了。

在搶購(gòu)過(guò)程中,用戶搶到了某個(gè)商品,會(huì)要求在規(guī)定的時(shí)間內(nèi)支付,各個(gè)平臺(tái)要求不一樣,有些平臺(tái)可能要求在2小時(shí)內(nèi)必須支付,但是下單的時(shí)候會(huì)占用庫(kù)存,從下單到支付有一定的流失,這樣究竟要讓用戶下多少量才能完成銷售目標(biāo)就成為電商運(yùn)營(yíng)銷售人員的一個(gè)挑戰(zhàn)。本文要解決就是預(yù)測(cè)商品在下單之后,會(huì)有多少最終付款。名詞解釋:下單數(shù)量:用戶在電子商務(wù)網(wǎng)站選擇完商品,生成了訂單的數(shù)量;支付數(shù)量:用戶通過(guò)支付寶網(wǎng)銀等接口對(duì)訂單完成支付,支付完成后的訂單的數(shù)量;支付轉(zhuǎn)化率:支付率=支付數(shù)量/下單數(shù)量,用來(lái)考察商品從下單到支付轉(zhuǎn)化率,下文簡(jiǎn)稱支付率。

1 數(shù)據(jù)分析—以某電商商品A為例

某電商是國(guó)內(nèi)知名的手機(jī)廠商的主要銷售渠道之一,其銷售特點(diǎn)是以限時(shí)搶購(gòu)為主,在分析的過(guò)程中,按商品售價(jià)不同來(lái)建立模型,此列選擇商品A,其單價(jià)在2000以上,其每個(gè)月的支付率如下表,從表中可以看出,支付率隨著銷售時(shí)間增長(zhǎng)而呈下降的趨勢(shì),為了能夠讓數(shù)據(jù)更好的用模型進(jìn)行預(yù)測(cè),需把月份進(jìn)行歸一化,本文把月份轉(zhuǎn)成一個(gè)序數(shù),讓商品的支付率跟具體的月份沒(méi)有關(guān)系,采用規(guī)則:第一個(gè)月的序數(shù)為1,第二個(gè)月的序數(shù)為2。

2 基于數(shù)據(jù)建立線性回歸預(yù)測(cè)模型

回歸分析(Regression Analysis)是用來(lái)確定2個(gè)或2個(gè)以上變量間關(guān)系的一種統(tǒng)計(jì)分析方法。如果回歸分析中,只包括一個(gè)自變量X和一個(gè)因變量Y時(shí),且它們的關(guān)系是線性的,那么這種回歸分析稱為一元線性回歸分析。[2]

在回歸分析中,變量有2類:因變量和自變量。因變量通常是指實(shí)際問(wèn)題中所關(guān)心的指標(biāo),用Y表示。而自變量是影響因變量取值的一個(gè)變量,用X表示,如果有多個(gè)自變量則表示為X1, X2, …, Xn。

分析主要步驟:

1.確定因變量Y 與自變量X1, X2, …, Xn 之間的定量關(guān)系表達(dá)式,即回歸方程。

從表二的數(shù)據(jù)可以看出,銷售的月份跟支付率有一定的線性關(guān)系,所以應(yīng)用一元回歸作為模型進(jìn)行分析。其中Y為支付率,X為月份,模型可表達(dá)為:Y = aX + b + c。其中Y,為因變量;X,為自變量;b,為截距;a,為自變量系數(shù);a*X+b, 表示Y隨X的變化而線性變化的部分;c, 為殘差或隨機(jī)誤差,是其他一切不確定因素影響的總和,其值不可觀測(cè)。假定c是符合均值為0方差為σ^2的正態(tài)分布,記作c~N(0,σ^2)。

在R語(yǔ)言中可表達(dá)為:

lm.r<-lm(y~x+1)

2.回歸參數(shù)估計(jì)[3]

對(duì)于上面的公式,回歸參數(shù)a,b是不知道的,需要用參數(shù)估計(jì)的方法來(lái)計(jì)算出a,b的值,而從得到數(shù)據(jù)集的X和Y的定量關(guān)系。目標(biāo)是要計(jì)算出一條直線,使直接線上每個(gè)點(diǎn)的Y值和實(shí)際數(shù)據(jù)的Y值之差的平方和最小,即(Y1實(shí)際-Y1預(yù)測(cè))^2+(Y2實(shí)際-Y2預(yù)測(cè))^2+ …… +(Yn實(shí)際-Yn預(yù)測(cè))^2 的值最小。一般通過(guò)最小二乘法進(jìn)行參數(shù)估計(jì)時(shí),只考慮Y隨X的線性變化的部分,而殘差c是不可觀測(cè)的,參數(shù)估計(jì)法并不需要考慮殘差。

在R語(yǔ)言中打印出估計(jì)的參數(shù):

lm.ab<-lm(y ~x+1)

lm.ab

可得截距為:0.95857,自變量系數(shù):-0.05571

3.回歸方程顯著性檢驗(yàn)

從回歸參數(shù)的公式二可知,在計(jì)算過(guò)程中并不一定要知道Y和X是否有線性相關(guān)的關(guān)系。如果不存相關(guān)關(guān)系,那么回歸方程就沒(méi)有任何意義了,如果Y和X是有相關(guān)關(guān)系的,即Y會(huì)隨著X的變化而線性變化,這個(gè)時(shí)候一元線性回歸方程才有意義。所以,需要用假設(shè)檢驗(yàn)的方法,來(lái)驗(yàn)證相關(guān)性的有效性。endprint

通常會(huì)采用三種顯著性檢驗(yàn)的方法。

T檢驗(yàn)法:T檢驗(yàn)是檢驗(yàn)?zāi)P湍硞€(gè)自變量Xi對(duì)于Y的顯著性,通常用P-value判斷顯著性,小于0.01更小時(shí)說(shuō)明這個(gè)自變量Xi與Y相關(guān)關(guān)系顯著。

F檢驗(yàn)法:F檢驗(yàn)用于對(duì)所有的自變量X在整體上看對(duì)于Y的線性顯著性,也是用P-value判斷顯著性,小于0.01更小時(shí)說(shuō)明整體上自變量與Y相關(guān)關(guān)系顯著。

R2相關(guān)系數(shù)檢驗(yàn)法:用來(lái)判斷回歸方程的擬合程度,R2的取值在0,1之間,越接近1說(shuō)明擬合程度越好。

在R語(yǔ)言中參數(shù)估計(jì):

summary(lm.ab)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 0.958571 0.041157 23.291 2.72e-06 ***

x2 -0.055714 0.009203 -6.054 0.00177 **

---

Sig.codes: 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘. 0.1 ‘ 1

Residual standard error: 0.0487 on 5 degrees of freedom

Multiple R-squared: 0.88, Adjusted R-squared: 0.8559

F-statistic: 36.65 on 1 and 5 DF, p-value: 0.001774

通過(guò)查看模型的結(jié)果數(shù)據(jù),我們可以發(fā)現(xiàn)通過(guò)T檢驗(yàn)的截距和自變量x都是非常顯著,通過(guò)F檢驗(yàn)判斷出整個(gè)模型的自變量是非常顯著,同時(shí)R2的相關(guān)系數(shù)檢驗(yàn)可以判斷自變量和因變量是高度相關(guān)的。

最后,我們通過(guò)的回歸參數(shù)的檢驗(yàn)與回歸方程的檢驗(yàn),得到最后一元線性回歸方程為:

Y=-0.05571×X + 0.95857

模型預(yù)測(cè)

獲得了一元線性回歸方程的公式,就可以對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)了。比如,對(duì)給定X=x0時(shí),計(jì)算出y0=b+a*x0的值,并計(jì)算出置信度為1-α的預(yù)測(cè)區(qū)間。當(dāng)X=x0,Y=y0時(shí),置信度為1-α的預(yù)測(cè)區(qū)間為

可得,該商品銷售的第二個(gè)月,在預(yù)測(cè)區(qū)間為0.95的概率時(shí),支付率為84.7%,區(qū)間范圍在[0.795,0.99]之間。

3 模型應(yīng)用及討論

本研究利用同價(jià)位的商品歷史數(shù)據(jù),采用了科學(xué)的統(tǒng)計(jì)分析,避免運(yùn)營(yíng)人員在新品限時(shí)搶購(gòu)中盲目的放量,指導(dǎo)每次搶購(gòu)時(shí)允許下單的最大量,很大程度上減少超售的情況,讓購(gòu)買(mǎi)的用戶能夠及時(shí)收到貨,提升了企業(yè)的口碑,同時(shí)也保證商品的庫(kù)存量與銷量匹配,完成銷售目標(biāo)。使企業(yè)能夠?qū)γ看螕屬?gòu)的運(yùn)營(yíng)工作予以更加科學(xué)、合理地安排,幫助企業(yè)在銷售的過(guò)程中,對(duì)自身的形勢(shì)進(jìn)行有效把握,使企業(yè)得到更好地成長(zhǎng)和進(jìn)步。

此模型在正常銷售情況下波動(dòng)較小,但是要非常準(zhǔn)確的預(yù)測(cè)支付率是一個(gè)難點(diǎn),因?yàn)椴粌H僅商品的價(jià)格與銷售時(shí)間會(huì)影響支付率,還有其他方面會(huì)影響用戶最終支付,這些方面有:1.消費(fèi)者因?yàn)樽陨碓蚺R時(shí)不便做出購(gòu)買(mǎi)決定;2.信息填錯(cuò),如收貨地址,收貨人,收貨人電話,產(chǎn)品型號(hào)等信息填錯(cuò)了,將會(huì)取消支付;3. 消費(fèi)者在支付頁(yè)面時(shí),心存顧慮,如果這種顧慮超出其購(gòu)物欲望,就不會(huì)進(jìn)行支付;4. 消費(fèi)者只是瀏覽商品并體驗(yàn)網(wǎng)站,并沒(méi)有立即的購(gòu)買(mǎi)需求。他們只是想體驗(yàn)一下購(gòu)買(mǎi)的流程;5. 網(wǎng)站支付防欺詐系統(tǒng)主動(dòng)拒絕用戶的支付等[4]。

本研究基于一元線性回歸預(yù)測(cè)支付率的模型,也存在著一定的局限性,主要有如下因素,1.針對(duì)支付率線性回歸的預(yù)測(cè)模型,本研究嘗試對(duì)月份數(shù)據(jù)進(jìn)行預(yù)處理,并忽略天或周的短周期的影響;2.本研究按照單價(jià)把商品區(qū)分成不同的類別,并未考慮不同單價(jià)商品在同一個(gè)訂單的情況,這種情況下不同的單價(jià)會(huì)相互影響;3.本研究也未考慮促銷等對(duì)支付率的影響。希望以后在支付率的預(yù)測(cè)模型能夠進(jìn)一步深入研究。

參考文獻(xiàn)

[1]中華人民共和國(guó)商務(wù)部.中國(guó)電子商務(wù)報(bào)告[M].北京:中國(guó)商務(wù)出版社,2016.

[2]師義民等.數(shù)理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2015.

[3]查特吉,哈迪等.例解回歸分析(原書(shū)第5版)[M].北京:機(jī)械工業(yè)出版社,2013.

[4]趙天鵬,曲芳芳.謹(jǐn)防電商支付平臺(tái)風(fēng)險(xiǎn)[J].中國(guó)金融,2017(3)102-103.endprint

猜你喜歡
R語(yǔ)言統(tǒng)計(jì)分析
基于GPS軌跡數(shù)據(jù)進(jìn)行分析改善城市交通擁擠
基于R語(yǔ)言的Moodle平臺(tái)數(shù)據(jù)挖掘技術(shù)的研究
如何發(fā)揮新時(shí)期統(tǒng)計(jì)工作的作用之我見(jiàn)
以統(tǒng)計(jì)分析為基礎(chǔ)的房地產(chǎn)稅收優(yōu)化分析
注重統(tǒng)計(jì)思維培養(yǎng)與應(yīng)用為主導(dǎo)的生物統(tǒng)計(jì)學(xué)課程建設(shè)
英山县| 阿拉尔市| 涿鹿县| 海原县| 邳州市| 得荣县| 五大连池市| 凤山县| 乐陵市| 崇文区| 灵璧县| 河南省| 长沙县| 雷波县| 吴堡县| 甘南县| 上杭县| 那坡县| 驻马店市| 田林县| 平罗县| 永登县| 道孚县| 泸溪县| 琼结县| 沐川县| 东莞市| 三门县| 山阴县| 府谷县| 全州县| 娄烦县| 雷山县| 永丰县| 蓝田县| 枞阳县| 洮南市| 新乡市| 石棉县| 香格里拉县| 治多县|