范興奎 劉奎 王夢宇
摘 要:運用K-means聚類法將任務(wù)按照經(jīng)緯度分類,進(jìn)行多元線性回歸分析,建立新的定價方案.構(gòu)建任務(wù)打包算法,進(jìn)行多元線性回歸分析,得到合理的定價策略.實驗結(jié)果表明,新方案的定價更為合理.
關(guān)鍵詞:K-means聚類法;多元線性回歸模型;打包半徑;任務(wù)打包算法
[中圖分類號]R19 [文獻(xiàn)標(biāo)志碼]A
Abstract:Firstly, we use K-means clustering method to classify tasks according to latitude and longitude and carry out multivariate linear regression analysis to establish a new pricing scheme. Then, we build the task packaging algorithm and carry out multivariate linear regression analysis to get a reasonable pricing strategy. Finally, the experimental results show that the pricing of the new scheme is more reasonable.
Key words:K-means clustering method;multivariate linear regression model;packing radius;task packing algorithm
1 模型假設(shè)及符號說明
1.1 模型假設(shè)
數(shù)據(jù)處理過程中忽略地球曲面因素對距離的影響;假設(shè)定價過程符合市場供求理論,且不考慮政策對該軟件的影響;不考慮火山、地震等自然災(zāi)害對任務(wù)的干擾;假設(shè)所有用戶和商家均為理性經(jīng)濟人;假設(shè)所有數(shù)據(jù)來源真實可靠.
表3的數(shù)據(jù)表明,殘差數(shù)值偏高,最高可達(dá)339.61,只有第四、第五、第六類的殘差值較低,表明模型擬合效果不理想.參考文獻(xiàn)[2]的定價規(guī)律不合理,存在主觀定價情況,導(dǎo)致遠(yuǎn)離市中心的任務(wù)完成度較低.定價是一個多因素導(dǎo)向的過程,只考慮距離與定價的關(guān)系而忽略其他客觀因素的影響,會造成定價不合理,從而導(dǎo)致任務(wù)無法完成.
任務(wù)未完成點主要集中在廣州市、深圳市及佛山市附近.距離市中心越遠(yuǎn),定價越高.任務(wù)未完成的主要原因是:
(1)定價合理是完成任務(wù)的基本因素.任務(wù)分包最核心的一環(huán)是定價,合理的價格可以吸引眾多參與者,促進(jìn)任務(wù)高效完成.若定價者僅基于任務(wù)點與聚類中心的距離定價,則會忽略用戶執(zhí)行任務(wù)時成本大于利潤的情況.
(2)會員數(shù)量是影響任務(wù)完成的因素之一.一般來說,會員數(shù)量越多,任務(wù)完成概率越大.
(3)經(jīng)濟發(fā)展水平影響任務(wù)的完成情況.深圳市周邊大量任務(wù)處于未完成狀態(tài),且定價明顯較低,但深圳市會員數(shù)量充足,幾乎不存在其他區(qū)域會員跨地區(qū)完成任務(wù)的情況.2016年深圳市居民人均年收入為45 000元[4],日常工資足以滿足人們的消費需求,基本不需要賺取外快來增加收入.因此,較高的經(jīng)濟發(fā)展水平會導(dǎo)致任務(wù)完成率較低.
(4)便捷的交通有利于任務(wù)的完成.如東莞市附近,一些價格較高的任務(wù)也無人接受.該區(qū)域位于東莞市城鄉(xiāng)結(jié)合部,交通網(wǎng)絡(luò)不發(fā)達(dá),時間成本和交通費用大于任務(wù)酬金,因此理性會員普遍會放棄接受此類任務(wù).
3 模型2:多元線性回歸模型[1]
3.1 指標(biāo)選取
會員到任務(wù)點的距離x1為采用針對某一任務(wù)選擇,所有會員與其距離的和;會員信譽值x2為參考文獻(xiàn)[2]中給出的指標(biāo);預(yù)定任務(wù)限額x3為每位會員預(yù)定的完成任務(wù)的上限;人均收入x4為全體成員獲取總收入的平均值;青年人口比例x5為一定區(qū)域內(nèi),某個時間段中,青年人口數(shù)占總?cè)丝跀?shù)的比重;交通便利程度x6為一個地區(qū)的道路交通狀況;τ為0-1變量,即當(dāng)任務(wù)點附近有地鐵時,τ為1,否則為0.相關(guān)數(shù)據(jù)來源于廣東省統(tǒng)計年鑒.[5]
3.2 模型建立
計算每類別的任務(wù)完成度,選擇其中具有代表性的三類:第三類(20%)、第五類(56%)和第六類(99%).計算每類別最大范圍、各會員與聚類中心的距離.若會員與聚類中心的距離處于某一范圍內(nèi)則歸為一類.計算會員到聚類中心的距離和.將三類任務(wù)點輸入百度地圖,統(tǒng)計各任務(wù)點附近一定范圍內(nèi)的公交站臺和地鐵站臺數(shù)量,計算交通便利度.[6]
建立多元線性回歸模型.計算結(jié)果表明[7],會員信譽度和預(yù)定任務(wù)限額的相關(guān)系數(shù)為0.653,相對較高.會員信譽度對價格的影響最小,因此,剔除該指標(biāo),建立五元線性回歸方程.
4 模型3:任務(wù)打包定價模型
任務(wù)打包對行業(yè)定價的影響因素為:接單者通過一次完成多項鄰近任務(wù)從而降低成本,商家通過將多項任務(wù)分配給同一接單者從而降低價格.基于任務(wù)距離打包的核心在于任務(wù)打包半徑的確定.本文分別選取1 km,2 km和3 km作為打包半徑,對任務(wù)進(jìn)行打包.
以第三類打包任務(wù)為例.隨機選擇某一點,以1 km為半徑,運用MATLAB軟件編程計算出任務(wù)點與其距離,與半徑對比,選擇所有距離小于半徑的點與初始點一起打包.通過任務(wù)打包算法,完成打包,得到各任務(wù)包的經(jīng)緯度數(shù)據(jù).建立基于任務(wù)打包的多元線性回歸模型,研究任務(wù)打包的定價策略.采用式(2)計算每個任務(wù)包與會員的距離與距離和.選取預(yù)定任務(wù)限額、人均月收入、青少年比例及交通便利度作為指標(biāo)進(jìn)行多元回歸分析.回歸模型為:
5 結(jié)論
基于“互聯(lián)網(wǎng)+”共享模式,研究任務(wù)分包軟件的定價策略問題.運用K-means聚類法,將任務(wù)按照經(jīng)緯度分為8類,任務(wù)點與聚類中心的距離作為自變量,與任務(wù)價格進(jìn)行擬合,分析任務(wù)未完成的原因.再選取對完成任務(wù)有影響的指標(biāo),進(jìn)行多元線性回歸分析,建立新的定價方案.新的定價方案與原有定價方案對比的結(jié)果表明,新方案的定價更為合理.構(gòu)建任務(wù)打包算法,進(jìn)行多元線性回歸分析,從而得到合理的定價策略.
參考文獻(xiàn)
[1] 司守奎,孫璽菁. 數(shù)學(xué)建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2008:1-35.
[2] 中國工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會.2017年全國大學(xué)生數(shù)學(xué)建模競賽B題[DB].http:// www.mcm.edu.cn/ht ml_cn/node/460baf68ab0ed0e1e557a0c79b1c4648.html.
[3] 賀超英,王少喻.MATLAB應(yīng)用與實驗教程[M].北京:電子工業(yè)出版社,2013.10-91.
[4] 中華人民共和國國家統(tǒng)計局,深圳市統(tǒng)計局. 深圳統(tǒng)計年鑒[M].北京:中國統(tǒng)計出版社,2016.139-143.
[5] 中華人民共和國國家統(tǒng)計局,廣東省統(tǒng)計局.廣東統(tǒng)計年鑒[M].北京:中國統(tǒng)計出版社,2016.100-267.
[6] 劉燕婷,蘇小熔,任龍文.廣州中心城區(qū)免費公園公共交通出行便利度分析[J].云南地理環(huán)境研究,2010,22(5):63-67.
[7] 盧紋岱.SPSS統(tǒng)計分析[M].北京:電子工業(yè)出版社,2010.109-137.
編輯:吳楠