吳奇,荊江雁,章琦,朱玉潔
(常州工學(xué)院數(shù)理與化工學(xué)院,江蘇 常州 213032)
在互聯(lián)網(wǎng)不斷發(fā)展的背景下,一種新的合作模式——眾包(Crowdsourcing)越來越流行。2005年中國學(xué)者劉鋒提出“威客”一詞,而杰夫·豪(Jeff Howe)于2006年在《連線》雜志中首次提出“眾包”的概念,威客與眾包有著異曲同工之處,都是指企業(yè)通過互聯(lián)網(wǎng)平臺發(fā)布任務(wù),依靠大眾資源為企業(yè)提供創(chuàng)意或解決問題的一種創(chuàng)新商業(yè)模式[1-2]。這種新的模式在很大程度上避免了生產(chǎn)和需求的脫節(jié),節(jié)約了社會資源,使企業(yè)的生產(chǎn)和服務(wù)更高效。然而,眾包模式下也存在懸賞金較低、分配制度不公、交易行為作弊等問題。因此,對眾包模式下的數(shù)據(jù)進(jìn)行調(diào)查統(tǒng)計(jì)就成為當(dāng)下非常熱門的研究課題。
陳強(qiáng)等[3](2013)提出競爭情報部門難以應(yīng)對大數(shù)據(jù)分析時,可以將期望的指標(biāo)發(fā)布到眾包平臺上吸引具有數(shù)據(jù)分析能力的專家參與。牟千[4](2016)分析了移動時代的媒體借助互聯(lián)網(wǎng)的力量,將眾包模式移植于新聞生產(chǎn)領(lǐng)域,變“消費(fèi)者”為“生產(chǎn)者”。陳衛(wèi)華[5](2016)提出政府統(tǒng)計(jì)調(diào)查項(xiàng)目可以借助眾包的模式進(jìn)行,有利于吸引公眾參與物價、社情和民意情況調(diào)查。
“拍照賺錢”是基于移動互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺,為企業(yè)提供各種商業(yè)檢查和信息搜集,相比傳統(tǒng)的市場調(diào)查方式可以大大節(jié)省調(diào)查成本,而且有效地保證了調(diào)查數(shù)據(jù)真實(shí)性,縮短了調(diào)查的周期。用戶注冊成為會員,領(lǐng)取拍照任務(wù)(比如上超市去檢查某種商品的上架情況),賺取酬金。任務(wù)定價是否合理是決定任務(wù)能否完成的核心要素,如果定價不合理,有的任務(wù)就會無人問津,從而導(dǎo)致商品檢查的失敗。針對這一問題,本文建立數(shù)學(xué)模型對影響價格的因素進(jìn)行分析,并對不合理任務(wù)定價方案進(jìn)行重新設(shè)計(jì)。
本文的數(shù)據(jù)來自2017年全國大學(xué)生數(shù)學(xué)建模競賽B題[6]。
首先根據(jù)競賽題附件1中已結(jié)束的任務(wù)數(shù)據(jù),將任務(wù)定價區(qū)間進(jìn)行分類,繪制了任務(wù)點(diǎn)的空間分布圖(見圖1)。發(fā)現(xiàn)這些點(diǎn)基本圍繞在廣州、佛山、東莞、深圳4市。接著利用K-means聚類算法計(jì)算出任務(wù)點(diǎn)的聚類中心。
圖1 按定價區(qū)間分布已結(jié)束項(xiàng)目散點(diǎn)圖
從圖1中可以看出:聚類中心附近的任務(wù)定價普遍較低,隨著任務(wù)位置與聚類中心之間距離的增加,價格隨之增加。即任務(wù)的定價與任務(wù)位置有關(guān),且定價的高低與其到聚類中心的距離總體上呈現(xiàn)正相關(guān)關(guān)系。
接著根據(jù)競賽題附件2中會員信息數(shù)據(jù),將任務(wù)點(diǎn)和會員點(diǎn)同時畫出,如圖2所示??梢钥闯龅投▋r任務(wù)周圍其他任務(wù)和會員都很密集,高定價任務(wù)周圍的分布情況相反,即表明任務(wù)定價受任務(wù)點(diǎn)周圍會員密度和任務(wù)密度影響,總體上呈負(fù)相關(guān)關(guān)系。
根據(jù)上述分析可以看出任務(wù)定價受到任務(wù)點(diǎn)到聚類中心的距離、任務(wù)密度、會員密度的影響,其中任務(wù)密度表示某一個任務(wù)周圍5 km內(nèi)其他任務(wù)的個數(shù),會員密度表示某一個任務(wù)周圍5 km內(nèi)會員的個數(shù)。
首先根據(jù)經(jīng)緯度距離轉(zhuǎn)換公式計(jì)算出各個任務(wù)點(diǎn)分別到4個聚類中心的距離:
(1)
然后將4個距離值進(jìn)行比較,選取最小值作為到屬于它的聚類中心的距離:
d0=min{d1,d2,d3,d4}
(2)
(a)低定價任務(wù)周圍會員分布
(b)高定價任務(wù)周圍會員分布
圖2任務(wù)點(diǎn)與會員點(diǎn)分布情況
同理,根據(jù)式(1)、(2)也可以計(jì)算出某一個任務(wù)點(diǎn)到各個會員的距離,統(tǒng)計(jì)距離小于5 km的個數(shù),完成情況中0表示未完成,1表示完成。截取部分結(jié)果如表1所示。
表1 影響因素數(shù)據(jù)表
為了得到任務(wù)定價和各個影響因素之間的具體相關(guān)度,根據(jù)相關(guān)系數(shù)的原理,通過R語言[7]進(jìn)行相關(guān)性分析,并按完成和未完成任務(wù)分類,計(jì)算出任務(wù)定價與各影響因素的相關(guān)系數(shù),結(jié)果如表2所示。
表2 相關(guān)系數(shù)表
根據(jù)前文分析可得如下結(jié)論:3個影響因素對任務(wù)定價均產(chǎn)生顯著影響,任務(wù)未完成的情況中,對任務(wù)定價影響最大的是任務(wù)點(diǎn)到聚類中心的距離,任務(wù)所處的位置越遠(yuǎn),任務(wù)定價越高。
因此任務(wù)未完成的原因可能有以下兩點(diǎn)。
第一,4市經(jīng)濟(jì)發(fā)展水平有差異。經(jīng)濟(jì)發(fā)達(dá)地區(qū)的會員對任務(wù)收益要求較高,導(dǎo)致定價較低的任務(wù)無人問津,雖然這些任務(wù)附近有較多的會員,但價格對會員的吸引力不足,導(dǎo)致任務(wù)未完成。
第二,任務(wù)位置偏僻。雖然任務(wù)定價較高,但距離聚類中心較遠(yuǎn),性價比不高從而導(dǎo)致任務(wù)未完成。
采用多元線性回歸分析的模型[8-9]來進(jìn)行分析。
根據(jù)第一部分的分析,選取到聚類中心的距離、任務(wù)密度、會員密度這3個因素作為解釋變量,定價作為因變量建立多元線性回歸模型來進(jìn)一步改進(jìn)任務(wù)定價模型,得到定價與上述3個指標(biāo)之間的關(guān)系,分析出定價的主要影響因素。建立以下任務(wù)定價模型:
y=β0+β1x1+β2x2+β3x3
(3)
其中:x1表示距離;x2表示任務(wù)密度;x3表示會員密度。
將表2中的數(shù)據(jù)代入多元線性回歸模型中計(jì)算,得到
y=71.67+0.14x1-0.34x2-0.08x3
(4)
從式(4)可以得出:任務(wù)定價隨著距離的增加而提高;會員密度與任務(wù)密度增大時,定價降低;會員密度相對任務(wù)密度的影響較小。將未完成任務(wù)的3項(xiàng)指標(biāo)代入模型中計(jì)算得到新的任務(wù)定價,見表3。
表3 未完成任務(wù)的預(yù)測定價
假定當(dāng)預(yù)測定價與實(shí)際定價差值不超過2元時,即認(rèn)為該任務(wù)完成(例如表3中的A0025、A0111、A0831等)。據(jù)此已結(jié)束任務(wù)中符合條件的任務(wù)個數(shù)增加117個,計(jì)算過程如圖3所示。
圖3 完成率計(jì)算
本文在分析未完成任務(wù)時,將任務(wù)點(diǎn)的經(jīng)緯度轉(zhuǎn)換為任務(wù)點(diǎn)到任務(wù)聚類中心的距離,并用圖表等形式使分析結(jié)果可視化,可以直觀看出定價與影響因素的關(guān)系。但由于實(shí)際定價時,影響因素有很多,而本文研究的數(shù)據(jù)有限,定價不能準(zhǔn)確合理地給出,與實(shí)際情況存在偏差,還需做進(jìn)一步研究。
本文模型的建立基于移動互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺,與其類似的服務(wù)還有外賣、打車等,都涉及任務(wù)位置信息,會員信息等數(shù)據(jù),可加以推廣應(yīng)用。