丁 青, 唐芊芊, 田 甜
(湖南財(cái)政經(jīng)濟(jì)學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖南 長沙 410205)
勞務(wù)眾包的概念第一次被提出是在2006年,HOWE J[1]將眾包定義為“企業(yè)借助互聯(lián)網(wǎng),將過去由內(nèi)部員工完成的任務(wù),在眾包平臺(tái)上以自由自愿的形式,交付給特定的大眾群體完成”,從國外的Guru,IT-square,o-Desk等,到國內(nèi)的豬八戒網(wǎng)、阿里眾包、京東眾包、拍拍賺和微差事等,現(xiàn)階段眾包平臺(tái)發(fā)展已經(jīng)較為成熟,國內(nèi)外也有許多學(xué)者對其進(jìn)行了研究。
盧新元等[2]分析得出定價(jià)、任務(wù)大小及難易程度是影響接包方是否接受任務(wù)的主要因素。合理的定價(jià)對任務(wù)完成率的提高、成本的降低和資源的充分利用,乃至整個(gè)眾包平臺(tái)的發(fā)展起著至關(guān)重要的作用?;诖?,有許多學(xué)者對任務(wù)定價(jià)這一因素進(jìn)行了研究。劉曉鋼[3]基于服務(wù)定價(jià)、在線逆向拍賣等理論,得出任務(wù)屬性以及市場競爭狀況差異會(huì)對發(fā)包方的定價(jià)產(chǎn)生影響。巢時(shí)剛[4]通過分析得出,任務(wù)定價(jià)與會(huì)員集中程度呈反比,且與經(jīng)緯度存在一定關(guān)系。這些研究的主要方向均為如何制訂一個(gè)合理的定價(jià)方案使得出包方能以較低的成本得到較高的任務(wù)完成率,沒能從實(shí)際案例和任務(wù)數(shù)據(jù)出發(fā),進(jìn)行實(shí)證分析建立具體的定價(jià)模型。張?zhí)焓娴萚5]考慮商家與會(huì)員的博弈關(guān)系,將任務(wù)聯(lián)合打包,建立了新的定價(jià)模型,但其研究未考慮到任務(wù)或是網(wǎng)點(diǎn)對會(huì)員的吸引力因素。徐芹[6]通過研究“拍照賺錢”平臺(tái)的商業(yè)運(yùn)行模式,給出了該平臺(tái)任務(wù)的均衡定價(jià)策略,并提出了提高任務(wù)完成率的捆綁式組合法,不足之處是其模型建立在任務(wù)一旦被分配,能夠保質(zhì)保量完成的基礎(chǔ)上,而在實(shí)際情況下,被分配的任務(wù)未完成的情況時(shí)有發(fā)生。由此可見前人的研究均存在一些不足之處。
在前人研究的基礎(chǔ)上,筆者從任務(wù)定價(jià)、未完成任務(wù)、任務(wù)打包等方面進(jìn)行探討,建立新的定價(jià)模型。由于眾包被廣泛應(yīng)用在經(jīng)濟(jì)、社會(huì)的眾多領(lǐng)域,而不同類型的平臺(tái)的定價(jià)規(guī)律會(huì)存在些許差異,故選取其中的拍照賺錢任務(wù)平臺(tái)的定價(jià)規(guī)律進(jìn)行研究。
要求分析與研究問題[7]附件一中項(xiàng)目的任務(wù)定價(jià)規(guī)律,分析任務(wù)未完成的原因,并設(shè)計(jì)新的任務(wù)定價(jià)方案,并和原方案進(jìn)行比較。
首先對收集到的拍照賺錢APP數(shù)據(jù)的歷史任務(wù)位置進(jìn)行可視化,得到任務(wù)的分布主要是在廣州、深圳、佛山、東莞4個(gè)地區(qū)。由于數(shù)據(jù)量較大且較為集中,考慮使用聚類分析[8]中的K-means聚類法進(jìn)行分析。得到的聚類效果如圖1所示,圖中的特征值X1為經(jīng)度坐標(biāo)信息,X2為拍照賺錢眾包任務(wù)的定價(jià)信息,x,y,z軸分別代表緯度坐標(biāo)、經(jīng)度坐標(biāo)以及眾包任務(wù)定價(jià)。
圖1 三維聚類效果圖Fig.1 3D clustering rendering
由聚類效果圖可看出離聚類中心對象較遠(yuǎn)的任務(wù)位置坐標(biāo)呈現(xiàn)一定的規(guī)律,據(jù)此,將經(jīng)緯度看作自變量,任務(wù)的價(jià)格看作因變量,使用MATLAB對其進(jìn)行回歸,可得表達(dá)式
x3i=1 187.7-3.515 9x1-9.150 9x2,
其相關(guān)系數(shù)R2=0.98。綜上可以得到“拍照賺錢”眾包任務(wù)定價(jià)的定價(jià)規(guī)律:
1)在離聚類中心較近的點(diǎn)遵循著非線性的任務(wù)定價(jià)規(guī)律,主要是由任務(wù)的難易程度決定,即與離中心對象點(diǎn)的距離存在一定關(guān)系;
2)離聚類中心較遠(yuǎn)的位置的眾包任務(wù)定價(jià)呈現(xiàn)出線性的關(guān)系,如隨著位置離聚類點(diǎn)的距離越遠(yuǎn),其定價(jià)越高,因而大多為較為固定的價(jià)格,如 75 元、80元、85元等;
3)定價(jià)函數(shù)與任務(wù)位置的經(jīng)緯度成反比,即當(dāng)緯度與經(jīng)度坐標(biāo)減小時(shí)其定價(jià)就會(huì)相應(yīng)地增高。
1.2 分析任務(wù)失敗的原因
由成功與失敗為 0-1 變量,屬于定性分析,考慮到數(shù)據(jù)的隨機(jī)取樣以及樣本的回歸準(zhǔn)確性,本文使用MATLAB對其進(jìn)行二元定性Logistic回歸分析?;貧w后的函數(shù)進(jìn)行對數(shù)變換后的函數(shù)為
對于定性的Logistic回歸實(shí)踐而言,P的取值僅有0或1,因此將導(dǎo)致上述函數(shù)式失去意義。因此,在應(yīng)用Logistic回歸分析的過程中,通常不是對P直接進(jìn)行回歸,先定義某種單調(diào)連續(xù)的函數(shù)θ,令
θ=P(Y=1|x1,x2,x3),0<θ<1,
故Logistic模型可以變換為
得到Logistic回歸后的系數(shù)為54.657 4,0.261 5,-0.542 7,0.014 1,分別代表常數(shù)項(xiàng)、緯度變量、經(jīng)度變量、任務(wù)定價(jià)的相關(guān)系數(shù),故其回歸方程為
(1)
(2)
Logit(P=1)=54.657 4+0.261 5x1-0.542 7x2+0.014 1x3。
(3)
對模型進(jìn)行檢驗(yàn)后得到的結(jié)果與現(xiàn)有數(shù)據(jù)進(jìn)行對比可知進(jìn)行回歸分析的誤判(差)率為37.8%,推測誤差較大的原因可從考慮的因素較少方面著手,但用分析得到的回歸方程進(jìn)行大體的定量分析亦是可行的。
當(dāng)考慮到收益對于任務(wù)成功失敗與否的影響時(shí)可以考慮單位時(shí)間收益與經(jīng)濟(jì)學(xué)中的機(jī)會(huì)成本比較,設(shè)單位時(shí)間收益為B,單個(gè)會(huì)員的機(jī)會(huì)成本為C,則單位時(shí)間收益與機(jī)會(huì)成本滿足關(guān)系式
利用經(jīng)緯度處理平臺(tái)對經(jīng)緯度進(jìn)行地址轉(zhuǎn)換處理,得到有具體市區(qū)的地址樣本。使用MATLAB 工具箱中的Classify函數(shù)對其分別進(jìn)行判別分析的訓(xùn)練,最終得到廣州、深圳、東莞、佛山4個(gè)輸出結(jié)果,其誤差率為0.078 5,因此可認(rèn)為該判別真實(shí)可靠。
將判別分析后的結(jié)果進(jìn)行處理,可以得到上述4個(gè)城市的任務(wù)成功率以及眾包任務(wù)定價(jià)如圖2所示。
圖2 各市任務(wù)標(biāo)價(jià)平均值以及成功率統(tǒng)計(jì)表Fig.2 Statistical table of average price and success rate of tasks in each city
由圖3可知,任務(wù)的成功率與任務(wù)定價(jià)必定存在一定的關(guān)系,即價(jià)格越高,其成功率也就越高。但是定價(jià)一味地升高同時(shí)會(huì)導(dǎo)致成本的提高,并且依據(jù)格雷欣法則(格雷欣法則是兩種實(shí)際價(jià)值不同而名義價(jià)值相同的貨幣同時(shí)流通時(shí),實(shí)際價(jià)值較高的貨幣,即良幣,必然退出流通,而實(shí)際價(jià)值較低的貨幣,也就是劣幣,則充斥在市場內(nèi)),平臺(tái)內(nèi)會(huì)充斥著信譽(yù)較低的會(huì)員搶占優(yōu)質(zhì)會(huì)員資源的現(xiàn)象,所以一個(gè)較為準(zhǔn)確的評價(jià)標(biāo)準(zhǔn)尤為重要。
基于以上分析,采用以下兩個(gè)標(biāo)準(zhǔn)作為評判定價(jià)方案是否有效,首先在成本不變的情況下,微調(diào)劃分區(qū)域的平均任務(wù)定價(jià),將成功率已經(jīng)比較高的區(qū)域的眾包任務(wù)定價(jià)略微降低,而與此同時(shí)將成功率較低的區(qū)域眾包任務(wù)定價(jià)略微提高。并且觀察各自區(qū)域的成功率,若某一區(qū)域的成功率在其余區(qū)域成功率不變的前提下有所上升或是整體的成功率有所上升,可以認(rèn)為對這一任務(wù)定價(jià)的方案可行。其次,若將某一區(qū)域的平均任務(wù)定價(jià)降低,其余區(qū)域的平均任務(wù)定價(jià)保持不變,可以得到在這一情況下的成功率,倘若該情況下的成功率不變或是有所增加,可認(rèn)為在保持成功率不變或是有所增加的情況下,使得平臺(tái)的成本有所降低,這也是一個(gè)較為可行的定價(jià)方案。
對會(huì)員的分布進(jìn)行可視化處理可以看出任務(wù)分布相對會(huì)員分布較為分散,因此可以考慮將會(huì)員與任務(wù)在這4個(gè)區(qū)域簇里的密度納入任務(wù)定價(jià)的指標(biāo)體系內(nèi)。另外,一個(gè)地區(qū)的會(huì)員對于眾包任務(wù)價(jià)格的期望也可以作為一個(gè)參考的指標(biāo)納入任務(wù)價(jià)格的決定體系內(nèi),于是可以得到改進(jìn)后的定價(jià)模型
x3i=1 187.7-3.515 9x1-9.150 9x2+p0β0i-p1β1i-p2β2i,
其中x1代表緯度坐標(biāo),x2代表經(jīng)度坐標(biāo),β0i則代表第i個(gè)地區(qū)的期望任務(wù)定價(jià),β1i代表第i個(gè)地區(qū)的會(huì)員密度,β2i代表第i個(gè)地區(qū)的任務(wù)密度,p0,p1,p2分別代表各自的權(quán)重,其中由經(jīng)濟(jì)學(xué)規(guī)律可知當(dāng)賣方市場比買方市場較發(fā)達(dá)時(shí),會(huì)出現(xiàn)供過于求的情況,從而導(dǎo)致價(jià)格下跌,可以得出除p0以外,其余變量都與任務(wù)的預(yù)定價(jià)格成反比。為方便計(jì)算,各自的值分別取0.05、0.5、0.15。
將得到的新的定價(jià)模型用式(1)對其進(jìn)行檢驗(yàn),求得符合判斷標(biāo)準(zhǔn)下的成功率分別為31%、84%、85%、83%,成功率均比原先的方案要高。
按照已建立的模型,同樣選取具有代表性的且具有一次接受多任務(wù)能力的會(huì)員去執(zhí)行打包任務(wù),即選取預(yù)訂任務(wù)限額大于10件的會(huì)員,對其作判別分析,將其同樣劃分為與歷史任務(wù)位置相同劃分的4個(gè)行政區(qū)域,對上述數(shù)據(jù)進(jìn)行一定的處理得到如表1所示的因素指標(biāo)統(tǒng)計(jì)表。
表1 城市各因素統(tǒng)計(jì)表/個(gè)Tab.1 Statistical table of urban factors/unit
在將上述會(huì)員分為4個(gè)簇后,可以將“打包”問題簡化為4個(gè)區(qū)域內(nèi)的任務(wù),由4個(gè)區(qū)域內(nèi)的優(yōu)質(zhì)會(huì)員接受??紤]到簡化后的“打包”問題需要對其中的會(huì)員簇進(jìn)行更加具體的分配與排序,可以采用谷歌搜索的PageRank排名算法[8],將劃分為4個(gè)區(qū)域的任務(wù)簇與會(huì)員簇看作是4個(gè)網(wǎng)頁,相互之間的PageRank值可以由一個(gè)線性加權(quán)式?jīng)Q定,即
PR(L1)=γ1E1+γ2E2,
γ1+γ2=1,
其中γ1,γ2分別代表距離遠(yuǎn)近因素E1和最大預(yù)定限額的匹配程度E2的權(quán)重,d代表距離的遠(yuǎn)近,數(shù)值1~4分別代表距離最近、距離較近、較遠(yuǎn)和很遠(yuǎn);f代表距離的匹配程度,1~4代表4個(gè)區(qū)域簇的任務(wù)量與所劃分的4個(gè)會(huì)員簇的匹配程度由優(yōu)轉(zhuǎn)化為差。
利用MATLAB編程可以得到各個(gè)區(qū)域簇的重要性(權(quán)重)為:深圳 0.264 2,東莞0.260 2,廣州 0.230 2,佛山 0.245 4。因此對于價(jià)格,在原有基礎(chǔ)上增加打包因素的定價(jià)模型為
P=P0-δ1ωi,
其中δ1代表系數(shù),P0代表原有的定價(jià)模型,ωi代表第i年的重要性排序。
通過PageRank算法得到的重要性排序可以得到不同地區(qū)簇的定價(jià)模型,并對其進(jìn)行檢驗(yàn)可以得到如表2所示的結(jié)果。
表2 任務(wù)成功率微調(diào)前后對比/%Tab.2 Comparison of task success rate before and after adjusting/%
對新任務(wù)數(shù)據(jù)進(jìn)行判別分析,得到其具體分類,使用已經(jīng)通過完善的定價(jià)模型進(jìn)行定價(jià)并用求得的logistic回歸方程對其進(jìn)行檢驗(yàn),得到深圳市的成功率約為44%,東莞市的成功率為86.1%。由于收集的新項(xiàng)目的數(shù)據(jù)只有坐標(biāo)位置,考慮具有模式識別功能的智能算法判別任務(wù)成功與否。先用舊項(xiàng)目的數(shù)據(jù)、各個(gè)區(qū)域的會(huì)員密度以及任務(wù)密度等數(shù)據(jù)對其進(jìn)行訓(xùn)練,得出的結(jié)果幾乎都與實(shí)際結(jié)果相重合,因此可以認(rèn)為該函數(shù)能夠較好地模擬預(yù)測原方案結(jié)果。最終得到深圳市和東莞市的任務(wù)成功率分別為24.3%、90%。
從最終的對比分析可以發(fā)現(xiàn)新的定價(jià)模型對于節(jié)約成本以及提高任務(wù)成功率的效果是顯著的,新的定價(jià)方案優(yōu)于原來的方案。
該模型可以推廣至其他眾包平臺(tái),如滴滴打車的定價(jià)問題以及相似的問題,甚至是基于地域與環(huán)境的產(chǎn)品的定價(jià)問題。建議對于眾包任務(wù)的發(fā)布者,收集類似任務(wù)在外包市場的報(bào)價(jià)、眾包市場中其他任務(wù)發(fā)布者的出價(jià),綜合考慮當(dāng)?shù)氐慕?jīng)濟(jì)條件,對三者進(jìn)行比較后,再?zèng)Q定是否在眾包平臺(tái)發(fā)布任務(wù)。
發(fā)布者可以根據(jù)自己的客戶完成情況設(shè)置一定的獎(jiǎng)勵(lì)機(jī)制,用于激勵(lì)客戶的完成任務(wù)的積極性,提高客戶信譽(yù),從而實(shí)現(xiàn)縮短的公司工作周期的“互利雙贏”效果。對于眾包軟件的開發(fā)者,平臺(tái)網(wǎng)站可以將其海量的交易數(shù)據(jù)進(jìn)行分類匯總,并用圖表的方式展示重要的信息以供任務(wù)發(fā)布者參考,如任務(wù)出價(jià)的分布、任務(wù)獲得參選作品數(shù)的分布、任務(wù)期限的分布等。
信譽(yù)的評價(jià)可以從多個(gè)方面進(jìn)行考慮,并賦予一定的權(quán)重參數(shù),通過分析,得出如何選取計(jì)算得出更合適的值。