国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于“拍照賺錢”眾包形勢下的任務定價優(yōu)化的研究——以東莞市數(shù)據(jù)為基礎

2018-09-14 10:27:02蔣木周振宇
電腦知識與技術 2018年16期
關鍵詞:隨機森林聚類分析回歸方程

蔣木 周振宇

摘要:近年來,互聯(lián)網(wǎng)新興社會媒體和開放式創(chuàng)新正逐步重塑人與人之間分享信息及協(xié)作的方式,同時也為軟件開發(fā)模式帶來了革新的機遇?!芭恼召嶅X”正是在這種環(huán)境下應運而生的,我們稱這種商業(yè)模式為“眾包”。如何驅動群體參與,是眾包應用管理當中的難點,而眾包策略研究針對的就是聚眾問題。本文對眾包下的任務定價進行了建模分析,任務額定價是否合理直接影響任務的完成量,在東莞市大數(shù)據(jù)的支持下對模型進行分析,討論定價規(guī)律并給出新的方案,并提出啟示與建議。

關鍵詞:隨機森林;聚類分析;泊松回歸;EMPR定價方法;回歸方程

中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)16-0169-03

1 引言

眾包指的是一個公司或機構把過去由員工執(zhí)行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡的做法。(就是通過網(wǎng)絡做產(chǎn)品的開發(fā)需求調研,以用戶的真實使用感受為出發(fā)點)。眾包定義由JeffHowe在2006年的《連線》雜志中提出。眾包又稱為網(wǎng)絡化社會生產(chǎn),是指把過去由員工執(zhí)行的工作任務,以自由自愿的形式外包給非特定的大眾網(wǎng)絡的做法,具有低成本生產(chǎn)、聯(lián)動潛在生產(chǎn)資源、提高生產(chǎn)效率,以及滿足用戶個性化需求等優(yōu)勢,如圖1可以清楚地理解眾包的原理[2]。

通常情況下,眾包的任務是單個工作者來完成的,但如果涉及需要多人協(xié)作完成的任務,也有可能以依靠開源的個體生產(chǎn)的形式出現(xiàn)。對各個行業(yè)而言,眾包提供了前所未有的解決問題的全新模式。該定義認為眾包是指公司或機構把過去由員工執(zhí)行的任務,以自由自愿的形式外包給非特定的大眾網(wǎng)絡群體的行為?;诒姲能浖_發(fā)通過互聯(lián)網(wǎng)召集全球的在線開發(fā)者完成覆蓋軟件生命周期的多種任務,本文就是基于題目討論“眾包”定價策略及優(yōu)化。筆者從定價分析、建立新的方案并,與原方案進行比較三個方面進行研究。

2 定價分析

從廣東省的數(shù)據(jù)進行分析,研究其中的任務定價規(guī)律:

在數(shù)據(jù)中存在著以下幾個變量:任務和會員的 GPS 經(jīng)緯度,任務標價,任務執(zhí)行情況,預訂任務限額,預訂任務開始時間,信譽值。將上述幾個變量以散點圖的形式表現(xiàn)出來后,可以明顯地看出任務標價與其他變量之間存在著明顯的聚類相關性。先運用多元回歸分析的方法,分別將經(jīng)緯度,任務執(zhí)行情況有直接關系的因素作為自變量,標價作為因變量,將預處理后的數(shù)據(jù)利用MATLAB擬合。通過觀測模型的 R?、sig 等統(tǒng)計量值,判斷模型的擬合效果,剩下變量結合散點圖進行直觀性觀察檢驗。

會員的位置分布散點圖如圖3,存在明顯的聚類現(xiàn)象。同時查詢實際地理位置后,得出會員的位置主要集中在東莞市中心,可以聯(lián)想到城市與郊區(qū)的地理位置對會員位置的分散影響。而任務的分布也存在聚類現(xiàn)象。同時查詢實際地理位置后,得出任務完成的位置主要集中在東莞的城市中心,而郊區(qū)或者交通不發(fā)達的位置往往存在任務未完成現(xiàn)象。

我們根據(jù)任務的位置的密度分為三類,分別為經(jīng)度區(qū)間為(112,113.5),(113.5,113.9),(113.9,114.5)。設回歸方程為: Y=t1A1+t2A2+t3A3+t4 借助spss對經(jīng)緯度,標價,完成程度進行回歸分析,如圖4。

由以上回歸分析中顯示:sig,=0<0.05,R2=0.74,說明該回歸方程較符合要求。得出回歸方程為:[Y=0.089A1+0.425A2+0.019A3-20.552] (模型一)。

雖然以經(jīng)緯度,完成情況以及標價之間關系得出的多元回歸方程得出存在一定的相關性,但是R2并不顯著,仍然存在一定的誤差,為此我們采用決策樹,隨機森林和交叉檢驗加以驗證的方法對模型進行一定的優(yōu)化。

首先進行數(shù)據(jù)預處理我們將價格量化,把65-85分為三類:低,中,高,分別0,1,2。通過模型隨機森林和決策樹,交叉檢驗的結果是70%,得出結果如圖5,可知模型的解答較符合。

由上圖考慮信譽值對價格定價的影響,對信譽值聚類,用95%左右貢獻區(qū)間的信譽值去觀察定價,信譽值和定價都集中在一片區(qū)域??傻梦赐瓿牲c大多聚集在價格較低處,可以得出價格低是任務未完成的一個比較重要的原因。同時結合模型一,當任務位置較偏時,也會造成任務未完成。

3 設計新的任務定價方案,并和原方案進行比較

我們從兩個角度去拷問,一個是價格的外在因素,一個是價格的內(nèi)在因素。

考慮外在因素,結合問題一中已出現(xiàn)的變量,我們可以考慮時間對定價規(guī)律是否存在一定的作用。在相關文獻理論[1]支持下,我們可以知道價格主要通過刺激參與者的外部動機,而時間則是采用任務周期影響工作強度。根據(jù)對參與者動機的研究表明,參與者的動機之間可呈現(xiàn)共生關系,也即標價和時間互相影響。我們以時間變量為自變量得出模型二。

另外對軟件眾包經(jīng)驗數(shù)據(jù)中的歷史任務價格進行特征分析,識別任務價格因子[3],這是價格的內(nèi)在因素。我們將經(jīng)緯度歸為識別的價格因子,以東莞市的數(shù)據(jù)為依據(jù),通過統(tǒng)計和機器學習算法建立經(jīng)驗定價模型二;之后將數(shù)據(jù)進行切分用于模型的驗證與評估;最后根據(jù)評估結果選擇最為有效的經(jīng)驗定價模型應用至新的任務定價方案。

我們采用泊松回歸來界定每個任務的定金策略和時間策略對于任務完成情況之間的實證計量回歸模型:

(1)Performancew~Possion([λ])其中Performancew為第u個任務收到的數(shù)量,[λ]是分布的參數(shù)。則任務參數(shù)和每個任務的定價和時間的關系為:

(2)[logλ=B1+B2logPrize+B3logT+B4logT2+B5logT×logPrize+B6logT2×logPrize +μ] (模型二)

其中[B2] 和[B3] 分別檢驗定價和時間各自的影響效果;而[B5] 則是檢驗定價和時間的交互影響。其他則是相關對任務完成情況可以產(chǎn)生影響的控制變量,主要作用控制可能的替代性解釋。為了使模型的估計更加準確,我們采用分層的方法,即在每層增加一個隨機參數(shù)來控制不同任務間的差異,即[μ]可以分解為:

(3) [μs+μω]

其中[μs]為組之間的固定變量,而[μω]為組內(nèi)不同個體的誤差系數(shù)。

以上三步綜合考慮分析了包含控制變量對任務完成情況的影響,時間和定價的主作用并加入了研究的調節(jié)變量,是一個比較完整的模型,給出了一種新型的定價方法。

對經(jīng)驗數(shù)據(jù)中歷史任務價格進行特征分析和因子識別,而得出的一種基于經(jīng)驗模型的定價方法,我們稱之為EMPR定價方法,該方法通過經(jīng)驗數(shù)據(jù)建立模型,利用過去成功實施任務中的定價經(jīng)驗來指導現(xiàn)階段的定價決策。根據(jù)EMPR定價方法,我們可以得出以下的問題分析框架如圖6。

我們將價格因子中的任務距離分為任務緯度和任務經(jīng)度兩種因素。對價格因子的數(shù)據(jù)分析如圖7:

模型三結合了問題一中我們都未結合研究的變量,并且有依據(jù)的將這些變量結合在一個模型當中,也是一種新型的定價方案。

我們從兩個角度出發(fā)對問題進行了全面的分析,外部因子與內(nèi)部因子的相結合,可以讓我們更清楚地了解到價格的定價規(guī)律,模型二,雖然沒有具體的相關系數(shù),但是在模型中可以直觀的展現(xiàn)出時間與定價的聯(lián)系。模型三利用EMPR定價方法,給出的過程同樣很直接。兩個模型相輔相成具有一定的參考意義。

4 模型的評價

在對模型一求解之后,并沒有放棄存在的誤差性,而是繼續(xù)采用隨機森林算法進行驗證,并從另一角度完善優(yōu)化了模型,使模型變得更貼近現(xiàn)實。

模型二三的建立類比了原模型的自變量與因變量,并將多種可變量結合在一起,完善了定價方案。

給出的限額,我們沒有過多的去分析和研究,其實這是一種歧視定價模型[4]當平臺對新老用戶進行歧視定價,可以結合模型給出最大的優(yōu)化,在現(xiàn)實眾包交易中具有較大的參考價值,但于模型收題目條件和數(shù)據(jù)的限制,只能給出最適合的模型。而現(xiàn)實中往往需要考慮的因素不僅僅是這些,比如,本論題也可以采用多臂賭博機問題,利用機器學習當中的監(jiān)督學習部分與解決多臂賭博機問題的貪婪算法,解決了在不考慮工作者完成任務數(shù)量且有預算的限制條件下,最大化任務發(fā)布者收益的問題。然后,考慮另定價問題模型,將黃金標準測試方法、定價機制設計與貪婪算法相結合,解決問題[5]。本文在時間這一變化因素上,若能給出每個任務所需完成的時間,可以將以上得出的所有模型都再次精確模擬,更能貼近現(xiàn)實。在算法上了,采取了比較經(jīng)典的隨機森林算法和打包算法,很適合多元問題的考慮,極大地優(yōu)化了多維度數(shù)據(jù),平衡誤差的同時給出了最大的準確性。商家在平臺發(fā)布任務,需要后續(xù)的動態(tài)調整,我們研究的是靜態(tài)過程,考慮到這點,可以結合平臺定價模型,求解模型的分布式框架[7],因時間有限,未能更立體化的研究問題。

參考文獻:

[1] 李丹妮,馮小亮,王殿文,等.眾包策略影響研究:獎金和時間的組合設計[J].北京:營銷科學學報,2016,12(2):100-110.

[2] 譚婷婷,蔡淑琴,胡慕海.眾包國外研究現(xiàn)狀[J].武漢,武漢理工大學學報·信息與管理工程版, 2011,33(2).

[3] 毛可.軟件眾包任務的定價模型與人員匹配方法研究及工具實現(xiàn)[J].中國科學軟件研究所,2014(4).

[4] 畢菁佩,舒華英.基于競爭平臺的新老用戶定價策略分析[J].北京:管理學報,2016,13(8).

[5] 孫信昕.眾包環(huán)境下的任務分配技術研究[D].揚州大學:2016.

[6] 馮小亮,黃敏學.眾包模式中問題解決者參與動機機制研究[J].商業(yè)經(jīng)濟與管理,2013(4).

[7]吳瑞杰,孫鵬,孫昱.分布式任務計劃動態(tài)調整模型及算法[J].系統(tǒng)工程與電子技術,2017,39(2):322-328.

猜你喜歡
隨機森林聚類分析回歸方程
采用直線回歸方程預測桑癭蚊防治適期
線性回歸方程的求解與應用
線性回歸方程要點導學
走進回歸分析,讓回歸方程不再是你高考的絆腳石
隨機森林在棉蚜蟲害等級預測中的應用
基于二次隨機森林的不平衡數(shù)據(jù)分類算法
軟件(2016年7期)2017-02-07 15:54:01
拱壩變形監(jiān)測預報的隨機森林模型及應用
農(nóng)村居民家庭人均生活消費支出分析
基于隨機森林算法的飛機發(fā)動機故障診斷方法的研究
基于省會城市經(jīng)濟發(fā)展程度的實證分析
中國市場(2016年33期)2016-10-18 12:16:58
宽城| 永丰县| 天门市| 淅川县| 彭州市| 孝义市| 保康县| 肇庆市| 蓬安县| 大英县| 赤峰市| 苍溪县| 海城市| 左贡县| 乌拉特中旗| 徐水县| 临桂县| 新宾| 柳州市| 恩平市| 陆河县| 邹平县| 沂南县| 郧西县| 白水县| 陇南市| 武隆县| 宁陵县| 霍城县| 中江县| 安国市| 綦江县| 景德镇市| 武陟县| 平山县| 湄潭县| 洪泽县| 榕江县| 洛浦县| 化州市| 珠海市|