楊靜 何金娥 賈洪杰 李雪梅 沈亭亭 方潤月
摘 要:隨著賞金類軟件的不斷發(fā)展,人們?nèi)粘5膶υ拸?今天你吃飯了嗎"轉(zhuǎn)變成"今天你領(lǐng)錢了嗎"。2017下半年,隨著支付寶掃碼賺賞金和直播答題賺賞金等活動的興起,賞金類軟件一時風(fēng)頭無兩,得到了國民的極高關(guān)注。文中利用R軟件進行數(shù)據(jù)的分析處理,旨在了解影響賞金類軟件推廣的因素,分析用戶對賞金類軟件的看法,研究其發(fā)展所面臨的問題。最后給出問題的解決建議。
關(guān)鍵詞:R語言;賞金類軟件;Logistic回歸模型;問卷調(diào)查;數(shù)據(jù)分析
中圖分類號: O212.1文獻標(biāo)志碼:A
文章編號:1672-1098(2020)03-0074-06
收稿日期:2019-10-14
基金項目:國家自然科學(xué)基金基助項目(61672001、61702008);安徽省自然科學(xué)基金資助項目(1808085MF193);大學(xué)生創(chuàng)新訓(xùn)練項目(201810361095)
作者簡介:楊靜(1980-),女,安徽淮北人,教授,博士,研究方向:DNA計算、智能計算。
Data Analysis of Bounty Software Based on R Language
JING Yang,HE Jine,JIA Hongjie,LI Xuemei,SHEN Tingting,F(xiàn)ANG Runyue
(School of Mathematics and Big Data, Anhui University of Science and Technology, Huainan Anhui 232001, China)
Abstract:With the continuous development of bounty software, people's daily conversations have changed from "Do you eat today?" to "Do you get the money today?" In the second half of 2017, with the rise ofearning bounty by scanning code with Alipay and live answering, and other activities, the bounty software was in the limelight, receiving great attention from the nationals. In this paper, R software was used for data analysis and processing, in order to understand the factors affecting the promotion of the reward software, analyze the users' opinions on it and study the problems faced in its development. Finally, some suggestions were given to solve the problem.
Key words:R language; bounty software; Logistic regression model; questionnaire survey; data analysis
近幾年來,直播類軟件的熱度不斷飆升,吸引了大量用戶。2017年年底以“答題賺賞金”為首的新型直播方式的出現(xiàn)[1],使得直播類軟件博得了廣大網(wǎng)民的眼球,贏得了廣泛的關(guān)注,更是被稱為2018互聯(lián)網(wǎng)行業(yè)的第一個“風(fēng)口”。支付寶采取類似的方式,通過掃碼領(lǐng)取獎勵金的方式來刺激用戶消費,并在2017年“雙十一”前后推出了“掃碼領(lǐng)紅包”、“邀請好友掃碼賺賞金”等活動。
除了直接發(fā)放獎金,不少軟件也在用間接獎勵的方式吸引用戶。比如現(xiàn)在很火的“平安好醫(yī)生”和騰訊旗下的悅動圈,就采取走路計步數(shù)的方式使用戶賺取獎金。百度文庫、道客閱讀、掌閱、網(wǎng)易云音樂等軟件也相繼采用連續(xù)簽到、記錄閱讀時長的方式來發(fā)放獎券、兌換金等。
上述這些賺取“賞金”的方式,既使得軟件本身得到了很好的推廣,同時也提高了相關(guān)贊助商的知名度,實現(xiàn)了企業(yè)間的互利共贏。
當(dāng)下,手機軟件越來越多,如何在門類繁多的軟件市場中脫穎而出,吸引用戶,這應(yīng)該是目前許多軟件運營商都在思考的問題。過去的兩年,賞金類軟件以黑馬之姿橫空出現(xiàn),一躍成為最熱門的軟件,下載量急速增長。但當(dāng)風(fēng)頭過去,此類軟件也逐漸歸于平靜。以其作為切入點,了解此類軟件背后的商業(yè)模式。通過調(diào)查,可以分析其成功的原因,以此來了解目前市場需求,為日后的軟件研發(fā)及推廣提供新思路。
1 數(shù)據(jù)分析
(1)問卷的信度和效度分析
信度是指在調(diào)查問卷過程中,對同一調(diào)查對象進行調(diào)查時,采用同一方法所得出調(diào)查結(jié)果的一致性和穩(wěn)定性,通過信度分析[2]可讓設(shè)計問卷具有科學(xué)性。這里使用目前社會研究中最常使用的CronbachSymbolaA@信度系數(shù)法,該方法能克服部分折半法的缺點。
利用R軟件對該問卷進行信度分析,結(jié)果如表1所示。
從上表1可以看出,本研究共有2 466條數(shù)據(jù),其中有效數(shù)據(jù)2 459條,缺失數(shù)據(jù)7條,問卷有效率為99.7%。
從上表2可看出,信度系數(shù)α為0.769,在剔除缺失數(shù)據(jù)后,經(jīng)過標(biāo)準(zhǔn)化的系數(shù)α為0.812>0.8,即分析該問卷具有一定意義。
(2)問卷分布
本次問卷調(diào)查共計2 466份問卷,問卷調(diào)查對象來自全國不同?。ㄊ?、區(qū))。問卷進行了合理的調(diào)整或直接剔除[3-5],最終確定2 459份問卷作為有效樣本。其中,受訪者中男女比例相對均衡,問卷的分布主要集中在安徽省內(nèi)。
(3)調(diào)查總體基本情況
在調(diào)查樣本[6-9]中,受訪者的年齡主要集中在18~30歲之間,共有1 768人,在總數(shù)中的占比達到了71.9%。對于受教育水平的分析,受訪者的受教育水平主要集中在本科及以上,占總體人數(shù)的76.2%。
關(guān)于月可支配金額,可以發(fā)現(xiàn)月可支配金額在5 000元以下的人數(shù)最多,占比達到了89.4%,造成該現(xiàn)象的主要原因可能是絕大多數(shù)受訪者為在校大學(xué)生。再結(jié)合每天使用手機時間在5h以上的受訪者約為總數(shù)的41.8%,因此有理由認(rèn)為賞金類軟件面對大學(xué)生更有市場。
(4) 影響安裝賞金類軟件意愿的因素分析
對于受訪者安裝賞金類軟件意愿與各個因素之間的關(guān)系,這里將選擇在手機上安裝賞金類軟件的受訪者規(guī)定為愿意,反之為不愿意,整理回收的有效數(shù)據(jù)并對其進行卡方檢驗。
因為受教育水平影響手機的使用情況,因此將受訪者的受教育水平進行分析。由數(shù)據(jù)可知,每個階段中愿意安裝與不愿意安裝此類軟件的人數(shù)比例均為1∶1。
針對每個人使用手機習(xí)慣的不同,通過數(shù)據(jù)分析可知,手機上幾乎沒有軟件的受訪者愿意安裝賞金類軟件的人與不愿意者之間的比例大約為1∶1,而對手機上軟件較多的受訪者來說軟件越多的人,安裝賞金類軟件的意愿程度越高。
通過對受訪者對賞金類軟件的前景預(yù)測,其中認(rèn)為賞金類軟件很有前景的受訪者中愿意安裝賞金類軟件的人數(shù)所占比例較多,而對于不怎么看好的人來說,不愿意安裝賞金類軟件的人數(shù)較多,因此可以初步認(rèn)為對賞金類軟件的看法與安裝賞金類軟件意愿之間呈明顯的負(fù)相關(guān)關(guān)系。
關(guān)于選擇登錄方式,絕大多數(shù)用戶較為傾向于使用QQ登錄賞金類軟件,選擇微信登錄的受訪者相對于選擇QQ登錄的人數(shù)較少。而選擇愿意接受手機號及其他登錄方式的用戶僅占總數(shù)的16.7%,相對較少。
通過對現(xiàn)在市面上大多數(shù)的賞金類軟件進行分析,得知大多數(shù)賞金類軟件在提現(xiàn)時都需要提現(xiàn)人輸入自己的身份證號、銀行卡號、銀行預(yù)留手機號等個人隱私信息,因此使得一部分用戶選擇卸載賞金類軟件。
在對賞金類軟件提現(xiàn)限制進行分析時發(fā)現(xiàn),市面上幾乎所有的賞金類軟件在提現(xiàn)時都需要達到指定金額。當(dāng)受訪者得知需要達到一定額度才能提現(xiàn)時,多數(shù)人表示拒絕安裝此類軟件。
對安裝賞金類軟件因素進行卡方檢驗,性別x1的P值為0.03、年齡x2的P值為0.001、受教育水平x3的P值為0.739、月可支配金額x4的P值為0.119、使用手機時間x5的P值為0.000、常用軟件類型x6的P值為0.000、下載途徑x7的P值為0.249、得知途徑x8的P值為0.227、了解程度x9的P值為0.000、看法x10的P值為0.000、喜愛類型x11的P值為0.007、登錄方式x12的P值為0.000、資料要求x13的P值為0.000、額度要求x14的P值為0.000。
由此可知對安裝賞金類軟件影響因素較大的變量,為了更明清楚的得到影響因素較強的變量進而構(gòu)建模型,這里對其進行了相關(guān)性檢驗。經(jīng)過對所有因素的之間的相關(guān)性分析檢驗得到圖1(顏色越深,兩個影響因素之間的相關(guān)性越強[10])。
其中,x2、x3、x4等變量分別對應(yīng)前面的各個分析影響因素的序號,從上圖可以看出提現(xiàn)要求、提現(xiàn)額度要求及對軟件類的看法等三個影響因素與賞金類軟件安裝意愿之間有著顯著的相關(guān)關(guān)系,經(jīng)過比較留下6個與下載意愿之間相關(guān)關(guān)系比較顯著的影響因素,分別為年齡、使用手機時間、使用軟件類型、登錄方式、提現(xiàn)個人資料要求及提現(xiàn)額度。
(5)賞金類軟件下載影響因素效應(yīng)分析
1)logistic回歸的基本理論 根據(jù)Logistic思想, 當(dāng)因變量是一個二元變量時, 只取0與1兩個值時, 因變量取1的概率就是要研究的對象。如果有很多因素影響y的取值, 這些因素就是自變量, 記為x1,…,xk,這些xi中既有定性變量,也有定量變量,其中最重要的一個條件是
lnp1-p=b0+b1x1+…+bkxk(1)
滿足上述條件的稱為Logistic線性回歸。Logistic函數(shù)的形式[10-14]為
f(x)=ex1+ex=11+e-x(2)
該分析篩選出了影響用戶下載意愿的主要因素,在這些因素中,用“0”表示愿意下載,“1”表示不愿意下載,這正好符合Logistic回歸模型的0-1模型,故此方法適用于該分析[11-14]。與其他分析方法相比,該方法具有以下優(yōu)點。
①該方法適合分類變量場景。
②計算代價較低且易理解并實現(xiàn),在內(nèi)存和時間需求上效率較高。它即可以應(yīng)用于分布式數(shù)據(jù),也可以通過在線算法實現(xiàn)用較少的資源處理大型數(shù)據(jù)。
③對于數(shù)據(jù)中小噪聲的魯棒性很好,并且不會受到輕微的多重共線性的影響。
2)影響因素效應(yīng)分析 從上述分析中可知,在問卷眾多的設(shè)計因素中,影響受訪者下載意愿的主要因素有:年齡;使用手機時間;使用軟件類型;登錄方式;提現(xiàn)個人資料要求;提現(xiàn)額度。
這里采用Logistic回歸模型對這些因素進行效應(yīng)分析[15],以得出影響下載意愿的最主要因素。
為便于繼續(xù)分析問題,這里分別將變量年齡、使用手機時間、使用軟件類型、登錄方式、提現(xiàn)個人資料要求及提現(xiàn)額度設(shè)為x1、x2、x3、x4、x5及x6,并將這六個因素作為自變量[16],將原始問卷中的問題13即是否會選擇在手機上安裝賞金類軟件設(shè)為y作為因變量。另一方面,在原始數(shù)據(jù)中用“0”表示愿意,“1”表示不愿意選擇在手機上安裝此類軟件。在該分析中選擇Logistic回歸作為研究問題的方法,為了便于分析,將愿意用“0”表示,不愿意用“1”表示,得出新的需要處理的數(shù)據(jù)。
通過多次擬合回歸,P值在0.01的顯著性水平下剔除的不顯著因素有:x1、x4,即年齡和登錄方式,剔除不顯著因素后重新擬合,得到最終擬合回歸系數(shù)表[17](見表4)。
在顯著性水平為0.01的情況下,這里認(rèn)為剩余變量均顯著有效,由此得到Logistic回歸方程為
p^=11+e-(-2.655+0.185x2-0.307x3+0.891x5+0.971x6)(3)
由以上分析知,影響受訪者下載意愿的主要因素有:使用手機時間、使用軟件類型、提現(xiàn)個人資料要求及提現(xiàn)額度。且模型的整體顯著性水平遠(yuǎn)遠(yuǎn)小于0.05,說明該模型整體高度顯著。
2 國內(nèi)賞金類軟件比較
對于賞金類軟件最有名的莫過于支付寶。支付寶天天領(lǐng)紅包活動從2017年9月4日一開始,短短的三個月時間,以星星之火可以燎原的速度,幾乎發(fā)展到全民參與的程度。支付寶通過補貼20億元紅包,用戶通過手機“掃碼領(lǐng)紅包”或“邀請好友掃碼賺賞金”然后到實體店購買物品時,紅包可以直接抵扣現(xiàn)金。 由于新的用戶一般“掃碼領(lǐng)紅包”金額比較大,而對于老的用戶金額一般比較小,因此有不少用戶開通了支付寶。支付寶不僅邀請到不少新的用戶,還拓展了線下消費場景,刺激用戶消費,逐漸的改變了消費者的習(xí)慣。
提到支付寶通過掃一掃領(lǐng)紅包,就不得不提直播答題贏獎金。2017a年底,打響了直播答題贏獎金的第一槍,從一開始一場幾萬元獎金到一場百萬元獎金,僅僅用了半個月時間。一時間直播答題贏獎金風(fēng)頭一時無二,掀起了一波全民答題熱潮。每場獎金在50萬、100萬、200萬不等,由于獎金金額巨大,提現(xiàn)門檻低,吸引了大量的用戶參與。多數(shù)情況下每場普通人能分到幾元,僅有極個別人能贏得大獎。巨大的流量更是能帶來巨大的商業(yè)變現(xiàn),廣告贊助商紛沓而至,自然而然不愁直播答題的巨額獎金從哪里來。
除了直接發(fā)放獎金,不少軟件采用間接方式“發(fā)紅包”比如騰訊旗下的悅動圈。悅動圈是深圳市悅動天下科技有限公司于2016年5月27日發(fā)布的一款記錄運動數(shù)據(jù)的手機軟件。悅動圈主要針對步行、跑步、騎行等運動基于GPS工具記步。只要用戶完成步行、跑步、騎行等任意一種指標(biāo)即可獲得現(xiàn)金紅包。一時間,不少人都下載軟件并完成運動目標(biāo),不僅可以鍛煉身體還可以獲得現(xiàn)金。
賞金類軟件既使得軟件本身得到了很好的推廣,同時也提高了相關(guān)贊助商的知名度,實現(xiàn)了企業(yè)間的互利共贏。他們最終的目的是要吸引用戶和增加新的用戶,還要提高用戶使用該軟件的頻率。但是對于賞金類軟件能不能持續(xù)發(fā)展,關(guān)鍵看用戶能否一直保持熱情。
3 結(jié)論和建議
結(jié)合問卷調(diào)查的有效數(shù)據(jù)以及利用R軟件對其進行的分析,可以得到如下結(jié)論和建議。
(1)結(jié)論
1)賞金類軟件的推廣與受訪者使用手機的習(xí)慣息息相關(guān)。結(jié)合生活實際,使用手機時間較長的受訪者更有可能對這種賞金類軟件產(chǎn)生興趣。而從受訪者平時使用手機軟件的類型來看,更易看出受訪者是否愿意下載這類軟件。因此,了解消費者使用手機的習(xí)慣,是賞金類軟件想要得到推廣的第一步。
2)賞金類軟件的推廣需要滿足大眾的需求。由數(shù)據(jù)分析可以清楚地看到日常運動(閱讀等)、答題賺賞金和支付寶推廣賺賞金這三類選擇的人數(shù)居多,在總體中所占的比例相差無幾,平均值在28%左右。而選擇視頻直播類和其他的受訪者平均占比在8%左右,相對較少。因此,在推廣這類軟件的時候需要迎合大眾的需求,不能一味地發(fā)展某一類軟件,而應(yīng)根據(jù)人們的需求有的放矢。
3)提現(xiàn)要求對安裝賞金類軟件有一定影響。在受訪者是否安裝賞金類軟件決策過程中,賞金提現(xiàn)的要求起到了顯著性的影響效應(yīng)。當(dāng)?shù)弥枰敿?xì)的個人信息才能提現(xiàn)時,或提現(xiàn)額度要求較高時,大多數(shù)的受訪者都拒絕安裝賞金類軟件。因此,適當(dāng)優(yōu)化提現(xiàn)要求,是留住用戶量的必經(jīng)途徑。
4)賞金類軟件的設(shè)計還需要進一步的優(yōu)化。本文分析了受訪者對賞金類軟件前景的看法,發(fā)現(xiàn)大家對此類軟件的評價褒貶不一,其中認(rèn)為有些軟件還行、有些只是跟風(fēng)的受訪者占了總?cè)藬?shù)的49%,由此可以看出其中大多數(shù)的受訪者認(rèn)為有些軟件還需要進一步的優(yōu)化。大多數(shù)用戶認(rèn)為這類軟件的崛起與賞金吸引和任務(wù)設(shè)計新穎有著密不可分的關(guān)系。同時部分用戶卻對軟件的人員安全性和任務(wù)合理性方面比較在意,但是少數(shù)用戶也表示只是抱著嘗試新事物的態(tài)度。
(2)建議
1)優(yōu)化提現(xiàn)對資料的要求,讓用戶放心使用 根據(jù)軟件用戶使用的登錄方式,合理地改變提現(xiàn)方式。例如,當(dāng)用戶使用QQ號或微信等快捷方式登錄時,由于人們對這類軟件都比較信任,或已經(jīng)在QQ和微信上實名認(rèn)證過了,因此通過直接綁定QQ號或微信等進行現(xiàn)金提現(xiàn),能更好地達到推廣的目的。
而現(xiàn)在許多賺賞金類軟件平臺需要用戶提供身份證信息或者是銀行卡號才可以提現(xiàn),這可能會讓大多數(shù)用戶認(rèn)為自己信息會被泄露,從而拒絕繼續(xù)使用該軟件。因此,合理優(yōu)化用戶提現(xiàn)方式顯得尤為重要。
2)降低提現(xiàn)額度要求,建立良好口碑 很多軟件為了留住用戶,設(shè)定了達到一定額度才能提現(xiàn)的條件。不過,除了留住舊用戶之外,還要對新用戶產(chǎn)生強大的吸引力。將提現(xiàn)的額度要求適當(dāng)降低,讓用戶對資金有握在手里的放心,才能對自己使用的軟件更加信任,從而達到建立良好口碑的目的。
3)優(yōu)化廣告投放,迎合大眾需求 進行軟件推廣時,分析賞金類軟件的使用人群,實現(xiàn)廣告的精準(zhǔn)投放,做到使投放的廣告有較大程度的響應(yīng)。在軟件平臺上適當(dāng)減少廣告的投放,用戶使用軟件時,不少的軟件會在平臺中出現(xiàn)各種廣告的彈窗,這可能會直接影響到用戶使用軟件的心情,從而導(dǎo)致軟件的用戶量流失。因此,優(yōu)化廣告投放是留住用戶重要的手段和途徑。
4)提高軟件性能,更好服務(wù)于生活 每個軟件的生存應(yīng)該靠的是軟件本身給用戶帶來的方便,不能單單靠賺賞金一種方式來吸引甚至留住用戶。2018年年初打得火熱的各種直播答題類軟件,以西瓜視頻為例,西瓜視頻里不僅有答題賺賞金的欄目,軟件本身也有很多搞笑、養(yǎng)生、新聞等視頻,不少用戶都將從視頻中學(xué)到的東西用于生活實際中,是比較實用的一類軟件。
提高軟件本身性能,更好地服務(wù)于生活才是最終勝出的方式,只有當(dāng)軟件實用、能為人類生活帶來便利或產(chǎn)生積極影響才是留住用戶和生存到最后的法寶。
參考文獻:
[1] 單鵬, 周鵬, 薛志揚,等. 直播答題商業(yè)模式分析及優(yōu)化策略[J]. 時代金融, 2019(5):87-88.
[2] BUNEVICIUS A. Reliability and validity of the SF-36 Health Survey Questionnaire in patients with brain tumors: a cross-sectional study[J]. Health & Quality of Life Outcomes, 2017, 15(1):92.
[3] 金勇進. 市場調(diào)查方法與技術(shù)[M] .北京:中國人民大學(xué)出版社,2009:20-130.
[4] 黃孝俊. 市場調(diào)查分析[M].浙江:浙江大學(xué)出版社, 2002:23-98.
[5] 曾五一, 汪彩玲, 王菲. 網(wǎng)絡(luò)調(diào)查的誤差及其處理[J]. 統(tǒng)計與信息論壇, 2008, 23(2):5-10.
[6] DU N,GUO C L,YANG M, et al. Assessing the current status of enhanced recovery after surgery in the usage of webbased survey questionnaires by thoracic surgeons and nurses attending the meeting in Mainland China[J].Chinese Journal of Lung Cancer, 2017, 20(3):157-162.
[7] UENO F,NAKAYAMA Y,HAGIWARA E,et al.Impact of inflammatory bowel disease on Japanese patients' quality of life:results of a patient questionnaire survey[J].Journal of Gastroenterology,2017,52(5):555-567.
[8] PONIS S T, PAPANIKOLAOU P A, KATIMERTZOGLOU P, et al. Household food waste in Greece: A questionnaire survey [J]. Journal of Cleaner Production, 2017, 149(4):1 268-1 277.
[9] LAMBERT T W, SMITH F, GOLDACRE M J. Career specialty choices of UK medical graduates of 2015 compared with earlier cohorts: questionnaire surveys [J]. Postgraduate Medical Journal, 2018, 94:191-197.
[10] 張文彤.SPSS 統(tǒng)計分析基礎(chǔ)教程[M]. 北京:高等教育出版社, 2004:2-200.
[11] OSMAN T,DIVIGALPITIYA P,ARIMA T.Driving factors of urban sprawl in Giza governorate of the Greater Cairo Metropolitan Region using a logistic regression model[J]. International Journal of Urban Sciences, 2017, 58(2):1-20.
[12] QIAN W, YI W, RUIQING N, et al. Integration of Information Theory, K-Means Cluster Analysis and the Logistic Regression Model for Landslide Susceptibility Mapping in the Three Gorges Area, China[J]. Remote Sensing, 2017, 9(9):938-966.
[13] SIDI P, MAMAT M, SUKONO, et al. Supply and demand analysis for flood insurance by using logistic regression model: case study at Citarum watershed in South Bandung, West Java, Indonesia[J]. IOP Conference Series: Materials Science and Engineering, 2017, 166:1-7.
[14] REANGSEPHET O, LISAWADI S, AHMED S E. A Comparison of Pretest, Stein-Type and Penalty Estimators in Logistic Regression Model[C]// International Conference on Management Science & Engineering Management.Mediacity UK,2017:19-34.
[15] 王濟川.logistic 回歸模型-方法與應(yīng)用[M].北京:高等教育出版社, 2001: 35-110.
[16] 何曉群.多元統(tǒng)計分析[M] .北京:中國人民大學(xué)出版社, 2015: 15-56.
[17] 楊貴軍.應(yīng)用抽樣技術(shù)[M] .北京:中國統(tǒng)計出版社,2017:23-116.
(責(zé)任編輯:李 麗,范 君)