国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關(guān)鍵詞關(guān)聯(lián)規(guī)則的優(yōu)惠券個性化推薦算法研究

2020-10-13 07:36:44秦曉安
攀枝花學(xué)院學(xué)報 2020年5期
關(guān)鍵詞:點擊率優(yōu)惠券餐飲

秦曉安,王 睿,舒 升

(安徽商貿(mào)職業(yè)技術(shù)學(xué)院,安徽 蕪湖 241002)

1 研究背景

隨著電子商務(wù)平臺的蓬勃發(fā)展,現(xiàn)在越來越多的交易是在網(wǎng)上完成的。根據(jù)最新的數(shù)據(jù),2018年,大約28.5%的交易是在線完成的,馬云在首屆中國國際進口博覽會論壇上表示,未來95%的交易會在網(wǎng)上完成。人們可以從數(shù)十億的在線交易中獲得前所未有的深刻見解,并開發(fā)了許多技術(shù)來改善消費者的購物體驗。其中一種技術(shù)是基于個人客戶偏好的個性化交易推薦。目前,大多數(shù)零售商在進行市場營銷活動時,并不區(qū)分顧客,例如,向所有顧客發(fā)送所有電子優(yōu)惠券。這類營銷通常以向客戶發(fā)送垃圾信息而告終,因為大多數(shù)客戶可能并不感興趣。即使一些顧客感興趣,他們關(guān)注的信息可能不太容易被發(fā)現(xiàn)。個性化推薦是解決這一問題的最佳方式,它只向目標客戶推薦相關(guān)產(chǎn)品,在幫助零售商獲得更多客戶的同時,也為零售商節(jié)省了成本[1]。個性化的推薦引擎需要考慮個人客戶的偏好和購買歷史,并找到最相關(guān)的產(chǎn)品。

個性化推薦可以被各類零售商使用,并且不同的業(yè)務(wù)邏輯需要不同類型的推薦算法。在文章中,我們討論了一種特殊類型的交易,即優(yōu)惠券交易,它具有一些特定的特征。這種商業(yè)模式的一個典型例子是美團,所有的交易都是在短期內(nèi)有效。因此,我們必須處理所有建議的“冷啟動”問題。在文章中,我們討論了關(guān)鍵詞在類交易推薦中的作用,實驗表明,我們提出的方法在優(yōu)惠券個性化投放率上優(yōu)于現(xiàn)有的基線方法。

2 研究準備工作

針對不同應(yīng)用推薦系統(tǒng)做了大量的研究,如好友推薦、基于位置的交易推薦、電影推薦、音樂推薦、產(chǎn)品推薦、app推薦[2]。在大多數(shù)情況下,評級信息可以用于推薦,如電影,音樂和產(chǎn)品交易[2]。在我們研究的案例中,優(yōu)惠券交易通常沒有任何評分或評級。因此,我們只能將每一個購買行為視為一個“積極”的行為,而沒有來自用戶的“消極”輸入。

在傳統(tǒng)的推薦應(yīng)用中,被推薦的項目總是可用的,例如電影、音樂和產(chǎn)品,但是優(yōu)惠券交易只在短時間內(nèi)有效。因此,在推薦優(yōu)惠券交易時,從其他人的歷史數(shù)據(jù)中引用交易在這種情況下不是很有用。協(xié)同過濾是最常用的一般項目推薦算法[3]。它計算項目到項目或用戶到項目的相似性,并使用組合相似性值推薦項目。但是我們希望推薦新的優(yōu)惠券交易,而協(xié)同過濾只有在所有交易都已經(jīng)有一些交易時才有效。根據(jù)協(xié)同過濾的公式,只推薦有交易的交易,不推薦沒有交易的新交易。

3 數(shù)據(jù)庫加工分析

我們研究了一組來自在線優(yōu)惠券交易市場的真實交易數(shù)據(jù)。由于這個數(shù)據(jù)源不是公共的,通過校企合作授權(quán)得到,所以只能在文章中列出關(guān)于數(shù)據(jù)集的統(tǒng)計信息。數(shù)據(jù)集的描述如下:

(1) 交易筆數(shù):15萬筆+

(2) 交易數(shù)量:2000+

(3) 交易用戶數(shù):76000+

(4) 至少有3筆交易的用戶數(shù):12000+

交易類別:餐飲、酒店、教育培訓(xùn)、休閑娛樂、旅游。這些類別是手動定義的。表1為這些類別交易的樣本,圖1為交易中的類別分布。

表1 五類交易樣本

圖1 各類交易占比

為了便于理解,表1列出了每種類別的一些類似案例樣本。案例樣本的詳細描述可以在交易網(wǎng)站上中找到。在數(shù)據(jù)集中,我們還對人們是否反復(fù)購買類似的商品進行了研究,例如,反復(fù)購買美食消費。但當我們試圖向用戶推薦交易時,總是面臨 “冷啟動”問題,即我們沒有足夠的交易歷史記錄來處理每天的新交易。因此,我們考慮使用關(guān)鍵詞將新交易與舊交易鏈接起來,并基于交易之間的關(guān)鍵詞映射來執(zhí)行推薦,提出了一種新的基于關(guān)鍵詞關(guān)聯(lián)規(guī)則的推薦算法。

4 算法的解決方案

4.1 關(guān)鍵詞間的關(guān)聯(lián)規(guī)則

傳統(tǒng)的Apriori算法關(guān)注交易之間的關(guān)聯(lián)規(guī)則,例如啤酒和嬰兒尿布一起購買。然而,在我們研究的數(shù)據(jù)集中,由于交易到期非常快,我們的算法不能推薦基于關(guān)聯(lián)規(guī)則的過期交易。因此,我們不是計算交易之間的關(guān)系,而是計算交易描述中的關(guān)鍵詞之間的關(guān)系。我們對交易描述進行預(yù)處理,只保留交易網(wǎng)站中描述的名詞[4]。

算法1計算關(guān)鍵詞關(guān)聯(lián)規(guī)則如下:

(4)將所有關(guān)鍵詞聚合到矩陣M中,每一行就是一個關(guān)鍵詞。所以M是一個R×2矩陣,R> 3 000 000。

(1)

(2)

(9)在160,000多個關(guān)鍵詞supp×conf中選擇值最高的5%。

表2 最常見的關(guān)鍵詞配對組合的例子

表2(續(xù))

我們在表2中選擇了一些具有高支持值和置信度值的典型關(guān)鍵詞組合,其中可以找出一些有趣的行為模式。我們可以把這些結(jié)果解釋為人們購買了一筆描述上有“關(guān)鍵詞1”的交易時他們也傾向于購買另一種帶有“關(guān)鍵詞2”的交易。例如,表2中支持度最高的關(guān)鍵詞組合是{自助餐, 自助餐}。說明:(1)描述中有“自助餐”的交易較多;(2)以前買過自助餐的人傾向于買另一種不同的自助餐。“自助餐”、“晚餐”、“酒店”、“休閑”等詞與“自助餐”一起出現(xiàn)的頻率最高,這意味著購買了這些詞的人將來更傾向于購買自助餐特惠產(chǎn)品。同樣的道理也適用于“醫(yī)療”、“全身”、“面部”、“spa”等,例如,買了全身按摩休閑的人以后會買面部醫(yī)療,這意味著人們會反復(fù)購買美容保健產(chǎn)品。有趣的是,我們發(fā)現(xiàn)不僅是服務(wù)交易(如餐飲、美容),而且一些產(chǎn)品交易,如小米和華為產(chǎn)品也在人們的購買模式中重復(fù)出現(xiàn)。這意味著我們可以向以前購買過同一品牌的顧客推薦優(yōu)惠。鑒于這些發(fā)現(xiàn),我們提出一種基于關(guān)鍵詞關(guān)聯(lián)規(guī)則的推薦算法。

4.2 基于關(guān)鍵詞關(guān)聯(lián)規(guī)則的推薦

我們設(shè)計了一個推薦算法,根據(jù)客戶購買歷史中的交易描述和4.1中計算的關(guān)鍵詞對關(guān)聯(lián)規(guī)則的先前知識,向客戶推薦新的交易。

(3)交易權(quán)重dn的計算方法如下:

(3)

(4)通過除以DT中的最大值amax,將an值歸于[0, 1 ]范圍。

4.3 按銷售數(shù)量列出的推薦

電子商務(wù)網(wǎng)站使用的最簡單和有效的推薦方法是根據(jù)出售的優(yōu)惠券數(shù)量對所有交易進行排序。我們定義為出售的優(yōu)惠券數(shù)量dn∈DT。每筆交易我們除以DT中最大值狻βmax得到正常狻βn值。

我們將關(guān)鍵詞關(guān)聯(lián)規(guī)則中的權(quán)重與銷售數(shù)量結(jié)合起來:

Yn=αn+βn

(4)

并按值向下排序所有交易。從關(guān)鍵詞關(guān)聯(lián)度和整體人氣來看,排名靠前的交易是與用戶最相關(guān)的交易。

4.4 實驗

我們在4.3節(jié)描述的優(yōu)惠券交易數(shù)據(jù)庫中,用基線算法對我們提出的算法進行了實驗測試。對于用戶購買的每一筆交易,我們都將其視為未知交易,并根據(jù)查詢?nèi)掌谥暗馁徺I歷史推薦一份交易列表,看看這樁交易是否屬于我們推薦的交易[6]。如果交易在推薦名單上,我們稱之為成功。在我們的實驗中,我們報告所有交易的點擊率。由于我們的算法依賴于購買歷史,因此我們跳過用戶購買的第一次購買,只推薦從第二次購買開始的交易。很明顯,命中率越高,推薦效果越好。我們還計算了每次點擊的平均排名,rank=1表示用戶實際購買的交易位于推薦列表的頂部[7]。所以較低的平均排名意味著更好的推薦。我們還根據(jù)以下等式計算平均倒數(shù)秩(MRR):

(5)

其中Q是所有熱門交易的集合。很容易看出,MRR值越高,推薦就越好。根據(jù)研究結(jié)果,我們知道,在餐飲、娛樂和旅游交易中,詞語的重復(fù)頻率更高,因為它們大多是服務(wù)交易,而對于產(chǎn)品和旅游交易,詞語不太可能有關(guān)聯(lián)。我們還觀察到,在這個數(shù)據(jù)庫中,人們往往購買同一類別的交易非常頻繁。例如,如果一個顧客購買了一份餐飲套餐,那么他的下一次購買很可能也是餐飲套餐。因此,我們的實驗步驟如下:

(1)對于每個用戶,在查詢?nèi)掌讷@取購買歷史記錄。

(2)如果最后購買的類別是餐飲、健康、活動,根據(jù)公式4推薦交易,否則按n值推薦交易。

(3)計算點擊率、所有點擊率的平均排名和MRR。

我們報告前5名、前10名和前20名推薦的點擊率、平均排名和平均倒數(shù)排名。從圖2、3、4實驗的結(jié)果可以得出,我們提出的關(guān)鍵詞關(guān)聯(lián)的算法在所有實驗中,無論是命中率、平均排名還是平均倒數(shù)排名,都優(yōu)于數(shù)量算法。前5名推薦的點擊率由12.9%提高到13.9%,前10名推薦的點擊率由21.1%提高到21.6%,前20名推薦的點擊率由35.7%提高到36.9%,不同情況的點擊率分別為7.8%、2.4%、3.4%。對于每次命中的平均秩,我們的算法總是有較低的秩,這意味著在所有情況下都有更好的性能。最后,我們還實現(xiàn)了在所有情況下比基線更高的平均倒數(shù)排名,分別為前5名、前10名和前20名的建議增加14.1%、9.3%和11.9%。

將來,我們希望更深入地研究交易,以確定哪些交易更適合使用關(guān)鍵詞關(guān)聯(lián)規(guī)則進行推薦。我們還計劃將關(guān)鍵詞關(guān)聯(lián)規(guī)則集成到協(xié)同過濾算法中,以獲得更好的性能[8]。

5 總結(jié)

文章提出了一種基于關(guān)鍵詞關(guān)聯(lián)規(guī)則的優(yōu)惠券交易推薦新算法,以解決傳統(tǒng)推薦案例中不太明顯的“冷啟動”問題?;谙惹暗陌l(fā)現(xiàn),將該算法應(yīng)用于“餐飲”、“娛樂”和“旅游”交易是很有意義的。關(guān)鍵詞關(guān)聯(lián)規(guī)則被計算出來,并用于計算推薦的每個交易的權(quán)重,權(quán)重以便于為特定用戶量身定制發(fā)放優(yōu)惠券。我們對提出的算法進行了實驗,并與基線銷量算法進行了比較,前5名、前10名和前20名的推薦點擊率得到了明顯改善,發(fā)放優(yōu)惠券時建議推薦按點擊率、平均排名和平均倒數(shù)排名。

猜你喜歡
點擊率優(yōu)惠券餐飲
可怕的餐飲外賣
淘寶直播優(yōu)惠券怎么設(shè)置
制止餐飲浪費,從你我做起
巧用優(yōu)惠券
基于特征工程的視頻點擊率預(yù)測算法
在餐飲外企揮灑精彩人生
海峽姐妹(2017年3期)2017-04-16 03:06:25
送外賣送出的“餐飲淘寶”
山東青年(2016年1期)2016-02-28 14:25:18
喜報!萌寶大賽參賽者660名,投票321657人次,點擊率超60萬!
海峽姐妹(2015年8期)2015-02-27 15:12:30
徹底消失
興趣英語(2013年8期)2013-11-13 06:54:02
《江南STYLE》為何這么火
海外英語(2013年3期)2013-08-27 09:37:01
墨脱县| 大化| 万荣县| 通城县| 万全县| 永平县| 咸宁市| 南涧| 浦江县| 太白县| 曲阜市| 福清市| 林州市| 乐昌市| 福泉市| 盐亭县| 峨眉山市| 马关县| 佛坪县| 红河县| 那曲县| 宁乡县| 正镶白旗| 界首市| 和林格尔县| 大冶市| 奉化市| 麟游县| 南陵县| 犍为县| 宁安市| 鹤庆县| 兴城市| 迁安市| 永修县| 湄潭县| 富蕴县| 兰西县| 巢湖市| 万荣县| 盐山县|