馬宗亞 張會(huì)彥
摘要:通過數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的運(yùn)用,在使用關(guān)聯(lián)算法的基礎(chǔ)上為客戶構(gòu)建虛擬導(dǎo)購。同時(shí),可分析某一熱銷產(chǎn)品捆綁另一產(chǎn)品可被一同購買的幾率為多少。通過對(duì)客戶偏好的商品類別分析和捆綁銷售模式為顧客提供量身定制的服務(wù),同時(shí)將電子商務(wù)平臺(tái)所得利益最大化。本文簡(jiǎn)要介紹了電子商務(wù)推薦系統(tǒng),在積累了前人構(gòu)建挖掘模型的基礎(chǔ)上建立了基于Apriori算法的電子商務(wù)推薦系統(tǒng)。研究關(guān)聯(lián)規(guī)則算法在電子商務(wù)推薦系統(tǒng)中的應(yīng)用,目前,Apriori算法已被廣泛的運(yùn)用到多個(gè)領(lǐng)域,準(zhǔn)確度高、簡(jiǎn)單化等優(yōu)點(diǎn)十分利于機(jī)器記憶與學(xué)習(xí)。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則算法電子商務(wù)推薦系統(tǒng)應(yīng)用
隨著電子商務(wù)(Electronic Commerce)的迅猛發(fā)展,給人們的日常生活帶來了眾多的便利,同時(shí)也給電子商務(wù)能否提供快速高效的服務(wù)帶來了挑戰(zhàn)。電子商務(wù)中配備推薦系統(tǒng)能夠很好地解決這一難題,該系統(tǒng)一經(jīng)推出就收到社會(huì)各界的廣泛關(guān)注。
1.電子商務(wù)推薦系統(tǒng)
電子商務(wù)推薦系統(tǒng)是指通過電商商務(wù)網(wǎng)站向購買者提供相關(guān)的購物建議和商品信息來幫助用戶挑選商品,是一種模擬導(dǎo)購的軟件系統(tǒng)。推薦系統(tǒng)主要有三方面的優(yōu)點(diǎn):第一,可提高網(wǎng)站之間的交叉銷售力度。第二,將網(wǎng)站的瀏覽者挖掘?yàn)橘徫镎?。第三,可大大提升客戶?duì)網(wǎng)站的依存度。這些優(yōu)點(diǎn)可挖掘出客戶的消費(fèi)模式,通過用戶的瀏覽記錄和購買商品趨勢(shì)收集到關(guān)于用戶喜好的大量信息。當(dāng)用戶登入時(shí)會(huì)其他用戶出現(xiàn)類似的消費(fèi)狀態(tài)時(shí)就可提供與此相關(guān)的各類產(chǎn)品。推薦系統(tǒng)主要由數(shù)據(jù)采集、推薦運(yùn)算和運(yùn)算結(jié)果三部分組成。圖1為常規(guī)的推薦系統(tǒng)模型圖。其中,關(guān)聯(lián)算法為電子商務(wù)推薦系統(tǒng)核心的組成部分,可達(dá)到高效運(yùn)算并提供確切的關(guān)聯(lián)規(guī)則的效果,電子商務(wù)推薦系統(tǒng)的成敗就在于關(guān)聯(lián)規(guī)則的確立是否正確。
2.關(guān)聯(lián)規(guī)則算法在電子商務(wù)推薦系統(tǒng)中的應(yīng)用
本文模擬在電子商務(wù)中購買電影票的情景來研究關(guān)聯(lián)規(guī)則在電子商務(wù)推薦系統(tǒng)中的各方面的應(yīng)用。Apriori算法是挖掘關(guān)聯(lián)規(guī)則中較為繁瑣的項(xiàng)集算法,Apriori算法的核心為在候選集與封閉測(cè)試兩部分來分析項(xiàng)集算法。目前Apriori算法已被廣泛的運(yùn)用到多個(gè)領(lǐng)域,尤其是電子商務(wù)中。
2.1關(guān)聯(lián)規(guī)則算法設(shè)計(jì)
2.1.2用戶數(shù)據(jù)準(zhǔn)備
挖掘模型的產(chǎn)生需要大量已存儲(chǔ)的信息和數(shù)據(jù)供挖掘模型記憶。本文挖掘模型采用的是ZhaoHui Tang提供的MovieClick數(shù)據(jù)集完成算法的模擬實(shí)驗(yàn)。在模擬實(shí)驗(yàn)中涉及到Customers(顧客)和Purchase(購買)兩個(gè)表格。Customers所代表的是客戶信息,包括:年齡、性別、受教育水平等狀況。Purchase為事務(wù)表,其中包含了顧客在電子商務(wù)平臺(tái)中購買電影片的列表。
2.1. 2關(guān)聯(lián)規(guī)則算法流程
創(chuàng)建Apriori算法是建立關(guān)聯(lián)挖掘模型的第一步,然后就是挖掘模型的學(xué)習(xí)階段,也成為訓(xùn)練階段。簡(jiǎn)言之,就是通過挖掘算法達(dá)到收集客戶數(shù)據(jù)內(nèi)的知識(shí)。在本文中的情景模擬①準(zhǔn)備了MovieClick的數(shù)據(jù)集樣本,可對(duì)顧客的信息與顧客所購買的電影票之間產(chǎn)生關(guān)聯(lián)模型的學(xué)習(xí),從而形成最終的挖掘模型。挖掘模型組件完成后,它就具備了推測(cè)顧客的購買電影的趨勢(shì),從而來完成電子商務(wù)推薦。具體的關(guān)聯(lián)挖掘模型如圖2所示。
2.2關(guān)聯(lián)規(guī)則算法設(shè)計(jì)結(jié)果與分析
通過對(duì)關(guān)聯(lián)規(guī)則算法的流程模擬來構(gòu)建挖掘模型,可促使電影商品與電子商務(wù)平臺(tái)的發(fā)展與融合。同時(shí),通過應(yīng)用Apriori算法創(chuàng)建的關(guān)聯(lián)挖掘模型發(fā)掘出頻繁的項(xiàng)集從而形成最終的關(guān)聯(lián)規(guī)則。由以挖掘出的關(guān)聯(lián)規(guī)則進(jìn)行探討分析可知其中的大量有價(jià)值的數(shù)據(jù)。例如:在已成規(guī)則中客戶已經(jīng)購買了《加勒比海盜I:黑珍珠號(hào)的詛咒》和《加勒比海盜II:聚魂棺》,那么有近98.5%的幾率會(huì)接著購買《加勒比海盜III:世界的盡頭》和《加勒比海盜Ⅳ:驚濤怪浪》。通過這些規(guī)則我們可從《侏羅記公園》、《速度與激情》、《哈利波特》、《納尼亞傳奇》、《博物館奇妙夜》 等具較強(qiáng)的連續(xù)性的電影,這一系列電影適合捆綁銷售。同時(shí),我們還可以發(fā)現(xiàn)一些喜歡《星河戰(zhàn)隊(duì)》、《諜影重重》、《虎膽龍威》等影片的顧客大部分為男性顧客,這說明《星河戰(zhàn)隊(duì)》、《諜影重重》、《虎膽龍威》等影片更受男顧客的歡迎,同時(shí)可關(guān)聯(lián)到看過《加勒比海盜I:黑珍珠號(hào)的詛咒》和《侏羅記公園》年齡在28~35歲之間,婚姻狀況為已婚,則說明年齡在28~35歲之間看過《加勒比海盜I:黑珍珠號(hào)的詛咒》和《侏羅記公園》電影的顧客有近78%為已婚人士,則可關(guān)聯(lián)電影《速度與激情I》,年齡在32~41歲之間的顧客大部分為中年觀眾。
3.結(jié)語
目前,電子商務(wù)推薦系統(tǒng)中最主要的組成部分為Apriori算法關(guān)聯(lián)挖掘算法的挖掘模型,通過本文的實(shí)驗(yàn)可見,電子商務(wù)推薦系統(tǒng)的設(shè)計(jì)部分需要更多的考慮顧客的個(gè)人需求,促使電子商務(wù)推薦系統(tǒng)智能化、人性化方面發(fā)展。但Apriori算法還存在一些缺陷,容易造成繁瑣的運(yùn)算規(guī)則,因此需要多次的數(shù)據(jù)庫掃描,無形中提高了電子商務(wù)推薦系統(tǒng)運(yùn)行的所消耗的資金。在實(shí)時(shí)的電子商務(wù)在線購物系統(tǒng)中,系統(tǒng)響應(yīng)時(shí)間過長(zhǎng)、整體效率偏低等因素限制了電子商務(wù)推薦系統(tǒng)的運(yùn)算效率,這些問題都是往后研究中的重點(diǎn),只有完成了這些難題的攻克才能從整體上提升電子商務(wù)系統(tǒng)的運(yùn)行效率。
參考文獻(xiàn):
[1] 孫成喜,謝金生.基于Web挖掘的電子商務(wù)推薦系統(tǒng)設(shè)計(jì)[J].甘肅科技縱橫,2011,40(2):20-22,184.
[2] 陳思敏,邢延.一種改進(jìn)的量化關(guān)聯(lián)規(guī)則算法在零售業(yè)中的應(yīng)用[J].電腦編程技巧與維護(hù),2011(6):24-25,34.