董敏 王琨
摘 要:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,大數(shù)據(jù)、云計(jì)算和數(shù)據(jù)的深度挖掘等技術(shù)的出現(xiàn),給電子商務(wù)發(fā)展提供了更多的技術(shù)支撐。電子商務(wù)發(fā)展至今,從傳統(tǒng)PC電子商務(wù)平臺(tái)發(fā)展到今天的移動(dòng)電子商務(wù),讓電子商務(wù)這個(gè)領(lǐng)域開(kāi)枝散葉,不斷擴(kuò)展。本文主要是通過(guò)對(duì)電子商務(wù)平臺(tái)中各類(lèi)型數(shù)據(jù)的采集,對(duì)用戶的購(gòu)物行為和對(duì)商品的喜愛(ài)特點(diǎn)進(jìn)行各種行為分析,已達(dá)到對(duì)用戶購(gòu)物行為數(shù)據(jù)的深度挖掘。以此可以理性地開(kāi)展各種形式的電子商務(wù)行為,減少電子商務(wù)活動(dòng)的成本,實(shí)現(xiàn)利益的最大化。
關(guān)鍵詞:電子商務(wù),評(píng)價(jià)數(shù)據(jù),數(shù)據(jù)挖掘,行為分析
伴隨電子商務(wù)在我國(guó)的飛速發(fā)展,各類(lèi)型的數(shù)據(jù)也呈現(xiàn)快速膨脹階段,已經(jīng)達(dá)到海量級(jí)別。在電子商務(wù)平臺(tái)中,用戶在購(gòu)買(mǎi)商品后,大部分會(huì)留下購(gòu)物體驗(yàn)和對(duì)商品使用的感受和心得,這種數(shù)據(jù)稱(chēng)作為了用戶評(píng)價(jià)數(shù)據(jù)。用戶評(píng)價(jià)數(shù)據(jù)很大程度上會(huì)影響用戶對(duì)該商品的購(gòu)買(mǎi)的因素。因此,可以通過(guò)研究用戶評(píng)價(jià)數(shù)據(jù),分析數(shù)據(jù)之間的特點(diǎn),挖掘數(shù)據(jù)的價(jià)值,就可以?xún)?yōu)化商品的不足之處,提高銷(xiāo)售份額。
一、數(shù)據(jù)挖掘在電子商務(wù)中的作用
數(shù)據(jù)挖掘:英文名稱(chēng)為Data Mining,是從海量數(shù)據(jù)中分析出有價(jià)值、有意義、潛在的信息。并根據(jù)分析結(jié)果對(duì)各種決策提供數(shù)據(jù)依據(jù)和技術(shù)上的支撐。如何對(duì)海量數(shù)據(jù)進(jìn)行有效利用,使得用戶能夠從海量數(shù)據(jù)中獲得自己所需要的知識(shí)和信息,提高其各種活動(dòng)的效率和價(jià)值。
在電子商務(wù)領(lǐng)域中,數(shù)據(jù)挖掘其主要的目的就是從互聯(lián)網(wǎng)中獲取大量有關(guān)于電子商務(wù)相關(guān)的數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘手段挖掘出電子商務(wù)活動(dòng)過(guò)程中的潛在價(jià)值的信息,以此來(lái)指導(dǎo)電子商務(wù)營(yíng)銷(xiāo)活動(dòng),其具體的作用如下幾點(diǎn):
1.根據(jù)用戶的瀏覽商品和購(gòu)買(mǎi)商品的記錄,挖掘出用戶線上的活動(dòng)規(guī)律,針對(duì)用戶電子商務(wù)活動(dòng)特點(diǎn),指導(dǎo)電子商務(wù)平臺(tái)用戶提供線上的“個(gè)性化”服務(wù)。
2.通過(guò)對(duì)電子商務(wù)網(wǎng)站用戶瀏覽商品頁(yè)面數(shù)據(jù)的分析,可以幫助電子商務(wù)平臺(tái)挖掘出該商品的潛在用戶。
3.目前對(duì)于線上網(wǎng)站來(lái)說(shuō),主要用戶都來(lái)自于搜索引擎和網(wǎng)站自身導(dǎo)航的引導(dǎo),因此如何優(yōu)化網(wǎng)站內(nèi)部關(guān)鍵字和電子商務(wù)平臺(tái)內(nèi)部導(dǎo)航,以提高網(wǎng)站訪問(wèn)流量和方位商品的精準(zhǔn)度。
4.通過(guò)對(duì)電子商務(wù)平臺(tái)中用戶對(duì)商品評(píng)價(jià)數(shù)據(jù)的挖掘,分析用戶購(gòu)買(mǎi)商品后的情感分析,可以更深層次的挖掘用戶的具體需求。
5.通過(guò)平臺(tái)Web數(shù)據(jù)的挖掘,可以分析出一定的網(wǎng)站威脅、欺詐、入侵和很多異常訪問(wèn)行為等。因此通過(guò)大數(shù)據(jù)挖掘分析,可以有效預(yù)防網(wǎng)絡(luò)危機(jī),構(gòu)建出一個(gè)安全、和諧的網(wǎng)絡(luò)環(huán)境。
隨著大數(shù)據(jù)的廣泛應(yīng)用,數(shù)據(jù)挖掘?qū)τ陔娮由虅?wù)的發(fā)展也起著很大影響,利用數(shù)據(jù)挖掘技術(shù),可以有效的提高用戶訪問(wèn)數(shù)量,優(yōu)化網(wǎng)站訪問(wèn)效率,挖掘潛在用戶、優(yōu)化出售商品性能和提高網(wǎng)站安全環(huán)境等級(jí)等作用。
二、電子商務(wù)用戶評(píng)價(jià)數(shù)據(jù)挖掘技術(shù)研究
1.電子商務(wù)數(shù)據(jù)挖掘的過(guò)程
數(shù)據(jù)挖掘作為大數(shù)據(jù)的重要發(fā)展方向之一,其主要的目的是挖掘潛在用戶,服務(wù)于用戶,為用戶提供定制化的個(gè)性服務(wù)。在電子商務(wù)活動(dòng)中,數(shù)據(jù)挖掘的服務(wù)對(duì)象是在線上的所有用戶,本文主要是研究用戶在電子商務(wù)平臺(tái)中各種對(duì)評(píng)價(jià)數(shù)據(jù),包括了對(duì)商品評(píng)價(jià),物流評(píng)價(jià)和售后評(píng)價(jià)等各個(gè)方面。
在電子商務(wù)活動(dòng)中,數(shù)據(jù)挖掘的一般過(guò)程分為三個(gè)方面:
(1)數(shù)據(jù)準(zhǔn)備階段,在該階段主要是對(duì)數(shù)據(jù)進(jìn)行采集、數(shù)據(jù)的預(yù)處理。數(shù)據(jù)采集,采用主題性爬蟲(chóng)進(jìn)行,通過(guò)對(duì)電子商務(wù)平臺(tái)的結(jié)果進(jìn)行分析,采用面向電子商務(wù)網(wǎng)站的主題網(wǎng)站爬蟲(chóng)。同時(shí)利用云計(jì)算平臺(tái)的高計(jì)算能力、高寬帶量、大吞吐能力等有點(diǎn),將網(wǎng)站爬蟲(chóng)部署到云計(jì)算平臺(tái)中,采取并行技術(shù),可以大大提高數(shù)據(jù)采集的效率,同時(shí)也可以提高數(shù)據(jù)采集的主題性。
將原始數(shù)據(jù)采集存放到數(shù)據(jù)庫(kù)后,接下來(lái)就是進(jìn)行數(shù)據(jù)的預(yù)處理階段。數(shù)據(jù)的預(yù)處理就是通過(guò)消除噪聲、計(jì)算缺值數(shù)據(jù)、數(shù)據(jù)去重,最終將數(shù)據(jù)轉(zhuǎn)換成離散型數(shù)據(jù)的過(guò)程。
(2)數(shù)據(jù)挖掘階段,對(duì)于采集和預(yù)處理后的數(shù)據(jù),首先要確定是數(shù)據(jù)挖掘目標(biāo)和類(lèi)型。在確定挖掘具體的任務(wù)后,可以采用相應(yīng)的數(shù)據(jù)挖掘算法進(jìn)行數(shù)據(jù)的挖掘,具體的算法接下來(lái)會(huì)詳細(xì)介紹數(shù)據(jù)挖掘的主要算法。經(jīng)過(guò)數(shù)據(jù)挖掘過(guò)程后,會(huì)對(duì)挖掘的結(jié)果保存到數(shù)據(jù)庫(kù)后,以便于接下來(lái)的處理。
(3)第三個(gè)階段是對(duì)挖掘的數(shù)據(jù)結(jié)果進(jìn)行評(píng)價(jià),在該階段主要是對(duì)發(fā)現(xiàn)的知識(shí),經(jīng)過(guò)量化評(píng)估后,對(duì)存在冗余的知識(shí)點(diǎn)和與挖掘目標(biāo)任務(wù)無(wú)關(guān)的知識(shí)點(diǎn)進(jìn)行清洗。其次就是對(duì)挖掘結(jié)果不完全滿足的數(shù)據(jù)進(jìn)行重新挖掘,可以選擇其他數(shù)據(jù)挖掘算法進(jìn)行。對(duì)于滿足用戶需求的挖掘結(jié)果數(shù)據(jù),經(jīng)過(guò)可視化處理后,提供個(gè)用戶進(jìn)行使用。
以上即是數(shù)據(jù)挖掘的三個(gè)主要階段,可以看出,數(shù)據(jù)在挖掘過(guò)程中,會(huì)出現(xiàn)挖掘不理想的情況,因此就需要調(diào)整挖掘算法進(jìn)行反復(fù)挖掘,直到對(duì)挖掘目標(biāo)任務(wù)滿足為止,同時(shí)保存挖掘不完整的過(guò)程,逐步的完善挖掘算法的自我學(xué)習(xí)和深度挖掘的能力,最終完成用戶所提出的挖掘需求。
2.電子商務(wù)數(shù)據(jù)挖掘算法介紹
數(shù)據(jù)挖掘算法是實(shí)現(xiàn)數(shù)據(jù)挖掘的關(guān)鍵性技術(shù),采取哪種數(shù)據(jù)挖掘算法會(huì)直接影響到數(shù)據(jù)挖掘的效果,以下即是介紹幾種常見(jiàn)的數(shù)據(jù)挖掘算法:
(1)聚類(lèi)挖掘算法,聚類(lèi)分析是一種典型的統(tǒng)計(jì)學(xué)方法,是一種同數(shù)據(jù)庫(kù)技術(shù)相結(jié)合形成的現(xiàn)代化數(shù)據(jù)挖掘最為常用的技術(shù)之一。其主要的思想是在給定的是一個(gè)初始化數(shù)據(jù)集中,搜索數(shù)據(jù)對(duì)象之間是否存在有價(jià)值聯(lián)系。在電子商務(wù)活動(dòng)中,可以利用聚類(lèi)分析算法來(lái)發(fā)現(xiàn)客戶群中不同特點(diǎn)的群組,從而針對(duì)不同的特征群組來(lái)優(yōu)化商品上下架、推廣的時(shí)間和位置,已提高商品銷(xiāo)售量。
(2)關(guān)聯(lián)規(guī)則分析法,該算法是比較基本的數(shù)據(jù)挖掘算法,其主要的思想是通過(guò)大量的數(shù)據(jù)來(lái)提取有用的數(shù)據(jù),通過(guò)提出對(duì)提取數(shù)據(jù)和過(guò)去數(shù)據(jù)進(jìn)行比較,找出數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)性,從而發(fā)現(xiàn)其潛在的關(guān)系。該算法可以幫助許多商務(wù)決策的制定,為商務(wù)活動(dòng)的決策提供可靠的數(shù)據(jù)依據(jù)。
(3)時(shí)間序列模式,該數(shù)據(jù)挖掘的主要思想是,通過(guò)發(fā)現(xiàn)按時(shí)間順序查看時(shí)間事件數(shù)據(jù)庫(kù),從數(shù)據(jù)中找出一個(gè)或多個(gè)相似的時(shí)序事件,通過(guò)時(shí)間序列搜索出重復(fù)發(fā)生概率較高的一種挖掘模式。發(fā)現(xiàn)序列模式便于進(jìn)行電子商務(wù)組織預(yù)測(cè)客戶的查找模式,從而對(duì)客戶進(jìn)行針對(duì)性的服務(wù)。在時(shí)序模式中,一個(gè)重要影響的方法是相似時(shí)序。
(4)預(yù)測(cè)與評(píng)價(jià),該方法與關(guān)聯(lián)規(guī)則分析法有一定的相似性,都是對(duì)歷史數(shù)據(jù)進(jìn)行綜合分析和歸納,從而推理出數(shù)據(jù)分布的時(shí)效性和規(guī)律性。從而對(duì)未來(lái)事件發(fā)展的趨勢(shì)和結(jié)果進(jìn)行預(yù)測(cè)和評(píng)估。
3.數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用
(1)建立電子商務(wù)推薦系統(tǒng),數(shù)據(jù)挖掘應(yīng)用于電子商務(wù)其最大的一個(gè)特點(diǎn)就是可以圍繞客戶為中心,為客戶提供個(gè)性化服務(wù)。因此可以根據(jù)客戶的喜好和不同的特征,可以建立其一個(gè)基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)。可以通過(guò)該系統(tǒng)為客戶提供與其感興趣的商品,幫助客戶快速找到所需要的商品,把電子商務(wù)由被動(dòng)變?yōu)橹鲃?dòng)。
(2)優(yōu)化商品的營(yíng)銷(xiāo)策略,通過(guò)對(duì)用戶對(duì)電子商務(wù)平臺(tái)Web頁(yè)面的訪問(wèn),采集用戶各類(lèi)評(píng)價(jià)數(shù)據(jù),進(jìn)行挖掘分析??梢猿浞至私庥脩粼谑褂蒙唐泛蟮恼媲懈惺?,從而優(yōu)化商品營(yíng)銷(xiāo)的策略。針對(duì)不同的產(chǎn)品進(jìn)行制定不同的營(yíng)銷(xiāo)策略,利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)不同的產(chǎn)品優(yōu)惠、各類(lèi)型促銷(xiāo)活動(dòng)的策略方針,實(shí)現(xiàn)商品銷(xiāo)售利潤(rùn)的最大化。
(3)優(yōu)化平臺(tái)網(wǎng)站結(jié)構(gòu),增強(qiáng)平臺(tái)的安全性,對(duì)于電子商務(wù)平臺(tái)來(lái)說(shuō),其方位的數(shù)據(jù)量和網(wǎng)站本身的安全性,是有個(gè)至關(guān)重要的運(yùn)營(yíng)因素。有很多方法可以很好的實(shí)現(xiàn),但是數(shù)據(jù)挖掘可以通過(guò)客戶本身的擁塞和訪問(wèn)平臺(tái)的性能,來(lái)提示平臺(tái)管理者加以改進(jìn)平臺(tái)的各項(xiàng)訪問(wèn)策略。比如網(wǎng)站的緩存策略、網(wǎng)絡(luò)傳輸策略、流量負(fù)載平衡機(jī)制和數(shù)據(jù)的分布策略等。同時(shí)還可以有效防止非法人員惡意訪問(wèn)平臺(tái),消除平臺(tái)的弱點(diǎn),提高站點(diǎn)可靠性,保證平臺(tái)的正常運(yùn)行。
4.客戶滿意度分析機(jī)制,對(duì)于客戶滿意度的調(diào)查,可以通過(guò)各類(lèi)型調(diào)查問(wèn)卷來(lái)進(jìn)行,但是這種方法最大的缺點(diǎn)就是被動(dòng),其效果與客戶填寫(xiě)資料的主觀性有著很大的影響。因此可以采取數(shù)據(jù)挖掘的方式來(lái)進(jìn)行,通過(guò)采集和挖掘用戶對(duì)商品、物流和客服的評(píng)價(jià)信息,進(jìn)行情感分析實(shí)現(xiàn)主動(dòng)式的客戶滿意度分析機(jī)制。這種分析機(jī)制可以主動(dòng)、準(zhǔn)確且客觀的分析出客戶對(duì)商品、物流公司和銷(xiāo)售服務(wù)的各項(xiàng)調(diào)查數(shù)據(jù),為改進(jìn)平臺(tái)的營(yíng)銷(xiāo)策略提供可靠的決策依據(jù)。
三、總結(jié)
通過(guò)數(shù)據(jù)挖掘技術(shù),對(duì)目前電子商務(wù)提出一個(gè)更為深刻的課題,打破了傳統(tǒng)的電子商務(wù)線上操作模式。對(duì)客戶的行為進(jìn)行深度的分析,為其提供更為有效、更為精準(zhǔn)的商品服務(wù),提供技術(shù)和數(shù)據(jù)上支撐,這也是今后一段時(shí)間內(nèi)電子商務(wù)發(fā)展的一個(gè)重要方向。
參考文獻(xiàn):
[1]蔣良孝,蔡之華.電子商務(wù)中的數(shù)據(jù)挖掘及其應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2003,6(24),74-75.
[2]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘--從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015,04:1-24.
[3]李雪菁.基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)客戶關(guān)系管理[J].計(jì)算機(jī)與數(shù)字工程,2018.
[4]易新忠.數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用探析[J].現(xiàn)代經(jīng)濟(jì)信息,2018,13.
[5]劉芬.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)及其應(yīng)用探究[J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2018,06.
[6]史紅霞.淺談數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用期[J].計(jì)算機(jī)產(chǎn)品與流通,2018,04.