摘要:本文通過大數(shù)據(jù)技術(shù)的應用能夠從海量的數(shù)據(jù)信息中挖掘出有價值的信息,并實現(xiàn)對信息發(fā)展趨勢的預測。在進行數(shù)據(jù)挖掘時,主要從數(shù)據(jù)清理、數(shù)據(jù)集成以及數(shù)據(jù)選擇等方面進行。為了加強大數(shù)據(jù)技術(shù)在電商平臺中的應用,促進電商平臺更好的發(fā)展,需要從用戶畫像探究與差異化服務、信用評估及消費者管理、聯(lián)系智能設施,推薦個性化應用方案三個方面進行。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);電商平臺;數(shù)據(jù)挖掘
隨著現(xiàn)代社會發(fā)展步伐的不斷加快,社會整體經(jīng)濟水平進一步提升,移動智能終端設備、無線傳感器等設備被廣泛應用,這些設施無時無刻都在產(chǎn)生海量的數(shù)據(jù),于此同時物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等又對這些數(shù)據(jù)進行收集和轉(zhuǎn)發(fā),互聯(lián)網(wǎng)服務全天不停歇的對這些龐大的數(shù)據(jù)信息進行處理與交互。大數(shù)據(jù)時代,通過對海量數(shù)據(jù)資源進行挖掘,發(fā)現(xiàn)其中的價值和規(guī)律,對其充分利用就能夠?qū)崿F(xiàn)利益的增長,換言之數(shù)據(jù)即價值。相關(guān)研究數(shù)據(jù)表明,當企業(yè)對數(shù)據(jù)資源的利用率增加5%,就能夠為企業(yè)帶來大約18%的利潤增長,企業(yè)的技術(shù)開發(fā)方式也從應用驅(qū)動方式發(fā)展為數(shù)據(jù)驅(qū)動方式。大數(shù)據(jù)在現(xiàn)代社會中的影響力越來越大,已經(jīng)成為了眾多領域共同研究的目標,在電商平臺建設中的作用也越來越顯著。
大數(shù)據(jù)概念涵蓋了技術(shù)與商業(yè)兩個方面,從技術(shù)角度來看,基于Hadoop集群的分布式存儲以及計算機系統(tǒng),實現(xiàn)了數(shù)據(jù)儲存以及計算水平可以滿足高量級數(shù)據(jù)需求;從商業(yè)角度來看,依托于大數(shù)據(jù)核心技術(shù)探索電子商務運營過程中出現(xiàn)的結(jié)構(gòu)化以及半結(jié)構(gòu)化數(shù)據(jù),挖掘出數(shù)據(jù)信息的隱藏價值,尋找出其中的規(guī)律,為企業(yè)決策的制定提供支持,也能夠促進精準營銷、差異化服務的發(fā)展,優(yōu)化電商平臺盈利體系[1]。
1 大數(shù)據(jù)技術(shù)
大數(shù)據(jù)應用的根本目的不僅僅是為了實現(xiàn)高量級數(shù)據(jù)信息的計算,而是希望從龐大的數(shù)據(jù)資源中提取出有價值的信息。數(shù)據(jù)提取與挖掘是指從龐大數(shù)據(jù)資源中提取出有應用價值的數(shù)據(jù)信息的有趣過程。通常情況下,在進行數(shù)據(jù)挖掘時,選取的數(shù)據(jù)源主要為數(shù)據(jù)倉庫、Web等[2]。其中,數(shù)據(jù)倉庫是專門為數(shù)據(jù)提取和挖掘提供服務的,實際上是一個面向主題的、集成化程度高的、時刻變化的、穩(wěn)定性好的數(shù)據(jù)集合,進而在管理人員制定決策過程中給予很好的幫助。從本質(zhì)上來看,可以將數(shù)據(jù)庫系統(tǒng)劃分為兩個部分,即聯(lián)機數(shù)據(jù)處理(OLTP)系統(tǒng)以及聯(lián)機分析處理(OLAP)系統(tǒng),兩種系統(tǒng)在面向?qū)ο蟆⒂猛?、?nèi)容、設計、視圖以及訪問模式等方面都具有明顯的不同[3],具體如表1所示。值得注意的是,數(shù)據(jù)庫應用的是聯(lián)機數(shù)據(jù)處理系統(tǒng),數(shù)據(jù)倉庫應用的是聯(lián)機分析處理系統(tǒng)。
上述部分對數(shù)據(jù)挖掘的概念進行了講解,接下來將重點闡述數(shù)據(jù)挖掘的主要流程。
1.1 數(shù)據(jù)挖掘主要流程
數(shù)據(jù)挖掘是實現(xiàn)從龐大數(shù)據(jù)信息中提取出有價值信息的系統(tǒng)性過程。要實現(xiàn)對數(shù)據(jù)信息的挖掘,一般需要經(jīng)過數(shù)據(jù)清理、數(shù)據(jù)集成以及數(shù)據(jù)選擇等途徑,數(shù)據(jù)挖掘的具體工作流程如圖1所示。
在數(shù)據(jù)挖掘過程中,數(shù)據(jù)清理的主要作用是為了降低噪聲以及消除不相同的區(qū)域;數(shù)據(jù)集成是將各種類型不相同的數(shù)據(jù)源整合起來;數(shù)據(jù)選擇是依照具體的要求從龐大數(shù)據(jù)信息中選擇目標數(shù)據(jù);數(shù)據(jù)轉(zhuǎn)化及離散化是依托于匯總等操作方法,完成對數(shù)據(jù)的統(tǒng)一性以及離散性操作,使得所有的數(shù)據(jù)信息都轉(zhuǎn)化成適宜數(shù)據(jù)挖掘的格式[4]。一般來說,主要基于最大最小、z-score等手段實現(xiàn)數(shù)據(jù)資源的統(tǒng)一化,之后依托于直方圖、概念分層等方式完成對數(shù)據(jù)資源的離散化處理[5]。模式發(fā)現(xiàn)主要是通過數(shù)據(jù)分析算法開展數(shù)據(jù)提取與分析操作,并從中獲取各個數(shù)據(jù)資源之間的關(guān)系模式。當下主流的模式涵蓋了頻繁模式、聚類分析以及離散點分析等。模式評估實際上是對模式發(fā)現(xiàn)的衡量,是利用實際的數(shù)據(jù)信息來查看發(fā)現(xiàn)模式的準確性,評估模式推理能否達到規(guī)定的標準。知識發(fā)現(xiàn)是指在完成模式評估以后,從中獲得的知識。
1.2 數(shù)據(jù)分析方法
在進行數(shù)據(jù)挖掘操作時,模式發(fā)現(xiàn)是最為關(guān)鍵的一個環(huán)節(jié),在面對各種類型的模式時應當要選擇與之相匹配的數(shù)據(jù)分析算法?,F(xiàn)階段,應用較為常見的數(shù)據(jù)挖掘方式主要有頻繁模式、關(guān)聯(lián)與相關(guān)性挖掘模式,在這種模式下一般使用的主流算法是Apriori算法[6]。分類與回歸模式的操作對象是已經(jīng)明確類別的數(shù)據(jù)集,并從其中探索到數(shù)據(jù)類型劃分的特征模型,并確保該模型可以很好的預測未知數(shù)據(jù)目標的類別。當下主要采用的分類方式有決策樹、遺傳算法以及神經(jīng)網(wǎng)絡等。聚類分析方法中需要進行分析的所有數(shù)據(jù)目標,初始時期并沒有任何的分類標記,之后依托于聚類算法實現(xiàn)數(shù)據(jù)信息的分類。在進行數(shù)據(jù)分組過程中,需要嚴格按照類內(nèi)最大相似度、類間最小相似度的原則進行[7]。如圖2所示為聚類分析示意圖,基于兩點之間的歐式距離為聚類標準,將各點自動劃分成三個部分。
2 大數(shù)據(jù)技術(shù)在電商平臺的應用
伴隨著云計算、物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,大數(shù)據(jù)在電商平臺上的應用越來越深入、越來越廣泛,電商企業(yè)的發(fā)展方式逐漸從以往依靠產(chǎn)品類型多種多樣、產(chǎn)品數(shù)量大、用戶基數(shù)積累等轉(zhuǎn)變到數(shù)據(jù)驅(qū)動,這也成為了現(xiàn)代電商企業(yè)業(yè)績增長的重要途徑。通常情況下,大數(shù)據(jù)在電商領域的應用主要體現(xiàn)在以下幾個方面,分別是用戶畫像探究、精準營銷、差異化服務以及互聯(lián)網(wǎng)金融等。
2.1 用戶畫像探究與差異化服務
用戶畫像探究是電商平臺面向消費者開展數(shù)據(jù)分析與數(shù)據(jù)應用最直接、最有效的方法,主流的畫像分析項目涵蓋了消費者的消費行為及需求畫像、消費者消費習慣畫像、消費者方位畫像。消費者在各個電商平臺上進行瀏覽商品信息時,會產(chǎn)生大量的數(shù)據(jù)信息,可以對消費者的這些信息進行分析,從而構(gòu)建出各種用戶畫像,比如說消費者在首次登陸注冊賬號填寫的各項信息、商品購買記錄、歷史瀏覽記錄、方位信息、支付方式以及銀行賬號信息等,同時更加構(gòu)建各種用戶畫像對消費者進行分類,為不同類別、不同層次的消費者提供差異化服務。比如說,針對中年消費群體,這部分人有著較強的原始積累,一般資金比較充足、消費能力比較高,再根據(jù)消費者的具體情況為其推送相對應的基金、黃金等理財產(chǎn)品。
2.2 信用評估及消費者管理
在電商平臺上無時無刻不在產(chǎn)生大量的數(shù)據(jù)信息,這些海量的數(shù)據(jù)中包含了大量的消費者個人信息,利用大數(shù)據(jù)分析技術(shù),結(jié)合構(gòu)建的各種用戶畫像,可以將消費者按照特定原則劃分為兩個類別,分別是一般消費者群以及重要消費者群,同時對各個群的用戶進行信譽度評估,構(gòu)建信譽度等級。此外,依托于消費者管理,對各個消費者建立正確的認知,并以此為基礎為消費者提供高效、有用的產(chǎn)品與服務[8]。比如說通過大數(shù)據(jù)分析技術(shù),能夠得知許多消費者在購買基金理財產(chǎn)品以后,還有很大概率會購買保險產(chǎn)品,為此,電商平臺可以對這部分消費者的消費行為、習慣以及特征進行提取和分析,為其提供與之相匹配的差異化的產(chǎn)品方案。
2.3 聯(lián)系智能設施,推薦個性化應用方案
現(xiàn)如今,物聯(lián)網(wǎng)、移動智能終端設備快速發(fā)展,智能家居、智慧城市以及智慧校園建設等持續(xù)進行,能夠在此基礎上為消費者提供個性化的應用方案。比如說在國家電網(wǎng)電商平臺上,能夠依托物聯(lián)網(wǎng)、智能家居對消費者的用電習慣、用電時間段以及用電總量等進行記錄,將這些數(shù)據(jù)信息導入到大數(shù)據(jù)平臺上,實現(xiàn)數(shù)據(jù)信息的共享,進行用電費用計算以及消費者畫像分析,同時根據(jù)每個消費者的用電情況,為消費者推薦適宜的用電方案,既能夠降低消費者用電成本,也可以緩解供電壓力。此外,依托于移動智能終端設備、智能電表等都能夠加強消費者與企業(yè)、消費者與消費者之間的數(shù)據(jù)信息交互。
3 結(jié)語
電商大數(shù)據(jù)是一個具有海量數(shù)據(jù)資源的產(chǎn)業(yè)平臺,通過對交易數(shù)據(jù)以及各種數(shù)據(jù)信息進行分析和提取,必然能夠為其它關(guān)聯(lián)產(chǎn)業(yè)帶來新的發(fā)展機遇,將來大數(shù)據(jù)技術(shù)的進一步應用也會推動企業(yè)向更高層次發(fā)展。在基于大數(shù)據(jù)為企業(yè)和消費者帶來便利的同時,也需要加強企業(yè)與消費者的信息安全,避免信息被不法分子所竊取,確保信息管理的安全性與高效性。
參考文獻
[1]徐國虎,孫凌.基于大數(shù)據(jù)技術(shù)的線上線下電商用戶數(shù)據(jù)挖掘流程分析[J].中國集體經(jīng)濟,2012 (30):187-188.
[2]于志濤,韋文杰.大數(shù)據(jù)時代傳統(tǒng)出版企業(yè)與電商平臺的融合策略研究 以青島出版集團為例[J].科技與出版,2015 (09):29-32.
[3]李家華.基于大數(shù)據(jù)的人工智能跨境電商導購平臺信息個性化推薦算法[J].科學技術(shù)與工程,2019,19 (14):280-285.
[4]鄧志超.基于大數(shù)據(jù)的跨境電商平臺選品分析策略[J].特區(qū)經(jīng)濟,2019 (06):135-137.
[5]陳文行.大數(shù)據(jù)背景下電商平臺信息分享策略研究[J].商業(yè)經(jīng)濟研究,2019 (01):83-85.
[6]謝海英,趙嬌潔.大數(shù)據(jù)背景下我國跨境電商發(fā)展創(chuàng)新路徑研究[J].價值工程,2019,38 (32):145-146.
[7]吳閩真,大數(shù)據(jù)時代我國跨境電商發(fā)展現(xiàn)狀及路徑創(chuàng)新[J].科技經(jīng)濟導刊,2019,27 (36):232.
[8]莫川川.大數(shù)據(jù)技術(shù)在跨境電商領域中的應用研究[J].湖北開放職業(yè)學院學報,2020,33 (01):120-121+12 6.
作者簡介
王秋實(1984-),湖北省老河口市人。碩士學位,講師,工程師。研究方向為職業(yè)教育管理、計算機應用。