張?zhí)m
摘要:電子商務(wù)行業(yè)由于互聯(lián)網(wǎng)技術(shù)的提高也得以迅速發(fā)展,但電子商務(wù)平臺(tái)也面臨處理大量數(shù)據(jù)的要求,而云計(jì)算的出現(xiàn)使電子商務(wù)得到新的發(fā)展,筆者為提高電子商務(wù)大數(shù)據(jù)處理的效率,探討了基于云計(jì)算的電子商務(wù)數(shù)據(jù)緩存處理的方法。
關(guān)鍵詞:電子商務(wù)數(shù)據(jù);數(shù)據(jù)緩存;云計(jì)算
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)23-0249-02
1 引言
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種數(shù)據(jù)迅速膨脹,現(xiàn)已呈現(xiàn)出爆炸性增長趨勢,大數(shù)據(jù)的影響已滲透到社會(huì)的各個(gè)層面。尤其在電子商務(wù)領(lǐng)域中,隨著大數(shù)據(jù)的到來,而今已步入基于數(shù)據(jù)的時(shí)代。
電子商務(wù)大數(shù)據(jù)伴隨著消費(fèi)者和企業(yè)的行為實(shí)時(shí)產(chǎn)生,而且電子商務(wù)數(shù)據(jù)類型種類很多,既包含消費(fèi)者交易信息、消費(fèi)者基本信息、消費(fèi)者評價(jià)信息、消費(fèi)者搜索瀏覽行為信息、消費(fèi)者的所處地理位置信息,同時(shí)還有企業(yè)的產(chǎn)品信息與交易信息等。
而如何管理這些大量信息,將對電子商務(wù)的發(fā)展起著至關(guān)重要的影響,當(dāng)前流行的數(shù)據(jù)管理技術(shù)是云計(jì)算技術(shù),它能夠很好地解決電子商務(wù)面臨的數(shù)據(jù)管理問題。
2 電子商務(wù)數(shù)據(jù)的特點(diǎn)
電子商務(wù)數(shù)據(jù)主要有以下特點(diǎn):
(1)電子商務(wù)數(shù)據(jù)類型多種多樣。數(shù)據(jù)類型可分為:以消費(fèi)者基本信息、交易信息、訂單信息、物流信息等結(jié)構(gòu)化的數(shù)據(jù);以網(wǎng)頁數(shù)據(jù)、商品圖片及對應(yīng)的商品文本描述的小文件;以網(wǎng)絡(luò)日志、視頻文件、備份數(shù)據(jù)及索引文件等大文件。而這種非結(jié)構(gòu)化的數(shù)據(jù)使得信息更復(fù)雜的、更多樣性,與之相伴的是對數(shù)據(jù)管理增加了難度。
(2)交易數(shù)據(jù)量大。艾瑞咨詢統(tǒng)計(jì)數(shù)據(jù)顯示,2015Q3中國電子商務(wù)市場整體交易規(guī)模為3.93萬億元,同比增長17.3%?,環(huán)比增長4.8%。中國中小企業(yè)B2B運(yùn)營商平臺(tái)營收規(guī)模為51.4億元,同比增長3.0%。以阿里巴巴為例,根據(jù)阿里巴巴旗下淘寶網(wǎng)的數(shù)據(jù)顯示,每天活躍數(shù)據(jù)量已經(jīng)超過50TB。企業(yè)與用戶雙方買賣的交易信息,客戶大量搜索、瀏覽、評價(jià)行為信息已構(gòu)成了淘寶網(wǎng)的數(shù)據(jù)產(chǎn)生來源。所以電子商務(wù)數(shù)據(jù)管理面臨的最突出問題就是海量數(shù)據(jù)。
(3)圖片數(shù)據(jù)。企業(yè)采用圖片是為了能更好地展示商品,這些圖片不能重復(fù)使用的,這就產(chǎn)生了大量的圖片數(shù)據(jù)。
(4)重復(fù)數(shù)據(jù)。在同一個(gè)商店中,有很多頁面不同,但是css、swf等文件可能相同,甚至可能存在不同商店的這些文件也是相同的,所以網(wǎng)站中包含了重復(fù)的html、css、script、swf文件數(shù)據(jù)。
3 云計(jì)算的相關(guān)技術(shù)
3.1 云計(jì)算概述
云計(jì)算是多種技術(shù)深入發(fā)展和融合的產(chǎn)物,即是分布式計(jì)算、并行計(jì)算及網(wǎng)絡(luò)計(jì)算的融合,是一種新興的商業(yè)計(jì)算模式,它將計(jì)算從用戶終端集中到“云端”,通過互聯(lián)網(wǎng)連接在一起的計(jì)算機(jī)終端設(shè)備虛擬為一個(gè)整體,實(shí)現(xiàn)邏輯上的連接,其采用動(dòng)態(tài)的、可擴(kuò)充的、經(jīng)過虛擬化的方式處理資源及進(jìn)行計(jì)算,其強(qiáng)大的存儲(chǔ)及交互能力大大提高。
3.2 分布式存儲(chǔ)
分布式存儲(chǔ)技術(shù)是云計(jì)算的一個(gè)核心技術(shù)之一。是解決海量數(shù)據(jù)存儲(chǔ)和快速處理問題的一種技術(shù),在信息量爆炸的今天,這一點(diǎn)至關(guān)重要。其分布式的架構(gòu)可以讓多達(dá)百萬臺(tái)的廉價(jià)計(jì)算機(jī)協(xié)同工作,將數(shù)據(jù)存儲(chǔ)在不同的物理設(shè)備中。分布式存儲(chǔ)不同于傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ),傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)是將所有數(shù)據(jù)存放在集中的存儲(chǔ)服務(wù)器中,這種存儲(chǔ)方式使得服務(wù)器存儲(chǔ)負(fù)荷過重,存儲(chǔ)服務(wù)器成為系統(tǒng)性能的瓶頸,難以解決大規(guī)模存儲(chǔ)的需要。而分布式網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),數(shù)據(jù)分散存儲(chǔ)在多臺(tái)存儲(chǔ)服務(wù)器中,分擔(dān)存儲(chǔ)負(fù)荷,這種存儲(chǔ)方式提高了系統(tǒng)的可靠性和可用性,能夠快速響應(yīng)用戶需求的變化,提高存取速度。
3.3 memcached
許多web應(yīng)用將數(shù)據(jù)保存在關(guān)系型數(shù)據(jù)管理系統(tǒng)中,應(yīng)用服務(wù)器從中讀取數(shù)據(jù)并在瀏覽器中顯示。但隨著電子商務(wù)平臺(tái)數(shù)據(jù)量的增大,用戶集中訪問平臺(tái),以致出現(xiàn)數(shù)據(jù)庫負(fù)擔(dān)加重、響應(yīng)惡化、網(wǎng)站顯示延遲等現(xiàn)象。memcached用于動(dòng)態(tài)web應(yīng)用以減輕數(shù)據(jù)庫負(fù)載,需要被緩存的對象或數(shù)據(jù)以key/value對的形式保存在服務(wù)器端,每個(gè)被緩存的對象或數(shù)據(jù)都有唯一的標(biāo)識符key,存取操作通過這個(gè)key進(jìn)行。保存到Memcached中的對象或數(shù)據(jù)放置在內(nèi)存中,并不會(huì)作為文件存儲(chǔ)在磁盤上,所以存取速度非??臁Mㄟ^在內(nèi)存中緩存數(shù)據(jù)和對象減少讀取數(shù)據(jù)庫的次數(shù),從而提高動(dòng)態(tài)、數(shù)據(jù)庫驅(qū)動(dòng)網(wǎng)站的速度。
4 電子商務(wù)數(shù)據(jù)緩存處理技術(shù)
4.1 電子商務(wù)數(shù)據(jù)邏輯模型
電子商務(wù)網(wǎng)站信息組織主要涉及兩個(gè)層次,第一層次:以html文件、CSS文件、腳本為主的網(wǎng)頁數(shù)據(jù);以動(dòng)畫文件、圖片文件、視頻文件為主的超媒體數(shù)據(jù);以索引文件、日志文件為主的文件數(shù)據(jù);以用戶的信息、訂單等為主的數(shù)據(jù)庫數(shù)據(jù)。第二層次是對第一層次數(shù)據(jù)的再組織,對應(yīng)于商品目錄和搜索引擎接口,以幫助用戶更快地找到合適的搜索引擎、目錄指南或指示數(shù)據(jù)庫等。圖1為電子商務(wù)數(shù)據(jù)邏輯圖。
4.2 前端頁面緩存
在WEB 服務(wù)器的前端增加反向服務(wù)器代理,作為WEB 服務(wù)器的內(nèi)容緩存區(qū)。因?yàn)殡娮由虅?wù)網(wǎng)站中有大量的網(wǎng)頁數(shù)據(jù),如html、圖片及script語言,當(dāng)用戶提出訪問請求時(shí),首先將用戶請求送到的前端頁面緩存,如果在代理服務(wù)器上有用戶請求的緩沖內(nèi)容,代理服務(wù)器直接將緩沖內(nèi)容發(fā)送給用戶。如果代理服務(wù)器沒有用戶請求的緩沖內(nèi)容,則先向WEB服務(wù)器發(fā)出請求,取回?cái)?shù)據(jù)后先本地緩存再發(fā)送給用戶。這樣 用戶請求將被發(fā)送到反向代理服務(wù)器,由反向代理服務(wù)器負(fù)責(zé)處理用戶的請求與應(yīng)答、與后臺(tái) WEB 服務(wù)器交互,這種方式減少了向WEB服務(wù)器的請求數(shù),因而降低了WEB服務(wù)器的負(fù)載,提高了訪問速度。其結(jié)構(gòu)圖如2。
4.3 頁面片段緩存
在電子商務(wù)網(wǎng)站中,在同一個(gè)商店中,有很多頁面不同,但是css、swf、script等文件可能相同,甚至可能存在不同商店的這些文件也是相同的,這是一個(gè)重復(fù)利用的問題,在這種情況下,下載頁面只需要刷新部分頁面即可。ESI技術(shù)可以很好地解決了這一問題,它是一種基于XML的標(biāo)記語言,使其用來做動(dòng)態(tài)頁面中相對靜態(tài)的片段部分的緩存,可以通過ESI標(biāo)記,區(qū)分出頁面的靜態(tài)部分和需要?jiǎng)討B(tài)更新的頁面片段,最后組裝在一起顯示。
4.4 緩存層與數(shù)據(jù)庫結(jié)合
在電子商務(wù)網(wǎng)站中,對于熱點(diǎn)資源是要頻繁查詢數(shù)據(jù)庫,使用memcached緩存技術(shù)與mysql磁盤數(shù)據(jù)庫相結(jié)合可以解決數(shù)據(jù)庫的壓力。memcached服務(wù)器作為數(shù)據(jù)庫的前端,其中存放用戶經(jīng)常訪問的熱點(diǎn)資源,如用戶查詢熱點(diǎn)問題已存在,則將相應(yīng)的數(shù)據(jù)直接取出找對象給用戶,如果不存在,則查詢mysql數(shù)據(jù)庫,在結(jié)果返回給用戶的同時(shí),并以key相應(yīng)的value值形式將查詢結(jié)果同步到memcached緩存服務(wù)器。如圖3所示。
5 結(jié)束語
本文首先介紹了電子商務(wù)大數(shù)據(jù)的發(fā)展概況,分析了電子商務(wù)數(shù)據(jù)的特點(diǎn)及數(shù)據(jù)邏輯模型,闡述了解決電子商務(wù)大規(guī)模數(shù)據(jù)處理的云計(jì)算的相關(guān)技術(shù),提出了基于云計(jì)算技術(shù)電子商務(wù)數(shù)據(jù)組織過程中數(shù)據(jù)緩存的方法。
參考文獻(xiàn):
[1] 米仁沙·艾尼. 云計(jì)算在電子商務(wù)中的應(yīng)用研究[J].電腦知識與技術(shù),2015(12).
[2] 白亞魯.云計(jì)算環(huán)境下大規(guī)模數(shù)據(jù)處理的研究[J].軟件,2013(5):128-129.
[3] 王振.基于Hadoop的大數(shù)據(jù)處理關(guān)鍵技術(shù)研究[M].南京郵電大學(xué),2014(2)
[4] 董旭. 數(shù)據(jù)庫集群技術(shù)淺析[J].郵電設(shè)計(jì)技術(shù),2012(10).