文蒙德欽
互聯(lián)網(wǎng)廣泛運(yùn)用在電子商務(wù)、社交領(lǐng)域和音樂、電影制作領(lǐng)域,但推薦系統(tǒng)在發(fā)展的過程中仍然存在一些問題,比如缺乏預(yù)測的精準(zhǔn)性,也容易存在冷啟動和稀疏性的情況。利用大數(shù)據(jù)技術(shù)可以實現(xiàn)更加高強(qiáng)度和精確性的靈活優(yōu)勢,并且有效的解決推薦系統(tǒng)的各方面問題。本文圍繞著基于大數(shù)據(jù)技術(shù)的推薦系統(tǒng)研究展開論述,希望為有關(guān)工作者提供一些參考和建議。
大數(shù)據(jù)技術(shù)的特征是多方面的,首先它具有較為龐大的數(shù)據(jù)規(guī)模,在大數(shù)據(jù)時代到來的背景之下,大量的數(shù)據(jù)體在數(shù)據(jù)庫之中被存儲,如果有需要可以隨時提取,隨拿隨用。大數(shù)據(jù)的基礎(chǔ)是不同領(lǐng)域的數(shù)據(jù)和資料,不管是社交數(shù)據(jù)還是日常數(shù)據(jù)都可以作為基礎(chǔ)樣本被存儲在空間之中。根據(jù)調(diào)查不難發(fā)現(xiàn),從2018年開始,我國全球數(shù)據(jù)量開始暴漲,并且往后日益有增長的趨勢;其次大數(shù)據(jù)具有多種數(shù)據(jù)類型,在大數(shù)據(jù)時代背景之下信息數(shù)據(jù)不僅僅限于文字信息處理,它的處理介質(zhì)已經(jīng)延伸到了圖形、音頻和視頻等范疇,同時大數(shù)據(jù)技術(shù)具有較快的處理速度,在先進(jìn)科技的引導(dǎo)和支持之下,大數(shù)據(jù)技術(shù)可以在較短的時間之內(nèi)完成數(shù)據(jù)對接和數(shù)據(jù)分析。目前就我國范圍之內(nèi)而言,網(wǎng)絡(luò)信號已經(jīng)遍布大江南北的每一個角落,在網(wǎng)絡(luò)信息的支撐之下,大數(shù)據(jù)技術(shù)可以對各種類型的信息數(shù)據(jù)展開實時傳遞,有效提高傳輸效率。
大數(shù)據(jù)推薦系統(tǒng)的最典型代表便是電子商務(wù)的個性化推薦,它指的是系統(tǒng)可以針對不同消費(fèi)者的個性需求、職業(yè)特征、喜好偏愛提供針對性的推廣服務(wù),電子商務(wù)企業(yè)也可以根據(jù)消費(fèi)者的網(wǎng)上購物習(xí)慣提供專業(yè)化的1對1優(yōu)質(zhì)購物平臺。推薦系統(tǒng)極具個性化特征,首先它的內(nèi)容具有精準(zhǔn)性,可以做好相關(guān)購物信息的精準(zhǔn)投放,電子商務(wù)呈現(xiàn)出個性化發(fā)展已經(jīng)不是一朝一夕的趨勢,以此為代表的電子商務(wù)推薦系統(tǒng),能夠滿足不同消費(fèi)者的廣大需求,還可以展開信息對接,消費(fèi)者就可以向系統(tǒng)提出自主要求,也可以展開服務(wù)評價;其次,電子商務(wù)推薦系統(tǒng)的內(nèi)容呈現(xiàn)出多樣化分布的特征,消費(fèi)者可以結(jié)合自身的不同需求隨意設(shè)置信息,獲取的時間、空間和地點(diǎn)內(nèi)容,電商企業(yè)服務(wù)商可以根據(jù)消費(fèi)者的個人信息反饋提供更加精準(zhǔn)化、更加符合其心意的服務(wù)項目,用戶也可以利用 Email音頻和視頻作為接收介質(zhì)來獲取信息內(nèi)容。這樣看來,以大數(shù)據(jù)為代表的推薦系統(tǒng)可以讓用戶的使用過程突破時間和空間的束縛。除此之外,大數(shù)據(jù)推薦系統(tǒng)還可以體現(xiàn)出智能化的特征,尤其是具有較為突出的交互化智能特點(diǎn),在使用的過程中可以結(jié)合用戶的瀏覽痕跡和瀏覽軌跡展開頻道的刷新和更替,讓用戶掌握更加及時的個性化資料。
大數(shù)據(jù)推薦系統(tǒng)的主要任務(wù)是各種精準(zhǔn)的商品信息推薦,從而進(jìn)行個性化的營銷,其營銷成功的基礎(chǔ)是客戶的資料和數(shù)據(jù)來源準(zhǔn)確,需要針對不同種類的用戶做出不同類型的推薦選擇。比如不同的用戶在注冊初始留下的信息要進(jìn)行判斷,還要對瀏覽記錄展開記憶,對已經(jīng)購買訂單的要進(jìn)行排除,這些抓取原始信息的操作步驟都是展開個性化推薦的基礎(chǔ)和前提。作為大數(shù)據(jù)推薦系統(tǒng)需要主動對用戶種類進(jìn)行區(qū)別和分辨,在用戶信息中進(jìn)一步展開數(shù)據(jù)加工分析。
信息處理和分析功能本身就是大數(shù)據(jù)的拿手好戲,大數(shù)據(jù)推薦系統(tǒng)具備主動推薦功能,同時也具備協(xié)作推薦功能。主動推薦指的是商務(wù)平臺可以主動抓取用戶信息,展開資料分析和處理,對用戶的購買訂單和用戶的需求信息進(jìn)行分析并處理發(fā)布,可以從用戶的搜索引擎中分析用戶的興趣愛好之所在,并且推理出用戶可能的未來需求;協(xié)作推薦指的是根據(jù)不同用戶之間的橫向?qū)Ρ?,找到相似或相同的信息推廣渠道,使這一類的用戶都可以共享信息查詢數(shù)據(jù)結(jié)果。
個性化推薦系統(tǒng)可以在冗余的無規(guī)則的商品信息中進(jìn)行智能化的檢索和篩選,屏蔽或過濾那些確實沒有用的錯誤信息,對那些有價值權(quán)重的信息加以高效利用和價值攫取,展開有針對性、有時效性的商品推廣,自動化的、智能化的把大數(shù)據(jù)變成有規(guī)律的數(shù)據(jù)鏈條,形成內(nèi)在相關(guān)的信息鏈,并且可以選擇較為容易理解的模式推廣給用戶,減少推廣錯誤和無效性。
大數(shù)據(jù)推薦系統(tǒng)可以針對非注冊用戶、新用戶和老用戶,對于不同種類的用戶可以實現(xiàn)不同種類的營銷策略,展開精準(zhǔn)化的數(shù)據(jù)推薦。目前在大數(shù)據(jù)推薦系統(tǒng)的設(shè)計過程中,可以采用BS模式全面提高系統(tǒng)的安全防護(hù)性和用戶隱私信息的保密性,在這種總體邏輯架構(gòu)背景之下,讓客戶端實現(xiàn)簡單的事務(wù)邏輯處理,而較為復(fù)雜的事物邏輯處理可以通過服務(wù)器端口來進(jìn)行,起到節(jié)約成本的實際效果,還能夠減少維護(hù)費(fèi)用。在非注冊用戶進(jìn)行平臺瀏覽之后,個性化和精準(zhǔn)化的大數(shù)據(jù)推薦系統(tǒng)可以根據(jù)用戶的來源和個人信息資料推薦一些具有誘惑性的熱門商品,比如查找用戶搜索的關(guān)鍵詞精準(zhǔn)投放該類商品;對于新注冊平臺的用戶來說,大數(shù)據(jù)推薦系統(tǒng)可以通過用戶的年齡、性別、家庭住址等不同的信息發(fā)掘用戶可能會感興趣的潛在商品進(jìn)行推薦;已經(jīng)經(jīng)常使用該平臺的老用戶,個性化推薦系統(tǒng)可以根據(jù)歷史瀏覽記錄或歷史下單情況,也可以根據(jù)其購買記錄和評價記錄等數(shù)據(jù)展開個性化精準(zhǔn)營銷。
具有個性化的推薦系統(tǒng)重點(diǎn)在于做好數(shù)據(jù)收集和采納,展開數(shù)據(jù)分類和處理,可以將其具體劃分為數(shù)據(jù)源、數(shù)據(jù)清洗、數(shù)據(jù)建模和個性化算法等不同的部分。
首先是數(shù)據(jù)源,不同類型的企業(yè)擁有不同的數(shù)據(jù)源頭,企業(yè)擁有滿足實際需求的不同種類數(shù)據(jù)就可以獨(dú)立進(jìn)行數(shù)據(jù)營銷,不需要在外界尋求支援,但是反觀現(xiàn)狀,我國大多數(shù)中小企業(yè)掌握的數(shù)據(jù)信息流是有限的,甚至是十分狹隘的,需要結(jié)合自身的實際要求通過各種類型的數(shù)據(jù)庫展開類比和對比。數(shù)據(jù)庫之中,數(shù)據(jù)網(wǎng)絡(luò)盤根錯節(jié),有具有結(jié)構(gòu)化的交易數(shù)據(jù)網(wǎng)絡(luò)和業(yè)務(wù)數(shù)據(jù)網(wǎng)絡(luò),同時也有與傳感器相輔相成的半結(jié)構(gòu)化數(shù)據(jù)網(wǎng)絡(luò)。與此同時,數(shù)據(jù)源頭可以反映用戶的特征屬性,也可以反映用戶的不同操作行為,無論是哪種類型的數(shù)據(jù)源頭都要符合數(shù)據(jù)庫的兼容形式。在數(shù)據(jù)庫的來源被確定之后緊接著要展開數(shù)據(jù)采納和收集工作。
其次是數(shù)據(jù)采集。根據(jù)不同種類的分類標(biāo)準(zhǔn)可以將數(shù)據(jù)劃分為各種類型和各種用途,不同的數(shù)據(jù)具有不同的作用,因此有關(guān)企業(yè)在展開數(shù)據(jù)采納和收集之前必須要做好兜底調(diào)查工作。在這一基礎(chǔ)和前提之上,在采集數(shù)據(jù)的過程之中要對不同數(shù)據(jù)種類的自身需求加以明確,做好數(shù)據(jù)規(guī)模的確定和數(shù)據(jù)價格的衡量,與數(shù)據(jù)庫展開端口對接和規(guī)范化接收。
再次是數(shù)據(jù)清洗,在數(shù)據(jù)采集工作完成之后,有關(guān)企業(yè)需要展開數(shù)據(jù)的清洗處理,確保數(shù)據(jù)質(zhì)量合格,安全過關(guān),并且發(fā)現(xiàn)數(shù)據(jù)建設(shè)過程中可能會隱藏的問題,防止出現(xiàn)錯誤或數(shù)據(jù)缺失。這一過程可以采取數(shù)據(jù)格式壓縮或邏輯統(tǒng)一的方式進(jìn)行清洗,在數(shù)據(jù)清洗完成之后可以進(jìn)入到數(shù)據(jù)建模階段。在建模階段,系統(tǒng)設(shè)計者在這一環(huán)節(jié)可以構(gòu)筑相應(yīng)的存放模型,根據(jù)存放規(guī)則或?qū)嶋H要求展開數(shù)據(jù)優(yōu)化或數(shù)據(jù)整合,對數(shù)據(jù)之間的關(guān)系進(jìn)行理清,方便后續(xù)加工。在數(shù)據(jù)建模完成之后在此基礎(chǔ)之上可以展開進(jìn)一步的用戶個性化推薦,具有個性化的核心環(huán)節(jié)是用戶的興趣建模,這一點(diǎn)非常重要,可以通過模型的建筑了解用戶在不同階段的興趣導(dǎo)向,接下來可以進(jìn)行具有個性化的推薦算法,設(shè)計者可以根據(jù)用戶的不同潛在興趣模型展開進(jìn)一步的個性化處理,讓系統(tǒng)能夠精準(zhǔn)判斷出用戶的喜好和偏向。
除此之外還包括用戶交互技術(shù)。在數(shù)據(jù)建模階段完成之后接下來就要展開具有個性化的實際推薦,實際推薦可以通過用戶興趣模型和個性化算法展開相應(yīng)的數(shù)據(jù)測算,了解用戶可能會感興趣的信息模板內(nèi)容并進(jìn)行精準(zhǔn)化的傳送,之后用戶的個性偏好和選擇傾向可以再次作為數(shù)據(jù)需要數(shù)據(jù)庫傳輸,未來也可以作為參照的藍(lán)本打造新型的數(shù)據(jù)庫源頭。
過濾和排名模塊的設(shè)計非常關(guān)鍵,它是由不同的子模塊組成的,每一個不同的子模塊都可以對某些無用的推薦結(jié)果進(jìn)行過濾,并且對其他類型的有價值的推薦結(jié)果進(jìn)行排名。過濾排名模塊包括不同的子模塊,首先是好奇心排名模塊,它的功能是在推薦的商品中對某些用戶已經(jīng)瀏覽過的信息進(jìn)行排除,這些信息通常是用戶已經(jīng)點(diǎn)擊不感興趣或者已經(jīng)購買過的商品信息,其主要的目的是讓客戶能夠快速發(fā)現(xiàn)自己感興趣的潛在商品,提高商品的曝光率,還可以提高用戶的使用頻率,但是好奇心排名模塊不能夠重復(fù)使用,也不能夠經(jīng)常使用,否則效果將不會達(dá)到預(yù)期的程度;其次是豐富性排名模塊,它指的是在推薦系統(tǒng)中覆蓋用戶所有的興趣愛好,并找到與之相對應(yīng)的商品屬性。豐富性排名模塊可以極大限度的滿足用戶的興趣,激發(fā)全新的購買欲望,比如用戶在購買手表之后,可以推薦和手表相互搭配的運(yùn)動衣或襯衫等;除此之外還有整體性排名模塊和點(diǎn)擊反饋模塊,整體性模塊指的是對用戶的推薦結(jié)果進(jìn)行重置和管理,對不同類型用戶的推薦頻率和權(quán)重進(jìn)行定義。點(diǎn)擊反饋模塊指的是用戶在看到結(jié)果的時候可以利用自己的點(diǎn)擊行為建立反饋模型,并且對反饋模型的推薦結(jié)果進(jìn)行自動調(diào)查。
綜上所述,在大數(shù)據(jù)技術(shù)的支持之下推薦系統(tǒng)變得更加游刃有余,可以有效地方便用戶使用。有關(guān)工作者需要加強(qiáng)對推薦系統(tǒng)的個性化研究,提高其性能。