司夢楚,張春明
?
服裝智能推薦系統(tǒng)在電子商務(wù)平臺中的應(yīng)用
司夢楚,張春明*
(青島大學(xué) 紡織服裝學(xué)院,山東 青島 266071)
近十年來,中國逐漸進(jìn)入全民網(wǎng)購的電子商務(wù)時代,越來越多的電商平臺和產(chǎn)品領(lǐng)域引用推薦系統(tǒng)提高交易效率。服裝作為電商品類的一大分支,其推薦系統(tǒng)也展現(xiàn)出巨大的商業(yè)潛力和應(yīng)用前景。為進(jìn)一步探索電子商務(wù)中服裝類商品的個性化推薦機(jī)制,本文結(jié)合產(chǎn)品屬性對服裝推薦算法及其應(yīng)用進(jìn)行研究,著重闡釋三種推薦技術(shù)的運(yùn)算步驟及特征,并總結(jié)各個算法的優(yōu)缺點(diǎn)以及目前服裝推薦系統(tǒng)研究中存在的不足,為電商平臺的服裝類產(chǎn)品及品牌營銷提供理論與智能算法依據(jù)。
推薦系統(tǒng);個性化推薦;服裝;電子商務(wù);網(wǎng)絡(luò)營銷;協(xié)同過濾
隨著互聯(lián)網(wǎng)的高速發(fā)展、電子商務(wù)與物流產(chǎn)業(yè)的日益成熟,我國電商行業(yè)的市場規(guī)模也發(fā)生了天翻地覆的變化。早在2010年,淘寶網(wǎng)的在線商品數(shù)已達(dá)到8億。同年首屆雙11,在當(dāng)時網(wǎng)購蔚然成風(fēng)的情況下,仍創(chuàng)造了一天5000萬的銷售額。根據(jù)近五年中國電子商務(wù)研究中心監(jiān)測數(shù)據(jù)顯示,2012到2017年中國電子商務(wù)市場交易規(guī)模翻了近4倍(見圖1),大多數(shù)人對網(wǎng)購已經(jīng)習(xí)以為常。中國網(wǎng)絡(luò)購物用戶規(guī)模也呈直線式增長(如圖2),5年內(nèi)網(wǎng)購用戶規(guī)模翻了一倍,即在中國接近一半人口會使用網(wǎng)購。根據(jù)表1顯示的各年齡消費(fèi)者網(wǎng)絡(luò)購物喜好排行,不難發(fā)現(xiàn)服裝類產(chǎn)品是網(wǎng)購人群的重要占比類。值得注意的是,服裝品類占據(jù)了電商B2C銷售規(guī)模的35%,網(wǎng)購滲透率達(dá)到36.9%。
圖1 2012-2017年中國電子商務(wù)市場交易規(guī)模
圖2 2012-2017年中國網(wǎng)絡(luò)購物用戶規(guī)模
商品種類與數(shù)量爆炸式增長,可想而知消費(fèi)者在選購自己心儀商品時會面臨信息超載的難題。對于類似C2C、B2C電子商務(wù)網(wǎng)站來說,消費(fèi)者想要從海量信息中篩選出自己想要的商品信息不是易事。但對于B2B、C2M類似的電子商務(wù)平臺來說,生產(chǎn)商和經(jīng)營方讓自己廠商的產(chǎn)品引起注意更加困難[2]。“人找信息”的服務(wù)模式已經(jīng)不適用于信息過剩的現(xiàn)代社會,急需一種依據(jù)用戶本人信息與歷史數(shù)據(jù)而自動組織和篩選服務(wù)模式。推薦系統(tǒng)應(yīng)運(yùn)而生,它的做法不止是把消費(fèi)者作為網(wǎng)站內(nèi)容的瀏覽者,同時更是網(wǎng)站內(nèi)容的制造者。目前,像淘寶、京東這類電商平臺已經(jīng)應(yīng)用了簡單的個性化推薦功能,主要是為了實(shí)現(xiàn)商家營銷目的,從消費(fèi)者自身出發(fā)的個性化推薦應(yīng)用少。同時,推薦算法在服裝電商行業(yè)的應(yīng)用規(guī)模還不成熟。
表1 各年齡消費(fèi)者網(wǎng)絡(luò)購物喜好排行[1]
服裝推薦系統(tǒng)是個性化推薦系統(tǒng)應(yīng)用在服裝行業(yè)的個例,利用數(shù)據(jù)挖掘等技術(shù)建立服裝數(shù)據(jù)模型和客戶模型,經(jīng)過數(shù)據(jù)分析,借助電子商務(wù)平臺適時的將與客戶興趣特點(diǎn)匹配的服裝進(jìn)行展示,幫助顧客完成服裝購買過程的協(xié)同機(jī)制[3]。
服裝電商領(lǐng)域的商品推薦主要包括:新款服裝面向大眾化的推薦、熱賣服裝,爆款服裝推薦、商家換季促銷特價服裝推薦和基于用戶瀏覽記錄,歷史購買(評分)記錄和喜好收藏商品的個性化推薦等。服裝作為電商銷售平臺的銷售大類,其推薦系統(tǒng)在推薦原理上與其他商品的推薦類似,但其本身的特殊性,也面臨著諸多挑戰(zhàn),具體表現(xiàn)為:
(1)用戶模型不穩(wěn)定,不易建模。消費(fèi)者對于服裝的喜好會受流行趨勢、地域文化、季節(jié)變化的影響,甚至是受某明星、某文化的一時影響。并且隨著現(xiàn)代生活的豐富,消費(fèi)者也經(jīng)常購買功能性的服裝。這使得系統(tǒng)很難捕捉用戶興趣,建立的用戶模型準(zhǔn)確度低。
(2)與對圖書電影、日用消費(fèi)品和電子類產(chǎn)品的推薦不同,消費(fèi)者在選購服裝產(chǎn)品時會存在求異心理,因此銷量好不能等同于值得推薦。服裝商品的推薦既要符合流行趨勢迎合人們的趨同心理,又要兼顧消費(fèi)者張揚(yáng)個性的求異心理。
(3)推薦系統(tǒng)運(yùn)算量巨大。從以上兩方面不難看出,服裝推薦系統(tǒng)運(yùn)行數(shù)據(jù)繁多,數(shù)據(jù)更新快,計算量大,會導(dǎo)致系統(tǒng)維護(hù)成本高。這也是限制一些中小型企業(yè)和網(wǎng)站投入運(yùn)行該系統(tǒng)的重要原因[4]。
在針對服裝的推薦算法上,國外的研究要早于國內(nèi)。Kudo等通過分析消費(fèi)者的數(shù)據(jù)制定用戶對服裝屬性的決策信息表,并將粗糙集理論應(yīng)用到服裝推薦中(2006)[5]。Lin等在原有研究的基礎(chǔ)上,提出除了用戶偏好之外的需求因素的用戶模型(2012)[6]。Choi等認(rèn)為隱式評級可以成功地替代協(xié)同過濾的顯式評級,而協(xié)同過濾和序列模式分析(SPA)的混合方法比單獨(dú)的評級要好,可為用戶建立更準(zhǔn)確的偏好模型(2012)[7]。Geuens等提出了一個新的決策支持框架,根據(jù)在線二進(jìn)制購買數(shù)據(jù)(稀疏級、采購分配和項(xiàng)目—用戶比率)生成建議,以幫助電商公司選擇最佳的協(xié)同過濾算法(CF)(2018)[8]。
國內(nèi)對于服裝個性化推薦建模問題研究較晚,主要是基于算法的改進(jìn)。吳健春,艾黎,徐兵兵均是用聚類的方法縮小協(xié)同過濾時用戶群的數(shù)量、從而在計算時降低屬性空間的維度,來解決信息過載問題[9-11];齊揚(yáng)關(guān)注了服裝商品的特殊性,將西服的主要特征分為領(lǐng)型、扣子、面料等不同要素,并對這些特征要素抽取分類,最后用BDEU決策樹算法建立用戶類別偏好模型(2010)[12];鄭充林在協(xié)同過濾算法中介入了產(chǎn)品生命周期理論,新算法考慮了時間信息影響的問題,提出了在推薦結(jié)果過程中加入由項(xiàng)目生命周期決定的權(quán)重信息,克服了傳統(tǒng)算法的弊端(2013)[3];陳丹兒等提出的協(xié)同過濾改進(jìn)算法首先將用戶歷史評分?jǐn)?shù)據(jù)映射為用戶偏好,然后使用BP神經(jīng)網(wǎng)絡(luò)建立偏好模型并預(yù)測新項(xiàng)目的評分,形成最近鄰后產(chǎn)生推薦(2015)[13];單毓馥等提出的服裝推薦方法基于AHP層次分析,該方法量化影響顧客選擇主要因素的權(quán)重,通過相似顧客的評分來預(yù)測其他顧客對該服裝的喜好(2016)[4];陳俊虹等調(diào)研用戶搜索時使用的關(guān)鍵詞,開創(chuàng)性構(gòu)建了標(biāo)簽體系,從而提高用戶在購買服裝時的精確度(2017)[2];
針對電子商務(wù)中服裝類商品的個性化推薦問題,國內(nèi)外學(xué)者進(jìn)行了一些研究,其成果多為根據(jù)客戶的瀏覽、點(diǎn)擊、收藏行為等進(jìn)行聚類從而實(shí)現(xiàn)產(chǎn)品推薦。然而,結(jié)合服裝產(chǎn)品特點(diǎn)的智能推薦系統(tǒng)或算法目前卻鮮有文獻(xiàn)報道。本文以電商平臺的服裝智能推薦系統(tǒng)為研究對象,結(jié)合三種推薦方式以及服裝產(chǎn)品種類、款式等提出了新的推薦算法,并對其運(yùn)算步驟及特征進(jìn)行了闡釋。
推薦系統(tǒng)除了解決信息過載的問題,更重要的是激勵用戶去購買新商品。針對于服裝這一類商品,目前主流采用的算法有以下幾種:基于內(nèi)容(Content-based,簡稱CB)、協(xié)同過濾(CollaborativeFiltering,簡稱CF)和混合推薦。
基于內(nèi)容的推薦不依賴用戶對項(xiàng)目的評價,利用歷史瀏覽、點(diǎn)擊、分享、加購和已購買這些項(xiàng)目數(shù)據(jù)來建立用戶偏好模型,再提取項(xiàng)目的內(nèi)容屬性形成特征矩陣,最后對比分析用戶模型與特征矩陣的吻合程度,將相關(guān)系數(shù)高的項(xiàng)目推薦給用戶。因此隨著用戶的瀏覽記錄數(shù)據(jù)的增加,這種推薦一般也會越來越準(zhǔn)確。項(xiàng)目內(nèi)容特征提取、用戶偏好數(shù)據(jù)模型建立和相似度匹配是該推薦模型的三大關(guān)鍵。項(xiàng)目特征的表示一般采用向量空間模型,最常用的是TF-IDF[14](Term Frequency-Inverse Document Frequency)方法,其為項(xiàng)目特征分配權(quán)重的思想如下:
關(guān)鍵詞在文檔中出現(xiàn)的頻率定義為:
(1)
關(guān)鍵詞在項(xiàng)目集中出現(xiàn)的逆向文檔詞頻定義為:
關(guān)鍵詞i在項(xiàng)目文件j中的權(quán)重為:
用戶偏好文檔和項(xiàng)目文檔的余弦相似度為:
利用公式(3)-(4)計算偏好文檔和項(xiàng)目文檔的余弦相似度,算得的相似度越高,表示用戶對該特征越偏好[15]。
比如,在進(jìn)行款式推薦時首先根據(jù)用戶的瀏覽記錄等提取用戶的興趣特點(diǎn)建立用戶模型,然后在服裝數(shù)字模型中尋找與用戶模型匹配度較高的服裝進(jìn)行推薦,其具體的推薦機(jī)制的基本原理如表2所示。假設(shè)有三種類型的用戶A、B、C,表格中的圓點(diǎn)表示該用戶喜歡購買該款式風(fēng)格的服裝。通過匹配用戶興趣模型以及款式的特征矩陣,系統(tǒng)對款式A的特征提取和款式C的類似。對號表示生成推薦,根據(jù)基于內(nèi)容的推薦思想,系統(tǒng)會把款式C推薦給用戶A。
表2 基于內(nèi)容的推薦原理
基于內(nèi)容的推薦有優(yōu)點(diǎn),如:沒有冷啟動問題和稀疏問題;實(shí)現(xiàn)原理簡單、直觀,結(jié)果易于理解,不需要具備專業(yè)行業(yè)知識[15];可以發(fā)現(xiàn)隱藏的“暗信息”,從而推薦新出現(xiàn)和非流行的項(xiàng)目資源。但也有缺點(diǎn),只能適用于資源內(nèi)容比較容易分析的系統(tǒng),對于抽象的內(nèi)容(如視頻、音樂等)會由于缺乏特征提取方法而無法實(shí)施;推薦資源的范圍也會過于狹窄,只能根據(jù)用戶歷史偏好進(jìn)行推薦,不能很好地發(fā)現(xiàn)用戶的新興趣。
協(xié)同過濾推薦算法是應(yīng)用最廣泛也是最成功的算法,它的原理是基于這樣的假設(shè):生活中當(dāng)我們接觸到新問題或購買新產(chǎn)品時,總會向身邊的朋友咨詢建議。它的算法基于三點(diǎn):(1)根據(jù)用戶歷史行為數(shù)據(jù)分析用戶喜好;(2)將具有相似喜好的用戶歸為一類;(3)綜合同類用戶對某項(xiàng)目的評分,預(yù)測目標(biāo)用戶對該項(xiàng)目的喜好程度。對同一用戶群的用戶推薦相似的服裝時,先根據(jù)用戶一項(xiàng)目評分矩陣中的用戶數(shù)據(jù)提取相似用戶,進(jìn)而產(chǎn)生推薦。協(xié)同過濾推薦算法分為基于用戶(User-Based)的協(xié)同過濾推薦和基于項(xiàng)目(Item-Based)的協(xié)同過濾推薦兩種類型。
2.2.1 基于用戶的協(xié)同過濾推薦算法
基于用戶的協(xié)同過濾推薦算法強(qiáng)調(diào)了人與人之間的合作,每個人的行為屬性都在某個特定群體的范圍之內(nèi),相同群體的用戶興趣偏好相似。首先根據(jù)用戶對項(xiàng)目的評價尋找特定群體范圍內(nèi)的最近鄰居集合,根據(jù)最近鄰居集合對某一項(xiàng)目的評分預(yù)測新用戶對該項(xiàng)目的喜好。
分為相似度計算、臨近選擇和產(chǎn)生推薦三步。修正的余弦相似度是衡量用戶間相似性的較好方法,公式見式(5)。
經(jīng)過上面的計算,就可以得到目標(biāo)用戶對所以未評分項(xiàng)目的評分,選擇評分最大的前k個項(xiàng)目推薦給用戶。
基于用戶的協(xié)同過濾算法的基本原理如表3所示。假設(shè)有三種類型的用戶A、B、C,表格中的圓點(diǎn)表示該用戶喜歡購買該類型的服裝。從表格信息可以推斷出,用戶A和用戶C的興趣大致類似,他們都喜歡購買運(yùn)動裝和工裝。表格中的對號表示將西裝推薦給用戶A,因?yàn)橛脩鬉和用戶C興趣類似,用戶C喜歡西裝,則用戶A也可能喜歡西裝。
表3 基于用戶的協(xié)同過濾推薦
2.2.2 基于項(xiàng)目的協(xié)同過濾推薦算法
基于項(xiàng)目的協(xié)同過濾推薦算法將項(xiàng)目的特征屬性放在特定項(xiàng)目的范圍內(nèi),假設(shè)用戶對某一項(xiàng)目有興趣,那與之相似的其他項(xiàng)目也可能引起用戶興趣。根據(jù)用戶一項(xiàng)目評分矩陣中的服裝數(shù)據(jù)來計算服裝之間的相似性,向顧客提供與以前喜歡的服裝相似的服裝。大體思想與基于用戶的推薦類似,唯一區(qū)別在于提取的是項(xiàng)目的相似度。
該算法思想依據(jù)假設(shè)某用戶對某項(xiàng)目產(chǎn)生興趣,那么用戶也會對與之相似的其他項(xiàng)目產(chǎn)生興趣,其基本原理如表4所示。表示假設(shè)有三種類型的用戶A、B、C,表格中的原點(diǎn)表示該用戶喜歡購買該類型的服裝。對于用戶C,根據(jù)所有用戶對某種款式的偏好情況,判斷出喜歡款式1的用戶都喜歡款式3,得出款式1和3相似,繼而推斷出用戶C可能對款式3感興趣。對號P表示系統(tǒng)會將款式3推薦給用戶C。
表4 基于項(xiàng)目的協(xié)同過濾推薦
協(xié)同過濾系統(tǒng)具有以下優(yōu)點(diǎn):可以對內(nèi)容識別困難的商品進(jìn)行項(xiàng)目分析,比如音樂、電影等;有挖掘消費(fèi)者潛在興趣和偏好的能力,新用戶的個性化學(xué)習(xí)過程得以加快。但同時也有難以克服的數(shù)據(jù)稀疏性問題,以及項(xiàng)目、用戶的冷啟動問題。這兩大問題使得相似度計算的結(jié)果與實(shí)際相差甚遠(yuǎn),導(dǎo)致推薦質(zhì)量的下降。隨著用戶與項(xiàng)目數(shù)量的劇增,傳統(tǒng)的算法也將遭遇到嚴(yán)重的擴(kuò)展性問題。
表5 混合推薦的七種類型[18]
每個算法都有一個相對“致命”的缺點(diǎn),混合算法的原理是采取組合策略,使不同的推薦算法“揚(yáng)長避短”?;旌纤惴ㄗ铋_始是作為一種新思想提出的,近幾年有很多學(xué)者針對這一問題進(jìn)行了研究,把理論變?yōu)閷?shí)踐,其中應(yīng)用最多的是把基于內(nèi)容的推薦與協(xié)同過濾算法結(jié)合?,F(xiàn)實(shí)生活中經(jīng)常會用到組合推薦的形式,在組合方式上有加權(quán),變換,混合,特征組合,層疊,特征擴(kuò)充和元級別(見表5)7種組合形式?,F(xiàn)階段,很多針對于推薦算法提高精確度的新突破都是基于混合這一思想。
個性化推薦系統(tǒng)目前在用戶偏好較穩(wěn)定的圖書、音樂、電影等產(chǎn)品領(lǐng)域的應(yīng)用較為成熟,但服裝類產(chǎn)品的智能推薦仍處于摸索階段。導(dǎo)致服裝推薦系統(tǒng)運(yùn)算數(shù)據(jù)巨大且準(zhǔn)確性不高的原因主要有以下幾點(diǎn):(1)消費(fèi)客體易受適用季節(jié)、流行生命周期、使用情境等因素的影響;(2)消費(fèi)主體購買服裝時的動機(jī)、態(tài)度、價值觀、生活方式等心理變量因素較為復(fù)雜:(3)服裝類產(chǎn)品的分類和評價方式更加多元化。
本研究梳理總結(jié)了幾種常見推薦算法在電商平臺服裝類產(chǎn)品智能推薦中的應(yīng)用,著重闡釋了三種推薦算法的運(yùn)行原理,對協(xié)同過濾算法進(jìn)行了優(yōu)化,計算用戶之間的相似度后,采取聚類分析,避免了大量運(yùn)算,為電商平臺的服裝類產(chǎn)品及品牌營銷提供了理論與智能算法依據(jù)?;趦?nèi)容的推薦沒有冷啟動的問題,但無法建立抽象內(nèi)容的特征矩陣,不能發(fā)掘用戶潛在新興趣;作為主流算法的協(xié)同過濾算法,具備推薦新信息,產(chǎn)生新奇推薦的能力。在資源內(nèi)容難以分析的情況下,協(xié)同過濾是很好的選擇。但是當(dāng)用戶評分信息不足10%時,會導(dǎo)致推薦算法性能的下降。還有一種極端的情況,新項(xiàng)目和新用戶都面臨著第一評價的問題(即冷啟動);混合推薦是一種新思想,并沒有具體的算法流程,目的是為了避免和改善單一算法的缺點(diǎn),靈活融合,提高推薦效率。
[1] 唯衣. 2017年消費(fèi)者網(wǎng)購行為分析,服裝穩(wěn)居首位[EB/OL].http://m.sohu.com/a/155530858_154452. 2017-7-8.
[2] 陳俊虹,劉詠梅.基于標(biāo)簽的商務(wù)女裝推薦模型研究[J].浙江紡織服裝職業(yè)技術(shù)學(xué)院報,2017,(4):68-72.
[3] 鄭充林.協(xié)同過濾的服裝推薦算法的改進(jìn)研究[D].上海:東華大學(xué),2013.1-5.
[4] 單毓馥,李丙洋.電子商務(wù)推薦系統(tǒng)中服裝推薦問題研究[J].毛紡科技,2016,(5):66-69.
[5] Kudo Y,Amano S,Seino T,et al.A simple recommendationsystem based on rough set theory[J].KanseiEngineering International,2006,6(3):19-24.
[6] Lin Y C, Kawakita Y, Suzuki E, et al.Personalizedclothing-recommendation system based on a modifiedBayesian network[A]. //2012 IEEE/IPSJ 12th InternationalSymposium on Applications and the Internet[C].IEEE,2012.414-417.
[7] Keunho Choi,DongheeYoo,Gunwoo Kim,et al.A hybrid online-product recommendation system: Combining implicitrating-based collaborative filtering and sequential pattern analysis[J].Electronic commerce research and applications,2012,11(4):309-317.
[8] StijinGeuens,KristofCoussement,Koen W, et al.A framework for configuring collaborative filtering-based recommendations derived from purchase data[J].European journal of operational research,2018,265(1):208-218.
[9] 艾黎.基于商品屬性與用戶聚類的個性化服裝推薦研究[J].現(xiàn)代情報,2015,(9):165-170.
[10]吳健春.基于協(xié)同過濾的服裝電子商務(wù)個性化推薦系統(tǒng)研究與開發(fā)[D].天津:天津工業(yè)大學(xué),2008.26-48.
[11]徐兵兵.基于粗集和模糊聚類的協(xié)同過濾算法[J].浙江紡織服裝職業(yè)技術(shù)學(xué)院學(xué)報,2010,(2):56-60.
[12]齊揚(yáng),朱欣娟.基于數(shù)據(jù)挖掘的服裝推薦系統(tǒng)研究[J].西安工程大學(xué)學(xué)報,2010,(4):438-443.
[13]陳丹兒,應(yīng)玉龍.基于項(xiàng)目屬性和BP神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾推薦[J].信息技術(shù),2015,(3):70-73.
[14]周軍鋒,湯顯,郭景峰.一種優(yōu)化的協(xié)同過濾算法[J].計算機(jī)研究與發(fā)展,2005.41(10):27-35.
[15]何佳知.基于內(nèi)容和協(xié)同過濾的混合算法在推薦系統(tǒng)中的應(yīng)用研究[D].上海:東華大學(xué),2016.8-12.
[16]汪嶺.基于Hadoop的電子商務(wù)推薦系統(tǒng)應(yīng)用研究[D].廣州:廣東工業(yè)大學(xué),2015.8-11.
[17]劉建國,周濤,汪秉宏.個性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,(1):2-7.
[18]鄧仙榮.基于梯度提升回歸算法的O2O推薦模型研究[D].淮南:安徽理工大學(xué),2016. 18-19.
Application of Clothing Intelligent Recommendation System in E-commerce Platform
SI Meng-chu, ZHANG Chun-ming
(College of Textiles and Clothing, Qingdao University, Qingdao Shandong 266071, China)
In order to further explore the personalized recommendation mechanism of clothing products in e-commerce, this paper combines product attributes to study the clothing recommendation algorithm and its application, focuses on the operation steps and characteristics of the three recommended technologies. And at last it has summarized the advantages and disadvantages of each algorithm and the shortcomings of the current clothing recommendation system, and it provides theoretical and intelligent algorithm basis for clothing products and brand marketing of e-commerce platform.
recommendation system; personalized recommendation; clothing; e-commerce; e-marketing; collaborative filtering
張春明(1981-),男,副教授,博士,碩士生導(dǎo)師,研究方向:服裝文化與品牌營銷.
中國博士后科學(xué)基金項(xiàng)目(2018M632624);中國紡織工業(yè)聯(lián)合會高等教育教學(xué)改革項(xiàng)目(2017BKJGX102);青島大學(xué)教學(xué)研究與改革項(xiàng)目(2018).
TS941.2
A
2095-414X(2019)02-0033-06