劉齊平,楊 平
(1.湖北經濟學院 信息管理學院,武漢 430205;2.湖北大學歷史文化學院,武漢 430062)
隨著互聯(lián)網的發(fā)展,用戶的“信息過載”問題日益嚴峻,因此幫助用戶快速發(fā)現(xiàn)其可能感興趣信息的個性化推薦系統(tǒng)已經成為互聯(lián)網應用的“標配”。然而,在洶涌而來的大數據之中,能夠很好反映用戶需求、偏好和關切的用戶評論和消息數據卻未能得到主流的個性化推薦系統(tǒng)的充分利用。以互聯(lián)網餐飲服務為例,目前已有的搜索和推薦系統(tǒng)主要基于價格、銷量、評分、地理位置等明確的結構化數據,而忽略了用戶在頁面上貢獻的大量充滿了強烈偏好信息的非結構化評論數據,未能將其轉化為精準有效的用戶偏好和商戶特征信息;另一方面,想要找到符合自己口味餐廳的用戶經常要花上大量的時間來閱讀、比較不同餐廳的其他用戶評價,在這個復雜費力的過程中往往陷入“選擇困難癥”,導致潛在消費意愿的流失。
在大數據時代,用戶生成內容越來越多,尤其是O2O平臺上的用戶體驗評論數據非常多,作為平臺如何利用好這些數據給用戶做精準推薦,給商戶提供餐飲改進建議,做好對用戶體驗、商戶價值的服務工作有較大的實踐意義。如果能將用戶評論數據轉化為比用戶購買數據更精準的用戶偏好、比用戶評分更全面的多維度評分,就能為用戶進行更加個性化的推薦,也能為平臺和商戶提供更加及時的產品反饋。一方面,平臺可以通過用戶評論動態(tài)地分析用戶的偏好,為用戶量身推薦最符合其需求的商戶,節(jié)省用戶搜尋成本,提高訂單轉化率;另一方面,平臺可以通過對商戶的評論動態(tài)地獲取商戶的屬性評分,為商戶匹配適合的目標用戶群,并為產品和服務的開發(fā)和改進提供參考借鑒。
對用戶評論的已有情報學研究可以分為以下幾類:
第一種通過對評論進行一般的統(tǒng)計分析研究用戶需求、用戶體驗及其改進策略等,例如公共圖書館[1][2]、酒店[3][4]、知識直播產品[5]、虛擬學術社區(qū)[6]、共享經濟平臺[7]等。
第二種通過對用戶評論進行情感分析構建基于用戶偏好的推薦模型,例如電影[8][9]、圖書[10]、手游[11]、飲食[12]、旅游景點[13]。此外,微博等[14]、視頻彈幕[15]等類似于用戶評論的文本也有基于情感分析的研究。
第三種通過對產品評論進行情感分析得到產品屬性評分并構建基于物品屬性的推薦模型,如SUV車型的汽車外觀設計推薦[16]、電商產品特征詞典[17]等。
第四種Turney最早提出了一種基于評論情感極性的無監(jiān)督學習推薦方法[18],開了同類研究的先河。同時對用戶評論和產品評論進行情感分析,通過對用戶偏好和物品屬性進行匹配構建聯(lián)合推薦模型,如電影推薦[19]、新聞推薦[20]、電視節(jié)目推薦[21]等。王安寧和張強等[22]認為網絡評論與物聯(lián)網產品數據的聯(lián)合分析將為商務智能帶來新的生機。
本文的思路接近于上述最后一種類型,可以看成一種通過對基于標簽的用戶畫像和產品畫像進行匹配的推薦策略。用戶畫像(user profile)是一種根據用戶的目標、行為和觀點的差異,將其區(qū)分為不同類型分組(user grouping),進而構造人物原型(personas)的過程,可以簡單概括為“用戶信息標簽化”。類似地,產品畫像(product profile)也可以簡單概括為“產品信息標簽化”。在現(xiàn)有文獻中,基于用戶畫像的個性化推薦方法出現(xiàn)不多,基于產品畫像的就更少。在早期的推薦系統(tǒng)研究中,有部分學者采用了用戶分組或用戶建模(user modeling)方法[23]-[25]。在近期研究中,僅有Li、Deng 等[26]和Gao 等[27]通過構建用戶畫像或用戶標簽進行推薦服務。
綜觀已有文獻,我們發(fā)現(xiàn)目前主流的推薦策略還是基于結構化的數據的協(xié)同過濾推薦算法,多采用通用的訓練集數據檢驗算法的有效性,而未能充分利用網絡用戶主動生成的大量非結構化的真實評論文本數據;即使利用了用戶評論數據,現(xiàn)有研究也大多沒有同時針對用戶偏好和物品屬性進行情感分析,更沒有由此構建出用戶畫像和產品畫像并進行匹配推薦。
本文通過對用戶評論數據的文本挖掘,計算在不同屬性維度上的用戶關注權重和商戶情感詞評分,然后加權求和得到商戶綜合評分,從而給出個性化的推薦結果。以大眾點評網餐飲門戶為例,本文提出了一種結合了個性化分析(用戶通過自己的評論顯示出的個人偏好)和大眾智慧(不同用戶對商戶的眾多評論)的較為合理的推薦策略,將有效提升網絡平臺的服務質量和用戶體驗。一方面,通過對特定用戶和商戶的評論文本的挖掘獲取用戶偏好(關注權重)和商戶特征(各屬性的情感分析結果),綜合計算得出推薦指數,并依據推薦指數排序進行推薦。另一方面,通過問卷調查收集受訪者對不同商戶屬性的關注度及閱讀評論后對商戶的選擇,以證實用戶偏好、商戶屬性與用戶選擇之間的相關性,從而驗證本文推薦策略的有效性。本文研究思路如圖1所示。
圖1 研究思路流程圖
評論文本涉及商品或服務的眾多屬性,任何商品或服務都是內容、形式和價值的結合產物。筆者運用文本挖掘工具ROST CM6的網站抓取功能對大眾點評網美食領域的用戶和商戶的相關評論進行采集,并處理采集到的文本數據,分析總結5類評論屬性的具體內涵,如表1所示。
表1 評論對象庫類別表
情感詞是挖掘評述中商戶屬性大眾認可度的依據,本文先使用自然語言處理技術和相關工具軟件對文本數據做預處理,再對語料做句法關系拆解得到詞料,分別給詞料標注詞性,最后匹配識別句子中的評論屬性和其情感詞,具體步驟如下:
1.數據處理與分析。首先利用文本挖掘工具ROST CM6 對采集到的文本數據進行預處理,比如篩選語句、分詞、去停用詞、清洗等步驟,得到預處理語料。根據語料挖掘出情感詞與評價屬性的句法依賴關系,主要有兩種,分別是主謂句式和定中句式,如表2所示。
表2 句法依賴關系表
導入ROST CM6文本分析功能,再對待挖掘數據進行預處理,得到表2中所示的分詞后詞料。
2.提取標注詞。本文利用中文句法分析器Stanford Parser 作為文本挖掘工具,對預處理語料做“抽絲剝繭”,識別出句子中的評價特征詞。Stanford Parser 的句法分析器先將分詞后的語料賦予詞性標注,如表3所示。
表3 詞性標注表
在表3中,主謂句式和定中句式結構的中心詞都是名詞,一般為評價屬性,而主謂式中的謂語和定中結構中的定語一般為情感詞,詞性多為形容詞和動詞。句法分析器Stanford Parser將句子處理成樹狀結構,如圖2所示,在句法樹中,為信息抽取程序設定如下規(guī)則:
圖2 句法樹示意圖
(1)遍歷句法樹中的所有葉子節(jié)點,尋找到被標注為常用名詞或固有名詞的節(jié)點,判斷這些節(jié)點的內容是否屬于評論屬性。
(2)當找到評論屬性相關的葉子節(jié)點時,尋找該節(jié)點的父節(jié)點下的所有兄弟節(jié)點。
(3)如果兄弟節(jié)點中有動詞短語節(jié)點或表語形容詞節(jié)點,提取其中的表語形容詞短語或者動詞短語節(jié)點下的表語形容詞或動詞。
在圖2中,句法分析器遍歷句法樹中的所有葉子節(jié)點,尋找到兩個標注常用名詞的節(jié)點,并與評論屬性庫對照,判斷它們(“菜品”“環(huán)境”)屬于評論屬性。隨后找到它們的父節(jié)點下的兄弟節(jié)點,即動詞短語,并提取各兄弟節(jié)點的子節(jié)點形容詞,分別是“好看”和“漂亮”,與“菜品”和“環(huán)境”相對應,最后生成評論屬性與情感特征的詞對表。
情感分析的目的是分析用戶的情感傾向,情感傾向可分成正向、負向和中性。推薦策略中,中性情感傾向往往基本沒有指導意義,故本文不將中性情感詞做為研究參考的數據。筆者對處理后文本語料進行情感極性匹配,得到各個評論屬性的正、負向情感詞頻數,作為推薦指數中商戶畫像的數字依據,具體步驟如下:
1.構建情感詞典。知網提供了4個方面的情感詞典,包括評價(正向、負向)、情感(正向、負向)、主張、程度級別。本文使用知網HowNet情感(正向、負向)詞典。[28]
2.挖掘情感傾向程度。利用Jupyter Notebook應用程序和Python編程語言,基于情感詞典對提取各個評論屬性對應的正負向情感詞做詞頻統(tǒng)計,部分代碼如下所示:
筆者研究的推薦策略主要涉及兩方面信息。一方面,每個用戶所表達的評論,體現(xiàn)出此用戶選擇商戶時關注的主要屬性。利用每個屬性占所有統(tǒng)計詞頻的百分比作為推薦指數計算的權重因式Wi。另一方面,某一個商戶的大量用戶評論客觀上體現(xiàn)出大眾對此商戶提供的商品或服務的印象,即大眾對該商戶各個屬性的認可度。采集并統(tǒng)計評論屬性對應的正負向情感詞的數量,進而將大眾智慧量化表示出商戶畫像。
公式(1)中,R是推薦指數的量化結果,i代表餐飲商戶的某個評論屬性,m是評論屬性的個數,Wi指評論屬性的用戶關注權重(用戶偏好程度),pi代表第i個評論屬性包含的正向評論的數量,而ni表示第i個評論屬性包含的負向評論數量。pi與ni的值差表示情感詞的綜合極性程度,pi與ni的和代表有效情感詞總數。由公式(1)可知,當用戶偏好(關注熱點)與商戶畫像分量化計算得到的因式值均較高,即產生積極共鳴時,推薦指數較高。
1.樣本選取。大眾點評網作為國內規(guī)模較大的第三方消費評價網站,不僅用戶數量多、商戶覆蓋率高,而且用戶活躍度高、商戶評論數量較多。因此,本文選擇大眾點評網的評論數據作為研究對象。
(1)先選取大眾點評網美食領域中評價數量排名靠前且具有代表性的三家餐飲商戶。DX海鮮點心酒家(簡稱DX酒家)的評價數量排名第一,且菜品種類豐富,兼具主食、菜品、甜點、飲品和小吃;QJ排名第二,為蛋糕西點美食商戶,美食種類較為單一,代表性欠佳;XS砂鍋排名第三,美食種類較為齊全;QY咖啡排名第四,僅為飲品商戶,不作為研究樣本,繼而選取其后的XC洋風料理(簡稱XC料理)。
(2)再使用簡單隨機抽樣的方法選取三位用戶。從隨機數表中的一位數、二位數、三位數和四位數中分別隨機取出100個數字,再從400個數字中隨機選出3個數字。根據選出的隨機數,依次在三家商戶的評論列表中查找到對應序號的評論用戶,作為用戶樣本對象。
2.用戶的評論數據采集與處理。
(1)首先通過八爪魚數據采集器爬取三個用戶對餐飲商戶的評論文本。選取的三位用戶中:用戶“梅花鹿”發(fā)表了美食評論47篇,用戶“愛醬”發(fā)表72篇,用戶“尋味”發(fā)表80篇。
(2)使用文本挖掘工具ROST CM6和“Jieba”中文分詞庫[29]對評論文本分詞。
(3)再使用文本挖掘工具ROST CM6的功能并導入大連理工大學的中文停用詞表[15]對分詞后的數據清洗和詞頻分析,導出前300位詞頻。
(4)最后根據評論屬性庫,與詞頻數據一一匹配,統(tǒng)計各用戶評論中屬性詞的詞頻和占比,如表4所示,作為用戶關注偏好的數字依據。
表4 用戶評論的詞頻統(tǒng)計表
3.用戶的評論數據分析。由表4的統(tǒng)計數據可知,三位用戶的關注點具有一定的共性,都把“食品質量”作為較為關注的屬性,而屬性“交通地段”都給予了較少關注。而存在明顯差異的地方有:用戶“愛醬”對于屬性“服務體驗”給予了高度的關注,用戶“尋味”給予了屬性“就餐環(huán)境”較高的關注。總之,用戶對于餐飲商戶選擇時,既有共同關注點,也有用戶個性層面的興趣偏好。
4.商戶的評論數據采集與處理。
(1)在分析完個人用戶的關注點后,分別對選取的三位商戶的500 條近期評論文本數據進行采集和預處理。
(2)把分句、分詞、清洗后的語料列表數據和情感詞典導入Jupyter Notebook 程序,并將兩者進行逐一匹配,記錄每個評論屬性匹配到的正、負向情感詞,最后匯總詞頻數,統(tǒng)計結果如圖3所示。
圖3 情感分析示意圖
5.商戶的評論數據分析。從圖3所反映出的信息可知,商戶“DX酒家”的屬性“服務體驗”負向情感詞頻數遠多于正向情感詞,翻看文本數據發(fā)現(xiàn),主要原因是商戶“排隊時間長,上菜慢,催上菜回應不及時”等。商戶“XC料理”的屬性“食品價格”的負向情感詞頻數稍多于正向詞頻數。分析數據發(fā)現(xiàn),主要原因是“同類型菜品,價格比其他商家稍貴”。除這兩點外,其余均為正向詞多于負向詞,其中的差異則為正向詞頻數占總情感詞頻數的比例大小,代表商戶畫像里大眾認可程度的高低。
繼續(xù)觀察圖3發(fā)現(xiàn),商戶“DX酒家”的“食品價格”屬性在三家商戶中的大眾認可度最高。調查發(fā)現(xiàn),三家商戶中,商戶“DX酒家”的人均消費最低,與實際情況相符。而其5個屬性中,“交通地段”的正向詞占比最大,可能與“位于武漢八號線地鐵附近”和在“漢街步行街里,離杜莎夫人蠟像館等景點距離近”等因素有關。商戶“XS砂鍋”的屬性“服務體驗”在其所有屬性的正向情感詞占比中最高,翻閱評論可知主要原因有“服務員反應迅速,中途會幫忙加熱湯”等,而屬性“交通地段”在三家商戶里情感正向詞占比最低,翻閱評論發(fā)現(xiàn)“附近停車位真的是很難找”等原因。商戶“XC料理”的屬性“就餐環(huán)境”在三家商戶中的大眾認可度最高,翻閱相關評論發(fā)現(xiàn)與“居酒屋裝修,日式風格,很舒服”等因素有關。
將“梅花鹿”等3位用戶的關注偏好量化值和“DX酒家”等3家商戶評論中的大眾認可度量化值帶入上文中的公式(1)),計算求得每個商戶對應每個用戶的推薦指標,如表5所示。
表5 用戶-商戶推薦指數計算表
由表5可知,商戶“DX酒家”對三位用戶的推薦指數均為墊底。回顧三位用戶的關注共性:食品質量,而“DX酒家”的評論中此屬性的計算結果排第三。故在推薦指數計算中,三位用戶都較高程度關注的屬性,卻得到最小的計算收益。
此外需要指出的是,全部計算結果中,商戶“XC料理”對應用戶“尋味”的推薦指數最高。觀察數據發(fā)現(xiàn),雖然其評論里的食品價格情感值為-0.065,但用戶“尋味”對該屬性的關注權重僅有0.045,即計算過程中,乘式運算獲得了最小損失。此用戶在屬性“食品質量”“就餐環(huán)境”“服務體驗”上的關注權重較為均勻,均在0.3附近,同時商戶“XC料理”在這三個屬性上的情感分析值也均在0.5-0.8之間,故這三個共同較高的權重都獲得了較大的計算收益。
本文研究的推薦策略有兩個主要影響因素,一是公式(1)中的關注權重Wi,它由用戶評論中的屬性名詞的詞頻比重決定;二是公式(1)中的第二個因子,它是商戶評論中屬性詞對應的正、負情感詞頻數按照一定規(guī)則計算出的結果。此因式會產生兩種情感共鳴類型,如果因式值為正數,則為積極情感共鳴,否則為消極情感共鳴。
關注權重和情感詞計算兩者共同影響推薦指數,關注權重來自用戶畫像,情感詞分析來源于商戶畫像,其中任何一方的高低并不能直接說明推薦指數的結果??梢?,推薦策略是兩因素綜合考慮的有機結合。
1.問卷調查。為了評測推薦策略的有效性,筆者設計了一份調查問卷,并通過網絡途徑發(fā)布,收集受訪者的關注點與網絡平臺中商戶評論畫像之間的關系數據。調查的內容有兩方面:一方面,了解受訪者選擇餐飲商戶時對商戶各個屬性的關注程度,即發(fā)掘受訪者的偏好;另一方面,問卷摘錄數家大眾點評網美食領域的三家商戶的數個文本評論,供受訪者閱讀,閱讀評論后根據自身感受勾選心儀商戶。回收問卷101份,篩選出有效問卷,過濾掉無效問卷。在檢查收集到的問卷時,發(fā)現(xiàn)有數個問卷的完成所用的時間僅有幾秒,而此次問卷涉及文段閱讀,有理由懷疑這部分受訪者沒有完整閱讀評論文本信息,故作無效問卷處理。在問卷數據的統(tǒng)計過程中,筆者發(fā)現(xiàn)有受訪者對于所有屬性的關注程度的填選均為“不關注”,既不符合實際情況,也不滿足研究需要,故認定為無效問卷。經篩選和過濾,過濾掉12份無效問卷,保留89份問卷。
具體過程如下:首先,統(tǒng)計每個受訪者對五個商戶屬性的關注分值,并計算出每個受訪者對應的每個關注點的權重,即某個關注分值除以總分值。其次根據問卷上商戶的文本評論數據挖掘出商戶畫像,即商戶屬性的情感分析結果。最后帶入推薦指數計算公式中,分別計算出商戶-受訪者對應的推薦指數,摘錄部分計算結果如表6所示。表6中節(jié)選的部分數據顯示商戶B的推薦價值最大,結合商戶B的畫像特點和受訪者的關注情況可發(fā)現(xiàn):受訪者對“食品價格”和“食品質量”的關注普遍較高,同時對交通地段的關注較低;商戶A和商戶C在價格和質量兩個屬性上有所欠缺,情感值計算為負值;而商戶B這兩項屬性的計算取值均為正數,“交通地段”的情感值為負。參考本文推薦算法實驗結果,問卷調查與其不謀而合。前后兩次分析的共同點是用戶較為關注的,商戶屬性同時被大眾認可的程度較明確,此時推薦策略呈現(xiàn)熱反應。
表6 問卷數據整理表(摘錄)
參考此結果可縮減推薦策略的處理流程,提高推薦效率。推薦模型在計算出用戶偏好和商戶畫像的量化結果時,可優(yōu)先比對用戶關注程度高的屬性,若此屬性在評論信息里的情感傾向明確,即可推薦。
2.推薦策略有效性驗證。記錄受訪者的商戶選擇,與推薦指數排名對照分析出推薦策略的有效性。結果顯示,在89位有效受訪者中實際選擇了推薦指數排名第1的商戶的有53位,占總數的59.6%,實際選擇了推薦指數排名第2和第3的用戶分別占總數的24.7%和15.7%。也就是說,有59.6%的受訪者的意向和首位推薦吻合,85.0%的受訪者選擇和推薦較高程度地達成一致。因此,推薦策略具有較強的有效性。雖然有問卷調查結果驗證了本文推薦算法的有效性,但由于受訪者在回答問卷時需要認真閱讀一定量的評論文本,一些認知規(guī)律會影響受訪者的閱讀行為,所以受訪者對商戶的最終選擇可能會受到這一過程的扭曲:
(1)閱讀過程中的信息加工,受刺激物的“驚奇值”[30]影響。在問卷上的文本評論中,出現(xiàn)了“顏值驚艷”“小姐姐服務員”等網絡熱點詞匯,這些詞匯對不同年齡段人群的刺激程度不同,影響受訪者的理性判斷。比如,某位受訪者對服務體驗的關注程度不高,而“小姐姐服務員”的“驚奇值”產生較高影響,則會導致此用戶對本不關注的屬性產生強烈興趣,從而選擇與推薦策略結果背道而馳的商戶。
(2)閱讀過程中的信息加工,受閱讀者的眼動凝視時間[31]的影響。問卷的商戶評論存在先后閱讀順序,當一個受訪者閱讀完靠前商戶評論,已經產生心儀感時,會縮短靠后商戶評論的凝視時間,造成受訪者對靠后信息獲取殘缺。比如某位受訪者非常注重食品質量屬性,閱讀完靠前商戶的評論,已經產生了選擇的想法,此時靠后商戶的評論中雖然有高質量食品的相關信息,但可能因為該受訪者無意識縮短了后文的眼動凝視時間,關鍵信息被忽略。
(3)閱讀過程中的信息加工,受詞頻[32]的影響。高詞頻和低詞頻在默讀中產生一種維持穩(wěn)定的頻率效應。即讀者在低頻度的詞用時比高頻度的詞更長,從而影響閱讀者的眼球運動。問卷閱讀文段中,反復出現(xiàn)“價格”“環(huán)境”“服務”這類標準化的詞匯,受訪者更容易跳過這類高頻且常規(guī)的詞,注視詞頻較低且新穎的詞,導致受訪者產生對文本理解的主觀偏差。
綜上所述,受訪者以及網絡用戶在閱讀評論文本時,不一定完整、準確、客觀地獲取了文本中的信息,因此問卷調查所得到結果的局限性是需要注意的。
本文充分利用了傳統(tǒng)推薦策略未能利用的具有豐富偏好信息的海量用戶評論數據,通過挖掘用戶關注與偏好和商戶畫像之間的擬合關系,構建了基于多維度用戶偏好和商戶特征模型的個性化推薦策略。本文通過網絡爬蟲技術采集了大眾點評網上特定用戶和商戶的評論數據,運用文本挖掘方法分析用戶偏好和商戶特征,得出用戶關注權重和商戶屬性情感分析結果,再將二者進行加權求和得到針對用戶個人的個性化推薦指數,最后依據推薦指數的排序進行推薦。本文提出的推薦策略是一種結合了個性化分析(用戶通過自己的評論顯示個人偏好)和大眾智慧(不同用戶對商戶的眾多評論)的較為合理的推薦策略,能有效提升推薦質量和用戶體驗。本文用問卷調查數據分析了用戶偏好、商戶特征與用戶實際選擇之間的關聯(lián),驗證了推薦策略的有效性,結果顯示有85.0%的受訪者選擇和推薦指數前三位商戶達成一致。
本文的理論價值在于:主流的協(xié)同過濾推薦算法只是在“用戶-物品”選擇矩陣的數據中根據用戶或物品的相似性做出唯象的預測,而本文提出的推薦策略沒有回避用戶決策過程的核心問題——用戶偏好和物品屬性,并通過對用戶評論的文本分析將用戶偏好和物品屬性數據挖掘出來,借助線性的效用函數模擬了用戶的決策行為,得到了較好的推薦結果。本文的推薦策略側重于決策過程的因果關系,與只考慮數據的相關關系的主流推薦算法可以形成方法論上的互補,這還有待于未來進一步的研究。
本文的實踐意義在于:(1)充分利用了具有豐富偏好信息的海量用戶評論數據,將其轉化為比用戶購買和評分等更加精細和全面的用戶偏好、商戶特征數據,為盤活現(xiàn)有海量數據、提升數據價值提供了新的思路;(2)通過構建和匹配用戶畫像和商戶畫像,為用戶量身推薦最符合其需求的商戶,節(jié)省搜尋成本,提高訂單轉化率;(3)平臺可以通過分析用戶發(fā)表的評論和商戶收到的評論,動態(tài)地獲取用戶偏好和商戶屬性評分,從而為商戶匹配適合的目標用戶群,并為產品和服務的開發(fā)和改進提供參考借鑒。
本文的方法基于對用戶評論的文本分析,因此需要用戶發(fā)表一定數量的評論,才能對用戶的偏好做出分析,也就是說對“冷啟動”不夠友好;但我們可以通過在新用戶注冊時引導用戶對各屬性維度進行偏好排序來為用戶偏好提供一個初始值。由于本文的文本分析僅限情感詞正負極性分析計算,而未能考慮情感色彩強度差異(比如“好吃”“美味”“絕世佳肴”同屬于正向情感詞,但情感色彩依次增強),因此在未來的研究中,可在詞頻的基礎上,增加強度賦值,提高推薦的準確度。此外,未來還可更多關注用戶的地域化習慣和口味習慣等群體特征和評論的非文字內容(如標點符號、表情符號、特殊符號)等數據的挖掘,拓展用戶畫像和商戶畫像的描繪方法。