孫玲玲 胡彥蓉 劉洪久
(1.浙江農(nóng)林大學 信息工程學院 杭州 311300;2.浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點實驗室 杭州 311300)
《2017年中國新媒體行業(yè)全景報告》統(tǒng)計顯示,中國在線社群數(shù)量超過300萬個,在線社群用戶超過2.7億人,在線社群市場經(jīng)濟規(guī)模超過3 000億元[1]。在線社群數(shù)量、用戶及市場經(jīng)濟規(guī)模持續(xù)增長下,社群經(jīng)濟與之興起,在線社群成為用戶社交活動發(fā)展新趨勢。據(jù)《2020社交零售白皮書》統(tǒng)計,隨著“全民社交”,中國社交零售滲透率達到71%,用戶參與相關(guān)社群的比例高達77%,傳播態(tài)勢由集中化向去中心化轉(zhuǎn)變。如何在傳播過程中,著重于創(chuàng)造用戶關(guān)注熱點內(nèi)容,實時檢測用戶關(guān)注主題發(fā)展趨勢,在開拓下沉市場同時開發(fā)以用戶為中心的私域流量,提高品牌競爭力,增強用戶黏性是企業(yè)亟待解決問題。
作為用戶分享產(chǎn)品信息、購買體驗、表達產(chǎn)品滿意度的重要場所。在線品牌社群中包含了大量對企業(yè)的市場營銷[2]、推廣新產(chǎn)品[3]、培養(yǎng)用戶忠誠度[4]、售后服務[5]、提升品牌知名度[6]、產(chǎn)品優(yōu)化等有價值的信息。企業(yè)不僅可以通過在線品牌社群實時獲取用戶需求信息,并進行產(chǎn)品開發(fā)[7];獲取用戶消費體驗評價,提供優(yōu)質(zhì)產(chǎn)品服務[8];與用戶溝通交流,建立企業(yè)與用戶長期共生關(guān)系[9]。潛在用戶也可從相關(guān)信息中了解產(chǎn)品使用者的總體評價狀況,為其購買決策提供有利支持。在線社群成為企業(yè)建立“用戶—品牌”聯(lián)系的重要支點[10]。因此,挖掘在線社群中的隱含信息,及時了解用戶關(guān)注熱點的發(fā)展態(tài)勢具有重要現(xiàn)實意義。
針對在線社群用戶互動行為的相關(guān)研究。景奉杰等[11]通過問卷調(diào)查法將用戶情緒作為中介效應,研究結(jié)果表明用戶之間的互動對品牌滿意度有正向影響。Bruhn等[12]得出的結(jié)論是,在線社群用戶的互動交流有利品牌忠誠度的提高,互動質(zhì)量對品牌在線社群的符號性、體驗性、功能性效益有積極影響。Wang等[13]對企業(yè)在Facebook上的信息進行了分析,發(fā)現(xiàn)使用社交媒體有助于企業(yè)實現(xiàn)客戶管理,增強市場能力。申光龍等[14]通過結(jié)構(gòu)方程模型,證實了社群用戶的體驗價值對用戶參與價值的正面影響。荊磊等[15]通過調(diào)查問卷分析了在線品牌社群優(yōu)化,認為文化認同、社群維護、體驗交流等行為對購買意愿有顯著的正向影響。黃鄭超等[16]通過對移動社群信息的分析,傳播中的負面口碑對品牌用戶忠誠度產(chǎn)生差異化影響。劉宇涵等[17]分析了消費者體驗、優(yōu)化共創(chuàng)價值與網(wǎng)絡輿情的關(guān)系,提出根據(jù)社群用戶間的不同需求點,開展在線社群活動以滿足用戶多需求。Ghose等[18]指出,網(wǎng)絡負面信息的集合降低了用戶購買欲望,影響用戶對品牌的情感信任度。雷宇[19]提出將具有相同消費偏好、消費觀點的用戶聚集在一起,企業(yè)可以提取這一群體的消費潛力。高海霞等[20]通過運用SOR模型對社交購物的用戶信息進行特征提取,發(fā)現(xiàn)購物分析信息顯著影響用戶的隱性需求。
從國內(nèi)外學者的研究現(xiàn)狀可以看出,網(wǎng)絡社群信息挖掘研究已成為學術(shù)界關(guān)注熱點,但是目前研究還存在以下問題:a.現(xiàn)有在線社群研究主要以傳統(tǒng)統(tǒng)計學分析方法為主。在數(shù)據(jù)來源上,以抽樣調(diào)查方式獲取數(shù)據(jù), 數(shù)據(jù)是實際調(diào)查或觀察中的一些個體, 這使得樣本分析的效果存在明顯局限性;在分析方法上,以“假設—驗證”為分析思路,利用數(shù)據(jù)信息建立的理論模型和主觀判斷來驗證這一假設,人的主觀判斷會對調(diào)查過程和結(jié)果產(chǎn)生影響,結(jié)論是單一性、片面性的[21]。b.現(xiàn)有研究分析主要集中在模式分析和創(chuàng)新上[22],基于用戶角度的網(wǎng)絡在線社群文獻相對較少,其中對汽車用戶需求研究更少。c.現(xiàn)有研究在主題挖掘上較少考慮時序參數(shù)信息,缺乏時間維度上的演化性。需要特別指明的是,社群化為企業(yè)帶來了許多裨益,但是少有研究著眼于在線社群用戶評論的文本挖掘的研究,缺乏對個案的分析和建議。
為此,本文提出一種基于LSTM-LDA算法和IPA分析的在線品牌社群關(guān)注熱點研究方法。采用LSTM-LDA算法,獲取在線社群用戶關(guān)注熱點和滿意度隨時間的變化趨勢,并運用IPA方法,構(gòu)建了在線品牌社群用戶的產(chǎn)品使用體驗要素結(jié)構(gòu),分析用戶關(guān)注熱點主題的發(fā)展趨勢。該方法的主要特點在于:a.以大數(shù)據(jù)技術(shù)對在線品牌社群進行研究。以“發(fā)現(xiàn)—總結(jié)”為分析思路,利用大數(shù)據(jù)驅(qū)動,通過對海量的數(shù)據(jù)進行快速的分析和價值挖掘,整合分析多維度、多角度的數(shù)據(jù),突破原有的數(shù)據(jù)分析范式,從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,實現(xiàn)對數(shù)據(jù)內(nèi)在聯(lián)系和價值的最大可能挖掘和分析。b.首先基于時序窗口利用LDA進行主題建模,結(jié)合時間離散分析方法,對用戶評論文本主題進行動態(tài)追蹤,并通過計算困惑度來確定最佳主題數(shù),保證文檔聚類效果,有效識別在線社群隱含主題,劃分用戶主題偏好,識別主題特征。困惑度是衡量LDA模型準確性的有效方法[23]。同時,婁巖等[24]證明了通過LDA抽取文本主題以獲取用戶的關(guān)注熱點和態(tài)度的可行性。c.引入邊緣評論概念,剔除邊緣評論,避免邊緣評論對用戶關(guān)注熱點主題識別造成的干擾。d.利用LSTM網(wǎng)絡提取用戶評論文本情感,完整獲取評論文本的非結(jié)構(gòu)化上下文信息,避免過多依賴情感詞典的構(gòu)建,準確挖掘用戶的情感態(tài)度。e.將文本挖掘法與IPA模型結(jié)合,從用戶需求供給側(cè)出發(fā),構(gòu)建品牌關(guān)注要素結(jié)構(gòu),并對其特征進行深入分析,以新的研究視角豐富在線品牌社群用戶需求挖掘的研究內(nèi)容。
1.1問題描述及解決框架隨著Web2.0的發(fā)展,用戶日常使用的社群、微信小程序/公眾號、平臺/社交電商、微博等,越來越成為用戶喜愛的“種草”工具。品牌營銷已從單向、單一的傳播模式轉(zhuǎn)向強社交、多觸點的傳播模式。對于企業(yè)而言,如何有效利用社群渠道強化品牌營銷影響力,深入多場景和用戶建立觸點,及時識別銷售機遇,激發(fā)用戶興趣、帶動用戶決策、持續(xù)受到用戶喜愛,是企業(yè)亟待解決的問題。本文從用戶需求視角,設計出基于LSTM-LDA算法和IPA分析的在線品牌社群用戶關(guān)注熱點分析方法,有效挖掘用戶評論中的有效信息,加強與用戶的信息交流,梳理內(nèi)部機制快速迭代新品,形成基于用戶評論數(shù)據(jù)的建議、推斷和決策。本文構(gòu)建的在線品牌社群用戶關(guān)注熱點分析框架如圖1所示。
圖1 用戶關(guān)注熱點分析框架
1.2 LDA主題模型
1.2.1 LDA主題提取 使用LDA模型從評論文本中提取主題。是由Blei等[25]在2003年提出的概率主題模型。作為三層貝葉斯概率模型,具有 “詞、主題、文檔”三層結(jié)構(gòu)。LDA主題模型認為,一個文檔有幾個主題,一個主題由幾個詞來體現(xiàn)。利用LDA獲取文本主題信息的分布,文檔是具有一定概率的潛在主題的隨機組合;每個主題是詞匯一定概率的組合,如圖2所示。
圖2 LDA模型的矩陣表示
其中,D表示“文檔-詞匯”矩陣;φ表示“主題-單詞”矩陣;θ表示為“文檔-主題”矩陣。使用LDA從頻率文本中提取主題的基本計算過程:使用公式(1),從矩陣D中,通過無監(jiān)督學習得到矩陣φ和θ。
(1)
其中,α為文檔參數(shù);β為詞匯參數(shù);θ為從β中采樣的“文檔-主題”矩陣;φ為從β中采樣的“主題-詞匯”矩陣;t為θ中采樣的主題;N為文檔集合中的單詞總數(shù)。
對于主題模型,本文利用困惑度來確定最優(yōu)主題數(shù)K,以保證主題提取效能。困惑度是評價語言模型性能的常用指標。一般來說,困惑度越低,說明聚類效果越好,主題擬合性越高。困惑度計算公式如式(2)所示。
(2)
其中,D為所需測試文檔集的數(shù)量,wd為d的詞匯序列,Nd為d的詞量。
1.2.2 熱點主題特征詞提取 根據(jù)式(1),得到“文檔-主題”矩陣φ。如式(3)所示,矩陣中共有m個主題和n個詞匯,每一列為各詞匯在m各主題中的分布概率,每一行為各主題在n個詞匯的分布概率。
(3)
根據(jù)公式(1),得到“主題-詞匯”矩陣θ。如公式(4)所示,矩陣中共有s個文檔和m個主題,每一列為各主題在s個文檔中的分布概率,每一行為各文檔在m個主題中的分布概率。
(4)
(5)
為更好地揭示主題間的結(jié)構(gòu)信息,本文引入邊緣評論概念。邊緣評論指的是,如果某一評論與所有文檔-主題概率都很低,則認為該評論主題不明確,對其進行剔除處理,避免邊緣評論對主題變化趨勢產(chǎn)生不利影響。因此,本文認為,當文檔-主題概率值小于α時,該評論屬于邊緣評論。
1.2.3 熱點主題關(guān)注度計算 根據(jù)式(1),可以計算得出文檔集合中每個文檔對應各個主題的分布概率,通常以最大分布概率對應的主題作為該文檔所屬的主題。但是,對于這些主題,哪些是常見主題,哪些是熱門主題,需要區(qū)分開來。由此,依據(jù)文檔主題支持度的思想,認為在某段時間內(nèi)該主題是熱點主題,則在線品牌社群評論文本集合中屬于該主題的評論文檔占據(jù)一定比例。根據(jù)蔣翠清等[26](主題演化)提出的平均熱度方法,將每個主題演化應用到結(jié)果分析中,該方法利用LDA模型提取文檔集的潛在主題,并以評論時間信息檢查不同離散時間段的主體分布情況,從而對主題進行歸一化平滑處理,統(tǒng)計不同時間段用戶討論主題的關(guān)注度趨勢,最終形成評論數(shù)據(jù)集合的整體主題演變趨勢。各時間段內(nèi)主題關(guān)注度按式(6)計算。
(6)
1.3 LSTM模型
1.3.1 LSTM網(wǎng)絡結(jié)構(gòu) 長短期記憶網(wǎng)絡(Long Short Term Memory Neural Network, LSTM)是一種用于處理時間序列數(shù)據(jù)的專用網(wǎng)絡[27],傳統(tǒng)RNN神經(jīng)網(wǎng)絡的神經(jīng)元通過輸入函數(shù)計算輸出單元,而LSTM神經(jīng)網(wǎng)絡是將神經(jīng)元轉(zhuǎn)為記憶單元,每個記憶單元由輸入門、遺忘門和輸出門三部分組成,單元圖如圖3所示。
圖3 LSTM網(wǎng)絡結(jié)構(gòu)
其中,c為長期狀態(tài),用來儲存長期記憶信息,保存序列的長期狀態(tài),并傳送到下一層。從左往右第一個框為遺忘門,用于c的更新,丟棄過時信息,它接收上一時刻ht-1和當前輸入的xt經(jīng)過wf得到另一個向量,由此才經(jīng)過σ。遺忘門的增加解決了RNN梯度消失和爆炸的問題。
xt數(shù)據(jù)到達網(wǎng)絡后,同上時刻的輸出ht-1作為輸入,更新Ct-1,到新Ct,計算公式如公式(7)所示。
(7)
在進行sigmod計算后,和更新后的Ct進行計算,得到該時刻下的ht,ht計算公式如下式(8)所示。
(8)
1.3.2 熱點主題滿意度計算 根據(jù)所提取主題的基礎(chǔ)上進行文本分類構(gòu)建。由于論壇帖子回復大多是短文本,每個用戶語言習慣不同,在進行分類前需如1.1步驟進行文本預處理、詞向量訓練。LSTM后,使用Dropout來防止模型過擬合并增強模型的適用性。由此對論壇帖子文本進行情感分析。將論壇帖子文本分為正、負兩種情感集合。根據(jù)9:1比例,將數(shù)據(jù)集分為訓練集、測試集。大量實驗證明,構(gòu)建LSTM網(wǎng)絡分類器進行文本分類所得到的結(jié)果遠遠高于樸素貝葉斯、邏輯回歸、SVM等機器學習算法[28-30]。最后根據(jù)分類結(jié)果計算主題滿意度,計算公式如式(9)所示。
(9)
其中,νk,t為t時間下主題k的滿意度,ht為t時間下k主題的好評文檔數(shù)量,Mk,t為時間t下的k主題評論個數(shù)。
1.4 IPA分析IPA(Importance Performance Analysis; IPA)分析法。最早由Martilla和James[31]于1997提出。其基本思想是對影響用戶滿意度的各種因素的重要性和用戶實際使用感知進行評估和分析,找出企業(yè)優(yōu)、劣勢。常采樣“重要性”:I、“績效/滿意度”:P建立二維坐標系。通過I、P各自均值分為四象限,分別為第一象限:優(yōu)勢區(qū);第二象限:維持區(qū);第三象限:改進區(qū);第四象限:弱勢區(qū),如圖4 所示。
圖4 IPA四象限圖
(10)
(11)
2.1數(shù)據(jù)源說明本文以愛卡汽車論壇帖子作為數(shù)據(jù)來源。愛卡汽車社區(qū)是全球最大的汽車主題社區(qū),也是國內(nèi)第一家社會化的汽車網(wǎng)絡互動媒體。它擁有著廣泛的客戶和更全面的數(shù)據(jù)。其次,本文將大眾作為研究品牌,選取大眾旗下高爾夫、途安、邁騰、途觀L、帕薩特、速騰,6個車型作為研究對象,主要原因為:該品牌為我國認知度較高汽車品牌,且在選取研究車型時包含轎車、SUV,符合我國汽車購買習慣,更具代表性。
通過使用“爬蟲”軟件在愛卡汽車論壇上抓取信息抓取。收集的內(nèi)容包括標題、發(fā)帖人、發(fā)帖時間、回復次數(shù)、瀏覽次數(shù)、最新回復者、最新回復時間、帖子類型和回復文本,共形成168 810個初始實驗數(shù)據(jù)集。對初始數(shù)據(jù)集進行合并、無關(guān)數(shù)據(jù)和重復數(shù)據(jù)刪除處理,形成研究語料庫,最終有效評論數(shù)據(jù)共計134 110條。丟棄重復、異常條目數(shù)據(jù)。將數(shù)據(jù)格式轉(zhuǎn)變?yōu)橛嬎銠C程序可識別形式。依據(jù)關(guān)鍵詞頻率,對同時出現(xiàn)多個汽車品牌的關(guān)鍵詞帖子,將其規(guī)劃到某一汽車品牌。為保證研究成果的正確性和科學性,將收集到的數(shù)據(jù)整理如下:
①初步處理數(shù)據(jù)。首先,整理分析帖子信息,找出與該汽車車型不相關(guān)的帖子,刪除無關(guān)數(shù)據(jù), 減少無關(guān)這些評論數(shù)據(jù)對最后結(jié)果的影響。②文本去重。同一個人可能會出現(xiàn)重復評論,有價值的即為第一條評論,將評論中重復部分除去。③機械壓縮去詞。收集的汽車評論信息中夾雜著大量無意義的內(nèi)容,文本去重之后,仍有許多信息需要處理。如:“哈哈哈”以及“非常好非常好”。④建立歸并詞表。即統(tǒng)一汽車的外觀、配置、性能等定義:如將“前臉”“正臉”等統(tǒng)一替換為“車頭”,將“后尾”“尾部”轉(zhuǎn)換為“車尾”等。⑤建立自定義詞表。建立與汽車相關(guān)聯(lián)的詞匯,精確分詞,使本文研究更加具有真實性。⑥去停用詞。⑦分詞。
2.2基于LDA的用戶關(guān)注熱點關(guān)注度分析
2.2.1 主題抽取和特征詞選取 按照主題關(guān)注度算法步驟對汽車評論文檔數(shù)據(jù)進行預處理,對評論文本使用LDA主題模型建模,挖掘主題詞及詞頻。根據(jù)經(jīng)驗值,模型的超參數(shù)取α=50/K,β=0.01,各主題關(guān)鍵詞數(shù)為20。根據(jù)式(3)計算不同主題數(shù)目下困惑度,結(jié)果如圖5所示,可以看出,K取8時,LDA主題模型困惑度產(chǎn)生局部最小值,之后Perplexity逐漸增加。同時,調(diào)用PyLDAvis包對各主題間距離進行可視化呈現(xiàn),由圖6所示,當K=8時,主題區(qū)分度明顯。因此,確定LDA最佳主題數(shù)K為8。
圖5 主題困惑度變化趨勢
圖6 主題距離圖
本文設置閾值α=0.2,去除3 697條邊緣評論,剩余130 413條評論。在此基礎(chǔ)上,針對在線品牌社群用戶關(guān)注熱點信息進行深層次挖掘與分析。
利用訓練好的LDA主題模型,對在線品牌社群評論文本進行主題抽取,得到矩陣:“文檔-主題”“主題-詞匯”,根據(jù)式(1)對“主題-詞匯”計算出每個主題的特征詞,分別如表1和表2所示。
表1 文檔主題矩陣的部分示例
表2 主題詞匯矩陣的部分示例
從實驗結(jié)果看,用戶對汽車品牌的關(guān)注主題呈現(xiàn)出范圍廣、多樣性的特點。不僅涵蓋了汽車價格、汽車制動、汽車保養(yǎng)等領(lǐng)域,還包括對汽車行業(yè)前景、用戶對汽車產(chǎn)品接受程度等話題的討論。以topic0為例,相關(guān)評論主要與汽車外形、顏色、車型設計、空間大小、配置問題密切相關(guān),因此將主題描述為汽車總體結(jié)構(gòu)問題?;诖朔椒ǚ謩e對topic1- topic7的主題進行描述為:汽車制動、汽車配置定制、汽車保養(yǎng)、汽車輪胎、汽車相關(guān)配件及其價格、汽車車友交流、汽車行車。
2.2.2 熱點主題關(guān)注度計算 對于主題抽取,根據(jù)式(5)進行主題關(guān)注度計算,分析各主題關(guān)注度隨時間的變化,得到汽車各主題關(guān)注度隨時間演變情況如圖7所示。在2017年12月至2018年4月期間,用戶對各主題的關(guān)注度有如下趨勢:相關(guān)討論以topic0為主,在此期間topic0主題關(guān)注度一直高于其余7個主題。相關(guān)討論以topic0、topic1為主,這些為用戶的主要關(guān)注熱點;topic2占比處于第3,屬于用戶主要關(guān)注點,但其波動呈現(xiàn)先增加后下降趨勢,說明用戶對該主題有所關(guān)注,但關(guān)注度呈現(xiàn)下降趨勢;topic3-topic7的關(guān)注相對穩(wěn)定,波動幅度不大。用戶在不同時間對不同主題的關(guān)注熱度不同,可能與相關(guān)政策或汽車推出有關(guān)。如在2017年,大眾集團在“2025年變革”會議中大眾產(chǎn)品攻勢正式啟動,將陸續(xù)推出多款車型,大眾在華發(fā)起最大規(guī)模的產(chǎn)品攻勢,旨在成為中國市場領(lǐng)先SUV品牌。此后,用戶對與汽車車型相關(guān)主題的關(guān)注以及討論迅速增加,且明顯高于其余主題,并在2018年1月達到最高值,且該主題在用戶討論中占據(jù)較大比重,表明汽車總體架構(gòu)為用戶的主要關(guān)注熱點。企業(yè)可圍繞用戶核心需求,實時獲取用戶對產(chǎn)品的需求和偏好,快速迭代,不斷更新提升產(chǎn)品,同用戶建立長遠信賴關(guān)系,驅(qū)動社交裂變,增強品牌在線社群的影響力。
圖7 汽車評論主題關(guān)注度時間演化
2.3基于LSTM的用戶關(guān)注熱點滿意度分析在模型數(shù)據(jù)訓練方面,根據(jù)9:1尺度將評論文本集分為訓練集、測試集。為了達到理想的情感分類效果,進行了LSTM模型參數(shù)的調(diào)整實驗。Droput設置為0.2,共執(zhí)行5個訓練周期。模型的準確率在訓練集上達93.4%,在測試集上超過90%。 最后由評論文本得到的分類結(jié)果為:正面評論:91 588條;負面評論:38 825條,見表3。
表3 熱點主題的情感分布情況
依據(jù)式(8)進行主題滿意度計算,具體結(jié)果如圖8所示。可以發(fā)現(xiàn)用戶對汽車評論滿意度普遍以積極情感為主,對各主題的滿意度存在差異性。例如,用戶對topic0、topic1的積極情感在2017年1月趨向于消極情感,在2017年12月達到最大值,并逐漸趨向于平穩(wěn)趨勢??梢钥闯鲇脩魧ζ囓囆秃推囍苿拥膽B(tài)度隨產(chǎn)品的持續(xù)出新,用戶消極情感有所上升,可能是發(fā)現(xiàn)某些汽車設計對用戶存在不便之處。用戶對topic6和topic7的積極情緒逐漸增加,并在2018年1月達到最大值,然后逐漸趨于穩(wěn)定,負面情緒增加,但主要以積極情緒為主。說明隨著一系列政策的出臺,更多用戶對汽車制動表現(xiàn)看好,少部分用戶持消極觀點。用戶對余下主題的積極情感出現(xiàn)持續(xù)上升再有所下降趨勢,用戶對主題情感趨向于積極態(tài)度,消極情感均低于積極情感。
圖8 汽車評論主題滿意度時間演化
2.4用戶關(guān)注熱點IPA分析在品牌形象感知各要素的關(guān)注度與滿意度的基礎(chǔ)上,用IPA方法計算該汽車產(chǎn)品感知的表現(xiàn)性數(shù)值和重要性數(shù)值,結(jié)果如圖9所示。進入第一象限的關(guān)注要素有:汽車制動、汽車配置要素,即用戶對這些主題要素關(guān)注度、滿意度高,說明大眾汽車的汽車制動、汽車配置性能良好,用戶享受了優(yōu)質(zhì)產(chǎn)品服務及其情感體驗。
圖9 用戶關(guān)注熱點IPA分析結(jié)果
落在第二象限的關(guān)注要素為:汽車輪胎、汽車行車要素,雖然用戶對這些要素關(guān)注度較低,但用戶對其評價價值較高,說明雖然用戶對大眾汽車的汽車輪胎、汽車行車的感知相對較低但較為滿意,在產(chǎn)品使用過程中獲得良好使用體驗。
進入第三象限的要素有3個,分別為:汽車保養(yǎng)、汽車配件及其價格、汽車車友交流,用戶對這些要素不僅感知重要性低,而且對其滿意度也較為低下,是大眾汽車未來產(chǎn)品研發(fā)方向和線上線下交流活動有待優(yōu)化的方面。汽車保養(yǎng)要素不足主要表現(xiàn)在汽車保養(yǎng)費用較高;保養(yǎng)地點較少,不方便;此外,在市場上有著 “開不壞的豐田,修不好的大眾”的俗語。后期問題出現(xiàn)時,進行保養(yǎng)修護比較困難。汽車車友交流的不足在于車友交流互動不夠?qū)崟r,有滯后性;活動較少。
在第四象限的要素為:汽車總體架構(gòu),說明用戶要素是影響其使用感價值的重要因素,大眾企業(yè)需采取相應處理措施進行有效優(yōu)化提升以提高優(yōu)化滿意度水平。從總體來看,大眾汽車優(yōu)化使用體驗滿意度平均值為0.29,滿意度為負值時,情感趨向于消極情緒,高于0時為積極情緒,除topic0以外其余情感均趨向于正向情感,說明大眾作為日系車的一大巨頭,用戶整體使用體驗感質(zhì)量相對較高。
本研究基于“愛卡汽車論壇”相關(guān)數(shù)據(jù),提出了基于LSTM-LDA算法和IPA分析方法,探索在線品牌社群用戶在不同時間片內(nèi)的參與交流評論的情況,勾勒熱點主題的關(guān)注度、滿意度的時序發(fā)展趨勢,并通過構(gòu)建IPA分析模型,明確當前熱點主題發(fā)展態(tài)勢。經(jīng)過實證研究得出如下結(jié)論:
a.從主題討論信息來看,在線品牌社群用戶通過論壇關(guān)注汽車信息以及交流使用心得,用戶關(guān)注主題具有范圍廣、類型多的特點。不僅涵蓋了汽車總體結(jié)構(gòu)、汽車制動、汽車配置定制、汽車保養(yǎng)、汽車輪胎等多種企業(yè)品牌產(chǎn)品特性,還包括了售后服務等問題的探討。
b.從主題時序發(fā)展態(tài)勢來看,主題關(guān)注度的演變趨勢反應了用戶對汽車品牌的關(guān)注情況,品牌用戶對各主題關(guān)注度變化趨勢呈現(xiàn)較為平穩(wěn)狀態(tài),用戶在不同階段所關(guān)注的主題側(cè)重點具有一定差異性。主題滿意度的演變趨勢反應了用戶對汽車品牌的情感態(tài)度,用戶對品牌總體滿意度趨向于正向,用戶主體滿意度較高。以topic0為例,其情感趨向于負向,這表明汽車產(chǎn)品周邊服務未能達到用戶期望值。
c.根據(jù)IPA四象限分析,挖掘品牌形象感知各要素。定位出處于改進區(qū)的要素為:汽車保養(yǎng)、汽車配件及其價格、汽車車友交流;處于弱勢區(qū)的要素為:汽車總體架構(gòu)。用戶作為產(chǎn)品的最終使用者,其使用反饋有利于汽車制造商、經(jīng)營商了解用戶需求及其發(fā)展趨勢,幫助相關(guān)企業(yè)制定產(chǎn)品開發(fā)戰(zhàn)略和產(chǎn)品優(yōu)化策略,以此滿足不同用戶的不同需求,提升用戶滿意度。
本文證明了利用在線品牌社群挖掘用戶關(guān)注熱點及其發(fā)展態(tài)勢的可行性,具有一定理論意義,在以往研究中,多集中于直接使用LDA模型訓練結(jié)果進行主題分析。相對于傳統(tǒng)的聚類主題挖掘,本文結(jié)合LDA與多時間窗口,從時間維度上梳理用戶關(guān)注主題演變趨勢,與此同時,通過過濾邊緣評論,充分考慮相似度低的評論對動態(tài)主題挖掘的影響,豐富了在線品牌社群用戶需求挖掘的結(jié)果研究。
研究結(jié)果還能為相關(guān)企業(yè)在進行產(chǎn)品創(chuàng)新、前景路線規(guī)劃、市場營銷等工作提供參考。一方面,當品牌進入市場疲軟期時,用戶關(guān)注度明顯下降,企業(yè)可提供感知結(jié)果,以便市場營銷部門根據(jù)用戶關(guān)注主題類型及其關(guān)注度的變化趨勢,及時了解并預測用戶的興趣主題及時調(diào)整營銷方向。為用戶提供個性化資源推薦和話語內(nèi)容反饋。例如,具有相似關(guān)注主題的討論貼、興趣小組等。另一方面,在主題演變周期的基礎(chǔ)上,實現(xiàn)對市場流程預警、引導、控制的管理。在滿意度低下階段,注重產(chǎn)品評價,探索產(chǎn)品出現(xiàn)的問題,形成預案,避免造成客戶群體流失,增強用戶市場黏合力。
本研究僅局限于愛卡汽車論壇,數(shù)據(jù)覆蓋面和研究對象范圍有限。在后續(xù)研究中,拓寬數(shù)據(jù)獲取渠道,對不同網(wǎng)絡、不同搜索引擎及不同車系信息進行收集,以便對該類問題做更深入細致的研究。