国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于在線評論的電商產品特征提取
——以淘寶女鞋產品為例

2019-12-17 09:21
新營銷 2019年13期
關鍵詞:女鞋高頻詞詞頻

(北京物資學院 北京 101149)

根據2020年中國互聯網絡信息中心(CNNIC)發(fā)布的第46次《中國互聯網絡發(fā)展狀況統(tǒng)計報告》,2020年中國網購人數規(guī)模已經達到6.59億人,網購滲透率達到79.5%。2020年上半年,我國互聯網個人應用形成平穩(wěn)增長態(tài)勢。其中,電商直播、短視頻、網絡購物增長最為顯著,增長率分別為16.7%、5.8%和5.5%。有研究顯示,91%的網購用戶會在購買新產品時會參考之前用戶的購買反饋,在線評論作為網購用戶反饋的重要媒介之一,在線評論文本所包含的商品特征對消費者購買產品與商家提升服務質量有著重要的參考意義。

一、研究目的及意義

根據2020年4月的淘寶指數,在淘寶平臺網購的消費者80%是“小年輕”、“青年”與“青壯年”,同時消費者的性別比例為1:9(男:女),女鞋在淘寶總的類目排行榜中排名第六,因此電商女鞋產業(yè)具有豐富的消費者受眾并帶有大量的用戶評論信息。2020年上半年,前中國女鞋行業(yè)第一“巨頭”達芙妮營業(yè)額驟降85%,虧損1.14億港元,同時在淘寶女鞋的支付排名也跌出了10名以外。網購對傳統(tǒng)女鞋行業(yè)造成了一定沖擊,傳統(tǒng)零售巨頭在電商升級轉型時也會遇到巨大的困難。網購相較于線下實體店的購買,不僅僅是支付方式的升級,同時也是營銷、制造、物流等多方面的全方位的升級。因此本文選擇能充分反映消費者感知的在線評論這一信息來源,并從中提取產品特征。本文將選擇淘寶的女鞋行業(yè)作為研究對象,對研究消費者網購關注點以及傳統(tǒng)女鞋零售企業(yè)進行產業(yè)升級提升服務有著一定的指導作用。

二、研究設計

在線評論的特征提取的主要步驟包括數據的獲取、數據的篩選清洗,數據并歸提取特征及一致性檢驗等環(huán)節(jié)。流程如圖1所示。

(一)數據來源

本文的大部分數據來源于淘寶平臺,淘寶是一個受眾面廣、在我國電子商務領域具有重要影響的綜合性電子商務網站。以支付寶為核心的平臺化、用戶數量、用戶規(guī)模都具有巨大的優(yōu)勢,故本文選擇采集2020年5月同品類銷量前五名的網店的部分鞋款的在線評論,本文將以同品類排名前五的淘寶店鋪部分商品的在線評論為基礎,提取商品特征,并對提取的商品特征進行分析對比。

圖1 評論數據處理流程圖

(二)數據的獲取

采用OCTOPUS爬蟲軟件對淘寶平臺女鞋銷量排名前五店鋪的2020年5月1日至2020年5月31日的在線評論數據進行爬取。

(三)數據清洗

為提升提取結果的精確度,考慮到在線評論中無用以及重復的評論,會對最終的提取結果造成影響,主要是借助Excel中的“排序”和“查找”功能依靠手工操作完成,其中去重復部分運用 ROST 軟件完成。最終經過數據清洗后剩余 10260條有效評論。

(四)文本內容處理

直接獲取的在線評論大多屬于自然句形式,需要準確提取要素需要對在線評論進行預處理。在線評論中還包含默認評論、語義不完整的詞句、包含一詞多義的評論、上下文相關性不強的評論與語意模糊的評論等。因此,獲取的在線評論文本需要進行規(guī)范化的預處理。

本文采用了ROST 6.0軟件。將所得到的數據分別進行格式轉換,轉換為文本格式后進行預處理。本文在對評論文本進行分析之前,首先利用分詞功能對在線評論數據集文檔進行分詞,使得非結構化的文本轉化為機器能夠讀取的離散數據。分詞是否準確,將會影響后面的工作質量。

ROST分詞系統(tǒng)的詞庫有限,同時基于本文的研究對象,分詞需要更加具有針對性。因店鋪評論中包含許多專有名詞以及口語化詞語,例如“尺碼”“磨腳”等,為保證后續(xù)研究的準確性,通過分批抽查分詞結果的方式多次更新自定義詞表,直至抽樣結果中無遺漏的詞語,更新分詞及詞頻統(tǒng)計結果,具體更新內容如表2所示。

表1 更新詞表

(五)一致性檢驗

本文選用店鋪在線評論代表該類行業(yè)的在線評論,為保證其科學性,將這些評論分為五組,分析其高頻詞的相似性,以驗證數據的內部一致性。信度分析是指對同一對象進行反復測量的(所用方法相同)結果的一致性程度,其常用的方法是信度系數法,即Cronbach系數。計算公式如下。其中K為量表中題項的總數,Si為第i題得分的方差,Sx為全部題項總得分的方差。通常α<0.35 表示信度很低,α>0.7 表示信度高。而α>0.8 則表示可靠性極高。根據不同組別評論中高頻詞出現的頻率,采用 SPSS 23.0 的相關分析方法,分析高頻詞在組別間分布的相似性。五家店鋪詞頻前五名的因子的Pearson相關系數顯著水平下兩兩之間的相關系數都大于0.7,顯示具有顯著相關性,說明5家網店消費者的關注點具有很高的一致性。同時,五組數據高頻詞出現頻率的克朗巴哈系數為0.976>0.7如表所示,說明本文提取的數據較有代表性,能夠代表該品類的評論。

三、在線評論商品特征提取

通過停用詞表和歸并詞表之后的統(tǒng)計分詞詞頻統(tǒng)計如表所示。

表2 主要詞語詞頻統(tǒng)計表

本文將高頻詞按照特征進行分類,將外觀、舒適度、材質、尺碼、品質、物流質量、腳感、商品價格、氣味、物流服務、商品特點等進行分類。

四、結語

本文抽取出了一些能夠體現消費者感知的產品特征詞,從前文可以看出,排名最高的詞匯是“好看”,頻次數為 3926,約占樣本總評論數的 41%,大于三分之一的消費者會在評論中提及商品的外觀,平價女鞋作為一種快消品,消費者對其的關注是符合實際情況的。高頻特征詞中排名比較靠前的“質量”、“舒服”等詞,表明很大一部分消費者在選購產品時會考慮商品質量、舒適度等。同時“性價比”、“價格”、“物流”等詞表示消費者同時也關注商品的物流服務質量以及商品的價格。因此電商女鞋企業(yè)應該主要關注產品的設計更加跟進潮流,同時需要關注產品的材料的運用及供應商選擇、定價策略以及物流服務提供商的選擇等。

猜你喜歡
女鞋高頻詞詞頻
30份政府工作報告中的高頻詞
省級兩會上的高頻詞
基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
28份政府工作報告中的高頻詞
省級兩會上的高頻詞
設計不“南”2020/21秋冬女鞋8大趨勢劇透來襲
詞頻,一部隱秘的歷史
中國女鞋之都8·18冬靴訂貨會 成都女鞋再放異彩
中國女鞋之都秋冬女鞋補單訂貨會再創(chuàng)佳績
云存儲中支持詞頻和用戶喜好的密文模糊檢索
凤凰县| 商城县| 武川县| 嘉祥县| 安塞县| 铜梁县| 高邮市| 岳普湖县| 宁河县| 海丰县| 民乐县| 寿宁县| 开阳县| 友谊县| 镇平县| 太白县| 香河县| 阿巴嘎旗| 呼图壁县| 西贡区| 邮箱| 德令哈市| 进贤县| 临汾市| 达尔| 濮阳市| 通城县| 陈巴尔虎旗| 丁青县| 惠来县| 绩溪县| 新河县| 凤山市| 郓城县| 甘泉县| 望都县| 安陆市| 喜德县| 达孜县| 芦山县| 十堰市|