張文杰 肖茜 張繼娟*
(中南林業(yè)科技大學(xué)家具與藝術(shù)設(shè)計學(xué)院,湖南 長沙 410004)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們的消費方式逐漸從線下轉(zhuǎn)到線上,各種電商平臺里的商品琳瑯滿目,用戶可以在購買商品后根據(jù)自己的使用體驗發(fā)表自己對產(chǎn)品的評價,這些評論可以幫助其他消費者更好地了解產(chǎn)品質(zhì)量,幫助他們甄別商品,同時也能幫助廠商更好地了解消費者的需求以及產(chǎn)品需要改進(jìn)的地方。家具行業(yè)作為傳統(tǒng)制造業(yè),在轉(zhuǎn)型電商的過程中會遇到許多困難和挑戰(zhàn)。目前涉足家具領(lǐng)域的線上電商平臺主要有京東、天貓、亞馬遜、淘寶、蘇寧易購等,受疫情影響,宅家線上辦公成為上班族常態(tài),人們對居家辦公環(huán)境有了更高的需求,一張舒適的辦公椅往往能給予他們生理和心理上的慰藉,辦公椅作為家具電商中最熱門的家具產(chǎn)品之一,不僅銷量實現(xiàn)了顯著的增長,還吸引了越來越多人的關(guān)注。本文以京東購物平臺的某款熱銷辦公椅為實例,運用大數(shù)據(jù)的思維對用戶的在線評論進(jìn)行大量有效的挖掘,并對獲取到的信息進(jìn)行處理并分析,協(xié)助辦公椅產(chǎn)品的創(chuàng)新設(shè)計。
大數(shù)據(jù)是一種在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合。大數(shù)據(jù)通過結(jié)合新系統(tǒng)、新工具、新模型對大量、動態(tài)、持續(xù)的數(shù)據(jù)進(jìn)行挖掘,從而獲得具有洞見力和全新價值的東西[1]。對于家居用品創(chuàng)新設(shè)計而言,家具設(shè)計師們?nèi)绻荒芎芎玫卣?、分析、利用這些大數(shù)據(jù)帶來的有用的信息,將導(dǎo)致他們的設(shè)計偏離消費者的真實需求,這將不利于產(chǎn)品的設(shè)計創(chuàng)新。
研究以京東購物平臺某款熱銷的辦公椅為例(圖1),該辦公椅的商品評論有20 萬條之多,因此在該辦公椅的用戶評論中蘊含著大量的信息,利用Python 編寫爬蟲程序代碼,獲取用戶評論并進(jìn)行分析,然而受技術(shù)、數(shù)據(jù)庫以及服務(wù)器的限制,只選取了該購物網(wǎng)站中這款辦公椅的前100 頁的商品評論內(nèi)容、評論創(chuàng)建時間、產(chǎn)品顏色、用戶昵稱、評分、點贊數(shù)等[2]。爬蟲程序的流程如圖2 所示。
圖1 辦公椅
圖2 爬蟲程序流程
首先使用 requests 庫向該網(wǎng)頁發(fā)送網(wǎng)絡(luò)請求,同樣也可以運用代理 IP 加上用戶代理池隨機選擇與搭配的方法,并設(shè)置爬取網(wǎng)頁的時間間隔“time.sleep(random.randint(3,5))”,以便能夠更加流暢地爬取信息。網(wǎng)頁解析JSON 格式數(shù)據(jù),將獲取到的頁面數(shù)據(jù)轉(zhuǎn)換為字典類型“json_data=response.json()”,以便更好地提取數(shù)據(jù)內(nèi)容。在評論內(nèi)容中選擇商品評論內(nèi)容、評論創(chuàng)建時間、產(chǎn)品顏色、用戶昵稱、評分以及點贊數(shù)的數(shù)據(jù)并保存為csv 格式,方便后續(xù)對數(shù)據(jù)進(jìn)行分析[3]。
利用python 編寫的爬蟲程序從京東購物網(wǎng)站中獲取了某辦公椅從2015 年11 月14 日17:34 至2022 年2 月10 日22:33的部分用戶評論(共999 條)數(shù)據(jù),通過Jieba 庫對讀取到的數(shù)據(jù)進(jìn)行分詞處理,將評論內(nèi)容中的語句進(jìn)行精準(zhǔn)的切分[4]。例如:將“產(chǎn)品外觀設(shè)計美觀,材質(zhì)挺好,安裝簡單,很舒適”劃分為“產(chǎn)品”“外觀設(shè)計”“美觀”“材質(zhì)”“挺”“好”“安裝簡單”“很”“舒適”,再利用現(xiàn)有的停用詞詞典對數(shù)據(jù)進(jìn)行清理,去除無意義的詞語以及標(biāo)點符號[5]。
詞頻— 反轉(zhuǎn)文件頻率 (term frequency-inverse document frequency,TF-IDF)是一種用于情報檢索與文本挖掘的常用加權(quán)技術(shù),用以評估一個詞對于一個文件或者一個語料庫中的一個領(lǐng)域文件集的重要程度[6]。通過TF-IDF 對數(shù)據(jù)進(jìn)行好詞、差詞詞頻的統(tǒng)計(表1、表2),剔除文本中的非關(guān)鍵詞,協(xié)助后續(xù)構(gòu)建詞云圖分析。
表1 好詞詞頻統(tǒng)計
表2 差詞詞頻統(tǒng)計
在對高頻詞進(jìn)行統(tǒng)計后,需要利用共詞矩陣的方式來統(tǒng)計文本中兩兩詞組之間共同出現(xiàn)的次數(shù),通過這種方式來描述詞組之間的關(guān)聯(lián)度[7],利用python 中的pandas 庫和numpy 庫進(jìn)行共詞矩陣的構(gòu)建(表3)[8],從表3 可以看出“質(zhì)量”“安裝”“服務(wù)”“調(diào)節(jié)”與辦公椅的關(guān)聯(lián)度較高,例如“椅子”和“安裝”的共現(xiàn)次數(shù)有303 次,“質(zhì)量”和“安裝”共現(xiàn)次數(shù)有210 次,表明這些都是消費者比較關(guān)注的地方。
表3 該辦公椅的在線評論共詞矩陣
語義網(wǎng)絡(luò)分析是以高頻詞兩兩之間的共現(xiàn)關(guān)系為基礎(chǔ),將其進(jìn)行數(shù)值化處理,再以圖形化的方式揭示兩個詞組之間的關(guān)系[9]。利用python 中的networks 庫繪制語義網(wǎng)絡(luò)圖(圖3)[10],從圖4可以看到“安裝”“質(zhì)量”“服務(wù)”“外觀”“調(diào)節(jié)”是該辦公椅在線評論語義網(wǎng)絡(luò)中的核心特征詞,這些特征詞是最容易影響消費者滿意度的,同樣也是左右消費者購買決策的重要影響因素,因此在后續(xù)的產(chǎn)品創(chuàng)新中需要格外關(guān)注。此外,從圖3 還可以看出“物流”“商家”“樣式”“扶手”等重要節(jié)點,這些節(jié)點是語義網(wǎng)絡(luò)中的“橋”,它們的存在使得整個語義網(wǎng)絡(luò)相互貫通,將不同評論觀點中最重要的部分銜接了起來[11],同時也是消費者在購買產(chǎn)品時的重要影響因素。
圖3 語義網(wǎng)絡(luò)圖
3.2.1 詞云圖 “詞云”就是對網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過濾掉大量的文本信息,使瀏覽網(wǎng)頁者只要一眼掃過文本就可以領(lǐng)略文本的主旨[12]。利用WordCloud庫分別對好評評論以及差評評論進(jìn)行詞云圖的構(gòu)建[13],通過詞云圖來展示消費者對產(chǎn)品的關(guān)注點和滿意度。
3.2.2 好詞詞云分析 在好評詞云中(圖4),可以看到“舒服”“結(jié)實”“方便”等積極詞匯占了大多數(shù),同時出現(xiàn)了“安裝”“客服”“服務(wù)”等詞匯,表明大部分顧客不僅對產(chǎn)品的質(zhì)量感到滿意,同時對該平臺的服務(wù)也表示滿意。
圖4 好詞詞云
3.2.3 差詞詞云分析 在差評詞云中(圖5),可以看到“扶手”“靠背”“頭枕”“螺絲”等詞匯,可以看出差評中購買者對商品零部件質(zhì)量存在不滿的態(tài)度以及在產(chǎn)品的安裝方面存在問題;“快遞”“發(fā)貨”等詞匯表明購買者對平臺物流方面的關(guān)注。
圖5 差詞詞云
對差詞詞云中提到的詞匯進(jìn)一步分析,定位到具體的用戶評論中,再對用戶提出的意見與該辦公椅的產(chǎn)品宣傳進(jìn)行對比總結(jié)(表4)。從用戶評論中可以看出,該辦公椅在靠背、頭枕、扶手的安裝方面存在問題,同時坐墊、腰枕存在舒適性的問題。針對該辦公椅存在的這些短板與不足,設(shè)計師需要以產(chǎn)品安裝和舒適性為重點,提出相應(yīng)的改進(jìn)策略和措施。例如,在安裝方面,對安裝視頻進(jìn)行詳細(xì)的講解,告知用戶安裝的注意事項,增加安裝說明書,在保證產(chǎn)品結(jié)構(gòu)穩(wěn)定性的提下,盡量減少零部件在安裝時需要過多的配件,同時提升配件質(zhì)量,使得安裝更加簡易化。在舒適性的問題上,主要是對材質(zhì)的選取是否合適,坐墊和腰枕的材料應(yīng)選取軟硬度較為適宜的,避免壓力集中帶來的壓迫感,同時還需要考慮材料的透氣性和導(dǎo)熱性[14]。此外,還需要優(yōu)化靠背的支撐形式,讓使用者腰背部的肌肉得到更好的放松,增加靠背、頭枕的可調(diào)節(jié)范圍以滿足不同使用場景的需求。
表4 產(chǎn)品宣傳與用戶意見對比
利用python 軟件對京東購物平臺中某款辦公椅的用戶評論進(jìn)行文本數(shù)據(jù)挖掘,通過分詞處理的方式對數(shù)據(jù)中的有效信息進(jìn)行篩選,再將篩選好的數(shù)據(jù)利用共詞矩陣和語義網(wǎng)絡(luò)分析的方法進(jìn)行可視化處理并制作成詞云圖分析,把該辦公椅產(chǎn)品在線評論中潛藏的重要信息挖掘出來。從詞云圖中可以看出,這款辦公椅的質(zhì)量、樣式、功能、材質(zhì)等產(chǎn)品特征是用戶選購產(chǎn)品時的主要關(guān)注點。此外,用戶對產(chǎn)品的包裝以及物流方面也有關(guān)注。通過這些數(shù)據(jù)分析反映出來的問題能夠幫助設(shè)計師找到消費者的隱形需求,找到產(chǎn)品優(yōu)化設(shè)計的方向與創(chuàng)新設(shè)計點。例如用戶對產(chǎn)品結(jié)構(gòu)的穩(wěn)定性、安裝的便捷性以及材料的舒適性等方面存在期待,因此在迭代升級設(shè)計下一代辦公椅時需要加強零部件的質(zhì)量,同時改善產(chǎn)品的包裝,在造型上同樣需要優(yōu)化。通過這種方法讓新產(chǎn)品能保持市場活力,同時設(shè)計師通過用戶評論來改善辦公椅的缺點,對產(chǎn)品進(jìn)行創(chuàng)新設(shè)計,這種方式也是讓客戶參與設(shè)計的方法之一,用戶最有發(fā)言權(quán)。
研究僅選取了京東購物平臺上的一款熱銷辦公椅進(jìn)行文本數(shù)據(jù)挖掘,數(shù)據(jù)來源較為單一,因此分析結(jié)果存在一定的局限性。未來研究中可以針對同一產(chǎn)品進(jìn)行多平臺的對比分析,進(jìn)一步提高分析結(jié)果的真實性、可靠性。