国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的經(jīng)濟(jì)銷售行為分析

2020-07-22 09:57崔澤豪羅養(yǎng)霞劉卓文董雨萌

崔澤豪 羅養(yǎng)霞 劉卓文 董雨萌

摘要:基于大數(shù)據(jù)分析指導(dǎo)銷售策略,提高經(jīng)濟(jì)銷售量是網(wǎng)絡(luò)銷售的核心問(wèn)題之一。論文基于數(shù)據(jù)分析挖掘情感詞,構(gòu)建詞向量矩陣;通過(guò)最小平方擬合動(dòng)態(tài)分析產(chǎn)品評(píng)級(jí)變化趨勢(shì);然后通過(guò)互信息法構(gòu)建評(píng)級(jí)模型,研究市場(chǎng)關(guān)注的商品屬性及滿意度關(guān)系;進(jìn)而確定產(chǎn)品的設(shè)計(jì)特征與成功和失敗的衡量標(biāo)準(zhǔn),從而找到合適的銷售策略。

關(guān)鍵詞:在線銷售;情感特征詞;互信息度量;KNN分析算法

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2020)06-0219-02

0 引言

在線銷售蓬勃發(fā)展,帶來(lái)了大量的產(chǎn)品評(píng)論,產(chǎn)品評(píng)論對(duì)潛在顧客具有參考價(jià)值,對(duì)商家具有商業(yè)價(jià)值,基于大數(shù)據(jù)分析經(jīng)濟(jì)銷售在線評(píng)論以促進(jìn)銷售策略。在線評(píng)論依附于某種產(chǎn)品存在,針對(duì)產(chǎn)品本身以及其具有的屬性進(jìn)行評(píng)價(jià),研究采用依存句法分析對(duì)評(píng)論文本進(jìn)行長(zhǎng)句分割,然后對(duì)分割后的評(píng)論文本構(gòu)建詞向量,再對(duì)單字進(jìn)行過(guò)濾,提取出特征詞,進(jìn)而統(tǒng)計(jì)特征詞出現(xiàn)的次數(shù);為了方便分析評(píng)論文本特征詞和評(píng)級(jí)與時(shí)間的關(guān)系,將時(shí)間劃分為片段化,利用最小平方擬合得出指數(shù)和線性趨勢(shì)線,分析在線評(píng)論文本特征詞與產(chǎn)品評(píng)級(jí)隨著時(shí)間動(dòng)態(tài)變化特點(diǎn)和趨勢(shì),以此來(lái)確定可以作為追蹤的數(shù)據(jù)指標(biāo)并關(guān)注產(chǎn)品聲譽(yù)的變化;按照文本和評(píng)級(jí),采用KNN算法對(duì)在線評(píng)論文本的產(chǎn)品屬性詞在每個(gè)產(chǎn)品評(píng)級(jí)下的出現(xiàn)頻率進(jìn)行統(tǒng)計(jì),進(jìn)而確定產(chǎn)品失敗和成功的衡量標(biāo)準(zhǔn)與銷量的關(guān)系,確定產(chǎn)品銷售決策。

1 基于數(shù)據(jù)挖掘的銷售行為分析模型構(gòu)建

1.1 構(gòu)建評(píng)論句詞向量

數(shù)據(jù)預(yù)處理直接影響數(shù)據(jù)的分析結(jié)果,會(huì)干擾結(jié)果的解釋,所以需要進(jìn)行詞性標(biāo)注預(yù)處理,構(gòu)建評(píng)論句詞向量[2]。通過(guò)獲取詞頻、定義和捕捉情感詞、計(jì)算每個(gè)等級(jí)中情感詞的頻率,計(jì)算互信息值,來(lái)獲取名詞、形容詞和動(dòng)詞組成評(píng)論詞向量,其中表示名詞,表示形容詞,表示動(dòng)詞。

1.2 基于特征詞信息熵的特征評(píng)級(jí)

信息熵來(lái)度量特征詞分類的穩(wěn)定性,特征詞熵愈小,系統(tǒng)的穩(wěn)定性愈大。首先,給予每個(gè)情感特征的權(quán)重計(jì)算,再通過(guò)訓(xùn)練文本分類,對(duì)情感特征詞進(jìn)行評(píng)分,計(jì)算特征詞信息熵,熵值越小,系統(tǒng)的確定性越大,然后對(duì)所有情感詞進(jìn)行權(quán)重的歸一化處理。

1.3 基于互信息的特征項(xiàng)過(guò)濾

基于互信息對(duì)情感詞進(jìn)行分析,統(tǒng)計(jì)每個(gè)等級(jí)出現(xiàn)的情感詞頻,并且計(jì)算每個(gè)詞在每一類的互信息值[1],如公式(1)所示。

互信息的特征項(xiàng)過(guò)濾,僅保留特征性較高的詞,對(duì)普遍性較高的詞,如分布較均勻、不同類中分布差異不大的詞,則過(guò)濾掉。

1.4 基于依存句法分析構(gòu)建屬性詞-詞頻模型

對(duì)評(píng)論句進(jìn)行依存句法分析,并且將句子按照詞性分割。通過(guò)匹配句子中詞性的不同,尋找句子成分的邊界,并添加逗號(hào),完成分割[2]。詞性標(biāo)注能判定句子中每個(gè)詞的詞性,判定該詞在劇中所處的成分外,更能體現(xiàn)詞與詞之間的依存關(guān)系,通過(guò)聯(lián)合多個(gè)詞的句法和詞性標(biāo)注的方式,加入了大量的上下文特征。

實(shí)驗(yàn)通過(guò)Python程序,在Matplot仿真情感詞在不同評(píng)級(jí)下的互信息值,采用KNN分類算法對(duì)文本進(jìn)行分類,系統(tǒng)在訓(xùn)練集中對(duì)待分類文本,找與其最近的個(gè)近鄰,這個(gè)近鄰中的大多數(shù)屬于哪一類別,就把待分類文本歸為哪一類。具體步驟如圖1所示。

建立了基于依存句法分析構(gòu)建屬性詞-詞頻模型,以此來(lái)為后續(xù)的基于時(shí)間模式的情感詞評(píng)論文本和評(píng)級(jí)模型來(lái)做基礎(chǔ)模型,便于統(tǒng)計(jì)和觀察基于時(shí)間模式下,產(chǎn)品評(píng)論和評(píng)級(jí)的變化趨勢(shì),對(duì)產(chǎn)品聲譽(yù)好壞進(jìn)一步挖掘評(píng)定。

2 基于時(shí)間模式的情感詞評(píng)論和評(píng)級(jí)模型

2.1 基于時(shí)間的用戶評(píng)論行為分析

從兩方面進(jìn)行分析:一是分析在線用戶評(píng)論行為的時(shí)間分布規(guī)律,分別以月和年為時(shí)長(zhǎng)片段,作為統(tǒng)計(jì)用戶評(píng)論行為的基礎(chǔ)時(shí)間序列;二是將評(píng)論的時(shí)間間隔作為時(shí)間序列,分別計(jì)算不同時(shí)間序列的用戶評(píng)論行為規(guī)律,并將時(shí)間間隔進(jìn)行階段劃分,分析各個(gè)階段用戶評(píng)論數(shù)據(jù)的特征[3]。

2.2 不同評(píng)級(jí)的趨勢(shì)線擬合

應(yīng)用趨勢(shì)線,即回歸分析,應(yīng)用趨勢(shì)線擬合數(shù)據(jù),預(yù)測(cè)未來(lái)銷售情況[4]。將產(chǎn)品評(píng)級(jí)作為因變量,按時(shí)間段(年)作為數(shù)據(jù)自變量,進(jìn)行趨勢(shì)分析[5],如圖2所示。

可以看出,不同評(píng)級(jí)數(shù)據(jù)變化與年階段增長(zhǎng)數(shù)據(jù)趨勢(shì)線擬合。包含情感的評(píng)論文本和產(chǎn)品評(píng)級(jí)有直接緊密的聯(lián)系,隨著評(píng)論文本里負(fù)面情感詞的增加,產(chǎn)品的評(píng)級(jí)降低,直接影響客戶對(duì)產(chǎn)品的購(gòu)買和評(píng)價(jià),決定下一步的銷售策略因素最大。

3 結(jié)語(yǔ)

此模型從從多個(gè)角度分析商業(yè)行為,注重各個(gè)因素之間的關(guān)系,運(yùn)用大量數(shù)據(jù)進(jìn)行仿真和模擬,使數(shù)據(jù)挖掘更具有說(shuō)服力。不足之處是對(duì)噪音數(shù)據(jù)的處理不夠,下一步將引入評(píng)論中的否定詞、無(wú)特殊意義的字母,符號(hào)等,結(jié)合時(shí)效性進(jìn)行深度分析。

參考文獻(xiàn)

[1] 胡云鳳.基于主題模型的在線評(píng)論分析方法研究[D].西安:西安電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院,2017.

[2] 石翠.依存句法分析研究綜述[J].智能計(jì)算機(jī)與應(yīng)用,2016,3(6):47-48.

[3] 安靜.基于依存句法分析與序列標(biāo)注的英文長(zhǎng)句機(jī)器翻譯[J].蘭州理工大學(xué)學(xué)報(bào),2018,44(1):101-102.

[4] 張艷豐.在線用戶評(píng)論行為時(shí)間序列關(guān)聯(lián)特征規(guī)律研究[D].吉林:吉林大學(xué)管理學(xué)院,2018.

[5] 崔永生.在線評(píng)論文本挖掘?qū)﹄娚痰挠绊懷芯縖J].中國(guó)商貿(mào),2018(33):17-23.

南通市| 尤溪县| 博客| 嘉义市| 广宗县| 高要市| 玉田县| 建湖县| 南宁市| 石林| 晋江市| 河池市| 蓝田县| 黑龙江省| 喜德县| 岐山县| 马关县| 香格里拉县| 交城县| 常熟市| 北票市| 安图县| 石景山区| 金秀| 娄底市| 锦州市| 陇川县| 沅江市| 枣庄市| 巴林右旗| 彝良县| 邵阳县| 屏东市| 沙坪坝区| 九龙城区| 蓬莱市| 文山县| 称多县| 栾城县| 阿合奇县| 华坪县|