国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)的酒業(yè)輿情信息監(jiān)測(cè)平臺(tái)

2020-06-02 03:36鄒佳成馬遠(yuǎn)遠(yuǎn)唐伯超劉振國(guó)
釀酒科技 2020年3期
關(guān)鍵詞:酒業(yè)輿情聚類

鄒佳成,馬遠(yuǎn)遠(yuǎn),劉 婷,唐伯超,劉振國(guó),高 輝

(1.電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,四川成都 611731;2.成都數(shù)之聯(lián)科技有限公司,四川成都 610094;3.宜賓五糧液股份有限公司,四川宜賓 644000;4.中國(guó)酒業(yè)協(xié)會(huì),北京 100831)

隨著移動(dòng)互聯(lián)網(wǎng)用戶的大規(guī)模增長(zhǎng),互聯(lián)網(wǎng)已經(jīng)成為人們生活的重要組成部分。如今社會(huì),眾多熱點(diǎn)事件層出不窮,負(fù)面敏感信息可以在短時(shí)間內(nèi)得到快速放大傳播,制造嚴(yán)重輿情危機(jī),給相關(guān)人員的聲譽(yù)造成嚴(yán)重影響。相關(guān)部門(mén)和企業(yè)部門(mén)越來(lái)越關(guān)注公眾輿論熱點(diǎn),面對(duì)洶涌的輿論,對(duì)大數(shù)據(jù)在線網(wǎng)絡(luò)輿情的挖掘、方法和預(yù)警等方面的研究具有重要的社會(huì)價(jià)值和理論意義。無(wú)論是電視、報(bào)刊、網(wǎng)絡(luò)、還是新媒體微博、論壇等,都在不斷發(fā)布和傳播各級(jí)政府的最新政策法規(guī),全面監(jiān)測(cè)這些媒體,可以及時(shí)獲得自己關(guān)心的相關(guān)政策動(dòng)向。同時(shí)根據(jù)自己所在部門(mén)和行業(yè)所關(guān)注的社會(huì)熱點(diǎn)新聞,每天能夠從輿情監(jiān)測(cè)中獲得所有的相關(guān)信息。

目前,輿情監(jiān)控已引起政府部門(mén)和先進(jìn)企業(yè)的重視[1],在大數(shù)據(jù)技術(shù)的支持下,相繼開(kāi)發(fā)了屬于自己的輿情監(jiān)測(cè)平臺(tái)[2]。如,新浪推出了自己輿情平臺(tái)“新浪輿情通”,可對(duì)某一網(wǎng)絡(luò)事件在互聯(lián)網(wǎng)上的整體傳播情況,收集全網(wǎng)數(shù)據(jù)進(jìn)行分析,自動(dòng)生成涵蓋事件簡(jiǎn)介、事件走勢(shì)、網(wǎng)站統(tǒng)計(jì)、數(shù)據(jù)類型、關(guān)鍵詞云、熱門(mén)信息、熱點(diǎn)網(wǎng)民、傳播路徑、相關(guān)詞、網(wǎng)民觀點(diǎn)、輿情總結(jié)等11 個(gè)維度的全網(wǎng)事件分析報(bào)告。政府部門(mén)也在開(kāi)發(fā)各領(lǐng)域下的大數(shù)據(jù)輿情平臺(tái)。同樣,對(duì)于酒業(yè),輿情同樣影響著每一個(gè)品牌和企業(yè)。假酒事件常有出現(xiàn),騙財(cái)害命也影響了品牌的形象。

酒業(yè)輿情較為龐雜,各業(yè)務(wù)部門(mén)、業(yè)務(wù)人員對(duì)于輿情的訴求各有所異,因此酒業(yè)輿情的處理不僅僅是對(duì)于酒業(yè)相關(guān)輿情的獲取,更需要將酒業(yè)輿情結(jié)合酒企的業(yè)務(wù)場(chǎng)景,為其提供高效的分主題輿情,使得各業(yè)務(wù)主體均可通過(guò)酒業(yè)輿情快速定位業(yè)務(wù)問(wèn)題,為企業(yè)相關(guān)業(yè)務(wù)的開(kāi)展提供充分的外部決策數(shù)據(jù),給業(yè)務(wù)部門(mén)提供參考與指導(dǎo)。本次研究的酒業(yè)輿情信息涵蓋了從百度貼吧、搜狐、新浪微博、騰訊、鳳凰網(wǎng)、網(wǎng)易、知乎、同花順、微信、今日頭條、人民網(wǎng)、宜賓零距離、央視網(wǎng)、新浪、東方財(cái)富網(wǎng)多個(gè)渠道所獲取的關(guān)于五糧液、茅臺(tái)、古井貢、洋河、瀘州老窖、劍南春6 個(gè)相關(guān)酒企的新聞、博客和帖子。

針對(duì)此而基于大數(shù)據(jù)開(kāi)發(fā)的酒業(yè)輿情信息監(jiān)測(cè)平臺(tái),能夠?qū)崟r(shí)采集酒企及主要競(jìng)爭(zhēng)對(duì)手在主流社交媒體上的酒業(yè)輿情信息,整理分類為“營(yíng)銷生產(chǎn)”:與白酒生產(chǎn)、營(yíng)銷、白酒價(jià)格升降相關(guān)的新聞、論壇帖子、公眾號(hào)文章等內(nèi)容;“金融投資”:與白酒企業(yè)股票、基金、期貨、投資、并購(gòu)等相關(guān)的財(cái)經(jīng)類內(nèi)容;“公司動(dòng)態(tài)”:與白酒企業(yè)人事調(diào)動(dòng)、公司高層動(dòng)態(tài)、公司對(duì)外合作等相關(guān)的文章;“產(chǎn)品討論”:討論白酒產(chǎn)品口味、真假、售價(jià)高低、包裝、物流等相關(guān)的評(píng)論文章;“社會(huì)新聞”:與白酒品牌相關(guān)的貪污受賄、清掃造假窩點(diǎn)、行業(yè)宣傳活動(dòng)等相關(guān)報(bào)道文章;“行業(yè)動(dòng)態(tài)”:討論整個(gè)白酒行業(yè)的評(píng)論性文章,白酒行業(yè)數(shù)據(jù)解讀類文章以及文章評(píng)論,并分析相關(guān)網(wǎng)帖、事件,判斷新聞情感傾向,跟蹤事件發(fā)展趨勢(shì)、事件熱度并實(shí)時(shí)預(yù)警,從而幫助酒企全面了解自己及競(jìng)爭(zhēng)對(duì)手在網(wǎng)絡(luò)媒體上的輿情動(dòng)態(tài),為制定品牌形象優(yōu)化策略提供指引,提前把握緊急事件。

1 基于大數(shù)據(jù)的酒業(yè)輿情信息監(jiān)測(cè)平臺(tái)架構(gòu)

圖1 平臺(tái)框架圖

本平臺(tái)能夠?qū)ξ寮Z液及其競(jìng)爭(zhēng)品牌的電商銷售數(shù)據(jù)與輿情數(shù)據(jù)進(jìn)行采集與分析,分別監(jiān)控各酒類品牌的電商銷售、渠道營(yíng)銷、用戶評(píng)價(jià)以及輿情口碑情況,幫助五糧液全面地了解線上市場(chǎng)、競(jìng)爭(zhēng)對(duì)手、用戶偏好以及實(shí)時(shí)跟蹤輿論事件發(fā)展動(dòng)態(tài),從而在線上銷售策略的制定、產(chǎn)品的渠道投放和用戶口碑建設(shè)等方面,為五糧液提供基于大數(shù)據(jù)的支撐和指引。平臺(tái)共分為7個(gè)層次,框架如圖1所示。

數(shù)據(jù)接入層包含酒企電商銷售數(shù)據(jù)及輿情數(shù)據(jù),采用基于Redis的增量式爬蟲(chóng),接入天貓、京東、酒仙網(wǎng)等各大電商平臺(tái),以及微博、微信公眾號(hào)、東方財(cái)經(jīng)、同花順等各大社交媒體和信息門(mén)戶,每小時(shí)定時(shí)爬取數(shù)據(jù),并將其自動(dòng)導(dǎo)入系統(tǒng)。數(shù)據(jù)標(biāo)準(zhǔn)化層檢查數(shù)據(jù)接入層獲取數(shù)據(jù)的完整性、有效性和規(guī)范性,并對(duì)其做元數(shù)據(jù)提取等預(yù)處理操作。數(shù)據(jù)存儲(chǔ)層利用分布式文件系統(tǒng)HDFS 和數(shù)據(jù)倉(cāng)庫(kù)工具HIVE對(duì)各類數(shù)據(jù)實(shí)現(xiàn)高效存儲(chǔ)。資源調(diào)度層采用airflow,對(duì)各層內(nèi)部、層與層之間,統(tǒng)一進(jìn)行資源的管理與調(diào)度。計(jì)算框架層主要包含可視化分析、深度學(xué)習(xí)框架和大數(shù)據(jù)計(jì)算框架,為平臺(tái)提供算法支撐。數(shù)據(jù)計(jì)算層根據(jù)具體需求對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行分類、聚類、情感分析等。應(yīng)用服務(wù)層用于建立和維護(hù)用戶管理系統(tǒng)、輿情系統(tǒng)、綜合展示系統(tǒng),真正實(shí)現(xiàn)可視化輿情信息并實(shí)時(shí)告警功能。

2 主要功能模塊介紹

平臺(tái)每小時(shí)自動(dòng)爬取網(wǎng)絡(luò)數(shù)據(jù),并利用數(shù)據(jù)預(yù)處理模塊對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和特征提取,得到處理好的待分類數(shù)據(jù),每條數(shù)據(jù)稱為網(wǎng)帖。利用分類模塊對(duì)網(wǎng)帖數(shù)據(jù)進(jìn)行分類,將網(wǎng)帖分為6 個(gè)類別。在每個(gè)類別內(nèi)部,利用聚類模塊進(jìn)行聚類,每個(gè)聚類結(jié)果稱為一個(gè)事件。最后利用聲量計(jì)算和情感分析模塊,根據(jù)熱度計(jì)算每個(gè)網(wǎng)帖的聲量,并對(duì)其進(jìn)行情感分析,確定網(wǎng)帖的正負(fù)情感傾向;將每個(gè)事件下所有網(wǎng)帖聲量之和作為事件的聲量,統(tǒng)計(jì)事件下網(wǎng)帖正負(fù)情感傾向,得到事件的情感正負(fù)向占比。數(shù)據(jù)處理流程如圖2所示。

2.1 數(shù)據(jù)預(yù)處理

圖2 數(shù)據(jù)處理流程

網(wǎng)帖指輿情新聞話題,由屬性和文本兩部分組成,其中屬性包括時(shí)間、酒企標(biāo)簽、轉(zhuǎn)發(fā)量、瀏覽量、聲量、情感正負(fù)向等,文本包括標(biāo)題和正文文本。屬性用于計(jì)算聲量及平臺(tái)前臺(tái)按條件篩選展示網(wǎng)帖,文本數(shù)據(jù)用于網(wǎng)帖分類、聚類及情感分析。平臺(tái)直接從網(wǎng)絡(luò)中獲取的網(wǎng)絡(luò)數(shù)據(jù)分散、零亂、標(biāo)準(zhǔn)不統(tǒng)一,需要對(duì)其進(jìn)行數(shù)據(jù)清洗和元數(shù)據(jù)提取。首先,以五糧液、瀘州老窖、洋河、茅臺(tái)、劍南春、古井貢為正則化規(guī)則,剔除原始數(shù)據(jù)庫(kù)中與六大白酒企業(yè)無(wú)關(guān)的網(wǎng)帖。另外,剔除微博數(shù)據(jù)中,標(biāo)簽大于3或者以http開(kāi)頭的網(wǎng)帖;剔除微博粉絲數(shù)少于200的微博用戶發(fā)布的網(wǎng)帖數(shù)據(jù);剔除標(biāo)題中出現(xiàn)“小說(shuō)”“故事”短語(yǔ)的網(wǎng)帖數(shù)據(jù)。由于網(wǎng)絡(luò)數(shù)據(jù)中可能包含大量的CSS、HTML 等特殊字符,影響后續(xù)數(shù)據(jù)處理的準(zhǔn)確性,所以再次利用正則匹配的方法,剔除網(wǎng)帖中的無(wú)關(guān)成分;對(duì)于沒(méi)有標(biāo)題的數(shù)據(jù),用文本的前十位進(jìn)行填充。對(duì)清洗后的數(shù)據(jù)進(jìn)行元數(shù)據(jù)提取,更新網(wǎng)帖屬性和文本對(duì)應(yīng)字段。最后,將處理好的數(shù)據(jù)壓縮,并存入清洗結(jié)果數(shù)據(jù)庫(kù)中。

2.2 網(wǎng)帖分類

Bert 模型[3]是Google 公司于2018 年發(fā)布的一種新的語(yǔ)言編碼模型,它在ELMO[4]、Word2Vec[5]等模型的基礎(chǔ)上,采用雙向語(yǔ)言模型進(jìn)行預(yù)訓(xùn)練,使用Transformer[6]代替循環(huán)神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)作為特征提取器。Bert 模型一經(jīng)提出,就在11 個(gè)NLP 任務(wù)上刷新了記錄,它具有非常好的效果和很強(qiáng)的普適性,只需要預(yù)訓(xùn)練和微調(diào),就能將Bert 模型應(yīng)用到不同的任務(wù)上。Bert-Base,Chinese 模型是Google 在原始Bert 模型基礎(chǔ)上預(yù)訓(xùn)練的中文文本分類模型,在使用過(guò)程中,只需要再對(duì)其進(jìn)行微調(diào),就能得到非常好的結(jié)果。

經(jīng)過(guò)對(duì)酒業(yè)輿情數(shù)據(jù)和輿情訴求數(shù)據(jù)的分析,得知酒企重點(diǎn)關(guān)注的業(yè)務(wù)領(lǐng)域如下:自身及競(jìng)爭(zhēng)產(chǎn)品在營(yíng)銷生產(chǎn)方面的動(dòng)態(tài)與市場(chǎng)反應(yīng)、行業(yè)企業(yè)的投資并購(gòu)金融近況、企業(yè)內(nèi)部運(yùn)營(yíng)變動(dòng)情況、行業(yè)突發(fā)緊急輿情、行業(yè)評(píng)論文章與網(wǎng)民態(tài)度。因此,本平臺(tái)將酒業(yè)輿情進(jìn)行主題輿情分類,并對(duì)分類結(jié)果進(jìn)行聚類,以更好地為酒企提供輿情服務(wù)。根據(jù)以上需求,我們通過(guò)人工標(biāo)注的方式,將10000 條網(wǎng)帖分為營(yíng)銷生產(chǎn)、金融投資、公司動(dòng)態(tài)、產(chǎn)品討論、社會(huì)新聞、行業(yè)觀察六個(gè)類別,用這些標(biāo)注后的樣本對(duì)Bert-Base,Chinese模型進(jìn)行微調(diào),得到能夠滿足酒業(yè)輿情分類需求的分類模型。利用該模型,將所有輸入的未分類網(wǎng)帖分為對(duì)應(yīng)類別,并自動(dòng)更新網(wǎng)帖屬性中對(duì)應(yīng)的類別字段。

由于模型以字為粒度對(duì)文本進(jìn)行切分,不需要任何分詞、去停用詞和詞嵌入操作,將清洗后的文本截取前200 個(gè)字直接送入模型,就可以得到分類結(jié)果。

在與傳統(tǒng)的分類模型對(duì)比發(fā)現(xiàn),平臺(tái)使用的模型分類準(zhǔn)確率能夠提升7%。可見(jiàn),我們選擇的模型,不僅能夠縮減分類步驟,減少分類所需時(shí)間,同時(shí)也能夠提高分類準(zhǔn)確率。

2.3 網(wǎng)帖聚類

使用網(wǎng)帖分類模塊將網(wǎng)帖分為6 個(gè)類別后,每類別中包含的網(wǎng)帖可能與某一相同事件有關(guān),將這樣具有相似性的網(wǎng)帖聚類成相同事件,有助于更加直觀的描述現(xiàn)實(shí)中的輿情事件。網(wǎng)帖包含我們將網(wǎng)帖文本字段分詞后得到文本詞語(yǔ)集合,利用doc2vec[7],將每條網(wǎng)帖數(shù)據(jù)分詞后的詞語(yǔ)集合嵌入到300 維的文檔向量。使用single-pass[8]計(jì)算兩個(gè)網(wǎng)帖向量的余弦相似度。

式中:A、B 表示A 網(wǎng)帖和B 網(wǎng)帖的文檔向量。將余弦相似度0.75 作為閾值,當(dāng)cosθ大于0.75 時(shí),將A、B 網(wǎng)帖聚為一個(gè)類別。事件包含的ID、聲量和正負(fù)向占比等字段。用不同ID 表示不同的事件,一個(gè)事件下的網(wǎng)帖有相同ID。對(duì)于已有事件,將事件中所有的網(wǎng)帖的文檔向量取均值作為該事件的聚類中心向量。對(duì)于每天新增的網(wǎng)帖,將計(jì)算其與已有事件的余弦相似度。當(dāng)余弦相似度大于閾值時(shí),網(wǎng)帖歸屬于余弦相似度最大的事件下,并更新當(dāng)前事件的中心向量;當(dāng)余弦相似度小于閾值時(shí),生成新事件ID,將新增網(wǎng)帖歸為此事件,且該新事件的聚類中心為網(wǎng)帖的文檔向量。

2.4 聲量計(jì)算與情感分析

輿情平臺(tái)關(guān)注媒體熱度高、群眾關(guān)注度高的網(wǎng)帖,該類網(wǎng)帖是非常重要的輿情信息。本平臺(tái)中,用聲量來(lái)衡量網(wǎng)帖的熱度,作為輿情熱度指標(biāo),以聲量的變化來(lái)描述現(xiàn)實(shí)生活中輿情熱度的變化,并為平臺(tái)提供輿情監(jiān)控和告警設(shè)置提供衡量標(biāo)準(zhǔn)。聲量(volume)定義如下:

式中:bi指評(píng)論數(shù)、點(diǎn)擊數(shù)、喜愛(ài)數(shù)、收藏?cái)?shù)、轉(zhuǎn)發(fā)數(shù)5 個(gè)網(wǎng)帖的相關(guān)信息,wi指bi對(duì)應(yīng)的權(quán)值,分別為0.3、0.2、0.2、0.1、0.2。

通過(guò)聲量公式直接計(jì)算網(wǎng)帖的聲量,用事件中所有網(wǎng)帖的聲量之和作為事件的聲量。每次更新數(shù)據(jù)時(shí),同時(shí)計(jì)算網(wǎng)帖的聲量增量和事件的聲量增量,并更新網(wǎng)帖和事件相應(yīng)字段,以便于畫(huà)出輿情的聲量走勢(shì)圖。對(duì)于連續(xù)7 天內(nèi),網(wǎng)帖數(shù)量增量或網(wǎng)帖聲量增量為0 的事件,將其設(shè)置為停止事件,不再對(duì)其進(jìn)行關(guān)注。

此外,了解網(wǎng)帖的正負(fù)情感傾向,有助于了解其是正向輿情還是負(fù)向輿情,掌控輿情發(fā)展?fàn)顩r。故平臺(tái)實(shí)現(xiàn)了對(duì)網(wǎng)帖的情感分析,并對(duì)事件中網(wǎng)帖的情感傾向進(jìn)行統(tǒng)計(jì),得到事件的正負(fù)情感傾向占比。我們將原始網(wǎng)帖數(shù)據(jù)分詞并去停用詞后,基于正負(fù)情感詞詞庫(kù),匹配網(wǎng)帖詞語(yǔ)集合中的所有詞語(yǔ)。網(wǎng)帖初始情感值設(shè)為0,匹配到正向詞語(yǔ)時(shí)情感值做+1 操作,匹配到負(fù)向詞語(yǔ)時(shí)情感值做-1 操作。匹配完所有網(wǎng)帖詞語(yǔ)后,得到最終的網(wǎng)帖情感值,對(duì)其進(jìn)行sigmoid 平滑處理。當(dāng)處理的平滑值大于0 時(shí),網(wǎng)帖情感傾向?yàn)檎?,否則為負(fù)向。情感傾向示意圖如圖3所示。

圖3 情感分析流程圖

事件不區(qū)分具體情感傾向,對(duì)事件中所有網(wǎng)帖情感傾向做統(tǒng)計(jì),得到事件的正負(fù)情感傾向比例,用該比例描述事件的性質(zhì)。當(dāng)正向網(wǎng)帖占比較大時(shí),認(rèn)為該事件屬于正向事件;當(dāng)負(fù)向網(wǎng)帖占比較大時(shí),認(rèn)為該事件屬于負(fù)向事件。

3 平臺(tái)展示

平臺(tái)能夠?qū)崟r(shí)采集酒企及主要競(jìng)爭(zhēng)對(duì)手在主流社交媒體上的輿情信息,分析識(shí)別相關(guān)網(wǎng)帖、事件,判斷新聞情感傾向,跟蹤事件發(fā)展趨勢(shì)、事件熱度并實(shí)時(shí)預(yù)警并根據(jù)其整理出輿情統(tǒng)觀信息。

輿情統(tǒng)觀功能利用每日在“騰訊”“搜狐”“網(wǎng)易”等新聞門(mén)戶網(wǎng)站,“百度貼吧”“今日頭條”“知乎”等論壇,“同花順”“東方財(cái)富”等財(cái)經(jīng)類網(wǎng)站,新浪微博等社交網(wǎng)站渠道收集的中國(guó)酒業(yè)輿情網(wǎng)帖信息(圖4),利用Bert 分類與情感傾向詞匯統(tǒng)計(jì)分析并動(dòng)態(tài)展現(xiàn)每日網(wǎng)帖聲量走勢(shì),橫向?qū)Ρ雀髑谰W(wǎng)帖數(shù)量及正負(fù)向情緒占比。

該功能直觀的展現(xiàn)了酒類品牌網(wǎng)帖的實(shí)時(shí)聲量走勢(shì),討論熱度,情緒正負(fù)向占比及熱議關(guān)鍵詞。為酒企輿情監(jiān)測(cè),突發(fā)事件公關(guān)提供詳細(xì)數(shù)據(jù)指導(dǎo)。

平臺(tái)每日監(jiān)控新聞?lì)悺⒄搲?、微博類等社交平臺(tái)及媒體渠道,實(shí)時(shí)采集“五糧液”“茅臺(tái)”“瀘州老窖”等中國(guó)酒業(yè)代表品牌相關(guān)的輿情網(wǎng)帖,統(tǒng)計(jì)各個(gè)網(wǎng)帖產(chǎn)生的輿情聲量。聲量大小體現(xiàn)了網(wǎng)帖的輿情熱度,圖5 展示了2019 年6 月聲量靠前的部分網(wǎng)帖,可見(jiàn)“張藝興,迪麗熱巴在五糧液生產(chǎn)間”網(wǎng)帖聲量大幅高于其余網(wǎng)帖,也體現(xiàn)了明星相關(guān)網(wǎng)帖熱度往往高于一般網(wǎng)帖,對(duì)企業(yè)的推廣有著積極的效果。

同時(shí),對(duì)各個(gè)渠道所獲取的網(wǎng)帖,平臺(tái)會(huì)分析網(wǎng)帖的情感正負(fù)向,統(tǒng)計(jì)網(wǎng)帖在一天、一周、一月的時(shí)間內(nèi)的數(shù)量并根據(jù)渠道來(lái)源展示其網(wǎng)帖的情感正負(fù)類,展示結(jié)果見(jiàn)圖6。

圖4 中國(guó)酒業(yè)輿情網(wǎng)帖聲量走勢(shì)及渠道分布

圖5 當(dāng)月中國(guó)酒業(yè)輿情事件及事件聲量

圖6 中國(guó)酒業(yè)輿情渠道及正負(fù)向網(wǎng)帖數(shù)量占比

對(duì)于事件與網(wǎng)帖,平臺(tái)會(huì)利用每日的新聞數(shù)據(jù)統(tǒng)計(jì)與分類跟蹤其聲量走勢(shì),以便酒企直觀的查看其對(duì)輿情造成的影響。也可查看具體網(wǎng)帖及其聲量走勢(shì)。圖7 展示了根據(jù)網(wǎng)帖聚類后所形成的事件“一噸新酒加一勺老酒就是陳釀,企業(yè)受到起訴”的前5 網(wǎng)帖及其事件輿情聲量近一個(gè)月的走勢(shì)??梢?jiàn)該事件一出現(xiàn)便引起了社會(huì)的廣泛關(guān)注,然后在一月時(shí)間內(nèi)討論熱度持續(xù)下降,但仍有一定的關(guān)注度。

告警系統(tǒng)如圖8 所示,可設(shè)置事件熱度閾值和通知方式及人員,閾值以每天的網(wǎng)帖數(shù)量,每天的聲量,每天微博大v 的博客數(shù)量來(lái)設(shè)定。對(duì)于熱度超過(guò)設(shè)定值的事件,平臺(tái)會(huì)向指定的相關(guān)人員以短信或郵件的方式發(fā)起告警,以及時(shí)做出處理緊急事件。

4 討論與總結(jié)

該平臺(tái)運(yùn)行近一年來(lái),在處理重大輿情事件的過(guò)程中,充分體現(xiàn)了快捷、高效、準(zhǔn)確的優(yōu)勢(shì)。面對(duì)突發(fā)事件,輿情平臺(tái)可以幫助酒企及時(shí)的獲得消息,及時(shí)地做出處理,以免事件發(fā)酵,造成更大的輿論影響,網(wǎng)絡(luò)輿情監(jiān)控對(duì)于了解社情民意,緩解輿論壓力具有重要作用和意義;同時(shí),在輔助決策方面,平臺(tái)提供了完整的統(tǒng)計(jì)信息,為酒企制定未來(lái)規(guī)劃提供了參考。

圖7 網(wǎng)帖詳情與其單月內(nèi)聲量走勢(shì)

圖8 事件告警系統(tǒng)

在平臺(tái)的進(jìn)一步優(yōu)化方面,可以通過(guò)深化和豐富互聯(lián)網(wǎng)輿情基礎(chǔ)理論,不斷修正模型;通過(guò)理論和實(shí)踐的相互促進(jìn),提升互聯(lián)網(wǎng)輿情監(jiān)測(cè)分析基礎(chǔ)模型的科學(xué)性,優(yōu)化完善互聯(lián)網(wǎng)輿情監(jiān)測(cè)分析系統(tǒng)。另一方面,在對(duì)大量網(wǎng)絡(luò)輿情事件開(kāi)展測(cè)試應(yīng)用,可以利用隨機(jī)森林進(jìn)行分析,使平臺(tái)能夠自動(dòng)確定或推薦事件聲量的合理告警閾值,加強(qiáng)平臺(tái)的自動(dòng)化性能。

猜你喜歡
酒業(yè)輿情聚類
2022中國(guó)杏花村國(guó)際酒業(yè)博覽會(huì)
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
雙溝酒業(yè)
第十七屆中國(guó)國(guó)際酒業(yè)博覽會(huì)宣布延期
金沙酒業(yè)2020年前4月銷售7.15億元
面向WSN的聚類頭選舉與維護(hù)協(xié)議的研究綜述
改進(jìn)K均值聚類算法
數(shù)字輿情
數(shù)字輿情
消費(fèi)輿情