国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于分布式爬蟲的微博輿情監(jiān)督與情感分析系統(tǒng)設(shè)計(jì)

2024-06-03 11:15:28何西遠(yuǎn)張?jiān)?/span>張秉文
現(xiàn)代信息科技 2024年5期
關(guān)鍵詞:情感分析網(wǎng)絡(luò)輿情

何西遠(yuǎn) 張?jiān)? 張秉文

收稿日期:2023-07-27

DOI:10.19850/j.cnki.2096-4706.2024.05.024

摘? 要:互聯(lián)網(wǎng)的興起使微博等自媒體平臺(tái)成為網(wǎng)民表達(dá)意見的主要途徑。同時(shí),網(wǎng)絡(luò)輿情的迅速傳播使得網(wǎng)民輿論管理成為一個(gè)難題。針對(duì)傳統(tǒng)方法在微博輿情管理上的局限性,文章設(shè)計(jì)一種基于分布式爬蟲的微博輿情監(jiān)測與情感分析系統(tǒng),并借助情感分析和LDA主題提取技術(shù),對(duì)熱點(diǎn)事件進(jìn)行分析,幫助政府和企業(yè)更好地把握輿情發(fā)展動(dòng)態(tài),捍衛(wèi)其社會(huì)公信力。

關(guān)鍵詞:網(wǎng)絡(luò)輿情;分布式爬蟲;情感分析;LDA主題提取

中圖分類號(hào):TP311.1? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2024)05-0111-05

Design of Sinaweibo Public Opinion Supervision and Sentiment Analysis System Based on Distributed Crawlers

HE Xiyuan, ZHANG Yue, ZHANG Bingwen

(School of Information Engineering, Shandong Youth University of Political Science, Ji'nan? 250103, China)

Abstract: The rise of the Internet has made Sinaweibo and other We Media platforms the main way for netizens to express their opinions. At the same time, the rapid spread of Internet public opinion makes the public opinion management of netizens a difficult problem. Aiming at the limitations of traditional methods in Sinaweibo public opinion management, this paper designs a Sinaweibo public opinion monitoring and sentiment analysis system based on distributed crawler. It uses sentiment analysis and LDA topic extraction technology to analyze hot events, helping governments and enterprises better grasp the development dynamics of public opinion and defend their social credibility.

Keywords: Internet public opinion; distributed crawler; sentiment analysis; LDA topic extraction

0? 引? 言

近年來,微博作為中國最受歡迎的社交平臺(tái)之一,已成為人們信息交流的主要途徑。微博每天都發(fā)布上億條信息,海量信息中蘊(yùn)藏著巨大的價(jià)值。通過分析,可以有效了解網(wǎng)民們對(duì)熱點(diǎn)事件的態(tài)度,并對(duì)輿情發(fā)展動(dòng)態(tài)進(jìn)行有效監(jiān)控。了解社情民意、調(diào)整政策、回應(yīng)社會(huì)關(guān)切對(duì)于政府和企業(yè)具有重要意義。

傳統(tǒng)的輿情分析方法主要采用人工方法或機(jī)器學(xué)習(xí)進(jìn)行。然而,在網(wǎng)絡(luò)時(shí)代下,這些方法已經(jīng)難以滿足快速處理分析的需求。一方面,微博對(duì)用戶IP的訪問次數(shù)進(jìn)行限制,導(dǎo)致數(shù)據(jù)獲取困難。另一方面,微博所涵蓋的數(shù)據(jù)規(guī)模巨大,其半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)類型使得數(shù)據(jù)處理存儲(chǔ)困難。

分布式爬蟲技術(shù)可以有效解決傳統(tǒng)的輿情分析方法在應(yīng)用中存在的局限。分布式爬蟲技術(shù)可以充分利用分布式系統(tǒng)的優(yōu)勢(shì),實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的快速抓取和高效處理,為輿情分析提供更為全面準(zhǔn)確的數(shù)據(jù)支持。情感分析和主題提取是常用的輿情分析方法[1]。情感分析技術(shù)能夠展現(xiàn)網(wǎng)民對(duì)社會(huì)熱點(diǎn)的情感態(tài)度,而主題提取則可以在大量的輿情信息中識(shí)別出輿情熱點(diǎn)。為了彌補(bǔ)傳統(tǒng)輿情分析方法的缺陷,本文從數(shù)據(jù)采集、處理、存儲(chǔ)、文本挖掘和可視化展示五個(gè)方面設(shè)計(jì)了一個(gè)基于分布式爬蟲技術(shù)的輿情監(jiān)測和分析系統(tǒng),用于挖掘輿情事件的熱點(diǎn)和情感傾向,幫助政府和企業(yè)引導(dǎo)輿情。

1? 架構(gòu)設(shè)計(jì)

為了滿足網(wǎng)絡(luò)輿情發(fā)展的特點(diǎn)和輿情管理的相關(guān)需求,微博的輿情分析系統(tǒng)應(yīng)該具備以下主要功能:采集微博熱度輿情事件、定時(shí)采集熱點(diǎn)事件、以監(jiān)控事件發(fā)展動(dòng)態(tài)以及篩選輿情數(shù)據(jù)。為此,本系統(tǒng)通過微博熱搜榜上的熱搜關(guān)鍵詞獲取數(shù)據(jù)。

根據(jù)上述需求,本系統(tǒng)的架構(gòu)設(shè)計(jì)包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)呈現(xiàn)四個(gè)方面。系統(tǒng)架構(gòu)圖如圖1所示。

1.1? 數(shù)據(jù)采集層

由于微博采取了一系列的反爬機(jī)制,數(shù)據(jù)的獲取變得十分困難。采用BeautifulSoup和Request進(jìn)行數(shù)據(jù)爬取時(shí),在爬取時(shí)間和獲取數(shù)據(jù)量方面的效果并不理想。因此,本文主要使用兩個(gè)爬蟲來獲取數(shù)據(jù),分別是基于Scrapy框架的分布式爬蟲和基于多線程爬蟲,這可以大大提升爬取效率。具體過程如圖2所示。

圖2? 數(shù)據(jù)爬取流程圖

1.1.1? 基于Scrapy框架的分布式爬蟲

Scrapy框架是一種開放源碼的、以Python為基礎(chǔ)的、可以快速有效地從大規(guī)模網(wǎng)頁中獲得有關(guān)信息的工具。Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測和自動(dòng)化測試[2]。該框架方便擴(kuò)展并且易于開發(fā)。

微博平臺(tái)每天涌現(xiàn)出數(shù)量驚人的博文,而一個(gè)社會(huì)熱點(diǎn)所涉及的博文數(shù)量往往更是龐大且海量。為了滿足輿情分析的需求,單個(gè)主機(jī)遠(yuǎn)遠(yuǎn)不夠,因此需要采用分布式設(shè)計(jì)。文章向每一臺(tái)主機(jī)共享一個(gè)Scrapy隊(duì)列,調(diào)度程序在每一臺(tái)主機(jī)上獲得一個(gè)請(qǐng)求以進(jìn)行爬行。這種設(shè)計(jì)使得爬蟲程序能夠在多臺(tái)主機(jī)上運(yùn)行,從而大幅提高其爬取效率[3]。

在Scrapy框架下,爬蟲的分布式采集方式是通過設(shè)定關(guān)鍵詞,獲得一個(gè)或幾條連續(xù)的微博搜索結(jié)果,并將結(jié)果寫入文件或數(shù)據(jù)庫。微博關(guān)鍵詞檢索是一種檢索博文中含有指定關(guān)鍵詞的微博的方法,允許用戶指定搜索的時(shí)段。例如,設(shè)定“圍棋”為關(guān)鍵詞,爬取在9月到10月期間所有包含該關(guān)鍵詞的微博。爬蟲程序?qū)?duì)該時(shí)間段內(nèi)的微博內(nèi)容進(jìn)行篩選爬取。獲取的內(nèi)容涵蓋了微博用戶ID、微博ID、博文內(nèi)容、發(fā)布位置、點(diǎn)贊數(shù)和評(píng)論數(shù)等信息。

1.1.2? 多線程爬蟲

為了更有效地執(zhí)行多線程爬蟲,本文采用了Python的Thread庫。多線程爬蟲通常使用分布式爬蟲獲取微博用戶ID和微博ID對(duì)URL進(jìn)行地址定位,以確定所要訪問的內(nèi)容。然后,根據(jù)預(yù)設(shè)的線程數(shù)量將任務(wù)平均分配到各個(gè)線程中,以抓取微博下的二級(jí)評(píng)論信息和發(fā)布微博的用戶信息。

根據(jù)微博網(wǎng)頁的類型,該系統(tǒng)使用Python的lxml類庫和re類庫實(shí)現(xiàn)Web頁面的分析。lxml庫是Python中用于解析HTML和XML文檔的高效工具。這個(gè)類庫能夠?qū)ξ谋具M(jìn)行快速的分析和抽取。使用re庫可以快速靈活地抽取所需要的信息,并且輕松處理網(wǎng)頁數(shù)據(jù)。為了提高數(shù)據(jù)價(jià)值,該系統(tǒng)在獲取微博評(píng)論、用戶ID和評(píng)論時(shí)間的同時(shí),將根據(jù)用戶ID進(jìn)入評(píng)論者主頁,以獲取評(píng)論者的個(gè)人信息。

1.1.3? 爬蟲優(yōu)化

在進(jìn)行微博數(shù)據(jù)獲取時(shí),經(jīng)常會(huì)面臨反爬蟲機(jī)制的限制和障礙。微博的反爬機(jī)制主要包括登錄驗(yàn)證、IP限制、Cookie池和數(shù)據(jù)加密。這些機(jī)制為數(shù)據(jù)獲取增加了難度。本文將采用以下方法來提高程序性能。

1)在Scrapy框架中,可以通過自定義中間件和擴(kuò)展等方式,結(jié)合Selenium來實(shí)現(xiàn)請(qǐng)求的模擬登錄。這樣可以避免被反爬機(jī)制識(shí)別為機(jī)器登錄,同時(shí)實(shí)現(xiàn)爬取到微博登錄后才能瀏覽的數(shù)據(jù)。使用Selenium還可以自由切換IP和User-Agent等參數(shù),從而提高爬取的成功率,降低IP被禁的風(fēng)險(xiǎn)。

2)設(shè)置代理IP池。用戶頻繁對(duì)網(wǎng)頁進(jìn)行訪問可能會(huì)導(dǎo)致IP被封。雖然本文采用了多線程爬蟲來提高效率,但其也存在被封IP的風(fēng)險(xiǎn)。因此,該系統(tǒng)設(shè)置了一個(gè)穩(wěn)定的代理IP池,一旦發(fā)現(xiàn)IP被封,即及時(shí)更換。保持系統(tǒng)的穩(wěn)定運(yùn)行。

1.2? 數(shù)據(jù)存儲(chǔ)層

微博數(shù)據(jù)往往呈現(xiàn)出無結(jié)構(gòu)的形式[4]。微博是一種隨性而發(fā)的文本內(nèi)容,可以包含文本、圖片、視頻、表情等不同的內(nèi)容形式,并可能出現(xiàn)錯(cuò)別字、縮寫、網(wǎng)絡(luò)用語等非標(biāo)準(zhǔn)的文本和語言表達(dá)。因此,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫很難滿足存儲(chǔ)微博數(shù)據(jù)的要求。Mongodb是一種非關(guān)系型數(shù)據(jù)庫,能夠存儲(chǔ)非結(jié)構(gòu)化的數(shù)據(jù),因此成為處理微博數(shù)據(jù)的理想方案。此外,它還具有高性能、高可靠性、可擴(kuò)展性和靈活性,能夠快速存儲(chǔ)和處理大量的微博數(shù)據(jù)。

1.3? 分析層

1.3.1? 文本預(yù)處理

為達(dá)到更好的文本分析效果,對(duì)于微博文本進(jìn)行預(yù)處理時(shí),需要運(yùn)用噪聲消除、停用詞去除、文本分割等技術(shù)。在Numpy庫的基礎(chǔ)上,利用Pandas工具對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以解決數(shù)據(jù)不完整、冗余和臟數(shù)據(jù)等問題。在分詞過程中,將中文分詞多個(gè)單詞,這些單詞在語義上是完整的。與英文不同的是,中文沒有明顯的分詞界限。因此,在中文中進(jìn)行分詞是一件非常困難的事情。為了解決這個(gè)問題,該系統(tǒng)使用了jieba庫,這是一款強(qiáng)大而靈活的中文分詞工具,能夠精確地進(jìn)行分詞操作。通過對(duì)微博評(píng)論進(jìn)行文本分詞,利用停用詞表刪除無實(shí)際意義的停用詞,這樣提升了程序的運(yùn)行速度和效率,并為文本分析做準(zhǔn)備。文本預(yù)處理流程如圖3所示。

1.3.2? 情感分析

文本情感分析,又稱傾向性分析,是對(duì)具有主觀情感色彩的文本進(jìn)行分析、處理、歸納和預(yù)測的過程[5]。本文采用了一種基于貝葉斯的文本分類方法,該方法具有計(jì)算復(fù)雜度低等優(yōu)點(diǎn)。在對(duì)評(píng)論文本進(jìn)行TF-IDF處理的基礎(chǔ)上,對(duì)其進(jìn)行矢量表達(dá),并對(duì)其進(jìn)行情緒分類,將其分為兩個(gè)類別。為提高模型準(zhǔn)確度,本文爬取了十幾萬條微博博文和評(píng)論數(shù)據(jù),涵蓋軍事、娛樂、音樂、美食等領(lǐng)域。然后,進(jìn)行模型的訓(xùn)練。根據(jù)訓(xùn)練好的模型得出情感得分,得分越高情感越積極,越低則越消極。通過對(duì)某一輿情事件的情感值進(jìn)行匯總統(tǒng)計(jì),可以很直觀地看出公眾對(duì)該事件的態(tài)度。算法流程如圖4所示。

圖3? 文本預(yù)處理流程圖

1.3.3? 基于LDA主題提取

LDA是由Blei等[6]提出的一種基于Dirichlet分布的概率話題模型,它包含了文檔、主題和詞項(xiàng)3個(gè)層次。LDA廣泛應(yīng)用于無監(jiān)督訓(xùn)練中[7-10],因?yàn)樗梢杂行У赜?xùn)練且不需要帶標(biāo)簽的訓(xùn)練數(shù)據(jù)。

按照LDA模型,文檔生成過程如圖5所示。

圖5? LDA算法模型

首先,根據(jù)參數(shù)α的Dirichlet分布中采樣來產(chǎn)生一個(gè)文檔相應(yīng)話題的多項(xiàng)式分布θ;其次,根據(jù)題目的多項(xiàng)式分布θ中采樣,以產(chǎn)生文檔i第j個(gè)詞的題目z;然后,根據(jù)參數(shù)β的Dirichlet分布中采樣,得到相應(yīng)于主題z的特征性詞匯的多項(xiàng)式分布u;最后,根據(jù)單詞的多項(xiàng)式分布u對(duì)單詞進(jìn)行抽樣,最終產(chǎn)生單詞w。

在此基礎(chǔ)上,提出了一種基于LDA的網(wǎng)絡(luò)輿情話題抽取方法。該系統(tǒng)先對(duì)采集到的輿情事件文檔進(jìn)行降噪和分詞處理,得到以詞匯為單位的語料集合。然后,對(duì)文本中的每一個(gè)詞進(jìn)行隨機(jī)的主題劃分。其次,利用Gibbs抽樣方法,根據(jù)詞頻和詞頻分布對(duì)各詞頻進(jìn)行加權(quán),對(duì)詞頻進(jìn)行賦值。這一過程一直持續(xù)到文件、主題和詞匯的分配趨于一致為止。本文在20個(gè)主題中選取排名前5的主題來反映該輿情事件的主要熱點(diǎn)和趨勢(shì),這樣的分析方法可以幫助用戶更好地了解事件的關(guān)鍵信息,進(jìn)一步揭示其背后的本質(zhì)。

1.4? 呈現(xiàn)層

本文旨在通過繪制圖表的形式,以使用戶能夠直觀地了解事件輿情的發(fā)展趨勢(shì)。詞云圖將微博博文的熱點(diǎn)呈現(xiàn)出來,用戶可以通過詞云圖快速了解熱點(diǎn)事件的信息。為繪制詞云圖,在微博數(shù)據(jù)預(yù)處理過程中,本文進(jìn)行了降噪、去停、分詞等操作,得到關(guān)鍵詞。WordCloud庫是一個(gè)基于Python的開源詞云生成庫,可以方便地生成美觀、高度自定義的詞云圖。該庫的功能包括將給定的文本轉(zhuǎn)化為詞頻分布,然后根據(jù)詞頻繪制出具有藝術(shù)效果的詞云圖像。其提供了豐富的參數(shù)和方法,使用戶能夠輕松實(shí)現(xiàn)對(duì)詞云圖的個(gè)性化定制。

情感分析的結(jié)果和主題展示的呈現(xiàn)通過Echarts庫實(shí)現(xiàn)。Echarts提供了Python的接口PyEcharts,為Python用戶提供了更加方便的操作和使用方式。Echarts圖形類型廣泛,交互能力強(qiáng),兼容性好,為用戶提供了個(gè)性化的樣式設(shè)計(jì)。

Django是一種以Python為基礎(chǔ)、帶有模板標(biāo)記的網(wǎng)絡(luò)框架,可以加快開發(fā)速度。此外,支持自定義前端設(shè)計(jì),輕松實(shí)現(xiàn)圖表和頁面間的兼容。另外,Django還提供了大量的第三方插件和類庫,這些類庫能夠提供給用戶更好的互動(dòng)體驗(yàn)。

2? 實(shí)驗(yàn)及結(jié)果評(píng)估

本文以“唐山打人”事件為關(guān)鍵詞,爬取了2022年7月1日到9月30日的近2萬條微博博文和評(píng)論數(shù)據(jù),并對(duì)該事件進(jìn)行情感分析和主題提取,以揭示事件的輿情變化趨勢(shì)和公眾關(guān)注的熱點(diǎn)。

2.1? 統(tǒng)計(jì)事件的情感比例

根據(jù)情感分析結(jié)果,對(duì)微博評(píng)論進(jìn)行正向、負(fù)向和中向三種類型的研究,并對(duì)輿情評(píng)論中各類情感進(jìn)行統(tǒng)計(jì)。利用Echarts繪制動(dòng)態(tài)圖表,以更直觀地展示公眾對(duì)該熱點(diǎn)事件的情感態(tài)度。根據(jù)圖6,可以了解各類數(shù)據(jù)的分布情況。在獲取的數(shù)據(jù)中,消極信息占據(jù)了76.7%的比例,這反映了網(wǎng)民對(duì)該事件的不滿、擔(dān)憂或批評(píng)。而通過圖7,可以具體地了解三類情感在輿情評(píng)論中的占比情況。

圖6? 事件整體數(shù)據(jù)概覽

圖7? 情感分析占比

2.2? 主題排行

根據(jù)LDA主題模型的結(jié)果,從20個(gè)主題中選出排名前5的主題詞,以更好地反映輿情事件的關(guān)注點(diǎn)和熱點(diǎn)。另外,使用Pandas庫對(duì)熱點(diǎn)詞進(jìn)行了統(tǒng)計(jì),得到了其在微博博文中出現(xiàn)的次數(shù),圖8可以明確反映出各主題詞的出現(xiàn)頻率。根據(jù)圖8可知,唐山和暴力是出現(xiàn)頻率較高的主題詞,反映了公眾對(duì)于“唐山打人”事件的關(guān)注點(diǎn)和態(tài)度。

圖8? 主題詞排名

2.3? 繪制輿情地圖

根據(jù)采集到的微博評(píng)論的IP地址,將各評(píng)論所在地的省份進(jìn)行分類匯總,并通過Echarts庫生成地域分布圖,可以直觀地展示各省對(duì)該輿情事件的關(guān)注度和態(tài)度。通過輿情地圖,可以發(fā)現(xiàn)該熱點(diǎn)事件引起了公眾的廣泛關(guān)注,進(jìn)一步傳播和擴(kuò)散,各省份之間的態(tài)度和情感也存在一定的差異和分歧。

2.4? 詞云圖

微博數(shù)據(jù)文本預(yù)處理后,使用WordCloud庫繪制了詞云圖,更好地突顯熱點(diǎn)詞。通過觀察詞云圖,用戶可直觀地了解整個(gè)輿情事件中關(guān)鍵詞的出現(xiàn)頻率和重要性,從而進(jìn)一步了解事件的主要熱點(diǎn)和趨勢(shì)。具體效果如圖9所示。

圖9? 詞云圖

3? 結(jié)? 論

隨著網(wǎng)絡(luò)輿情形勢(shì)的不斷復(fù)雜化,準(zhǔn)確掌握輿情發(fā)展趨勢(shì)顯得尤為緊迫。本文設(shè)計(jì)了一種利用情感分析和主題提取的輿情監(jiān)測與分析系統(tǒng)。該系統(tǒng)采用分布式爬蟲和多線程爬蟲相結(jié)合的形式采集微博數(shù)據(jù)并進(jìn)行文本預(yù)處理、情感分析、LDA主題模型提取等步驟,實(shí)現(xiàn)微博輿情的自動(dòng)化監(jiān)測和分析。同時(shí),通過數(shù)據(jù)可視化技術(shù),以圖表和詞云圖的形式呈現(xiàn)結(jié)果,用戶可直觀地了解輿情事件的關(guān)鍵信息和趨勢(shì)。在實(shí)際應(yīng)用中,該系統(tǒng)展現(xiàn)了高效性、準(zhǔn)確性和自動(dòng)化的特點(diǎn),具有廣泛的實(shí)用性和應(yīng)用價(jià)值。針對(duì)不同的輿情事件,可以通過該系統(tǒng)進(jìn)行自動(dòng)化監(jiān)測和分析,可以幫助政府和公司及時(shí)了解公眾聲音,把握輿情發(fā)展的動(dòng)態(tài),做出更好的決策。與此同時(shí),該系統(tǒng)抓取數(shù)據(jù)的速度、情感分析模型和主題提取模型的準(zhǔn)確性、用戶的交互性等有待提高。相信在未來的研究中,可以進(jìn)一步完善和提高該系統(tǒng)的精度和實(shí)用性,為更好地服務(wù)社會(huì)提供更可靠的技術(shù)支撐。

參考文獻(xiàn):

[1] 葉艷,吳鵬,周知,等.基于LDA-BiLSTM模型的在線醫(yī)療服務(wù)質(zhì)量識(shí)別研究 [J].情報(bào)理論與實(shí)踐,2022,45(8):178-183+168.

[2] 姚云飛,杜洪波,梁建輝.基于SpringMVC框架畢業(yè)設(shè)計(jì)管理系統(tǒng)設(shè)計(jì) [J].軟件,2018,39(1):91-93.

[3] 周毅,李威,何金,等.基于Scrapy框架的分布式網(wǎng)絡(luò)爬蟲系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) [J].現(xiàn)代信息科技,2021,5(19):43-46.

[4] 劉子謙,王志強(qiáng).基于爬蟲和文本處理的微博輿情分析系統(tǒng) [J].北京電子科技學(xué)院學(xué)報(bào),2020,28(3):31-39.

[5] 孫強(qiáng),李建華,李生紅.基于Python的文本分類系統(tǒng)開發(fā)研究 [J].計(jì)算機(jī)應(yīng)用與軟件,2011:28(3):13-14.

[6] BLEI D M,NG A Y,JORDAN M I. Latent Dirichlet alloction [J].Journal of Machine Learning Research,2003,3:993-1022.

[7] 邰悅,葛斌,李慧宗.基于改進(jìn)LDA的細(xì)粒度主題建模方法研究 [J].佳木斯大學(xué)學(xué)報(bào):自然科學(xué)版,2022,40(5):1-4.

[8] 張東鑫,張敏.圖情領(lǐng)域LDA主題模型應(yīng)用研究進(jìn)展述評(píng) [J].圖書情報(bào)知識(shí),2022,39(6):143-157.

[9] 楊文忠,丁甜甜,康鵬,等.基于輿情新聞的中文關(guān)鍵詞抽取綜述 [J].計(jì)算機(jī)工程,2023,49(3):1-17.

[10] 高萬林,張港紅,李楨,等.關(guān)于農(nóng)業(yè)信息化與農(nóng)村信息化關(guān)系的探討 [J].中國農(nóng)學(xué)通報(bào),2011,27(1):466-470.

作者簡介:何西遠(yuǎn)(2002—),男,漢族,山東濟(jì)寧人,本科在讀,研究方向:大數(shù)據(jù)、人工智能。

猜你喜歡
情感分析網(wǎng)絡(luò)輿情
基于語義的互聯(lián)網(wǎng)醫(yī)院評(píng)論文本情感分析及應(yīng)用
基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)對(duì)象抽取研究
基于SVM的產(chǎn)品評(píng)論情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
在線評(píng)論情感屬性的動(dòng)態(tài)變化
預(yù)測(2016年5期)2016-12-26 17:16:57
網(wǎng)絡(luò)輿情事件的引導(dǎo)策略分析
數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情管理中的研究
“互聯(lián)網(wǎng)+”背景下高校平安校園建設(shè)研究
中國市場(2016年38期)2016-11-15 23:42:46
淺析網(wǎng)絡(luò)輿情治理
基于社會(huì)穩(wěn)定視角的網(wǎng)絡(luò)輿情預(yù)警機(jī)制構(gòu)建的思考
今傳媒(2016年9期)2016-10-15 22:02:52
道真| 隆德县| 维西| 南安市| 盖州市| 武定县| 贵州省| 田东县| 鄂托克旗| 德庆县| 乐都县| 偃师市| 喀喇沁旗| 沂水县| 景洪市| 黄骅市| 桃园市| 墨江| 托克逊县| 历史| 德令哈市| 都兰县| 安国市| 右玉县| 报价| 和田市| 普定县| 长治市| 广南县| 福建省| 报价| 苍山县| 堆龙德庆县| 洪雅县| 壶关县| 鄱阳县| 梅州市| 通海县| 来宾市| 临桂县| 隆子县|