国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

旅游網(wǎng)絡(luò)評(píng)論情感分析方法研究及系統(tǒng)實(shí)現(xiàn)

2015-02-06 03:45覃國(guó)蓉葉志成莊檳豪蔡哲聰
關(guān)鍵詞:連接詞分詞詞典

覃國(guó)蓉,葉志成,莊檳豪,蔡哲聰

(深圳信息職業(yè)技術(shù)學(xué)院軟件學(xué)院,廣東 深圳 518172))

旅游網(wǎng)絡(luò)評(píng)論情感分析方法研究及系統(tǒng)實(shí)現(xiàn)

覃國(guó)蓉,葉志成,莊檳豪,蔡哲聰

(深圳信息職業(yè)技術(shù)學(xué)院軟件學(xué)院,廣東 深圳 518172))

本文針對(duì)旅游領(lǐng)域,展開(kāi)網(wǎng)絡(luò)評(píng)論情感分析方法研究并為航空公司、酒店用戶實(shí)現(xiàn)了一個(gè)實(shí)用的旅游網(wǎng)絡(luò)評(píng)論監(jiān)控系統(tǒng)。設(shè)計(jì)了簡(jiǎn)捷方便的情感分析方法,基于情感詞典對(duì)旅游網(wǎng)絡(luò)評(píng)論進(jìn)行情感分析,針對(duì)旅游領(lǐng)域優(yōu)化分詞詞典和情感詞典,以獲得較高的準(zhǔn)確率。通過(guò)旅游網(wǎng)絡(luò)評(píng)論監(jiān)控系統(tǒng),企業(yè)可實(shí)時(shí)掌握用戶對(duì)服務(wù)的評(píng)價(jià),及時(shí)處理負(fù)面評(píng)論,避免造成不可挽回的影響。

旅游網(wǎng)絡(luò)評(píng)論;情感分析;情感詞典;分詞詞典;網(wǎng)絡(luò)評(píng)論監(jiān)控

以微博為代表的自媒體時(shí)代,信息傳播異常迅猛。如果對(duì)于網(wǎng)絡(luò)上的意見(jiàn)類訴求不及時(shí)響應(yīng),往往會(huì)對(duì)企業(yè)形象造成不可挽回的負(fù)面影響。所以,在靠口碑取勝的領(lǐng)域(如旅游行業(yè)的航空公司、酒店等)越來(lái)越重視網(wǎng)絡(luò)輿論的作用。依靠人工監(jiān)控網(wǎng)絡(luò)輿情,顯然費(fèi)時(shí)費(fèi)力而且成效又不高。因此采用計(jì)算機(jī)來(lái)自動(dòng)地分析網(wǎng)絡(luò)評(píng)論表達(dá)的情感,即對(duì)網(wǎng)絡(luò)評(píng)論進(jìn)行情感分析成為目前學(xué)術(shù)界研究的一個(gè)熱點(diǎn)。

文本情感分析任務(wù)包括對(duì)網(wǎng)絡(luò)文本進(jìn)行主客觀分類、對(duì)主觀性文本情感極性和情感極性強(qiáng)度分析。針對(duì)文本情感分析,人們提出了很多算法,但目前還沒(méi)有哪一種能夠完美地解決文本情感傾向識(shí)別這一問(wèn)題,也還沒(méi)有哪個(gè)系統(tǒng)能夠在情感分析判斷中具有較高的準(zhǔn)確率[1]。為了尋求突破,應(yīng)該進(jìn)一步細(xì)分具體問(wèn)題及其應(yīng)用領(lǐng)域,展開(kāi)有針對(duì)性、更簡(jiǎn)捷方便的識(shí)別方法的研究。因?yàn)楸狙芯酷槍?duì)旅游領(lǐng)域,所以具有重要的理論研究意義和應(yīng)用價(jià)值。

1 相關(guān)研究

按照文本的顆粒度,文本情感分析可以劃分為針對(duì)文本中的詞、句子、篇章三個(gè)級(jí)別的識(shí)別與分析。文獻(xiàn)[1]以文本顆粒度為視角,從情感詞抽取、語(yǔ)料庫(kù)和情感詞典構(gòu)建、評(píng)價(jià)對(duì)象與意見(jiàn)持有者分析、篇章級(jí)情感分析、實(shí)際應(yīng)用五個(gè)方面對(duì)文本情感分析文獻(xiàn)進(jìn)行了梳理,并做出必要評(píng)述。可見(jiàn)現(xiàn)有的文本情感分析方法沒(méi)有充分利用自然語(yǔ)言處理的研究成果以及現(xiàn)有語(yǔ)言工具和相關(guān)資源,也大多沒(méi)有細(xì)分具體問(wèn)題及其應(yīng)用領(lǐng)域。

文獻(xiàn)[2]針對(duì)中文文本情感分析的研究現(xiàn)狀與進(jìn)展進(jìn)行總結(jié)?,F(xiàn)有中文文本情感分析研究,存在以下問(wèn)題(1)詞語(yǔ)的情感傾向判別只是局限在形容詞,實(shí)際上一些名詞和動(dòng)詞也具有情感傾向,而且應(yīng)該結(jié)合具體的語(yǔ)境和領(lǐng)域來(lái)判別詞語(yǔ)的情感傾向;(2)針對(duì)語(yǔ)句和篇章的情感分析還比較粗粒度,應(yīng)該更精確地更細(xì)粒度地對(duì)某一個(gè)具體的評(píng)價(jià)對(duì)象進(jìn)行分析。

文獻(xiàn)[3]首先利用基礎(chǔ)情感詞典以及基準(zhǔn)詞對(duì)所需研究領(lǐng)域的評(píng)論文本進(jìn)行分析,以此獲得特定領(lǐng)域具有感情傾向的特征詞語(yǔ)。而后利用基準(zhǔn)詞以及獲得的特征詞語(yǔ)對(duì)評(píng)論進(jìn)行分析,對(duì)于有感情詞的句子,采用計(jì)算感情值來(lái)判別其感情傾向以及感情程度,對(duì)于無(wú)感情詞的句子,采用連詞的方法來(lái)進(jìn)行感情的判別。該方法考慮到了領(lǐng)域特性,但是還是沒(méi)有針對(duì)特定領(lǐng)域(如旅游),所以文本情感分類的準(zhǔn)確率還有較大的提升空間。

文獻(xiàn)[4]則針對(duì)中文微博情感分析的研究進(jìn)行綜述,從微博網(wǎng)站數(shù)據(jù)構(gòu)成的角度出發(fā),對(duì)情感分析做了延伸分析。但是現(xiàn)有中文微博情感分析研究沒(méi)有針對(duì)網(wǎng)絡(luò)語(yǔ)言的過(guò)濾和情感挖掘重點(diǎn)開(kāi)發(fā)相關(guān)的詞典或語(yǔ)料庫(kù),也沒(méi)有針對(duì)不同主題對(duì)微博做特定的情感分析研究。

目前關(guān)于旅游領(lǐng)域網(wǎng)絡(luò)評(píng)論情感分析的研究還比較缺乏,主要是針對(duì)旅游目的地的評(píng)論研究(文獻(xiàn)[5]和在知網(wǎng)上唯一找到文獻(xiàn)[6]),它們都沒(méi)有涉及航空公司、酒店這些旅游服務(wù)行業(yè)。

本文受文獻(xiàn)[1-4]的啟發(fā),針對(duì)旅游領(lǐng)域,特別是航空公司、酒店等網(wǎng)絡(luò)評(píng)論情感分析需求迫切的旅游服務(wù)領(lǐng)域,展開(kāi)有針對(duì)性的研究,設(shè)計(jì)了基于知識(shí)工程(旅游網(wǎng)絡(luò)評(píng)論領(lǐng)域知識(shí))的旅游網(wǎng)絡(luò)評(píng)論情感分析方法,并且實(shí)現(xiàn)了一個(gè)實(shí)用的系統(tǒng),可以實(shí)時(shí)監(jiān)控?zé)衢T微博(如新浪)、人氣論壇(如天涯的旅游板塊)的有關(guān)旅游的評(píng)論,自動(dòng)進(jìn)行分析,及時(shí)把負(fù)面評(píng)論反饋給航空公司、酒店等用戶。

2 旅游網(wǎng)絡(luò)評(píng)論情感分析方法研究及系統(tǒng)實(shí)現(xiàn)

2.1 基于旅游網(wǎng)絡(luò)評(píng)論領(lǐng)域知識(shí)的情感分析方法

基于旅游網(wǎng)絡(luò)評(píng)論領(lǐng)域知識(shí)的情感分析方法,就是針對(duì)旅游網(wǎng)絡(luò)評(píng)論建立情感詞典,基于情感詞典進(jìn)行情感分析,并且在情感分析過(guò)程中,充分利用語(yǔ)言本身的特點(diǎn)(否定詞、程度副詞和連接詞),以提高情感分析的準(zhǔn)確率。

基于情感詞典的情感分析方法對(duì)于通用的文本情感分析,具有實(shí)現(xiàn)簡(jiǎn)單、執(zhí)行效率高但是由于含有較多的歧義詞導(dǎo)致準(zhǔn)確率低的特點(diǎn)??紤]到如果針對(duì)特定領(lǐng)域?qū)η楦性~典進(jìn)行優(yōu)化和完善,基于情感詞典的情感分析方法在保證性能的基礎(chǔ)上可以獲得比較理想的準(zhǔn)確率,所以我們選擇基于情感詞典的情感分析方法。

2.1.1 旅游網(wǎng)絡(luò)評(píng)論情感詞典的建立

由于本算法準(zhǔn)確率依賴于情感詞典,所以情感詞典的完備性和準(zhǔn)確性是本算法成功的關(guān)鍵。

為了獲得理想的情感字典,我們?cè)跈?quán)威的5大中文情感詞典——知網(wǎng)的情感詞典、臺(tái)灣大學(xué)整理的中文情感詞典NTUSD、《學(xué)生褒貶義詞典》、《褒義詞典》、《貶義詞典》)基礎(chǔ)上整合了一個(gè)新的情感詞典,去除重復(fù)的情感詞;在這個(gè)新的情感詞典的基礎(chǔ)上,基于北京大學(xué)綜合型語(yǔ)言知識(shí)庫(kù)CLKB(旅游領(lǐng)域部分)和現(xiàn)代漢語(yǔ)口語(yǔ)標(biāo)注語(yǔ)料庫(kù)CASIA-CLASSIL,加上了旅游領(lǐng)域情感詞,并針對(duì)旅游領(lǐng)域盡量進(jìn)行消歧處理;最后,我們還在情感詞典中加上網(wǎng)絡(luò)流行詞語(yǔ),構(gòu)建了超過(guò)37000條情感詞的字典。

其中, CLKB是目前國(guó)際上規(guī)模最大而且獲得廣泛認(rèn)可的漢語(yǔ)語(yǔ)言知識(shí)資源,涵蓋了詞、詞組、句子、篇章各單位和詞法、句法、語(yǔ)義各層面,從漢語(yǔ)向多語(yǔ)言輻射,從通用領(lǐng)域深入到專業(yè)領(lǐng)域,有利地支持了中文信息處理的理論研究和應(yīng)用技術(shù)開(kāi)發(fā)。CLKB已產(chǎn)生了巨大的學(xué)術(shù)影響,并獲得了很好的社會(huì)效益和一定的經(jīng)濟(jì)效益,簽約用戶遍布美、日、德、法、新加坡、中國(guó)內(nèi)地、臺(tái)灣、香港等10多個(gè)國(guó)家和地區(qū),免費(fèi)用戶數(shù)以萬(wàn)計(jì)[7]。

CASIA-CLASSIL語(yǔ)料是從15000多個(gè)現(xiàn)場(chǎng)錄音中選取的約1000段對(duì)話,限定為旅游信息咨詢領(lǐng)域,包括以下5個(gè)子領(lǐng)域:(1)旅館預(yù)定;(2)電話訂餐;(3)機(jī)場(chǎng)信息資訊;(4)旅行社服務(wù);(5)搭乘出租車。每一段對(duì)話都被轉(zhuǎn)錄成了文本,并進(jìn)行了詳細(xì)標(biāo)注。該標(biāo)注規(guī)范涵蓋了語(yǔ)音、語(yǔ)義、語(yǔ)用、主題及情感等多方面的標(biāo)注信息[8]。

圖1 建立旅游網(wǎng)絡(luò)評(píng)論情感詞典Fig.1 The establishment of the emotional dictionary of the tourism network Review

2.1.2 旅游網(wǎng)絡(luò)評(píng)論情感分析

基于旅游網(wǎng)絡(luò)評(píng)論情感詞典,我們按照如下步驟對(duì)旅游網(wǎng)絡(luò)評(píng)論進(jìn)行情感分析(見(jiàn)圖2):

(1)讀取一條經(jīng)過(guò)預(yù)處理的旅游網(wǎng)絡(luò)評(píng)論;

(2)以中英文標(biāo)點(diǎn)符號(hào)(.。,,??!!)作為分句標(biāo)識(shí)對(duì)評(píng)論進(jìn)行分句;

(3)對(duì)評(píng)論的每個(gè)分句計(jì)算情感值,具體見(jiàn)2.1.3 ;

(4)累加每個(gè)分句的情感值作為這條評(píng)論的情感值。如果情感值大于0,則表示該評(píng)論具有積極情感傾向(正面評(píng)論),小于0則具有消極情感傾向(負(fù)面評(píng)論),否則為中性評(píng)論。

圖2 旅游網(wǎng)絡(luò)評(píng)論情感分析過(guò)程Fig.2 The process of emotion analysis of travel network review

2.1.3 分句情感值計(jì)算

圖3 分句情感值計(jì)算Fig.3 The calculation of the sub-clause emotional value

如圖3,分句的情感值計(jì)算首先是對(duì)分句做分詞處理,然后根據(jù)分句中是否含有情感詞典中的情感詞做不同處理:

(1)如果含有情感詞,檢查分句中情感詞前面是否含有否定詞,由于否定詞會(huì)使情感詞的極性發(fā)生改變,所以需要針對(duì)否定詞進(jìn)行處理;檢查分句中情感詞前面是否有程度副詞,由于程度副詞會(huì)使情感詞的情感強(qiáng)度發(fā)生變化,所以需要針對(duì)副詞進(jìn)行處理。同樣反問(wèn)句和驚嘆號(hào)也會(huì)對(duì)情感極性和情感強(qiáng)度產(chǎn)生影響,也需要做相應(yīng)處理。具體見(jiàn)2.1.4。

圖4 含有情感詞的分句情感值計(jì)算Fig.4 The calculation of emotional value of the sub-clause with emotion words

(2)如果不含有情感詞,則檢查分句首詞是否是連接詞。如果是連接詞,則根據(jù)連接詞在前后2句中的的作用分為:平行連接詞、轉(zhuǎn)折連接詞和遞進(jìn)連接詞的三種不同的連接詞(見(jiàn)表1實(shí)例),分別作做不同處理:平行連接詞,則情感值與上一分句相同;轉(zhuǎn)折連接詞,則情感值與上一句相反,即乘以-1;遞進(jìn)連接詞,則情感值是上一句的1.5倍。

表1 連接詞實(shí)例Tab.1 The instance of conjunction

2.1.4 含有情感詞的分句情感值計(jì)算

否定詞處理。如果情感詞有否定詞修飾將引起情感極性發(fā)生逆轉(zhuǎn),則分句的情感值將乘以-1。如果有多個(gè)否定詞修飾,則需要根據(jù)否定詞個(gè)數(shù)進(jìn)行判斷,如果是奇數(shù)個(gè),則極性改變,偶數(shù)個(gè)則情感極性不發(fā)生變化。表2為常見(jiàn)否定詞。

Tab.2 The instance of Common negative words表2 常見(jiàn)否定詞

程度副詞處理。如果情感詞有程度副詞修飾,將引起情感強(qiáng)度發(fā)生變化。我們采用知網(wǎng)提供的程度副詞,按藺璜提出的四個(gè)等級(jí)[9]劃分為極高、高、中、低,分別賦予2.0、1.75、1.0、0.5的權(quán)值。如表3所示。

表3 程度副詞權(quán)值劃分Tab.3 The weight of degree adverb

感嘆句處理。感嘆句加強(qiáng)了句子的情感強(qiáng)度,對(duì)感嘆句的處理就是整個(gè)句子情感強(qiáng)度加倍,即情感值乘以2。識(shí)別感嘆句就是找出句尾的驚嘆號(hào),包括中文符號(hào)?和英文符號(hào)?。

反問(wèn)句處理。出現(xiàn)反問(wèn)詞的句子為反問(wèn)句。反問(wèn)句是用疑問(wèn)句的形式表達(dá)相反的觀點(diǎn),所以對(duì)于反問(wèn)句的處理就是將整個(gè)句子的情感值乘以-1。需要注意,反問(wèn)句的處理與否定詞處理是不同的:否定詞是將其修飾的情感詞的極性逆轉(zhuǎn),而反問(wèn)句是將整個(gè)句子的情感極性逆轉(zhuǎn)。識(shí)別反問(wèn)句的關(guān)鍵是找到句子中是否有反問(wèn)詞,表4列出了常用的反問(wèn)詞。

表4 常見(jiàn)反問(wèn)詞Tab.4 The instance of common interrogative words

2.2 旅游網(wǎng)絡(luò)評(píng)論情感分析系統(tǒng)實(shí)現(xiàn)

2.2.1 系統(tǒng)架構(gòu)

基于以上研究,我們實(shí)現(xiàn)了一個(gè)旅游網(wǎng)絡(luò)評(píng)論情感分析系統(tǒng),該系統(tǒng)提供以下功能:

(1)網(wǎng)絡(luò)評(píng)論自動(dòng)抓取功能:抓取熱門微博(如新浪)和知名網(wǎng)站(如天涯論壇的旅游板塊)關(guān)于民航、酒店等旅游行業(yè)網(wǎng)絡(luò)評(píng)論;

(2)網(wǎng)絡(luò)評(píng)論情感分析功能:對(duì)評(píng)論進(jìn)行情感分析,判斷情感傾向(正面或負(fù)面)及極性(強(qiáng)弱程度);

(3)負(fù)面評(píng)論的預(yù)警功能:結(jié)合網(wǎng)絡(luò)評(píng)論的轉(zhuǎn)發(fā)數(shù)、閱讀數(shù)等指標(biāo)確定評(píng)論的重要等級(jí),向用戶推送適當(dāng)?shù)念A(yù)警消息。

該系統(tǒng)架構(gòu)如圖5所示。

圖5 旅游網(wǎng)絡(luò)評(píng)論情感分析系統(tǒng)架構(gòu)Fig.5 The architecture of the emotion analysis system of tourism network review

用戶管理模塊對(duì)用戶信息進(jìn)行管理,其實(shí)現(xiàn)沒(méi)有太多難度。情感分析是系統(tǒng)的核心模塊,除了分詞部分,已經(jīng)在3.1節(jié)詳細(xì)說(shuō)明,下面主要介紹分詞、網(wǎng)絡(luò)爬蟲和差評(píng)預(yù)警部分。

2.2.2 分詞

我們基于開(kāi)源的ansj分詞系統(tǒng)實(shí)現(xiàn)分詞功能。同情感詞典一樣,對(duì)該分詞系統(tǒng)的基礎(chǔ)詞庫(kù),我們基于北京大學(xué)綜合型語(yǔ)言知識(shí)庫(kù)CLKB(旅游領(lǐng)域部分)和現(xiàn)代漢語(yǔ)口語(yǔ)標(biāo)注語(yǔ)料庫(kù)CASIACLASSIL,加上了旅游領(lǐng)域詞匯,構(gòu)建了超過(guò)20000條詞匯的分詞詞典,以提高分詞系統(tǒng)的準(zhǔn)確率。

2.2.3 微博爬蟲和網(wǎng)站爬蟲

微博爬蟲實(shí)現(xiàn)對(duì)熱門微博的旅游網(wǎng)絡(luò)評(píng)論的自動(dòng)抓取,網(wǎng)站爬蟲實(shí)現(xiàn)對(duì)知名論壇的旅游板塊的自動(dòng)抓取。微博爬蟲和網(wǎng)站爬蟲均采用模擬登錄的方式實(shí)現(xiàn)。

2.2.4 差評(píng)預(yù)警

差評(píng)預(yù)警模塊提供自動(dòng)預(yù)警、在線預(yù)警和預(yù)警條件設(shè)置功能。自動(dòng)預(yù)警功能使得用戶無(wú)須登錄系統(tǒng),在滿足預(yù)警條件的差評(píng)發(fā)生時(shí)會(huì)在注冊(cè)的郵箱、微信和QQ收到預(yù)警信息。在線預(yù)警當(dāng)用戶登錄本系統(tǒng)時(shí),將預(yù)警信息推送到用戶界面,而且用戶還可通過(guò)本系統(tǒng)主動(dòng)搜索相關(guān)評(píng)論,并按嚴(yán)重程度顯示查詢結(jié)果。預(yù)警條件設(shè)置讓用戶可以設(shè)置預(yù)警條件,如網(wǎng)絡(luò)評(píng)論的轉(zhuǎn)發(fā)數(shù)、閱讀數(shù)等。

自動(dòng)預(yù)警和在線預(yù)警調(diào)用網(wǎng)絡(luò)爬蟲和情感分析模塊來(lái)實(shí)現(xiàn)。

2.2.4 系統(tǒng)運(yùn)行效果

我們以數(shù)據(jù)堂(網(wǎng)址http://www.datatang.com/ datares/go.aspx?dataid=616732)提供的用于文本情感分析的酒店評(píng)論語(yǔ)料(包括正面的1000條和負(fù)面的1000條)進(jìn)行測(cè)試,目前該系統(tǒng)對(duì)正面評(píng)論的情感分析正確率達(dá)到81%,負(fù)面評(píng)論的正確率達(dá)到75%。對(duì)于比較嚴(yán)重的負(fù)面評(píng)論(402條語(yǔ)料)正確率達(dá)到100%,能夠滿足預(yù)警需求。

3 結(jié)束語(yǔ)

本文針對(duì)旅游領(lǐng)域進(jìn)行網(wǎng)絡(luò)評(píng)論情感分析研究并且實(shí)現(xiàn)了一個(gè)可自動(dòng)監(jiān)控旅游網(wǎng)絡(luò)評(píng)論的實(shí)用系統(tǒng)。有以下創(chuàng)新點(diǎn):第一,針對(duì)旅游網(wǎng)絡(luò)評(píng)論,建立了較為權(quán)威和完備的分詞詞典和情感詞典,提高了情感分析準(zhǔn)確率;第二,為航空公司、酒店等網(wǎng)絡(luò)評(píng)論情感分析需求迫切的旅游企業(yè)行業(yè)用戶提供了一個(gè)自動(dòng)的網(wǎng)絡(luò)輿情監(jiān)測(cè)和分析系統(tǒng),填補(bǔ)了這方面系統(tǒng)的空白。

本文的情感詞典、分詞詞典以及副詞詞典、否定詞詞典、連接詞詞典還需要進(jìn)一步完善;情感分析只是采用了基于知識(shí)工程的方法,沒(méi)有用到基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法。所以,下一步的工作將針對(duì)旅游網(wǎng)絡(luò)評(píng)論,結(jié)合統(tǒng)計(jì)方法進(jìn)一步提高情感分析的準(zhǔn)確率。

[1]楊立公,朱儉,湯世平.文本情感分析綜述[J].計(jì)算機(jī)應(yīng)用2013,33( 6) :1574 - 1578,1607 YANG Ligong,ZHU Jian,TANG Shiping.Survey of text sentiment analysis[J].Journal of Computer Applications,2013,33( 6) :1574 - 1578,1607.(in Chinese)

[2]魏韡,向陽(yáng),陳千.中文文本情感分析綜述[J].計(jì)算機(jī)應(yīng)用2011,31( 12) :3321 -3323 WEI Wei,XIANG Yang,CHEN Qian.Survey on Chinese text sentiment analysis[J].Journal of Computer Applications,2011,31( 12) :3321 -3323.(in Chinese)

[3]劉玉嬌,琚生根,伍少梅.基于情感字典與連詞結(jié)合的中文文本情感分類[J],四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,52(1):57-62.LIU Yu-jiao,Ju Sheng-gen,Su Chong.Classification of chinese texts sentiment based on semantic and conjunction[J].Journal of Sichuan University(Natural Science Edition),2015,52(1):57-62.(in Chinese)

[4]周勝臣,瞿文婷,石英子,施詢之,孫韻辰.中文微博情感分析研究綜述[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(3):161-164,181..Zhou Shengchen Qu Wenting Shi Yingzi Shi Xunzhi Sun Yunchen.Overview on sentment anylysis of Chinese microbologging [J].Computer Applications and Software,2013,30(3):161-164,181.(in Chinese)

[5]Ye Q,Zhang Z,Law R.Sentiment classification of online reviews to travel destinations by supervised machine learning approaches[J].Expert Systems with Applications,2009,36( 3) :6527 - 6535.

[6]鄭文英.旅行目的地中文評(píng)論的情感分析研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.Zheng Wenying.Sentiment analysis of travel destination reviews in Chinese[D].Harbin:Harbin Institute of Technology,2010.(in Chinese)

[7]宗慶成.統(tǒng)計(jì)自然語(yǔ)言處理[M].北京:清華大學(xué)出版社,2014.Zong Qin-cheng.Statistical natural language processing[M].Beijing:Tsinghua University press,2014(in Chinese)

[8]周可艷,宗成慶.對(duì)話行為信息在口語(yǔ)翻譯中的應(yīng)用[J].中文信息學(xué)報(bào),2010,24(6):57-62.ZHOU Keyan,ZONG Chengqing.Apply Dialog Act Information in Spoken Language Translation[J].Journal of chinese information processing,2010,24(6):57-62.(in Chinese)

[9]藺璜,郭姝慧.程度副詞的特點(diǎn)范圍與分類[J].山西大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2003,26(2):71-74.LIN Huang,GUO Shu- hui.On the Characteristics,Range and Classification of Adverbs of Degree[J].Journal of Shanxi University(Philosophy&Social Science),2003,26(2):71-74.(in Chinese)

Research of tourism network review sentiment analysis method and system implementation

QIN Guorong,YE Zhicheng,ZHUANG Binhao,CAI Zhecong
(School of Software,Shenzhen Institute of Information Technology,Shenzhen 518172,P.R.China)

In this paper,we study the method of sentiment analysis in the field of tourism,and realize a practical application of the tourism network review monitoring system for the aviation company and hotel users.A simple and convenient method of sentiment analysis is designed,based on the sentiment dictionary to analyze the tourism network,and to obtain a higher accuracy rate for the optimization of the tourist areas.Through the system,enterprises can real-time master user of service evaluation,timely deal with negative comment,avoid causing irreparable.

tourism network review;sentiment analysis;sentiment dictionary;word segmentation dictionary;tourism network review monitoring

TP391.1

A

1672-6332(2015)03-0057-06

【責(zé)任編輯:高潮】

2015-09-26

本課題得到深圳信息學(xué)院校級(jí)科研培育項(xiàng)目(編號(hào):LG201433)和廣東省教育科研“十一五規(guī)劃項(xiàng)目(編號(hào):2010TJK410)資助.

覃國(guó)蓉(1969-),女(漢),碩士,教授,主要研究領(lǐng)域?yàn)檐浖こ?、信息安?、自然語(yǔ)言處理。 E-mail:qingr@sziit.edu.cn

猜你喜歡
連接詞分詞詞典
連動(dòng)結(jié)構(gòu)“VP1來(lái)VP2”的復(fù)句化及新興小句連接詞“來(lái)”的形成
分詞在英語(yǔ)教學(xué)中的妙用
米蘭·昆德拉的A-Z詞典(節(jié)選)
米沃什詞典
結(jié)巴分詞在詞云中的應(yīng)用
結(jié)巴分詞在詞云中的應(yīng)用
漫畫詞典
《胡言詞典》(合集版)刊行
論英語(yǔ)不定式和-ing分詞的語(yǔ)義傳承
英語(yǔ)連接詞:傳統(tǒng)與反思
大渡口区| 澄城县| 马鞍山市| 夏津县| 德化县| 丰原市| 荆门市| 镇原县| 淄博市| 贵定县| 永吉县| 巴东县| 龙里县| 扎囊县| 两当县| 南和县| 周口市| 曲阜市| 九寨沟县| 西和县| 沙田区| 尤溪县| 天长市| 正镶白旗| 新营市| 大方县| 广汉市| 太湖县| 定兴县| 东明县| 永昌县| 东乡县| 米脂县| 灵璧县| 蓝山县| 攀枝花市| 常州市| 扶沟县| 光泽县| 北宁市| 石泉县|