夏東杰+++劉少霞
摘要:基于如何能夠更好地利用互聯(lián)網(wǎng)醫(yī)院的評論信息,使其能夠有利于指導(dǎo)醫(yī)院改進(jìn)提高,讓人們能夠更好地了解以往患者就診的情況,同時(shí)探討更好的提升文本情感分析效果的方法。該文首先使用python爬蟲爬取烏鎮(zhèn)互聯(lián)網(wǎng)醫(yī)院的評論信息,其次在hownet詞典的基礎(chǔ)上,構(gòu)建新的情感詞典、否定詞典、程度副詞詞典以及連詞詞典,構(gòu)建了相應(yīng)的情感分析規(guī)則。同時(shí),根據(jù)評論信息分詞后的詞頻數(shù)據(jù)運(yùn)用R語言進(jìn)行數(shù)據(jù)的可視化分析。得出使用情感詞典和語義規(guī)則對互聯(lián)網(wǎng)醫(yī)院評論信息進(jìn)行分析是有效的結(jié)論,同時(shí)指出了評論者關(guān)注點(diǎn)主要在態(tài)度、效果、耐心、治療、預(yù)約、病人、時(shí)間等方面上。
關(guān)鍵詞: 互聯(lián)網(wǎng)醫(yī)院;文本分析;情感分析;情感詞典;語義規(guī)則
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)03-0180-04
隨著我國互聯(lián)網(wǎng)的高速發(fā)展,越來越多的傳統(tǒng)業(yè)務(wù)借助互聯(lián)網(wǎng)實(shí)現(xiàn)業(yè)務(wù)的轉(zhuǎn)型升級。加上我國醫(yī)療改革的呼聲日益高漲,互聯(lián)網(wǎng)醫(yī)院開始悄然興起?;ヂ?lián)網(wǎng)醫(yī)院是代表醫(yī)療行業(yè)發(fā)展的新方向,它對解決我國現(xiàn)在醫(yī)療資源嚴(yán)重不平衡以及人們?nèi)找嬖黾拥尼t(yī)療資源的需求之間的矛盾具有巨大的推動(dòng)作用,是目前我國衛(wèi)生部門積極引導(dǎo)及推動(dòng)的醫(yī)療發(fā)展新模式[1]。
互聯(lián)網(wǎng)醫(yī)院除了將傳統(tǒng)的掛號、疾病咨詢、處方等流程搬到互聯(lián)網(wǎng)上[2],還為患者或患者家屬提供了向互聯(lián)網(wǎng)醫(yī)院傳達(dá)醫(yī)院服務(wù)水平、表達(dá)自己在醫(yī)院服務(wù)感受的平臺(tái),即面向大眾的互聯(lián)網(wǎng)評論?;颊呒盎颊呒覍倏梢酝ㄟ^平臺(tái)對互聯(lián)網(wǎng)醫(yī)院的服務(wù)環(huán)節(jié)、具體環(huán)境、資源分配等各個(gè)方面發(fā)表自己的看法,一方面向醫(yī)院傳遞醫(yī)院值得肯定的地方及醫(yī)院需要改進(jìn)的環(huán)節(jié)等信息,從而提升患者的體驗(yàn),另一方面給想要了解互聯(lián)網(wǎng)醫(yī)院服務(wù)狀況的患者及患者家屬提供了良好的信息通道。由于互聯(lián)網(wǎng)醫(yī)院評論數(shù)量非常多,而且多為一百字以內(nèi)的語句級短文本,如何能夠快速準(zhǔn)確地從這些語句級評論中分析出評論者的關(guān)注點(diǎn)以及對互聯(lián)網(wǎng)醫(yī)院的服務(wù)的正負(fù)向評價(jià)從而給醫(yī)院的改進(jìn)提供方向,成為了亟須解決的研究課題。
1 相關(guān)研究情況
本文是對互聯(lián)網(wǎng)醫(yī)院評論的文本信息進(jìn)行分析和研究,根據(jù)評論信息判定其情感的傾向性及關(guān)注點(diǎn)內(nèi)容。就文本情感分析而言,目前學(xué)術(shù)界已經(jīng)有許多專家和學(xué)者研究如何快速高效的進(jìn)行情感的傾向分類。根據(jù)是否訓(xùn)練學(xué)習(xí)可以將情感分類的方法分為基于語義規(guī)則的情感分類和基于機(jī)器學(xué)習(xí)的情感分類[3]。根據(jù)文本的處理粒度的大小不同,則可以將文本情感分類分為篇章級分類、語句級分類、詞語級分類[4]。本文采用的是基于情感詞典與語義規(guī)則的語句級分類方法進(jìn)行分類。
對于基于情感詞典與語義規(guī)則方面的研究,徐琳宏、林鴻飛等通過計(jì)算待分類文本詞匯與知網(wǎng)中已標(biāo)注詞匯之間的相似度,選取傾向性明顯的詞匯作為特征詞,采用SVM及語義規(guī)則相結(jié)合的方法,提高對文本褒貶的識別強(qiáng)度[5]。趙鵬、趙志偉等提出了基于語義的TriPos模式的分類方法,將統(tǒng)計(jì)分析與語義分析相結(jié)合,提高了主客觀分析的準(zhǔn)確率、召回率和F值,取得了良好的效果[6]。吳江、唐常杰等通過Apriori方法對金融文本屬性進(jìn)行抽取,然后使用語義規(guī)則的分析方法對web金融文本進(jìn)行情感分析[7],取得的結(jié)果優(yōu)于ku[8]的算法結(jié)果。楊立公、樊孝忠等提出了最大限度地綜合利用各種語言的詞典信息,對候選詞進(jìn)行情感語義歸類,適用于沒有其他知識背景的情況,具有一定的實(shí)用價(jià)值[9]。王志濤、於志文等根據(jù)微博的特性,對微博的不同語言層次制定不同的語義規(guī)則,結(jié)合微博文本的粒度和表情符號,對微博文本進(jìn)行情感分類,并驗(yàn)證了該方法的有效性[10]。趙天奇、姚海鵬等則通過把微博表情引入情感加權(quán)的方式,使得微博情感分類有了一定程度的提高[11]。陳國蘭在已經(jīng)標(biāo)注的微博語料的基礎(chǔ)上,構(gòu)建包括程度副詞、關(guān)系連詞、否定詞的詞典,使用SVM分類,取得了較好的效果[12]。楊佳能、陽愛民構(gòu)建了表情符號詞典和網(wǎng)絡(luò)用語詞典,并使用依存句法分析構(gòu)建情感表達(dá)樹,并制定語義分析規(guī)則計(jì)算微博文本情感強(qiáng)度進(jìn)行情感分類,證明了加入表情符號和網(wǎng)絡(luò)用語有助于情感分類[13]。
2 評論文本的獲取與處理
2.1 評論文本的獲取
本文是選取烏鎮(zhèn)互聯(lián)網(wǎng)醫(yī)院(掛號網(wǎng))中的復(fù)旦大學(xué)附屬中山醫(yī)院的患者的評論信息作為研究對象進(jìn)行文本情感分析。作者通過借助Python爬蟲完成掛號網(wǎng)賬號的登錄、驗(yàn)證碼的識別、評論信息的下載等任務(wù),共獲取4315條評論信息。
2.2 評論信息的預(yù)處理
1)由于評論信息中存在同一個(gè)評論者連續(xù)評論多次,且每次評論的內(nèi)容都相同的情況,所以需要對多余的評論信息進(jìn)行刪除處理。
2)對評論信息進(jìn)行中文分詞處理。目前分詞工具比較多,使用較多的有jieba分詞、中科大的NLPIR系統(tǒng)分詞、庖丁解牛分詞等等,本文使用中科大的NLPIR系統(tǒng)進(jìn)行分詞。該分詞方法在分詞、詞性標(biāo)注等方面取得較好的效果,同時(shí)方便添加詞典。
3 相關(guān)詞典的構(gòu)建
3.1 網(wǎng)絡(luò)用語情感詞典的構(gòu)建
由于目前網(wǎng)絡(luò)信息非常多且更新的非???,每時(shí)每刻都會(huì)產(chǎn)生新的網(wǎng)絡(luò)用詞代表使用者的情感傾向,比如“然并卵”、“日了狗”、“猴賽雷”等等。這些詞在使用者使用時(shí)是作為一個(gè)完整的詞來表達(dá)他們特定的情感,但是由于分詞系統(tǒng)并不能及時(shí)將這些新的詞納入到分詞詞典中去,從而導(dǎo)致在分詞的過程中,將一個(gè)完整的詞拆分為若干部分,如“日了狗”被拆分為“日”、“了”、“狗”,“猴賽雷”被拆分為“猴”、“賽”、“雷”,從而失去了原來的意義,不利于評論者情感傾向的分析。
本文認(rèn)為在同一句內(nèi),如果分詞后的若干個(gè)詞一起連續(xù)出現(xiàn)的次數(shù)超過一定的較小的閾值但又同時(shí)小于一個(gè)較大的閾值,則可以初步判斷若干詞連續(xù)組合起來有可能形成一個(gè)新詞。例如“日了狗”作為一個(gè)網(wǎng)絡(luò)用詞可能會(huì)有較多的評論者在評論時(shí)用到,但是對整個(gè)評論的數(shù)量而言,仍然是少數(shù)的,同時(shí),“聽了”、“好了”等一些常見的一起出現(xiàn)的組合卻不應(yīng)該作為一個(gè)新詞對待。根據(jù)該原則,本文構(gòu)建獲得新詞的算法通過以下偽代碼實(shí)現(xiàn):
[算法3.1 查找新詞\&輸入:\&\&\&評論信息\&\&閾值下限n\&\&閾值上限N\&輸出:\&\& \&新詞\&
1)對評論信息根據(jù)標(biāo)點(diǎn)符號進(jìn)行分句,形成分句集合SentenceSet;\&2) 對分句集合SentenceSet的每個(gè)句子進(jìn)行分詞,形成分詞集合vocbSets;\&3)建立一個(gè)詞頻集合FreqSet{vocb,freq},其中vocb代表詞,freq代表該次出現(xiàn)的頻率,初始化為0;\&4) 建立一個(gè)新詞的集合newVocbSet用來存放新詞;\&5) for each vocbSets:\&6) for each vocb in vocbSets:\&7) if(([vocbi]+[vocbi+1])沒有出現(xiàn)在FreqSet中) then \&8) FreqSet中([vocbi]+[vocbi+1])對應(yīng)的頻率為1\&9) elseif(([vocbi]+[vocbi+1])出現(xiàn)在FreqSet中) then\&10) FreqSet中([vocbi]+[vocbi+1])對應(yīng)的頻率再加1\&11) end if\&12) end for\&13) end for\&14) for each freq in FreqSset:\&15) if(freq的值>n and freq的值 17) end if 18) end for\&19) 手動(dòng)將不是新詞的組合刪除,并對新詞進(jìn)行傾向性分類形成網(wǎng)絡(luò)用語情感詞典\&] 算法3.1可以根據(jù)每相鄰兩個(gè)詞的組合構(gòu)建網(wǎng)絡(luò)用語,由于部分網(wǎng)絡(luò)用語詞典是有多個(gè)詞組成的,所以本文還針對相鄰三個(gè)詞、相鄰四個(gè)詞分別做了相同的處理,得到更為全面的網(wǎng)絡(luò)用語情感詞典。通過該方法,本文共獲得了“點(diǎn)贊”,“牛逼”,“狂頂”,“白跑一趟”等53個(gè)新詞,其中褒義的有32個(gè),貶義的有21個(gè)。 3.2 基于HowNet的情感詞典的構(gòu)建 3.2.1 情感詞的相似度計(jì)算 HowNet(知網(wǎng))是一個(gè)以漢語和英語的詞所代表的概念為描述對象,揭示概念之間及概念的屬性之間的關(guān)系為基本內(nèi)容的知識庫[14]。在HowNet中,詞語與詞語之間的相似度是通過義原之間的距離加權(quán)計(jì)算得出。劉群、李素建等提出了通過如下方式來計(jì)算語義相似度的公式[14]: [sim(p1,p2)=αα+dist(p1,p2)] (1) 其中,α表示一個(gè)正的可變參數(shù),dist(p1,p2)則表示義原的距離。但是這種方法并不完善,例如“漂亮”和“美麗”的意義基本一樣,在通過該公式計(jì)算后相似度最大值為1,而“美麗”和“丑陋”兩個(gè)詞的意義是相反的,但是通過該公式計(jì)算兩個(gè)詞的其他基本義原的相似度也是1,所以這個(gè)方法不太準(zhǔn)確。江敏、肖詩斌等針對以上算法提出了新的基于HowNet的改進(jìn)的語義相似度的計(jì)算方法[15],公式如下: [][sim(p1,p2)=α(depth(p1)+depth(p2))α(depth(p1)+depth(p2))+dist(p1,p2)+|depth(p1)-depth(p2)|] (2) 其中depth(p1)表示p1距離根節(jié)點(diǎn)的層次,dist(p1,p2)表示義原之間的距離,α表示一個(gè)正的可變參數(shù)。同時(shí),具有以下規(guī)定:①如果p1,p2兩個(gè)義原具有相反意義,則他們的相似度記為-1;②如果p1,p2兩個(gè)義原路徑中存在相反意義的關(guān)系,則他們的相似度記為-1*sim(p1,p2) ′。其中sim(p1,p2) ′是將距離p1,p2最近的一對具有相反意義的義原節(jié)點(diǎn)看作同一個(gè)節(jié)點(diǎn),然后通過(2)式計(jì)算得出。 3.2.2 情感詞的傾向性計(jì)算 情感詞傾向性可以通過計(jì)算待分類情感詞語與基準(zhǔn)情感詞的相似度的大小來判斷。本文先人工選取并確定兩組強(qiáng)度很強(qiáng)的基準(zhǔn)詞,一組是褒義的,一組是貶義的,分別有43個(gè)詞,其中褒義的傾向值強(qiáng)度為1,貶義的傾向志強(qiáng)對為-1。然后通過以下公式計(jì)算待分類情感詞的傾向性[16]: [orientation(word)=1ni=1nsim(word,seed1i)-1mj=1msim(word,seed2j)] (3) 其中seed1i為褒義的基準(zhǔn)詞,seed2j為貶義的基準(zhǔn)詞,如果結(jié)果為正數(shù),則可以判定該待分類詞應(yīng)該為褒義的,同時(shí)加入到褒義詞中,如果結(jié)果為負(fù)數(shù),則可以判定待分類詞為貶義的,同時(shí)加入到貶義詞中去,其中,orientation(word)的值作為word的傾向值強(qiáng)度。 3.3 修飾詞詞典的構(gòu)建 3.3.1 程度副詞詞典的構(gòu)建 在評論信息中,許多情感傾向詞前帶有程度副詞作為修飾,來表達(dá)評論者的情感的強(qiáng)弱,但是一般不改變情感的極性。由于中科大分詞系統(tǒng)在分詞過程中,能過對各個(gè)詞進(jìn)行詞性標(biāo)注,因此可以根據(jù)分詞后的詞性標(biāo)注獲得程度副詞集合,進(jìn)而組成程度副詞詞典。本文獲得程度副詞采用的算法如下: [算法3.3 獲得程度副詞集合\&輸入:\&\&\&評論信息\&輸出:\&\& \&程度副詞集合\&1)對評論信息根據(jù)標(biāo)點(diǎn)符號進(jìn)行分句,形成分句集合SentenceSet;\&2) 對分句集合SentenceSet的每個(gè)句子進(jìn)行分詞,形成分詞集合vocbSets;\&3) 建立一個(gè)副詞的空集合AdvVocbSet用來存放副詞;\&4) for each vocbSets:\&5) for each vocb in vocbSets:\&6) if(vocb的詞性為副詞且vocb后面第一個(gè)詞或者第二個(gè)詞是形容詞) then \&7) 把vocb添加到AdvVocbSet中\&8) end if\&9) end for\&10) end for\&11) 對AdvVocbSet進(jìn)行Set集合運(yùn)算,去掉重復(fù)的詞,最終獲得非重復(fù)的副詞集合\&]
然后對程度副詞集合進(jìn)行人工篩選和進(jìn)一步補(bǔ)充,并對其修飾程度賦予權(quán)值,從而組成程度副詞詞典。本文將修飾程度分為4個(gè)等級,具體如表1所示:
表1 程度副詞表示及權(quán)值
3.3.2 否定詞詞典的構(gòu)建
鑒于否定詞的數(shù)量較少,且比較好搜集,本文通過搜集、整理,一共得到了25個(gè)否定詞,如:“不”、“非”、“沒”等,并將它們加入到否定詞詞典中去,否定詞典的詞的權(quán)值都為-1。
3.3.3 連詞詞典的構(gòu)建
由于有些評論者的評論信息中會(huì)含有連詞,而不同的連詞可能有不同的作用,如“而且”作為遞進(jìn)關(guān)系的連詞表示情感極性的強(qiáng)化,“但是”作為轉(zhuǎn)折關(guān)系的連詞則表示情感極性的反轉(zhuǎn)。鑒于連詞對整個(gè)句子的情感強(qiáng)度具有加強(qiáng)或者削弱等作用,本文按照算法4.3的方式,只是將“副詞”改為“連詞”,獲得較多的連詞,經(jīng)過進(jìn)一步的人工篩選和補(bǔ)充,并賦予權(quán)值,具體如表2所示:
表2 連詞表示及權(quán)值
4 語句的情感極性分析
本文對評論信息中的詞語組合進(jìn)行傾向值計(jì)算,從而判斷該詞語組合的傾向性,具體的規(guī)則如下:
規(guī)則一:在每個(gè)分句中,如果出現(xiàn)情感詞前面五個(gè)詞中出現(xiàn)否定詞但是沒有副詞,則計(jì)算否定詞的數(shù)量,如果否定詞的數(shù)量為奇數(shù),則初步判定該詞組合與情感詞的傾向相反,強(qiáng)度為情感詞強(qiáng)度*-1;如果否定詞的數(shù)量為偶數(shù),則初步判定該詞組合與情感詞的傾向相同,強(qiáng)度為情感詞強(qiáng)度*1;如果不出現(xiàn)否定詞,則情感詞的傾向性和強(qiáng)度不變。
規(guī)則二:情感詞之前出現(xiàn)了程度副詞,則該詞組的情感傾向與情感詞的傾向一致,情感強(qiáng)度為程度副詞的權(quán)值*情感詞的強(qiáng)度。例如“劉醫(yī)生的態(tài)度非常差?!?,其中“非?!钡臋?quán)值為最高級5,“差”的情感強(qiáng)度為-1,所以“非常差”的情感傾向?yàn)樨?fù),即貶義,情感強(qiáng)度為-5。
規(guī)則三:情感詞前同時(shí)出現(xiàn)否定詞和程度副詞,則需要考慮副詞和否定詞的位置。如果副詞在否定詞之前,則表示側(cè)重副詞對否定詞起作用,規(guī)定副詞+否定詞的情感強(qiáng)度為副詞的權(quán)值*-2;而否定詞在副詞之前,則表示側(cè)重否定詞對副詞起作用,規(guī)定否定詞+副詞的情感強(qiáng)度為副詞的權(quán)值*-0.5。然后將程度副詞和否定的組合當(dāng)做新的程度副詞對待。例如:“不太好”和“太不好”,都表示“不好”的意思,但是明顯“太不好”表示的強(qiáng)度比“不好”的強(qiáng)度更強(qiáng),而“不太好”的情感強(qiáng)度比“不好”的情感強(qiáng)度要弱。
規(guī)則四:每個(gè)分句如果出現(xiàn)了連詞,則該句的情感強(qiáng)度要在以上規(guī)則計(jì)算基礎(chǔ)上乘以連詞的權(quán)值來計(jì)算得出。
規(guī)則五:每條完整的評論信息的情感強(qiáng)度值由各個(gè)分句的情感強(qiáng)度值相加得出。
如果用a表示情感值強(qiáng)度,ad表示程度副詞權(quán)值,n表示否定詞個(gè)數(shù),c表示連詞權(quán)值,用g表示組合后的情感強(qiáng)度,以上規(guī)則的情景可通過表3表示:
表3 情感強(qiáng)度計(jì)算方法
5 實(shí)驗(yàn)與分析
5.1 評論信息關(guān)注點(diǎn)分析
本文對評論者評論關(guān)注點(diǎn)獲取方式是基于關(guān)鍵詞的頻數(shù)。通過對所有的評論信息進(jìn)行分詞,然后引入停用詞詞典,將存在停用詞詞典中的詞刪除,對剩余的所有詞計(jì)算詞頻,取前300個(gè)詞及詞頻,通過R語言的wordcloud包對詞和詞頻進(jìn)行可視化,具體如圖1:
圖1
從圖1可以很容易看出關(guān)鍵詞依次是:態(tài)度、醫(yī)院、效果、耐心、治療、預(yù)約、病人、時(shí)間等等??梢娫u論者對醫(yī)院醫(yī)生的態(tài)度、是否耐心、治療的效果,預(yù)約的便捷性以及看病排隊(duì)的時(shí)間是比較關(guān)注的。對于醫(yī)院而言,也可以有方向地針對這些關(guān)鍵點(diǎn),著手改進(jìn)和提高,從而提升患者的看病體驗(yàn)。
5.2 語句傾向性效果分析
本文通過爬蟲的方式,從烏鎮(zhèn)互聯(lián)網(wǎng)醫(yī)院(掛號網(wǎng))共爬去4315條數(shù)據(jù),然后使用本文提到的方法構(gòu)建詞典,其中新詞詞典共有詞匯121個(gè),褒義詞有76個(gè),貶義詞有45個(gè),情感詞典共有詞匯12624個(gè),褒義詞有7342個(gè),貶義詞有5282個(gè),程度副詞有219個(gè),否定詞25個(gè),連詞47個(gè)。然后用既定的規(guī)則對評論信息分析情感傾向性的強(qiáng)度值。本文規(guī)定,如果整個(gè)語句的情感傾向性強(qiáng)度值大于0.15,則判定為褒義的;如果整個(gè)語句的情感傾向強(qiáng)度值小于-0.15,則判定為貶義的;如果整個(gè)語句的情感傾向強(qiáng)度值介于-0.15-0.15之間,則判定為中性的。對性能的評估,本文使用查準(zhǔn)率(Pecision)、查全率(Recall)和F值來評估:
Pecision = 提取出正確的信息條數(shù) / 提取出的信息條數(shù),
Recall = 提取出正確的信息條數(shù) / 樣本中的信息條數(shù),
F = (2*Pecision*Recall)/(Pecision+Recall)。
本文分別計(jì)算了基礎(chǔ)的情感詞典、基礎(chǔ)情感詞典+新的情感詞典、基礎(chǔ)情感詞典+新的情感詞典+語義規(guī)則來計(jì)算查準(zhǔn)率、查全率和F值,具體如表4所示:
表4 實(shí)驗(yàn)方法效果對比
通過實(shí)驗(yàn)驗(yàn)證,在基礎(chǔ)情感詞典的基礎(chǔ)上加上新的情感詞典以及使用語義規(guī)則的方法能夠較大的提高準(zhǔn)確率和F值,即該方法取得了較好的效果。
6 結(jié)論
本文通過在現(xiàn)有情感詞典的基礎(chǔ)上,構(gòu)建新的情感詞典、否定詞典、程度副詞詞典以及連詞詞典,并對詞典的詞賦予一定的權(quán)值,從而能夠根據(jù)規(guī)則計(jì)算評論信息的強(qiáng)度值,方便對其進(jìn)行情感極性的分類。同時(shí),本文對中性評論的強(qiáng)度指定了一個(gè)范圍,從而能夠更好地對評論信息的極性進(jìn)行分類,更符合實(shí)際情況。根據(jù)指定語義規(guī)則分類,最后取得較好的效果。本文還根據(jù)評論信息分詞后的詞的頻率,找出了關(guān)鍵詞,并進(jìn)行了可視化,從而方便直觀地看出評論者的關(guān)注點(diǎn),對醫(yī)院的改進(jìn)和提高有借鑒意義。但本文還有較多的不足之處,大致包括以下幾點(diǎn):
1)本文的詞典構(gòu)建主要依賴于Hownet,比較單一,而目前已經(jīng)有較多的情感詞典可供參考,從而從多個(gè)角度計(jì)算情感詞典的強(qiáng)度,這樣更為理想。
2)本文標(biāo)注、測試的文本數(shù)量只有4315條,數(shù)量相對較少,獲取的新詞也不夠多,對較大數(shù)量的文本,獲取新詞的成本會(huì)比較高。
3)對語句的分析類型還不夠,可以增加反問句、疑問句、正話反說等等的句式以及更多其他的搭配,從而能夠更加符合評論的實(shí)際情況。
總體來說,評論信息的文本情感分類的研究還不是十分的完善,仍然需要相關(guān)方面的專家和學(xué)者不斷提高分類的效果。
參考文獻(xiàn):
[1] 劉新. 互聯(lián)網(wǎng)醫(yī)院,來了![J]. 互聯(lián)網(wǎng)經(jīng)濟(jì),2015(5):16-19.
[2] 閆龑. 聚焦互聯(lián)網(wǎng)醫(yī)院[J]. 現(xiàn)代養(yǎng)生,2016(10):6-7.
[3] 馬力,宮玉龍. 文本情感分析研究綜述[J]. 電子科技,2014(11):180-184.
[4] 楊立公,朱儉,湯世平. 文本情感分析綜述[J]. 計(jì)算機(jī)應(yīng)用,2013(6):1574-1578+1607.
[5] 徐琳宏,林鴻飛,楊志豪. 基于語義理解的文本傾向性識別機(jī)制[J]. 中文信息學(xué)報(bào),2007(1):96-100.
[6] 趙鵬,趙志偉,陶新竹,等. 基于語義的TriPos模式的中文主客觀分析方法[J]. 計(jì)算機(jī)應(yīng)用研究,2012(9):3285-3288.
[7] 吳江,唐常杰,李太勇,等. 基于語義規(guī)則的Web金融文本情感分析[J]. 計(jì)算機(jī)應(yīng)用,2014(2):481-485+495.
[8] KU LW, LIANG Y T, CHEN H H. Opinion extraction,summarization and tracking in news and blog corpora[C]//Proceedings of the 2006 AAAI Symposium on Computational Approaches to Analysing Weblogs. Menlo Park: AAAI Press,2006:100-107.
[9] 楊立公,樊孝忠,朱儉. 利用語義詞典的情感詞快速識別[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2013(8):2978-2982.
[10] 王志濤,於志文,郭斌,等. 基于詞典和規(guī)則集的中文微博情感分析[J]. 計(jì)算機(jī)工程與應(yīng)用,2015(8):218-225.
[11] 趙天奇,姚海鵬,方超,等. 語義規(guī)則與表情加權(quán)融合的微博情感分析方法[J]. 重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2016(4):503-510.
[12] 陳國蘭. 基于情感詞典與語義規(guī)則的微博情感分析[J]. 情報(bào)探索,2016(2):1-6.
[13] 楊佳能,陽愛民,周詠梅. 基于語義分析的中文微博情感分類方法[J]. 山東大學(xué)學(xué)報(bào):理學(xué)版,2014(11):14-21,30.
[14] 劉群,李素建.基于 “知網(wǎng)” 的詞匯語義相似度計(jì)算[C]//第三屆漢語詞匯語義學(xué)研討會(huì)論文集.臺(tái)北,2002:59-76.
[15] 江敏,肖詩斌,王弘蔚,等. 一種改進(jìn)的基于《知網(wǎng)》的詞語語義相似度計(jì)算[J]. 中文信息學(xué)報(bào),2008(5):84-89.
[16] 李永忠,胡思琪. 基于HowNet和PAT樹的網(wǎng)購評語情感分析[J]. 圖書情報(bào)研究,2016(3):66-70,65.