国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于詞匯范疇和語義相似的顯性情感隱喻識別機制

2012-05-31 08:42:54飛,侃,
大連理工大學(xué)學(xué)報 2012年5期
關(guān)鍵詞:特征詞喻體范疇

林 鴻 飛, 許 侃, 任 惠

(大連理工大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,遼寧 大連 116024)

0 引 言

分析一篇文章的情感色彩,需要對詞進(jìn)行著重分析,因為文章是由句子組成的,而句子是由詞組成的.在文本情感計算時,常??梢园l(fā)現(xiàn)并不是每個句子當(dāng)中都含有情感詞,這時計算機很難準(zhǔn)確地給出這個句子的情感.然而情感是豐富而抽象的,往往通過隱喻給以形象的描述.因此,對這些隱喻進(jìn)行識別,并且將其解釋成普通的語言表達(dá)方式,有助于文本的情感計算.

例如:“這律師是狐貍?!?/p>

計算機很難從字面上直接給出這句話的真實情感.但是從隱喻的角度考慮,本體是“律師”,喻體是“狐貍”,話外之音是省略掉的喻底“狡猾”、“多疑”,這句話表達(dá)的真正意思是“律師像狐貍一樣狡猾.”因此,隱喻的識別和理解,對于情感計算有很大的幫助.

從20世紀(jì)60年代起,西方對隱喻的研究掀起了熱潮,隱喻研究者把隱喻從修辭學(xué)納入認(rèn)知語言學(xué)的范疇,人們認(rèn)識到隱喻既是一種語言現(xiàn)象,也是一種思維方式[1].而漢語的隱喻研究也逐漸被放在一個更加重要的位置,國內(nèi)語言學(xué)界對隱喻的研究給予了極大的熱情,主要集中于有關(guān)漢語隱喻修辭的語言學(xué)和心理學(xué)范疇的討論.而隱喻計算化方面的研究仍處于探索研究階段.國內(nèi)的相關(guān)學(xué)者進(jìn)行了一些隱喻計算模型的探討和試驗,俞士汶從自然語言理解角度提出了多個層面的隱喻理解問題[1],張威等在隱喻邏輯推理方面進(jìn)行了研究[2-4].

王治敏[5]使用機器學(xué)習(xí)的方法識別名詞短語隱喻,采用了基于實例、樸素貝葉斯、最大熵3種分類方法進(jìn)行比較,得出最大熵的分類效果最好.

賈玉祥等基于現(xiàn)有的詞典資源,對名詞性隱喻進(jìn)行識別[6],并利用隱喻知識庫進(jìn)行了隱喻理解方面的研究[7].

本文主要針對隱喻識別進(jìn)行初步探討,以便將其應(yīng)用到情感計算中.王治敏主要處理的是名詞短語隱喻,而本文考慮的隱喻中的本體和喻體不限于名詞短語;賈玉祥利用詞典資源識別名詞性隱喻,對于未登錄詞的處理會有限制,而本文通過依存句法分析可以彌補這一缺陷;利用隱喻知識庫處理會需要大量的知識庫建立工作,而本文的方法不需要用到隱喻知識庫.

1 隱喻的識別

隱喻的理解過程分為兩個步驟:隱喻的辨認(rèn)和隱喻意義的推斷[8],分別稱之為隱喻的識別和隱喻的理解,其中隱喻的理解是建立在正確的隱喻識別基礎(chǔ)之上的.因此,研究隱喻的識別對于隱喻的機器理解而言,是一項很有意義的基礎(chǔ)性工作,對于基于文本的情感計算具有十分重要的意義[9,10].

1.1 隱喻的特點和分類

本體和喻體之間存在明顯差異是隱喻的一個重要特征,完全相同的事物是不能構(gòu)成隱喻的.本體和喻體不僅要有差異,也要相似,相似性也是隱喻的基本要素.而隱喻的理解就是找到本體到喻體的映射.由此可以得出影響漢語隱喻理解的四大要素:本體、喻體、相異點和相似點[2].從隱喻的表現(xiàn)形式、功能和效果、認(rèn)知特點等角度,可以把隱喻分為顯性隱喻(明喻)與隱性隱喻、根隱喻與派生隱喻、以相似性為基礎(chǔ)的隱喻和創(chuàng)造相似性的隱喻等[2].本文中只討論對顯性隱喻的識別.

1.2 顯性隱喻的識別

對于隱喻的識別來說,由于漢語句子本身的復(fù)雜性,不宜展開來通篇識別,應(yīng)該從一個小范圍入手,本文選擇顯性隱喻這個類別作為切入點.顯性隱喻的特征是隱喻的四要素都存在于句子之中,明確說明兩者是一種對比關(guān)系,漢語中的典型形式是“A像B”或“A像B一樣C”.如:

例1 “建筑像凝固的音樂?!?/p>

但是,并不是所有含有“像”字的句子都是隱喻句.如:

例2 “未經(jīng)書面授權(quán)禁止復(fù)制或建立鏡像?!崩? “一九四二年創(chuàng)作的浮雕《毛澤東像》是毛澤東的側(cè)面頭像?!?/p>

這兩個句子中的“像”都是名詞,句子并不是隱喻句.又如:

例4 “就像鄧小平同志指出的:統(tǒng)一戰(zhàn)線仍然是一個重要法寶?!?/p>

例5 “像標(biāo)志牌寫的那樣,要有志氣把三峽工程建好?!?/p>

例4、5兩個句子中含有動詞“像”,但是句子本身也不是隱喻句.

這些隱喻句是隱喻當(dāng)中結(jié)構(gòu)比較簡單的一類,但是即便是這樣,對它們的識別也不是那么容易的.在實驗中,從隱喻本身的特點出發(fā),去考慮解決顯性隱喻的識別問題.從邏輯角度來看,隱喻中涉及的兩個主詞屬于兩個不同的類型,因而將它們用系詞(通常是be)聯(lián)結(jié)起來實際上構(gòu)成了一種邏輯錯誤,或稱“范疇置錯”.在顯性隱喻的識別過程中就是使用隱喻中本體詞匯和喻體詞匯的范疇矛盾性來解決識別問題.如:

例6 “她的手像冰一樣?!?/p>

例6中“手”是本體,“冰”是喻體.實際生活中,冰的溫度明顯低于手的溫度,“手”和“冰”并不屬于同一個詞匯范疇,因而判定該句為隱喻句.由人對“冰”的固定認(rèn)知可以推斷,這個句子的真正意義是:“她的手像冰一樣冷”.

2 利用詞性標(biāo)注提取特征詞

詞性標(biāo)注是特征詞提取的基礎(chǔ).在詞性標(biāo)注階段,利用自動分詞程序?qū)ξ谋局械木渥舆M(jìn)行分詞,然后逐詞進(jìn)行查找和分析.過程分為兩個步驟:提取標(biāo)志詞匯,然后提取標(biāo)志詞匯的相關(guān)詞匯.

在特征詞的提取過程中,每個句子的結(jié)構(gòu)被描述成一個三元組O∶={C,T,S}.

其中C中的元素被稱為標(biāo)志詞(character word),元素的選擇范圍為“像/v”和“像/n”.即在分詞完成的句子中,“像/v”和“像/n”需要作為標(biāo)志詞來提取.含有名詞“像”的句子,不屬于顯性隱喻的識別范疇.含有動詞“像”的句子將會被進(jìn)一步處理.由于詞性標(biāo)注工具的不同,可能會產(chǎn)生不同的詞性分類體系,本文主要考慮“像/v”和“像/n”這兩類.

T、S中的元素分別被稱為本體詞(target word)和喻體詞(source word).以C為中心,按照臨近名詞規(guī)則來確定句子中的本體詞和喻體詞.在處理的過程中,根據(jù)句子的復(fù)雜程度,需要把整個句子按照“,”進(jìn)行斷句,如果在C的當(dāng)前分句中無法找到T或者S,那么就需要擴大查找范圍,在其他分句中確定T或S.在本系統(tǒng)中,會指定C的下一小分句的第一個名詞為要查找的本體詞.如:

例7 “她/r的/u面龐/n笑/v得/u竟/d像/v一/m 朵/q盛開/v的/u鮮花/n”

可以得到“像/v”以及本體“面龐”和喻體“鮮花”.又如:

例8 “像/v無數(shù)/m 燃燒/v的/u蠟燭/n一樣/a,/wp所有/b老師/n都/d情愿/v燃燒/v自己/r,/wp照亮/v別人/r。/wp”

按照臨近名詞規(guī)則,只能找到喻體“蠟燭”,而對于本體“老師”臨近規(guī)則失效,這時,擴大詞的查找范圍,指定 “像/v”的下一小分句的第一個名詞為要查找的本體詞.從而,可以找到標(biāo)志詞“像/v”以及本體“老師”和喻體“蠟燭”.

3 利用依存句法分析提取特征詞

在利用詞性標(biāo)注提取本體和喻體特征詞的同時,需要利用依存句法分析來加強對喻體特征詞的進(jìn)一步提取.在本文中,利用的是哈爾濱工業(yè)大學(xué)的依存句法分析系統(tǒng)[11],其分析結(jié)果為特征詞的提取提供了有力的支持.

系統(tǒng)通過依存句法分析,把句子從一個線性序列重新組織成一個結(jié)構(gòu)化的依存分析樹,而句子中詞之間的依存關(guān)系是通過依存弧來反映的.依存句法分析的優(yōu)點是深入語言的內(nèi)部結(jié)構(gòu)而不再局限于表層的匹配.為了加強詞性標(biāo)注提取的準(zhǔn)確性,這里要利用依存句法分析進(jìn)行本體和喻體的進(jìn)一步確定,本文所用系統(tǒng)的無標(biāo)記依存弧句法分析準(zhǔn)確率為80%左右,對提高詞匯提取的正確性起到了一個很好的作用.

具體說來,“像”字在句子中一般充當(dāng)謂語和介詞,所以后面跟的一般都是動賓詞和介賓詞.在依存句法分析系統(tǒng)中,動賓關(guān)系和介賓關(guān)系的分析標(biāo)識分別為“VOB”和“POB”,而這些依存于“像”字的詞匯往往就是要查找的喻體詞匯.如:

例9 “優(yōu)秀/a大學(xué)生/n就/d像/v社會主義/n精神文明/n建設(shè)/v的/u種子/n。/wp”

依存句法分析結(jié)果如圖1所示.

本體為“大學(xué)生”,喻體為“種子”.如果利用詞性標(biāo)注來判斷喻體為“社會主義”,顯然是錯誤的,但是根據(jù)依存句法分析,通過“像_種子/VOB”這一項,可以得出“種子”是“像”的動賓詞,因此可以得到喻體“種子”.

圖1 依存句法分析示例之一Fig.1 Example 1of interdependence parsing analysis

4 詞匯范疇判別及語義相似度計算

提取到本體和喻體特征詞以后,需要對兩個特征詞的范疇進(jìn)行判別并且計算詞的相似度.而知網(wǎng)中含有豐富的詞匯語義知識,因此本文詞匯范疇判別和相似度的計算都是基于知網(wǎng)(HowNet Knowledge Database)進(jìn)行的.

4.1 知網(wǎng)的知識詞典

知網(wǎng)是一個網(wǎng)狀結(jié)構(gòu)的知識系統(tǒng),主要反映概念以及概念的屬性之間的各種關(guān)系.知網(wǎng)的基礎(chǔ)文件是知識詞典,在知識詞典中,每一個詞的概念及其描述對應(yīng)一條記錄,而每一條記錄都主要包含詞語、詞語詞性、詞語例子以及概念定義這4項內(nèi)容[12].

看一個具體的例子:

在上例中,NO.是概念編號,W_C是漢語詞語,G_C是漢語詞性,E_C是漢語例子,W_E是英語詞語,G_E是英語詞性,E_E是英語例子,DEF是概念定義[12].其中DEF是最重要的.可以認(rèn)為知網(wǎng)中的概念定義是這個詞所屬的一個類別.而這個類別,對處理隱喻,用來表示本體和喻體的范疇是很重要的.

4.2 詞匯范疇的判別

根據(jù)知網(wǎng)知識詞典的語言描述,可以利用其中的概念定義來判別一個詞所屬的類別.如果提取的本體和喻體特征詞屬于同一個類別或者相近的類別,就可以判斷這個句子不是隱喻;反之,如果這兩個特征詞匯不屬于同一個類別,那么就構(gòu)成隱喻.

例10 “這些地區(qū)都應(yīng)像京郊災(zāi)區(qū)一樣,振

例11 “遠(yuǎn)處的她像一束飄動的紅綢子?!?/p>

提取特征詞為“她”、“綢子”,這兩個詞匯在知網(wǎng)中的概念定義分別為“他”、“材料”,因此可以判斷它們不屬于同一個概念范疇,那么就構(gòu)成隱喻.

對于詞匯相近范疇的識別,需要支持向量機的學(xué)習(xí)來進(jìn)行.

4.3 語義相似度計算

如果兩個詞語相互替換而不改變替換文本的句法語義結(jié)構(gòu),那么這兩個詞是相似的.而它們的相似度在于改變替換文本句法語義結(jié)構(gòu)的程度,改變得越小,相似度越高,改變得越大,相似度越低.

計算兩個詞語的語義相似度,對于隱喻的識別有重要的意義,本體和喻體的相似度可以作為隱喻識別的一個重要特征.根據(jù)知網(wǎng)提供的詞匯義原以及知網(wǎng)本身的網(wǎng)狀結(jié)構(gòu),可以計算出詞之間的距離[13].

首先,應(yīng)該計算兩個詞之間相似度的大小.對于兩個漢語詞語W1和W2,如果W1有n個義項奮精神,精打細(xì)收,力爭抗災(zāi)奪豐收?!?/p>

提取特征詞為“地區(qū)”、“災(zāi)區(qū)”,這兩個詞匯在知網(wǎng)中的概念定義均為“地區(qū)”,因此可以判斷它們屬于同一個概念范疇,那么就不構(gòu)成隱喻.(概念):S11,S12,…,S1n,W2有m個義項(概念):S21,S22,…,S2m,W1和W2的語義相似度即是各個概念的相似度之最大值[12].即

這樣可以根據(jù)兩個概念之間的相似度來計算兩個詞之間的相似度.

然后,根據(jù)計算得到的相似度大小,設(shè)定一個閾值來界定兩個詞的范疇,從而判斷它們是不是屬于同一個類別.這樣,就可以把概念之間的相似度問題歸結(jié)成兩個詞之間的范疇問題,最終達(dá)到是否屬于一個類別判斷的目的.

在系統(tǒng)中,相似度的取值范圍規(guī)定在0~1.針對實驗語料,在0~1定義一個閾值d,相似度大于d的詞被視為同一范疇,小于等于d的則被視為不同范疇,即構(gòu)成隱喻.閾值d的計算公式為

例12 “頭發(fā)白得像臘月里的雪。”

通過計算得到,本體詞“頭發(fā)”和喻體詞“雪”的相似度為0.1.根據(jù)閾值判斷,它們的相似度比較低,本體和喻體不屬于同一個范疇,因此構(gòu)成隱喻.

5 基于支持向量機的隱喻識別

支持向量機根據(jù)特征空間的數(shù)據(jù)是否線性可分,分為線性支持向量機和非線性支持向量機.非線性支持向量機的原理是把輸入向量從低維特征空間映射到高維特征空間,從而把非線性問題轉(zhuǎn)換成線性問題.而這種變換是通過核函數(shù)k(x,xi)來實現(xiàn)的[14].

本系統(tǒng)采用SVMlight 4.0版本軟件包[15,16]來實現(xiàn)分類器的訓(xùn)練和測試.

使用基于特征向量的機器學(xué)習(xí)方法進(jìn)行隱喻識別,最重要的過程就是特征向量的構(gòu)造.選取恰當(dāng)?shù)奶卣髂軌蜉^好地對實體進(jìn)行表述,有利于學(xué)習(xí)效果的提高.

隱喻的特征選取,需要針對其結(jié)構(gòu)特點,依據(jù)詞匯范疇的原則來進(jìn)行.通過對訓(xùn)練語料進(jìn)行分析,把“像/v”,“像/n”,本體、喻體詞在知網(wǎng)中的概念定義,本體、喻體詞的相似度4個方面作為隱喻識別的特征.

“像/v”表示“像”在句子中以謂詞的成分出現(xiàn),它是判斷一個句子有可能是要處理的隱喻的一個基本特征;“像/n”是判斷一個句子為非隱喻句的一個重要而直接的特征,是區(qū)分隱喻和非隱喻的標(biāo)志.根據(jù)這個特征可以把語料中非隱喻的句子直接排除出去.

本體、喻體詞在知網(wǎng)中的概念定義是詞匯范疇詳細(xì)劃分的特征,根據(jù)這個特征可以給出詞在概念層次的范疇分類.運用分詞和依存句法分析對句子進(jìn)行主成分分析,以“像”為中心,根據(jù)本體、喻體特征詞進(jìn)行提取.根據(jù)范疇分類,可以有效地判斷特征類別范疇相同的句子為非隱喻句.

本體、喻體詞的相似度為本體、喻體詞范疇二元劃分的特征.除了詞的概念層次范疇分類以外,對于類別范疇相似或相近的詞匯,需要采取相似度的計算來判斷本體、喻體詞的范疇.根據(jù)此特征可以進(jìn)一步地對詞的類別進(jìn)行劃分,并且可以通過調(diào)整相似度的閾值來進(jìn)行范疇的界定.

在實驗過程中,把以上4個方面作為隱喻識別的特征加入特征向量中,進(jìn)行機器學(xué)習(xí)的訓(xùn)練和預(yù)測.

6 實驗與結(jié)果分析

6.1 實驗說明

本文中利用的語料來自于國家語委語料庫(http://219.238.40.213:8080/).在網(wǎng)站中,通過語料庫的檢索系統(tǒng)搜索出含有“像”字的句子4 590句,從中抽取前1 000句作為本次實驗的語料,然后手工整理到數(shù)據(jù)庫中.因為標(biāo)注的語料數(shù)量有限,很難覆蓋所有的詞,而且漢語的表達(dá)方式靈活多樣,因此在訓(xùn)練語料和測試語料劃分時,其中938句作為訓(xùn)練語料,62句作為測試語料.實驗的流程如圖2所示.

在實驗過程中,首先把語料分成訓(xùn)練樣本和測試樣本.然后,在數(shù)據(jù)轉(zhuǎn)換模塊對語料進(jìn)行分詞、句法分析,并提取其中的本體和喻體信息,形成特征數(shù)據(jù),生成SVMlight所需要的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù).其次,利用SVMlight對得到的數(shù)據(jù)進(jìn)行訓(xùn)練和分類,最后對SVMlight得到的結(jié)果進(jìn)行分析整理,得到最終的數(shù)據(jù).

6.2 實驗結(jié)果及分析

根據(jù)以上流程,實現(xiàn)了一個基于知網(wǎng)的隱喻計算程序模塊.共設(shè)計了兩個對比實驗.

圖2 顯性隱喻識別的實驗流程Fig.2 Experiment process of dominant metaphor indentification

實驗1 僅僅利用詞性標(biāo)注來提取本體和喻體詞,并通過知網(wǎng)判斷詞的范疇.

實驗2 利用詞性標(biāo)注和依存句法分析提取本體和喻體詞,通過知網(wǎng)以及相似度計算來判斷詞的范疇.

實驗結(jié)果如表1所示.

表1 實驗結(jié)果Tab.1 Experiment results

實驗2同實驗1相對比,加入了依存句法分析和相似度計算,結(jié)果有了一定的提高.但是兩個實驗共同的問題是:準(zhǔn)確率相對不高,而召回率卻比較高,說明實驗中的噪音比較大.

對實驗流程進(jìn)行分析,發(fā)現(xiàn)特征詞提取不準(zhǔn)確是造成噪音比較大的一個主要原因.

在本體和喻體特征詞提取過程中,由于語料中句子比較復(fù)雜,詞的提取規(guī)則并不能適用于所有的句子.如:

例13 “城市夢對于地處偏僻山區(qū)龍華的農(nóng)民來說,不再像天上的月亮可望不可即?!?/p>

人工對本句進(jìn)行詞信息提取,可以得到本體“城市夢”和喻體“月亮”,但是如果通過機器提取,句子成分的復(fù)雜程度已經(jīng)超出了規(guī)則范圍.因此,語料的復(fù)雜程度是影響特征詞提取準(zhǔn)確與否的一個重要因素.

另一方面,依存句法分析在特征詞提取過程中確實起到了一定的作用,但對于語料中某些句子,并不能用依存句法分析來提取本體詞,而用來提取喻體詞的準(zhǔn)確率也不是很高.如:

例14 “我們決不能像無頭蒼蠅一樣亂撞亂飛?!?/p>

依存句法分析的結(jié)果如圖3所示.

通過例句可以看出,并不能得到本體“我們”和喻體“蒼蠅”,因此這也是造成特征詞提取不準(zhǔn)確的一個原因.

另外,由于語料有限,相對于知網(wǎng)來說,特征詞匯覆蓋面比較小,造成SVMlight特征向量矩陣比較稀疏,不能達(dá)到一個理想的學(xué)習(xí)效果,也是影響實驗結(jié)果的一個重要因素.

由于受到目前句法分析工具準(zhǔn)確率的限制,本體和喻體的提取會影響最終實驗結(jié)果的準(zhǔn)確率和召回率,由此可見加強對本體和喻體的提取是提高隱喻識別精度的一個重要因素.

圖3 依存句法分析示例之二Fig.3 Example 2of interdependence parsing analysis

7 結(jié) 語

本文提出了一種基于語義和詞匯相似度的漢語顯性隱喻識別方法.仔細(xì)分析實驗結(jié)果可以發(fā)現(xiàn),當(dāng)前實驗中,由于選擇的語料句子比較復(fù)雜,在特征詞抽取方面的準(zhǔn)確率還不是很高,造成詞匯范疇判斷和相似度計算得不到正確的結(jié)果.

在以后的研究中,除進(jìn)一步提高抽取準(zhǔn)確率外,可以考慮更多類型的隱喻,對多種類型隱喻的識別進(jìn)行研究.

[1] 俞士汶.語料庫與綜合型語言知識庫的建設(shè)[C]//中文信息處理若干重要問題.北京:科學(xué)出版社,2002.YU Shi-wen.Construction of corpus and comprehensive language knowledge-base [C]// Several Important Problems for Chinese Information Processing.Beijing:Science Press,2002.(in Chinese)

[2] 張 威,周昌樂.漢語隱喻理解的邏輯描述初探[J].中文信息學(xué)報,2004,18(5):23-28.ZHANG Wei,ZHOU Chang-le.Study on logical description of Chinese metaphor comprehension[J].Journal of Chinese Information Processing,2004,18(5):23-28.(in Chinese)

[3] 楊 蕓,周昌樂,王雪梅,等.基于機器理解的漢語隱喻分類研究初步[J].中文信息學(xué)報,2004,18(4):31-36.YANG Yun,ZHOU Chang-le,WANG Xue-mei,etal.Research into machine understanding-based classification of the metaphor of Chinese[J].Journal of Chinese Information Processing,2004,18(4):31-36.(in Chinese)

[4] 周昌樂.隱喻、類比邏輯與可能世界[J].外國語言文學(xué)研究,2004,4(2):17-22.ZHOU Chang-le. Metaphor,analogous logic and possible worlds [J].Research in Foreign Language and Literature,2004,4(2):17-22.(in Chinese)

[5] 王治敏.漢語名詞短語隱喻識別研究[D].北京:北京大學(xué),2006.WANG Zhi-min.Chinese noun phrase metaphor recognition[D].Beijing:Peking University,2006.(in Chinese)

[6] 賈玉祥,俞士汶.基于詞典的名詞性隱喻識別[J].中文信息學(xué)報,2011,25(2):99-104.JIA Yu-xiang, YU Shi-wen. Nominal metaphor recognition based on lexicons[J].Journal of Chinese Information Processing,2011,25(2):99-104.(in Chinese)

[7] 賈玉祥,俞士汶.基于實例的隱喻理解與生成[J].計算機科學(xué),2009,36(3):138-141.JIA Yu-xiang,YU Shi-wen.Instance-based metaphor comprehension and generation[J].Computer Science,2009,36(3):138-141.(in Chinese)

[8] 束定芳.隱喻學(xué)研究[M].上海:上海外語教育出版社,2000.SHU Ding-fang.Studies in Metaphor[M].Shanghai:Shanghai Foreign Language Education Press,2000.(in Chinese)

[9] 陳建美,林鴻飛.中文情感常識知識庫的構(gòu)建[J].情報學(xué)報,2009,28(4):492-498.CHEN Jian-mei,LIN Hong-fei.Constructing the affective commonsense knowledgebase[J].Journal of the China Society for Scientific and Technical Information,2009,28(4):492-498.(in Chinese)

[10] 徐琳宏,林鴻飛,趙 晶.情感語料庫的構(gòu)建和分析[J].中文信息學(xué)報,2008,22(1):116-122.XU Lin-h(huán)ong, LIN Hong-fei, ZHAO Jing.Construction and analysis of emotional corpus[J].Journal of Chinese Information Processing,2008,22(1):116-122.(in Chinese)

[11] 劉 挺,車萬翔,李正華.語言技術(shù)平臺[J].中文信息學(xué)報,2011,25(6):53-62.LIU Ting, CHE Wan-xiang, LI Zheng-h(huán)ua.Language technology platform [J]. Journal of Chinese Information Processing,2011,25(6):53-62.(in Chinese)

[12] 董振東,董 強.知 網(wǎng) [DB/OL].http://www.keenage.com.DONG Zhen-dong,DONG Qiang.HowNet[DB/OL].http://www.keenage.com.(in Chinese)

[13] 劉 群,李素建.基于《知網(wǎng)》的詞匯語義相似度計算 [C]//第三屆漢語詞匯語義學(xué)研討會.臺北:[s n],2002.LIU Qun,LI Su-jian. Word meaning similarity computation based on HowNet [C]// The 3th Chinese Lexical Semantics Workshop.Taipei:[s n],2002.(in Chinese)

[14] Cristianini N,Shawe-Taylor J.An Introduction to Support Vector Machines [M ]. Cambridge:Cambridge University Press,2000.

[15] Canny J. A computational approach to edge detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-698.

[16] Joachims T. Making large-scale SVM learning practical[M]//Sch lkopf B,Burges C,Smpla A.Advances in Kernel Methods—Support Vector Learning.Cambridge:MIT Press,1999.

猜你喜歡
特征詞喻體范疇
比喻讓描寫更形象
批評話語分析的論辯范疇研究
正合范疇中的復(fù)形、余撓對及粘合
Clean-正合和Clean-導(dǎo)出范疇
基于改進(jìn)TFIDF算法的郵件分類技術(shù)
產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
從喻體選擇對比哈薩克語和漢語比喻的民族差異
語言與翻譯(2015年3期)2015-07-18 11:11:05
喜馬拉雅
面向文本分類的特征詞選取方法研究與改進(jìn)
關(guān)于“方言特征詞”理論的回顧及思考
南充市| 阜城县| 含山县| 获嘉县| 蚌埠市| 淳安县| 从化市| 化隆| 潜江市| 新和县| 霍林郭勒市| 和平区| 额尔古纳市| 开阳县| 晴隆县| 西昌市| 浦县| 九龙县| 雷波县| 广东省| 东安县| 黄石市| 虞城县| 嵊泗县| 祁连县| 荥阳市| 怀来县| 汉川市| 和田县| 喜德县| 横峰县| 天峻县| 泗水县| 庆阳市| 玉环县| 都匀市| 油尖旺区| 五台县| 瓦房店市| 泰兴市| 临颍县|