詞項(xiàng)
- 奧卡姆和布列丹對指代劃分的比較
語言討論命題中的詞項(xiàng)與其所指對象的關(guān)系的理論。在中世紀(jì),許多邏輯學(xué)家提出指代理論并對指代做出詳盡的劃分,并且不同的學(xué)者有不同的觀點(diǎn)。威廉·奧卡姆和瓊·布列丹是中世紀(jì)重要的邏輯學(xué)家,“中世紀(jì)晚于奧卡姆的最著名的邏輯學(xué)家大概只有布列丹(1300-1358)一位”[1]。作為奧卡姆的追隨者,布列丹也是一名唯名論者。布列丹在許多邏輯學(xué)的研究領(lǐng)域都頗有建樹,諸如命題的真值條件理論、推論理論和悖論等,雖然布列丹對指代也有詳盡的論述,但是他的指代理論并沒有超越奧卡姆,兩
科學(xué)咨詢 2022年19期2022-11-24
- 基于語料庫的大學(xué)英語近義動詞語義韻研究
被發(fā)現(xiàn)的,英語中詞項(xiàng)的搭配行為顯示著一定的語義趨向,靠人的知覺難以察覺語義韻的存在[1]。語義韻是指一定的詞項(xiàng)會習(xí)慣性地吸引某一類具有相同語義特征的詞項(xiàng),這些搭配詞項(xiàng)在文本中高頻共現(xiàn),使整個語境中彌漫了某種語義氛圍[2]。語義韻分為積極語義韻或褒韻(favourable prosody)、消極語義韻或貶韻、中性語義韻或混合語義韻(mixed prosody)三類。各種語義氛圍均通過核心節(jié)點(diǎn)詞與周圍搭配詞項(xiàng)來體現(xiàn)[3]。語義韻的研究可以采用定位檢索軟件Ant
晉中學(xué)院學(xué)報(bào) 2022年4期2022-06-28
- 正式性的測量方法和描寫路徑*
性、實(shí)證的方法把詞項(xiàng)(lexical item)歸入各正式性層次(Rickford&McNair-Knox 1995:265),進(jìn)而指導(dǎo)語篇正式性的功能描寫成為一個難題(Heylighen&Dewaele 1999;Li et al.2016)。第一,如何用客觀數(shù)據(jù)和主觀直覺相平衡的方法(Halliday 2004:23-24;Sinclair 2004),把詞項(xiàng)歸入各正式性層次,進(jìn)而評測語篇正式度?從研究現(xiàn)狀看,直覺和數(shù)據(jù)兩種取向各自為政。前者多從研究者
外語研究 2022年2期2022-05-31
- 奧卡姆和柏力對簡單指代劃分的比較*
語言討論命題中的詞項(xiàng)與其所指對象的關(guān)系的理論。在中世紀(jì),許多邏輯學(xué)家提出指代理論并對指代做出詳盡的劃分。威廉·奧卡姆(William Ockham)和瓦爾特·柏力(Walter Burley)是中世紀(jì)同時代重要的邏輯學(xué)家,對簡單指代都做出了較為詳盡的論述。但是,他們對簡單指代的定義和劃分存在差異,通過比較可知,較之柏力,奧卡姆對簡單指代的劃分則更加明確,筆者將進(jìn)一步探究產(chǎn)生差異的原因。一、簡單指代的定義奧卡姆在《邏輯大全》中把簡單指代定義為:“當(dāng)一個詞項(xiàng)指
- 論指代的作用
《邏輯大全》上篇詞項(xiàng)理論部分對指代做出了詳盡的說明,提出著名的指代理論。指代理論是討論命題中的詞項(xiàng)與其所指對象間關(guān)系的理論,在這一理論中,中世紀(jì)的邏輯學(xué)家們說明了命題中的詞項(xiàng)以什么樣的規(guī)則標(biāo)準(zhǔn)代表其所指對象。我們在清楚地把握指代理論①的基礎(chǔ)上不禁要問:指代有什么作用?中世紀(jì)指代理論受到西方學(xué)者的廣泛關(guān)注,概括來講,西方學(xué)者主要從兩個方面來探討指代的作用。一方面,人們普遍認(rèn)為指代的作用是在命題中精確地使用概念、語詞,避免詭辯;另一方面,中世紀(jì)邏輯學(xué)家們提出指
信陽師范學(xué)院學(xué)報(bào)(哲學(xué)社會科學(xué)版) 2022年2期2022-03-03
- 一種基于多任務(wù)學(xué)習(xí)的方面級情感分析方法
ysis)和方面詞項(xiàng)情感分析ATSA(Aspect Term Sentiment Analysis)兩個子任務(wù)。對于ACSA,上述細(xì)粒度情感分析定義中的“評論對象”指的是方面類別詞;對于ATSA,其中的“評論對象”指的是方面詞項(xiàng)。ACSA任務(wù)例如:“The boiled fish is delicious, but the price is too expensive.”,boiled fish對應(yīng)的food類是積極的情感極性,而price對應(yīng)的price
計(jì)算機(jī)應(yīng)用與軟件 2022年2期2022-02-19
- 模態(tài)語境下的指稱曖昧問題及其解決
昧是指如下情形:詞項(xiàng)的指稱在普通語境下原本非常明確,但在模態(tài)語境下卻會變得游移不定,可能指稱這個對象,也可能指稱另一個對象,用蒯因的話說就是變得“曖昧”。指稱曖昧?xí)?dǎo)致在正常語境下為真的命題,在模態(tài)語境下卻為假,具體表現(xiàn)為兩種失效:單獨(dú)詞項(xiàng)同一替換原理失效和模態(tài)表達(dá)式量化存在概括原則失效。同一替換原理是指“給定一個關(guān)于同一性的真陳述,可以用它的兩個詞項(xiàng)中的一個替換另一個出現(xiàn)在任一真陳述中的詞項(xiàng),而其結(jié)果將是真的”[2]129,是支配同一性的基本原理之一。但
北京印刷學(xué)院學(xué)報(bào) 2021年7期2021-08-13
- 形式邏輯學(xué)中的概念與詞項(xiàng)辨析
式邏輯學(xué)中概念—詞項(xiàng)部分的理論存在諸多問題。概念與詞項(xiàng)的混用現(xiàn)象嚴(yán)重,內(nèi)涵與外延的說明有失偏頗,概念或詞項(xiàng)的語言學(xué)內(nèi)涵式分類顯得多余,定義的方法始終存在理論缺陷。而在形式邏輯當(dāng)中討論概念是否恰當(dāng)?對此,可以在確立詞項(xiàng)而非概念作為形式邏輯研究的基本對象的基礎(chǔ)上,肯定一切詞項(xiàng)的外延與其內(nèi)涵具有同等程度的“存在”,不主張對詞項(xiàng)從內(nèi)涵層面進(jìn)行分類,對定義方法的正當(dāng)性繼續(xù)存疑。這些問題本來不必成為形式邏輯的問題,事實(shí)卻是被當(dāng)作形式邏輯的問題進(jìn)行說明。[關(guān)鍵詞]概念;
大學(xué)教育 2021年2期2021-03-08
- 上古“問”類詞義 場特征及其歷時演變
問”類義場的主要詞項(xiàng):問、諮、詢、訊1、訊2、詰、訪、謀。文章對上古文獻(xiàn)中“問”類語義場各詞項(xiàng)進(jìn)行全方位的測查、歸納和整理,考察分析該義場各詞項(xiàng)的異同及其歷時演變并探討變化的原因。研究發(fā)現(xiàn),該語義場上古前期詞項(xiàng)豐富而后期詞項(xiàng)減少。詞義的變化不僅僅是其自身發(fā)展的結(jié)果,還常常是由于處于聚合關(guān)系或組合關(guān)系中受到其他詞語的變化影響所致。[關(guān)鍵詞]“問”類動詞;語義場;詞項(xiàng);組合關(guān)系;聚合關(guān)系[中圖分類號]H13?? [文獻(xiàn)標(biāo)志碼]A??? [文章編號]2095-0
- 上古“問”類詞義場特征及其歷時演變
還是對義場內(nèi)各個詞項(xiàng)的義位變化以至于義場演變的研究,尤其對常見詞項(xiàng)演變軌跡的追尋以及詞義引申規(guī)律的探求,我們都會用到語義特征分析法。根據(jù)語義特征的有無和組合來進(jìn)行義場歸納以及研究義場之間的聯(lián)系,也根據(jù)語義特征的差別來進(jìn)行義場內(nèi)部的比較,從而描寫岀“問”類動詞范疇的意義系統(tǒng),同時進(jìn)行縱向的演變規(guī)律的探討。當(dāng)然,對上古詞語的語義特征分析,我們要借助于訓(xùn)詁學(xué)的優(yōu)秀成果,“詞以類分,同類而聚集,這就是一種聚合,因而,在早期訓(xùn)詁材料的纂集里,就已經(jīng)存在著西方語義學(xué)所
- 隱喻理論在詞項(xiàng)習(xí)得中的應(yīng)用
以期將隱喻理論在詞項(xiàng)(lexical items)學(xué)習(xí)中得到應(yīng)用,并進(jìn)一步應(yīng)用于外語的教學(xué)過程?!娟P(guān)鍵詞】隱喻;認(rèn)知隱喻;詞項(xiàng);外語教學(xué)在學(xué)習(xí)一門外語的過程中,學(xué)習(xí)者將遇到并且必須克服記憶單詞和表達(dá)這一障礙。詞項(xiàng)的缺乏或詞匯量的不足制約了學(xué)習(xí)者語言能力的提高,另一方面,對詞匯認(rèn)知上的分歧和差異往往會導(dǎo)致母語者和外語學(xué)習(xí)者之間語言的使用會有間隙。而學(xué)習(xí)隱喻可能有助于克服或者至少緩解這些困難。隱喻這一概念不僅是一種修辭手段/修辭格,其在本質(zhì)上與形態(tài)學(xué)、語義學(xué)和
- Sinclair語料庫語言學(xué)視閾下的語言教學(xué)難題及解決途徑
280)主張“對詞項(xiàng)的描述最好采用最大途徑,而不是最小途徑”。上面提到的詞項(xiàng)(lexical items),是貫穿于Sinclair意義單位研究的一個核心概念,他在最早的一篇詞匯研究的文章中就提到了詞項(xiàng)(Sinclair 1966)。寬泛地講,一個詞項(xiàng)就是一個意義單位,由一個以上的單詞共同構(gòu)成。確切地講,詞項(xiàng)是指一種向心式結(jié)構(gòu)(endocentric structure),包含了兩個或多個鄰近型符,它們彼此在意義上關(guān)聯(lián),并由一個單一的核聚在一起,共同構(gòu)成一
語料庫語言學(xué) 2020年2期2020-02-22
- 基于語料庫的英漢近義詞語義韻對比研究
——以ANNOUNCE,DECLARE和宣布為例
究者所研究的某個詞項(xiàng))總是習(xí)慣性地與某類具有相同或相似語義特征的詞項(xiàng)共現(xiàn),構(gòu)成顯著搭配。受搭配詞的影響,節(jié)點(diǎn)詞被‘傳染’上了有關(guān)的語義特征,在語境內(nèi)形成一種語義氛圍”[2]。在詞匯學(xué)習(xí)過程中,由于近義詞在語義上的相似性,總是被等同化,出現(xiàn)近義詞替代現(xiàn)象。事實(shí)上,近義詞僅是在語義上相近,它們在搭配和語義韻方面均存在差別。鑒于此,本研究選取了ANNOUNCE,DECLARE和宣布這三個常見近義詞,利用語料庫及相關(guān)工具,對三者的搭配和語義韻進(jìn)行分析,比較異同。這
巢湖學(xué)院學(xué)報(bào) 2019年5期2019-12-10
- 大數(shù)據(jù)背景下文檔關(guān)鍵詞抽取方法的探討
的文檔集。(2)詞項(xiàng)(詞組)集為了對N個文檔賦予關(guān)鍵詞,對所有文檔逐一地進(jìn)行分詞。分詞是按照一定的規(guī)范重新組合成詞項(xiàng)的過程。中文分詞是文本挖掘基礎(chǔ)。對于輸入一段中文,成功的中文分詞,可以達(dá)到電腦可以自動識別語句含義的效果。對所有N的個文檔進(jìn)行分詞后,我們獲取了“詞項(xiàng)(詞組)”集合。在這個詞項(xiàng)(詞組)集合中的每一個詞項(xiàng)(詞組)可能成為某一文檔的關(guān)鍵詞。當(dāng)然,并不是在詞項(xiàng)(詞組)集合中的詞都能稱為關(guān)鍵詞。一個詞項(xiàng)(詞組)能不能成為關(guān)鍵詞,就要看這個詞項(xiàng)(詞組)
新教育論壇 2019年34期2019-09-10
- 亞里士多德的顯示法的擴(kuò)展應(yīng)用
I(2)選取顯示詞項(xiàng)N,從S中選出N,N滿足所有N是P,所有N是R(3)所以有SAP→NAP,SAR→NAR(4)通過換位法NAR→RIN2.2 運(yùn)用顯示法證明第三格OAO(2)選取顯示詞項(xiàng)N,從S中選出N,使N滿足所有N不是P。(3)所以有SOP→NEP,SAR→NAR(4)通過換位法NAR→RIN圖4 SEP關(guān)系圖圖5 POS關(guān)系圖第一個證明的意義不大,只是運(yùn)用了顯示法,但核心的思路還是與亞里士多德書中給出的化歸法證明方式相同。第二個證明凸顯出了顯示法
海外文摘·藝術(shù) 2019年3期2019-05-15
- 關(guān)于信息檢索方法的探討
索過程。1.1 詞項(xiàng)——文檔關(guān)聯(lián)矩陣給出搜索詞及多個文檔,以傳統(tǒng)思想進(jìn)行思考,要得到索引文件,最直接的方即為枚舉法,對每個文檔進(jìn)行遍歷只對文檔中是否存在某一詞項(xiàng)進(jìn)行判斷,建立矩陣,以詞項(xiàng)為行,以文檔為列,記錄結(jié)果。若存在記為“1”,不存在記為“0”。但詞項(xiàng)——文檔矩陣的不足之處也是顯而易見的,當(dāng)遍歷文檔集規(guī)模過于龐大時,建立的矩陣可能已經(jīng)超過所能承載的極限,這種方式顯然已經(jīng)不合適再進(jìn)行下一步的檢索。1.2 倒排索引那么當(dāng)解決大容量文檔集時,需要用到的是倒排
數(shù)碼世界 2019年4期2019-05-10
- 論編輯如何提高邏輯素養(yǎng)
原因很多,既有對詞項(xiàng)概念、詞項(xiàng)種類認(rèn)識不透徹, 也有內(nèi)容違背邏輯規(guī)律、推理違反邏輯規(guī)則等。編輯應(yīng)具備一定的邏輯素養(yǎng),在邏輯意識和邏輯思維中編輯, 以有效避免邏輯性差錯的存在。提高邏輯素養(yǎng)的前提是夯實(shí)邏輯知識,在此基礎(chǔ)上,于長期的編輯工作中逐步錘煉邏輯能力,使理論與實(shí)踐相互滋養(yǎng)。【關(guān) 鍵 詞】傳媒中差錯;編輯工作;邏輯因素;邏輯意識;邏輯思維【作者單位】吳鍵,《南海法學(xué)》雜志?!局袌D分類號】G232 【文獻(xiàn)標(biāo)識碼】A 【DOI】10.16491/j.cnki
出版廣角 2018年20期2018-11-16
- 融合詞語共現(xiàn)距離和類別信息的短文本特征提取方法*
度稀疏的特點(diǎn)。從詞項(xiàng)共現(xiàn)角度來看,兩個詞項(xiàng)的關(guān)聯(lián)性可從詞項(xiàng)共現(xiàn)的角度體現(xiàn),且短文本所包含的詞語稀少,兩詞項(xiàng)之間相隔詞項(xiàng)的距離對語義信息的計(jì)算也造成了一定的影響;從類別信息的角度來看,特征詞在類間的分布以及在類內(nèi)部文檔中的分布情況可以考慮進(jìn)來進(jìn)行綜合加權(quán)。一方面,若特征詞在各個類間分布比較均勻,這樣的詞對分類基本沒有貢獻(xiàn),若特征詞比較集中地分布在某個類中,而在其它類中幾乎不出現(xiàn),這樣的詞就能夠很好地代表這個類的特征。如何將這種詞語的類別信息挖掘出來是至關(guān)重要
計(jì)算機(jī)工程與科學(xué) 2018年9期2018-10-08
- 基于改進(jìn)相似度與類中心向量的半監(jiān)督短文本聚類算法*
習(xí),提出一種依據(jù)詞項(xiàng)類別區(qū)分能力的強(qiáng)弱,按類別抽取并構(gòu)建強(qiáng)類別區(qū)分度詞項(xiàng)集合的策略,并且將其應(yīng)用到短文本相似性度量方法中,使短文本之間相似性的度量更加有效和準(zhǔn)確。同時,提出利用短文本與類中心向量之間的相似程度來決定它們的類別,從而形成基于改進(jìn)相似度和類中心向量的半監(jiān)督短文本聚類算法ISaCV(Improved Similarity and Class-center Vector),來提高聚類性能,算法結(jié)構(gòu)如圖1所示。Figure 1 Algorithm s
計(jì)算機(jī)工程與科學(xué) 2018年9期2018-10-08
- “黃”字職用演變研究
聯(lián)系的引申或派生詞項(xiàng)?!包S”字在記錄形義密切相關(guān)的本用詞項(xiàng){黃病之人}的基礎(chǔ)上,記錄了如下兼用詞項(xiàng)。(一)記錄詞項(xiàng){黃2},表示“熱病、馬病”“黃”字的本義詞項(xiàng){黃1}(黃病之人)自然派生出表示“熱病”的詞項(xiàng)義。由人及馬,又可以表示“馬病”的詞項(xiàng)義,筆者將這兩種詞項(xiàng)義合并為一項(xiàng),記作詞項(xiàng){黃2}。(1) 我馬玄黃。(《詩經(jīng)·周南·卷耳》)(2) 豈能然艾灸頞,瓜蒂歕鼻,治黃不差,而臥死兒女手中乎!(《資治通鑒·隋煬帝大業(yè)八年》)(二)記錄詞項(xiàng){黃3},表示
安順學(xué)院學(xué)報(bào) 2018年3期2018-01-01
- 亨普爾對經(jīng)驗(yàn)主義意義標(biāo)準(zhǔn)的一種探析
——從邏輯的觀點(diǎn)看
6,從構(gòu)成語句的詞項(xiàng)、語句間的相互關(guān)系及語句系統(tǒng)(科學(xué)理論)3個維度對經(jīng)驗(yàn)主義意義標(biāo)準(zhǔn)重新進(jìn)行了考察,指出了經(jīng)驗(yàn)主義意義標(biāo)準(zhǔn)所面臨的一些困境。一、語詞經(jīng)驗(yàn)意義刻畫的狹隘性和局限性“邏輯實(shí)證主義者認(rèn)為理論名詞本身沒有意義,因?yàn)槔碚搶ο蠹兇馐怯杏玫奶摌?gòu),但是作為能夠使思維經(jīng)濟(jì)、方便的概念工具,它們可以從有關(guān)觀察名詞那里獲得部分意義?!盵3]71在經(jīng)驗(yàn)主義者當(dāng)中還存在一種用滿足某些特定條件的詞項(xiàng)來刻畫有意義語詞的做法,所謂的特定條件是指這些詞項(xiàng)的意義能夠通過觀察
- 應(yīng)用于問答系統(tǒng)的Lucene相似度檢索算法改進(jìn)
行擴(kuò)展,分析檢索詞項(xiàng)的語義相似度以及將詞項(xiàng)位置關(guān)系的特征應(yīng)用到Lucene中。在Lucene的基礎(chǔ)上,對其語義相似度算法進(jìn)行改進(jìn),提出了一種新的語義相似度評分算法。該算法考慮了詞項(xiàng)位置關(guān)系和語義理解,能夠更好地應(yīng)用于問答系統(tǒng)。實(shí)驗(yàn)結(jié)果表面,提出的相似度算法能有效地提高自動問答系統(tǒng)的回答準(zhǔn)確率。Lucene;相似度;問答系統(tǒng);語義0 引 言Lucene是用Java語言實(shí)現(xiàn)的開放源代碼的全文檢索引擎工具包,是Apache軟件基金會Jakarta項(xiàng)目組下的一個子
計(jì)算機(jī)技術(shù)與發(fā)展 2017年11期2017-11-20
- 先秦—唐詩歌中“向下看”概念場研究
向下看”概念場;詞項(xiàng)屬性分析在先秦—唐詩歌中,表“向下看”概念的詞項(xiàng)共19 個,即:臨、臨睨、覽、瞰、下視、下看、俯視、俯察、俯觀、俯看、俯覽、俯眺、俯臨、下見、下瞰、下望、俯望、俯見、俯瞰,它們具有共同的語義屬性,均指“施事把目光投向下方”,因此構(gòu)成了“向下看”概念場。為便于論述,下面從先秦兩漢、魏晉南北朝、隋唐三個時期分別闡述“向下看”概念場的發(fā)展演變。一、先秦兩漢時期先秦兩漢時期的詩歌,我們主要以《詩經(jīng)》《楚辭》和逯欽立輯校的《先秦漢魏晉南北朝詩》①
賀州學(xué)院學(xué)報(bào) 2017年3期2017-11-07
- 融合詞向量的多特征問句相似度計(jì)算方法研究
詞向量距離,結(jié)合詞項(xiàng)權(quán)重、句子長度等因素的問句相似度計(jì)算方法。該方法綜合考察兩個句子的語義信息,句法信息,詞的表層信息來測量問句的相似度。實(shí)驗(yàn)部分設(shè)計(jì)四種問句相似度計(jì)算方法,結(jié)果表明該方法提高相似度計(jì)算的準(zhǔn)確率。詞向量;依存關(guān)系;問句相似度;詞項(xiàng)權(quán)重0 引言常見的句子相似度算法有基于關(guān)鍵詞表層信息、基于句法信息以及基于語義信息等的計(jì)算模型[1-2]?;陉P(guān)鍵詞表層信息的方法,考慮了詞形、句長、詞序等信息,但該方法沒有考慮語義、句法信息。同時在關(guān)鍵詞抽取過程
現(xiàn)代計(jì)算機(jī) 2017年17期2017-08-10
- 利用主題內(nèi)容排序的偽相關(guān)反饋*
增加與其語義相近詞項(xiàng)的方式,將用戶初始查詢中未充分表達(dá)的內(nèi)容展示出來。QE按照是否考慮初檢結(jié)果文檔集,分為全局和局部兩種技術(shù)。在局部QE技術(shù)中,按照是否考慮初檢結(jié)果文檔集中與用戶查詢真正相關(guān)的文檔,又可以分為相關(guān)反饋(relevance feedback,RF)和偽相關(guān)反饋(pseudo relevance feedback,PRF)兩種方法。RF方法利用與用戶查詢真相關(guān)文檔對用戶查詢進(jìn)行重構(gòu)。然而,這種方法要求用戶將初檢結(jié)果標(biāo)注為相關(guān)或不相關(guān),這在用戶的
計(jì)算機(jī)與生活 2017年5期2017-06-05
- 形式邏輯教學(xué)中需要深究并辨識的幾對概念
??梢詮倪x擇集合詞項(xiàng)與非集合詞項(xiàng)、反對關(guān)系與矛盾關(guān)系、相容選言命題與不相容選言命題、推理的有效性與真實(shí)性等四對非常重要又容易混同的概念加以辨析和探討,以供形式邏輯課程主講教師教學(xué)時參考。[關(guān)鍵詞]形式邏輯;詞項(xiàng);命題;推理[中圖分類號] B812 [文獻(xiàn)標(biāo)識碼] A [文章編號] 2095-3437(2017)05-0120-03概念是最基本的思維形態(tài),是構(gòu)成命題和推理的基本單元。在形式邏輯教學(xué)中講概念、講命題,最終是為了講推理,以增強(qiáng)學(xué)生的推理能力——邏
大學(xué)教育 2017年5期2017-05-10
- 一種改進(jìn)的向量空間模型的文本表示算法
df算法僅考慮了詞項(xiàng)特征與文檔之間的關(guān)系,沒有考慮與類別關(guān)聯(lián)性的問題,引入數(shù)理統(tǒng)計(jì)卡方分布方法,以此改進(jìn)了tf-idf算法,構(gòu)成為新算法tf-idf-cθ。該算法將詞項(xiàng)的卡方分布值c作為文本表示的一個因子,用該c值來衡量詞項(xiàng)在文本類中分布的差異,并且引入詞性因子θ,得到改進(jìn)向量空間模型的表示文本。對改進(jìn)前后的2個算法進(jìn)行文本分類實(shí)驗(yàn),結(jié)果表明:改進(jìn)后的算法得到了提升,部分解決了詞項(xiàng)特征與類別的關(guān)聯(lián)性。文本表示;向量空間模型;卡方分布;tf-idf近年來互聯(lián)
- 詞項(xiàng)之間的關(guān)系在公務(wù)員考試中的運(yùn)用
學(xué)效果。關(guān)鍵詞:詞項(xiàng);關(guān)系;邏輯普通邏輯學(xué)中詞項(xiàng)間關(guān)系只有全同關(guān)系、真包含關(guān)系、真包含于關(guān)系,交叉關(guān)系和全異關(guān)系五種。公務(wù)員考試中類比推理詞項(xiàng)間關(guān)系可以涵括為詞項(xiàng)間的概念關(guān)系、詞義關(guān)系、相關(guān)類關(guān)系、邏輯類關(guān)系和語法類關(guān)系及常識類關(guān)系。詞項(xiàng)間關(guān)系在在公務(wù)員考試中的運(yùn)用主要以類比推理的形式出現(xiàn),它是根據(jù)兩個或兩類對象有部分屬性相同或相似,從而推出它們的其他屬性也相同的或相似的推理。類比推理是國家公務(wù)員錄用考試的必考題型之一,在“行測”中,題型有三種:二項(xiàng)式、三
東方教育 2016年15期2017-01-16
- 基于偽反饋的有效XML查詢擴(kuò)展*
中挑選有用的擴(kuò)展詞項(xiàng),是解決偽反饋中查詢主題漂移的兩個重要方面。對此,針對XML(extensible markup language)文檔,提出了一個解決框架:一方面,研究了XML偽反饋文檔查找方法,在充分考慮XML內(nèi)容和結(jié)構(gòu)特征的前提下,提出了基于檢索結(jié)果聚類和兩階段排序模型相結(jié)合的高質(zhì)量XML偽相關(guān)文檔查找技術(shù);另一方面,針對CO(content only)查詢,對詞項(xiàng)擴(kuò)展進(jìn)行了研究,提出了帶結(jié)構(gòu)語義的詞項(xiàng)權(quán)值計(jì)算方法。一系列的相關(guān)實(shí)驗(yàn)數(shù)據(jù)表明,所提
計(jì)算機(jī)與生活 2016年12期2016-12-19
- 基于詞項(xiàng)關(guān)聯(lián)關(guān)系的FCM微博聚類算法
6133)?基于詞項(xiàng)關(guān)聯(lián)關(guān)系的FCM微博聚類算法程玉勝,黎康,王一賓,任勇(安慶師范大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 安慶 246133)針對微博內(nèi)容的稀疏、高維等特征,提出了一種基于詞項(xiàng)關(guān)聯(lián)關(guān)系的模糊C均值聚類算法。該算法通過挖掘詞項(xiàng)間語義的關(guān)聯(lián)程度,將文本特征最大化,并用提前標(biāo)注部分同類文本的方式來指導(dǎo)模糊C均值算法在初始聚類中心上的選擇,從而達(dá)到優(yōu)化效果。實(shí)驗(yàn)結(jié)果表明,該算法一定程度上克服了微博本身存在的數(shù)據(jù)稀疏性問題,能高效地進(jìn)行微博聚類。微博;詞項(xiàng)關(guān)
- “干”字的職用演變* 1
在漢語史上記錄的詞項(xiàng)數(shù)量較多,其涉及的字詞、義值等關(guān)系復(fù)雜多變。運(yùn)用李運(yùn)富先生的字用學(xué)理論,從歷時性的角度全面考察“干”字記錄的19個詞項(xiàng),分析其本用、兼用、借用的使用職能;通過探討其職能的擴(kuò)展和減縮,發(fā)現(xiàn)“干”字在先秦時期共出現(xiàn)18個詞項(xiàng),并為后世沿用,只在宋代新增1個詞項(xiàng),表示“關(guān)聯(lián)”義?!案伞弊值氖褂寐毮馨l(fā)展緩慢,具有很強(qiáng)的穩(wěn)固性,在現(xiàn)代漢語中才出現(xiàn)了大幅減縮和轉(zhuǎn)移的現(xiàn)象。關(guān)鍵詞:字用學(xué);“干”字;詞項(xiàng);職能李運(yùn)富先生強(qiáng)調(diào)應(yīng)立足“三個平面”,建立漢字
楚雄師范學(xué)院學(xué)報(bào) 2016年1期2016-05-10
- 基于詞重要性的信息檢索圖模型
建模中,確定索引詞項(xiàng)在文檔中的重要性是一項(xiàng)重要內(nèi)容。以詞袋(bag-of-word)的形式表示文檔來建立檢索模型的方法中大多是基于詞項(xiàng)獨(dú)立性假設(shè),用TF和IDF的函數(shù)來計(jì)算詞項(xiàng)的重要性,并未考慮詞項(xiàng)之間的關(guān)系。該文采用基于詞項(xiàng)圖(graph-of-word)的文檔表示形式來捕獲詞項(xiàng)間的依賴關(guān)系,提出了一種新的基于詞重要性的信息檢索圖模型TI-IDF。根據(jù)詞項(xiàng)圖得到文檔中詞項(xiàng)的共現(xiàn)矩陣和詞項(xiàng)間的概率轉(zhuǎn)移矩陣,通過馬爾科夫鏈計(jì)算方法來確定詞項(xiàng)在文檔中的重要性(
中文信息學(xué)報(bào) 2016年4期2016-05-03
- 語料庫驅(qū)動下的外語詞匯教學(xué)
詞:語料庫驅(qū)動;詞項(xiàng);建構(gòu)主義摘要:語料庫語言學(xué)的研究成果更新了人們對語言本質(zhì)和語言教學(xué)的觀念。語料庫語言學(xué)對語言運(yùn)用的重視為語言描寫帶來了概率分布的視角,從而揭示了語言的概率性特點(diǎn);語言的習(xí)語原則以及詞項(xiàng)中心語言觀推動了對意義單位的認(rèn)識,并且消除了語言中詞匯—語法的二分對立;語料庫驅(qū)動方法推崇的“探索/描述”法也符合現(xiàn)代教育理論認(rèn)為的教學(xué)的建構(gòu)主義觀點(diǎn)?;诖?,語料庫驅(qū)動下的外語詞匯教學(xué)體現(xiàn)在教學(xué)設(shè)計(jì)和教學(xué)實(shí)施兩方面。在教學(xué)設(shè)計(jì)上,語料庫可以輔助外語詞匯
- 文獻(xiàn)知識網(wǎng)絡(luò)的節(jié)點(diǎn)度變化對領(lǐng)域熱點(diǎn)的影響
擇m個詞作為種子詞項(xiàng)集A,其中A取訓(xùn)練網(wǎng)絡(luò)與測試網(wǎng)絡(luò)中共同擁有的詞項(xiàng),即A∈N1∩N2。在訓(xùn)練網(wǎng)絡(luò)G1中,以種子集A中的節(jié)點(diǎn)為起點(diǎn)提取其間接節(jié)點(diǎn),得到間接節(jié)點(diǎn)集C,計(jì)算所有關(guān)系鏈(A-Btrain-C)的一個分值SAC,對結(jié)果集C按SAC值從大到小排序,取有序結(jié)果集CSorted中前L個詞項(xiàng),得到CSorted_TopL={c1,c2,…cL}。在測試網(wǎng)絡(luò)G2中,以種子節(jié)點(diǎn)集A中的節(jié)點(diǎn)為起點(diǎn)提取其直接關(guān)聯(lián)節(jié)點(diǎn),得到關(guān)聯(lián)節(jié)點(diǎn)集Btest。計(jì)算有序結(jié)果集CSo
中華醫(yī)學(xué)圖書情報(bào)雜志 2016年11期2016-03-25
- 奧康語言哲學(xué)思想解析*
亞里士多德的古典詞項(xiàng)邏輯與斯多亞學(xué)派的命題學(xué)說完整地帶入中世紀(jì)。在中世紀(jì)后期,古代邏輯理論的相關(guān)應(yīng)用發(fā)展到了登峰造極的程度。這種知識工具成為了奧康語言哲學(xué)思想發(fā)展不可或缺的組成部分。其三,中世紀(jì)晚期的思想交鋒。奧康時代托馬斯的理性主義承認(rèn)哲學(xué)家可以按照自然賦予的理性探索真理,為哲學(xué)的解放開辟了道路,深遠(yuǎn)地影響著中世紀(jì)后期經(jīng)院學(xué)者對真理的認(rèn)識和判斷。與奧康同時期的司各脫意志主義強(qiáng)調(diào)意志高于理智,但卻是在理智所能夠提供的范圍自由活動,司各脫的歸納科學(xué)知識成為了
- 基于詞項(xiàng)語義映射的短文本相似度算法
方法主要包括基于詞項(xiàng)比較的方法和基于HowNet語義詞典的方法[7]。因?yàn)槲谋镜奶卣髦饕峭ㄟ^詞項(xiàng)來反映,因此采用詞項(xiàng)比較來量化文本之間相似度是一種常用的方法,諸如提取文本之間共有詞項(xiàng)的比例[8]、比較文本之間詞項(xiàng)間的逆序關(guān)系[9]、統(tǒng)計(jì)詞項(xiàng)詞頻填充文本向量度量余弦相似度[10]。這種詞項(xiàng)比較方法相對適用于長文本,長文本的信息量能夠通過規(guī)模較大的詞項(xiàng)數(shù)量得到較為全面的反映。對短文本而言,通過數(shù)量稀疏的詞項(xiàng)難以全面地體現(xiàn)短文本的含義,因此衍生出基于HowNe
計(jì)算機(jī)工程與設(shè)計(jì) 2015年6期2015-12-23
- 一種基于公共詞塊的英文短文本相似度算法
詞塊信息,在基于詞項(xiàng)重合的關(guān)鍵詞重疊相似度算法基礎(chǔ)上,集合公共詞塊在文本中出現(xiàn)的次序,提出一種利用公共詞塊作為計(jì)算單元的短文本相似度的算法——公共詞塊相似度算法(common chunks similarity algorithm,CCS)。該算法主要是將兩個文本中所有連續(xù)出現(xiàn)的相同關(guān)鍵詞看做一個詞塊單元,利用所有公共詞塊中的關(guān)鍵詞計(jì)算重疊相似度,并考慮這些公共詞塊在兩個文本中的出現(xiàn)次序?qū)Χ涛谋鞠嗨贫鹊挠绊懀黾訖?quán)處理,以提高文本相似度計(jì)算的算法性能。1
- 基于詞項(xiàng)共現(xiàn)關(guān)系圖模型的中文觀點(diǎn)句識別研究
篇文檔表示成一個詞項(xiàng)向量或特征向量。這種文檔特征向量的表示方法基于詞項(xiàng)間強(qiáng)獨(dú)立性假設(shè),并未考慮詞項(xiàng)與詞項(xiàng)之間的順序和依賴關(guān)系。在英文觀點(diǎn)句識別中,采用基于VSM的有監(jiān)督機(jī)器學(xué)習(xí)的分類方法可以取得不錯的識別性能。然而,由于中文微博、論壇、貼吧等評論信息都是口語化的文本,表達(dá)方式多樣,而且評論的長度一般有限,這些缺點(diǎn)導(dǎo)致手工構(gòu)建語法庫不僅工作量大,而且與日??谡Z的表達(dá)方式仍然存在差異,采用基于SVM的有監(jiān)督機(jī)器學(xué)習(xí)方法進(jìn)行中文觀點(diǎn)句識別并不能取得較好的性能?;?/div>
中文信息學(xué)報(bào) 2015年6期2015-04-12
- 一種新的微博短文本特征詞選擇算法*
合匹配規(guī)則,根據(jù)詞項(xiàng)的TF-IDF、詞性與詞長因子構(gòu)造綜合評估函數(shù),結(jié)合詞項(xiàng)與文本內(nèi)容的語義相關(guān)度,對微博短文本進(jìn)行特征詞選擇,以使挑選出來的特征詞能準(zhǔn)確表示微博短文本內(nèi)容主題。將新的特征詞選擇算法與樸素貝葉斯分類算法相結(jié)合,對微博分類語料集進(jìn)行實(shí)驗(yàn),結(jié)果表明,相比其它的傳統(tǒng)算法,新算法使得微博短文本分類準(zhǔn)確率更高,表明該算法選取出來的特征詞能夠更準(zhǔn)確地表示微博短文本內(nèi)容主題。微博短文本;特征詞選擇;統(tǒng)計(jì)與語義信息;詞性組合;樸素貝葉斯分類算法1 引言隨著計(jì)算機(jī)工程與科學(xué) 2015年9期2015-01-09
- 當(dāng)代漢語類推詞使用情況研究
有較高的知曉率。詞項(xiàng)“X 奴”、“X族”、“X 門”、“X秀”、“低碳X”的知曉率100%;“X霸”、“X 哥”、“X二代”、“山寨X”、“X 團(tuán)”、“X 套餐”等詞的知曉率也很高,均達(dá)到了 92.5%;“曬 X”、“X 貼士”、“裸X”等詞的知曉率是80%;“X客”、“X 帝”、“X 控”、“雷X”、“X黨”等詞的知曉率是70%;知曉率最低的詞項(xiàng)是“她X”,僅有50%。訪談得知,教師對“房奴”、“上班族”、“艷照門”、“服裝秀”、“低碳生活”這些詞語非常- 數(shù)據(jù)源敏感的多源XML 數(shù)據(jù)相似度量方法*
發(fā)現(xiàn)文本中的相似詞項(xiàng).文獻(xiàn)[8]最早提出了利用編輯距離來度量兩棵樹的相似度.文獻(xiàn)[9]提出,兩個XML 文檔的距離可以通過計(jì)算它們的索引樹來測定.文獻(xiàn)[10]基于文檔的分類提出對詞項(xiàng)權(quán)重進(jìn)行修正.文獻(xiàn)[11]在預(yù)處理的基礎(chǔ)上,通過建立屬性對象表,提出了Max-merge 算法對XML 重復(fù)對象進(jìn)行檢測.文獻(xiàn)[12]用樹編輯距離的上下限優(yōu)化基于樹編輯距離的相似檢測算法,降低了相似檢測計(jì)算的復(fù)雜度,提高了運(yùn)算效率.文獻(xiàn)[13]提出了一種遞歸相似度計(jì)算方法計(jì)算X- 語詞運(yùn)用中的邏輯問題
又都是表達(dá)概念的詞項(xiàng),因此,必須明確邏輯概念含義,這是明確語詞含義并準(zhǔn)確恰當(dāng)?shù)剡\(yùn)用語詞的先決條件與基本條件。有時,人們沒有真正明確某詞項(xiàng)含義,就大膽地運(yùn)用起某詞項(xiàng)來,結(jié)果犯了用詞不當(dāng)?shù)腻e誤。例如:(1)我們應(yīng)當(dāng)感謝老師對大家無所不至的關(guān)懷。(2)在這次烹飪訓(xùn)練班的學(xué)習(xí)過程中,大大提高我的烤制各種花色面包的技術(shù)。例(1)錯誤地將“無所不至”理解為“無微不至”的意思(實(shí)質(zhì)上是沒有真正明確語詞的含義),因而犯了用詞不當(dāng)?shù)腻e誤。例(2)沒有真正明確“烹飪”這個語詞語文學(xué)刊 2014年4期2014-03-13
- 基于詞項(xiàng)—句子—文檔三層圖模型的多文檔自動摘要
口大小的方法得到詞項(xiàng)間的共現(xiàn)關(guān)系,若兩個詞項(xiàng)同時出現(xiàn)在窗口內(nèi),則可以看作這兩詞項(xiàng)之間有邊相連,構(gòu)建詞項(xiàng)的無向無權(quán)圖,然后采用類似PageRank算法的隨機(jī)游走方法根據(jù)詞項(xiàng)頂點(diǎn)的入度和出度計(jì)算詞項(xiàng)在文檔中的權(quán)重[13-14]。Rousseau等也是通過同樣的方法得到詞項(xiàng)的共現(xiàn)關(guān)系,同時還根據(jù)詞項(xiàng)出現(xiàn)的位置關(guān)系得到詞項(xiàng)間的順序關(guān)系,從而構(gòu)造出關(guān)于文檔詞項(xiàng)的有向無權(quán)圖,不同于Blanco等確定邊的權(quán)重方法,這里的邊的權(quán)重僅僅由該詞項(xiàng)節(jié)點(diǎn)的入度數(shù)來確定[15]。雖中文信息學(xué)報(bào) 2014年6期2014-02-28
- 一種基于類別先驗(yàn)信息的問題檢索語言模型
ly)進(jìn)行一種在詞項(xiàng)層次上(at the word level)的簡單的線性插值。語言模型建模的方法因其在信息檢索中具有非常不錯的檢索性能,已經(jīng)成為一個非常具有吸引力的研究方向。因此,在本文中我們將嘗試將類別信息融入到一元語言模型的建模過程中。我們的基本出發(fā)點(diǎn)是這樣的: 同一個詞項(xiàng)w在不同的類別中應(yīng)該具有不同的詞項(xiàng)權(quán)重。即,一個歷史問題Q中的一個詞項(xiàng)w在其所屬的類別Cat(Q)中應(yīng)該與該詞項(xiàng)在其他類別Cat′(Q)中具有不同的詞項(xiàng)權(quán)重。例如,詞項(xiàng)“Chin中文信息學(xué)報(bào) 2014年4期2014-02-28
- 搜索引擎用戶查詢的廣告點(diǎn)擊意圖分析
[7]發(fā)現(xiàn)不同的詞項(xiàng)(term)在引發(fā)廣告點(diǎn)擊的可能性上具有特定的差別.例如“數(shù)碼相機(jī)”和“人腦結(jié)構(gòu)”的廣告意圖是不同的,前者引發(fā)廣告點(diǎn)擊的可能性高于后者.因此,在論文中提出通過詞項(xiàng)的點(diǎn)擊率來反映這種固有的差別.A.Ashkan等[7]意識到更好地理解用戶查詢的意圖有助于提供個性化的搜索結(jié)果并且提高用戶滿意度,他們利用歷史點(diǎn)擊信息、查詢自身的特征以及搜索結(jié)果頁的內(nèi)容分析預(yù)測用戶查詢的商業(yè)意圖,研究表明將這3 組特征結(jié)合起來可以有效檢測出用戶的查詢意圖.在國哈爾濱工業(yè)大學(xué)學(xué)報(bào) 2013年1期2013-09-16
- 上古“欺騙”類動詞的演變規(guī)律
國初期、晚期均有詞項(xiàng)進(jìn)入該義場;有的詞項(xiàng)退出,如戰(zhàn)國晚期“諼”便退出該義場。但該義場的中堅(jiān)力量——“欺”和“詐”,一直比較穩(wěn)定,致使整個義場在上古都處于穩(wěn)步發(fā)展的狀態(tài)。另外,我們還可以看出,戰(zhàn)國晚期是義場內(nèi)詞項(xiàng)比較豐富、發(fā)展比較穩(wěn)定的一個時期。戰(zhàn)國中期之前均有不同詞項(xiàng)進(jìn)入義場,而這一時期各個詞項(xiàng)在自己特定的位置上體現(xiàn)自己特有的價值,顯得井然有序,有條不紊。之所以在戰(zhàn)國晚期各詞項(xiàng)得到豐富發(fā)展,可能是由于戰(zhàn)國晚期,社會比較動蕩,各種思想劇烈撞擊,因此人們也就需中國校外教育 2013年21期2013-08-15
- 網(wǎng)絡(luò)交際中語氣語調(diào)運(yùn)用的性別差異考察
工智檢索通對某些詞項(xiàng)進(jìn)行篩選,窮盡搜索出共61個表示語氣語調(diào)的詞項(xiàng)。去除“嘩嘩”“唰”“呼呼”(其中的2個)等在聊天過程中用以描述別的事物的擬聲詞,同時對一些詞項(xiàng)進(jìn)行適當(dāng)?shù)臍w并,如將“嗬嗬”合并到“呵呵”(“嗬嗬”共出現(xiàn)1次,眾所周知,其意思和“呵呵”一樣),合并“嗚嗚”和“嗚”“嗯”和“恩”“嘿嘿”和“嘿”等相同字節(jié)不同音節(jié)數(shù)的語氣詞或者感嘆詞,將“啊呀”“哎呀”“唉呀”“哎唷”并為一個統(tǒng)計(jì)詞項(xiàng)“啊呀”。在分析過程中,我們把所觀察的具有語氣語調(diào)表達(dá)功能的- 詞項(xiàng)語法評析
50028)引言詞項(xiàng)語法(Word Grammar)于20世紀(jì)80年代由英國語言學(xué)家理查德·哈德森(Richard A.Hudson)創(chuàng)立。國內(nèi)首位研究該語法的學(xué)者楊炳鈞(2001)將Word Grammar 譯為“詞項(xiàng)語法”,本文沿用這一中文譯名。詞項(xiàng)語法涉及句法學(xué)、語義學(xué)、形態(tài)學(xué)、認(rèn)知語言學(xué)、神經(jīng)語言學(xué)、社會語言學(xué)、歷史語言學(xué)以及言語加工等多個學(xué)科和研究領(lǐng)域。其理論目標(biāo)是通過整合語言各方面建立有關(guān)語言結(jié)構(gòu)的普遍理論,理論假設(shè)是可以像對其他知識和行為進(jìn)行黑龍江教育學(xué)院學(xué)報(bào) 2013年3期2013-05-12
- 漢語級差詞項(xiàng)“一些”的語義-語用解讀*
,不存在所謂單個詞項(xiàng)的默認(rèn)意義(Sperber&Wilson 1986/1995,Carston 1998);默認(rèn)論的觀點(diǎn)認(rèn)為級差含義的產(chǎn)生與語言結(jié)構(gòu)密切相關(guān)且不依賴語境(Levinson 2000,Chierchia 2004),同經(jīng)典格賴斯理論劃分的意義相比更偏向于語義范疇(Geurts&Pouscoulous 2009)。實(shí)際上這兩種不同理論都是對語義和語用之間關(guān)系的不同解釋,但它們大都基于語言學(xué)家的內(nèi)省式分析而難以得到足夠的具有實(shí)證性質(zhì)的客觀支持。外語學(xué)刊 2012年6期2012-09-05
- 基于向量空間模型附加詞義特征的句子相似度研究
關(guān)鍵詞權(quán)重表示的詞項(xiàng)向量,最后通過計(jì)算兩個句子向量的夾角余弦,得到句子相似度。傳統(tǒng)的向量空間模型沒考慮到詞語的語義,沒考慮到詞語之間的相似度。論文在向量空間模型的基礎(chǔ)上增加了詞義特征,通過在傳統(tǒng)的向量空間模型中引入詞語之間的相似度,從而使計(jì)算出的兩個句子的相似度分?jǐn)?shù)更加準(zhǔn)確。1 向量空間模型在向量空間模型中,把每個句子都表示為一個 n維詞項(xiàng)向量的形式,然后在計(jì)算兩個句子的相似度時,將其轉(zhuǎn)換成向量空間中的向量夾角計(jì)算問題。使用向量空間模型計(jì)算句子相似度的時候成都信息工程大學(xué)學(xué)報(bào) 2012年3期2012-01-05
- 杜威邏輯體系中的命題理論
對于命題的構(gòu)成即詞項(xiàng)進(jìn)行了多方面的闡述。杜威的命題理論為理解邏輯的起源、基礎(chǔ)和應(yīng)用提供了一條值得參考的研究路徑。杜威;命題;邏輯杜威對命題的討論中涉及大量關(guān)于傳統(tǒng)邏輯理論、形而上學(xué)和語言哲學(xué)方面的闡述,尤其在對命題分類和組成部分即詞項(xiàng)的討論上提出了與傳統(tǒng)邏輯學(xué)和現(xiàn)代邏輯學(xué)都不太相同的見解。本文擬闡明杜威的邏輯思路,對比現(xiàn)代邏輯學(xué)的基本觀點(diǎn),以便更清楚地理解杜威的立場。一、命題的分類在杜威的邏輯體系中,命題和判斷都是基于它們在探究活動中的地位和作用來分析的,- 英語詞項(xiàng)搭配范圍及可預(yù)見度
鄭立信?英語詞項(xiàng)搭配范圍及可預(yù)見度鄭立信(上海海事大學(xué)外國語學(xué)院,上海 200135)搭配范圍受到詞項(xiàng)的語義特征、語義范圍、搭配限制、適合性等諸多因素制約;搭配可預(yù)見度則受到開放選擇原則、成語原則、固化過程、語義韻等諸多因素制約。詞項(xiàng)的搭配可預(yù)見度在很大程度上取決于詞項(xiàng)的搭配范圍,兩者之間的關(guān)聯(lián)需從多種角度分析考量。搭配范圍;搭配可預(yù)見度;語義范圍;固化過程;語義韻筆者在與朱永生、苗興偉合著的《英漢語篇銜接手段對比研究》一書第10章中討論了英漢兩種語言中詞- 依據(jù)語篇中多層次信息的句法分析方法
析依據(jù)主要是句內(nèi)詞項(xiàng)間的信息,尤其是句內(nèi)兩個直接關(guān)系成分間的信息,因此出現(xiàn)許多歧義現(xiàn)象。這種分析的缺陷就是尋找句法分析依據(jù)的范圍只局限在句內(nèi),只局限在一個單一的層次,因此出現(xiàn)不足分析現(xiàn)象。而語言的實(shí)際情況是某個詞項(xiàng)的句法語義地位在語篇中可能受到各種不同層次的因素的選擇限制作用,因此需要依據(jù)語篇中多層次的信息進(jìn)行句法分析,以找出句內(nèi)詞項(xiàng)間句法語義關(guān)系上的確定性。語篇 多層次信息 句法分析 方法一、句法分析的目的句法分析主要是確定句內(nèi)詞項(xiàng)間在結(jié)構(gòu)、語義上的關(guān)系大家 2011年9期2011-08-15
- 一種改進(jìn)的Lucene語義相似度檢索算法*
檢索,很少有考慮詞項(xiàng)語義的Lucene檢索研究。此外,對于Lucene詞頻分析檢索函數(shù)的性能也很少被討論。因此,如果能對Lucene的檢索函數(shù)加以改進(jìn)的話,則能夠有利于各種基于Lucene的應(yīng)用,如業(yè)界廣泛使用的開源搜索引擎Nutch[2]。本文基于上述觀察,提出了一種結(jié)合檢索詞項(xiàng)語義的檢索函數(shù),該函數(shù)改進(jìn)了傳統(tǒng)基于詞頻的方法對語義忽視所造成的檢索不夠精確的問題,同時也給出了一個初步判定文檔相似性的算法。通過這些改進(jìn),實(shí)驗(yàn)結(jié)果表明,對比傳統(tǒng)的基于詞頻的方法- 基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴(kuò)展技術(shù)研究
語料資源中挖掘各詞項(xiàng)與原始查詢之間的某種關(guān)聯(lián)屬性,進(jìn)而選擇較好的詞項(xiàng)作為擴(kuò)展詞。查詢擴(kuò)展技術(shù)的兩個關(guān)鍵之處在于擴(kuò)展資源的選取以及詞項(xiàng)間關(guān)聯(lián)屬性的挖掘。在擴(kuò)展詞資源方面,大規(guī)模真實(shí)的搜索引擎日志通常包含了用戶的原始查詢、瀏覽頁面、點(diǎn)擊鏈接以及對應(yīng)的時間等非常豐富且有價值的信息,作為擴(kuò)展資源,其質(zhì)量相比于傳統(tǒng)的偽相關(guān)文檔更具有優(yōu)勢。同時,在真實(shí)的搜索引擎日志中,也包含了大量的噪聲數(shù)據(jù),因此,需要有效地挖掘詞項(xiàng)關(guān)聯(lián)屬性以求更好地篩選出與原始查詢相關(guān)的擴(kuò)展詞項(xiàng)。本中文信息學(xué)報(bào) 2011年1期2011-06-14
- 論克里普克與普特南自然類詞項(xiàng)語義學(xué)觀之異同
克與普特南自然類詞項(xiàng)語義學(xué)觀之異同□朱建平 [蘇州大學(xué) 蘇州 215123]雖然哲學(xué)家們一直使用克里普克-普特南理論來稱謂他們關(guān)于自然種類詞項(xiàng)的語義學(xué)學(xué)說,但這是兩個很不相同的理論,其差別不僅表現(xiàn)在理論提出的最初動機(jī)方面,更體現(xiàn)在理論的最終內(nèi)容方面。本文的目的不在于詳細(xì)說明兩位哲學(xué)家關(guān)于自然類詞項(xiàng)的理論特點(diǎn),而是試圖對他們關(guān)于自然類詞項(xiàng)的學(xué)說做出應(yīng)有的區(qū)別。自然種類詞項(xiàng);指稱;因果的歷史說明;本質(zhì)克里普克(Saul Kripke)和普特南(Hilary P電子科技大學(xué)學(xué)報(bào)(社科版) 2011年1期2011-04-01
- 一種新的微博短文本特征詞選擇算法*