国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于問(wèn)題關(guān)鍵詞匹配度的相似度計(jì)算

2012-04-29 11:50石鳳貴
電腦知識(shí)與技術(shù) 2012年30期
關(guān)鍵詞:計(jì)算方法原理檢索

摘要: 答疑是教學(xué)中不可或缺的環(huán)節(jié),傳統(tǒng)面對(duì)面的答疑浪費(fèi)時(shí)間和精力,因而開(kāi)發(fā)高效、準(zhǔn)確、智能化的自動(dòng)答疑系統(tǒng)是必要的。系統(tǒng)返回答案的準(zhǔn)確性在一定程度取決于問(wèn)題匹配的相似度。該文介紹了智能答疑系統(tǒng)中傳統(tǒng)的相似度計(jì)算,然后在傳統(tǒng)的相似度計(jì)算的基礎(chǔ)上提出了一種新的相似度計(jì)算方法——基于問(wèn)題關(guān)鍵詞匹配度的相似度計(jì)算,同時(shí)給出了該思想在系統(tǒng)中的實(shí)現(xiàn)算法。

關(guān)鍵詞:智能答疑系統(tǒng);相似度;匹配度

中圖分類(lèi)號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)30-7323-03

我們知道,有效的學(xué)習(xí)知識(shí)必須有學(xué)生和教師之間的交流,答疑是教學(xué)中的一個(gè)重要環(huán)節(jié)。在傳統(tǒng)的教學(xué)模式中,師生之間通過(guò)面對(duì)面的交流,可以及時(shí)解決教學(xué)中出現(xiàn)的問(wèn)題。如果教師與學(xué)生之間面對(duì)面的答疑,教師可能對(duì)同一個(gè)問(wèn)題對(duì)不同的學(xué)生要分別答疑。這將浪費(fèi)寶貴的答疑時(shí)間,因?yàn)榇鹨蓵r(shí)間總是有限的,教師也沒(méi)有那么多的精力逐個(gè)回答學(xué)生提出的問(wèn)題。這種人工答疑方式將會(huì)使教師不堪重負(fù)。因此,如果能讓計(jì)算機(jī)自動(dòng)解答學(xué)生的疑問(wèn)將會(huì)大大減輕教師負(fù)擔(dān),同時(shí)及時(shí)排解學(xué)生在學(xué)習(xí)過(guò)程中遇到的難題,從而提高學(xué)生的學(xué)習(xí)質(zhì)量和效率。但是,目前開(kāi)發(fā)高效、準(zhǔn)確、智能化的自動(dòng)答疑系統(tǒng)仍然是一個(gè)難題。本課題就是適應(yīng)這一要求而提出的,目的是利用現(xiàn)有的自然語(yǔ)言理解技術(shù)改革現(xiàn)有的智能答疑系統(tǒng)模式,充分利用遠(yuǎn)程教育網(wǎng)絡(luò)資源,通過(guò)機(jī)器處理自動(dòng)理解用戶提出的自然語(yǔ)言描述的問(wèn)題,并自動(dòng)返回答案,達(dá)到減輕教師的負(fù)擔(dān),幫助學(xué)生學(xué)習(xí),提高遠(yuǎn)程教學(xué)質(zhì)量和效率的目的。在目前的遠(yuǎn)程教學(xué)模式中,研制開(kāi)發(fā)一個(gè)智能答疑系統(tǒng)的意義尤為重大,這是因?yàn)椋?/p>

1)答疑是學(xué)生進(jìn)行系統(tǒng)學(xué)習(xí)的有益補(bǔ)充,同時(shí)也是學(xué)生鞏固知識(shí)的重要途徑,無(wú)論學(xué)習(xí)的形式如何變化,答疑對(duì)于學(xué)習(xí)活動(dòng)來(lái)說(shuō)是必要且不可或缺的,在網(wǎng)絡(luò)壞境下,及時(shí)、有效地獲得解答是學(xué)生遠(yuǎn)程學(xué)習(xí)的基本需求。

2)通過(guò)對(duì)學(xué)生所提問(wèn)題的記錄分析,可以統(tǒng)計(jì)出學(xué)生普遍存在的知識(shí)薄弱環(huán)節(jié),為教師進(jìn)一步改進(jìn)教學(xué)方法提供參考,成為輔助教學(xué)的有效工具。

3)在網(wǎng)絡(luò)環(huán)境下的智能答疑系統(tǒng)采用了友好自然的自然語(yǔ)言接口,學(xué)生可以輕松自如地提問(wèn),及時(shí)解決學(xué)習(xí)過(guò)程中遇到的難題,使遠(yuǎn)程教學(xué)真正起到用戶良師的作用,對(duì)于遠(yuǎn)程教學(xué)方式在我國(guó)的進(jìn)一步普及,具有不可估量的重大意義。

4)將功能良好的智能答疑系統(tǒng)應(yīng)用于國(guó)家大力發(fā)展的遠(yuǎn)程教學(xué)支撐平臺(tái)中,具有很大的社會(huì)價(jià)值。

5)為自然語(yǔ)言理解以及信息檢索技術(shù)的應(yīng)用發(fā)展提供了一個(gè)方向,可以推動(dòng)該技術(shù)領(lǐng)域的發(fā)展。

如何讓計(jì)算機(jī)理解用戶提出的自然語(yǔ)言描述的問(wèn)題,檢索到目標(biāo)問(wèn)題,并自動(dòng)的返回答案,這是智能答疑系統(tǒng)的關(guān)鍵。本文討論怎樣根據(jù)用戶問(wèn)題去匹配目標(biāo)問(wèn)題的思想及其算法,這也是智能答疑系統(tǒng)的最終目的。

1 問(wèn)題關(guān)鍵詞匹配度計(jì)算

一個(gè)問(wèn)題中含有一個(gè)或多個(gè)關(guān)鍵詞,但是每個(gè)關(guān)鍵詞在句子中的地位是不一樣的,有的起決定性的作用。該類(lèi)關(guān)鍵詞就是要重點(diǎn)考慮的關(guān)鍵詞,它與問(wèn)題的匹配度為1。如:“編譯原理是什么?”,含有關(guān)鍵詞“編譯原理”、“編譯”,在這個(gè)問(wèn)題中學(xué)生要問(wèn)的是“編譯原理是什么”,因而“編譯原理”是要重點(diǎn)考慮的關(guān)鍵詞。但是“編譯”也屬于《編譯原理》這門(mén)課程的專(zhuān)業(yè)詞,匹配時(shí)也可以考慮,因?yàn)檫@將有利于問(wèn)題答案的檢索。如果學(xué)生問(wèn)的“編譯是什么?”,若FAQ中沒(méi)有該匹配對(duì),不能檢索到相同的問(wèn)題則檢索近似的問(wèn)題。

起決定性作用的關(guān)鍵詞,它與該問(wèn)題的匹配度為1,不起決定性的關(guān)鍵詞與問(wèn)題的匹配度為0.5。

采用這種策略,可以實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)義分析。

例如:“編譯原理是什么?”與“什么是編譯原理?” 是同一個(gè)問(wèn)題。如果用戶輸入的是這兩個(gè)問(wèn)題,則檢索到的都是同一個(gè)問(wèn)題。

如果問(wèn)的是“編譯是什么?”(假設(shè)FAQ中沒(méi)有該問(wèn)題與“編譯”的匹配度為1的匹配對(duì)),則檢索到近似的“編譯原理是什么?”,然后返回其答案。這樣系統(tǒng)用一個(gè)近似的問(wèn)題及其答案來(lái)回答學(xué)生所問(wèn)問(wèn)題,從所返回的答案中學(xué)生能有所啟發(fā)。

2 基于問(wèn)題關(guān)鍵詞匹配度的相似度計(jì)算

系統(tǒng)根據(jù)用戶所問(wèn)問(wèn)題去檢索相應(yīng)的問(wèn)題及其答案,即根據(jù)用戶問(wèn)題去匹配目標(biāo)問(wèn)題。匹配到的目標(biāo)問(wèn)題是否與用戶問(wèn)題對(duì)應(yīng),相似程度有多大?這將涉及到相似度問(wèn)題。

句子相似度計(jì)算在自然語(yǔ)言處理中有著廣泛的應(yīng)用,例如,在基于實(shí)例的機(jī)器翻譯中的源語(yǔ)言檢索,面向常問(wèn)問(wèn)題集的自動(dòng)問(wèn)答系統(tǒng)中的問(wèn)句檢索等領(lǐng)域。在不同的具體應(yīng)用中,相似度的含義也有所不同。例如,在基于實(shí)例的機(jī)器翻譯中,相似度主要用于衡量文本中詞語(yǔ)的可以相互替換使用而不改變文本的句法語(yǔ)義結(jié)構(gòu)的程度;在信息檢索中,相似度更多的是反映文本與用戶查詢?cè)谝饬x上的符合程度。

目前常見(jiàn)的兩種句子相似度的計(jì)算方法:(1)基于詞向量空間模型的TF-IDF相似度計(jì)算方法;(2)基于語(yǔ)義詞典的相似度計(jì)算方法。

本文在這兩種相似度計(jì)算方法的基礎(chǔ)上提出了一種新的相似度計(jì)算——基于問(wèn)題關(guān)鍵詞匹配度的相似度計(jì)算:

當(dāng)用戶問(wèn)題中的關(guān)鍵詞與目標(biāo)問(wèn)題的匹配度為1且句子類(lèi)別一致時(shí),則認(rèn)為目標(biāo)問(wèn)題與用戶問(wèn)題完全相似,相似度為1。

當(dāng)用戶問(wèn)題中的關(guān)鍵詞與目標(biāo)問(wèn)題的匹配度為0.5且句子類(lèi)別一致時(shí),則認(rèn)為目標(biāo)問(wèn)題與用戶問(wèn)題近似相似,相似度為0.5。

當(dāng)用戶問(wèn)題中的關(guān)鍵詞與目標(biāo)問(wèn)題的匹配度為1或0.5但句子類(lèi)別不一致時(shí),則認(rèn)為目標(biāo)問(wèn)題與用戶問(wèn)題低相似,相似度為0.25。

利用這種相似度計(jì)算方法,相似度在系統(tǒng)實(shí)現(xiàn)中不用單獨(dú)計(jì)算,它的計(jì)算隱含在問(wèn)題匹配中。

在實(shí)際的系統(tǒng)實(shí)現(xiàn)中,一般只要考慮前兩種。這種方法是一種非常有效的相似度計(jì)算方法,在實(shí)際的系統(tǒng)中能大大提高系統(tǒng)的效率,減少了傳統(tǒng)的相似度計(jì)算的復(fù)雜統(tǒng)計(jì)及計(jì)算。

3 問(wèn)題匹配算法

利用本文中提出的相似度計(jì)算來(lái)完成問(wèn)題的匹配——用戶問(wèn)題與目標(biāo)問(wèn)題的匹配。

利用FAQ庫(kù)進(jìn)行用戶問(wèn)題解答的基本計(jì)算流程如下圖所示:

3.1 算法程序代碼

4 結(jié)束語(yǔ)

本文闡述了智能答疑系統(tǒng)的作用,介紹了一種基于問(wèn)題關(guān)鍵詞匹配度的相似度計(jì)算,然后利用該思想來(lái)完成問(wèn)題匹配,并給出了問(wèn)題匹配算法的流程圖以及程序代碼。

參考文獻(xiàn):

[1] 侯麗敏.基于網(wǎng)絡(luò)的智能答疑系統(tǒng)的研究與實(shí)現(xiàn)[D].河南:河南大學(xué),2005.

[2] 石鳳貴. 《編譯原理》智能答疑系統(tǒng)中課程知識(shí)庫(kù)檢索模塊的開(kāi)發(fā)[D].安徽:安徽工業(yè)大學(xué),2007.

猜你喜歡
計(jì)算方法原理檢索
浮力計(jì)算方法匯集
了解咳嗽祛痰原理,有效維護(hù)健康
2019年第4-6期便捷檢索目錄
平均場(chǎng)正倒向隨機(jī)控制系統(tǒng)的最大值原理
化學(xué)反應(yīng)原理全解讀
通信原理教學(xué)改革探索
專(zhuān)利檢索中“語(yǔ)義”的表現(xiàn)
隨機(jī)振動(dòng)試驗(yàn)包絡(luò)計(jì)算方法
不同應(yīng)變率比值計(jì)算方法在甲狀腺惡性腫瘤診斷中的應(yīng)用
一種伺服機(jī)構(gòu)剛度計(jì)算方法