李寬宇 袁健 沈?qū)庫(kù)o
摘 ?要: 在知識(shí)庫(kù)問答系統(tǒng)任務(wù)中,由于自然語(yǔ)言表達(dá)方式的多樣性與復(fù)雜性,語(yǔ)義相同表達(dá)方式不同的問句得到的答案可能不同,生成問句釋義可以緩解這一問題。其次,關(guān)系檢測(cè)是知識(shí)庫(kù)問答系統(tǒng)中至關(guān)重要的一步,問答系統(tǒng)回答問題的準(zhǔn)確性主要受這一步驟的影響,傳統(tǒng)的基于注意力機(jī)制的關(guān)系檢測(cè)模型沒有考慮到答案路徑不同抽象級(jí)別的不同重要程度。因此,本文提出了基于問句釋義和詞級(jí)別注意力機(jī)制的關(guān)系檢測(cè)模型,用于知識(shí)庫(kù)問答系統(tǒng)任務(wù)中,實(shí)驗(yàn)表明本文模型回答問題準(zhǔn)確率較高。
關(guān)鍵詞: 問句釋義;詞級(jí)別注意力;關(guān)系檢測(cè);知識(shí)庫(kù)問答系統(tǒng)
中圖分類號(hào): TP391.1 ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.05.013
本文著錄格式:李寬宇,袁健,沈?qū)庫(kù)o. 融合了問句釋義和詞級(jí)別注意力的關(guān)系檢測(cè)模型[J]. 軟件,2019,40(5):7176
【Abstract】: In the knowledge base question answer system, due to the diversity and complexity of natural language expression, the question with the same semantic but different expressions may yield different answer. The generation of paraphrase can alleviate this problem. Secondly, relation detection is a crucial step in the knowledge base question answer system. The accuracy of the question answering system to answer questions is mainly affected by this step. The traditional attention-based relation detection model does not take into account the importance of different part of the different abstract levels of the answer path expression. Therefore, this paper proposes a relation detection model based on paraphrase and word-level attention mechanism, which is used in the knowledge base question answer system end task. Experiments show that the model has higher accuracy in answering questions.
【Key words】: Paraphrase; Word-level attention; Relation detection; KB-QA
0 ?引言
1 ?相關(guān)研究
語(yǔ)義分析方式最主要的缺點(diǎn)沒有利用到知識(shí)庫(kù)提供的背景知識(shí),為此,Yao和Van Durme等人[6]提出信息檢索的方法,通過實(shí)體鏈接縮小了查找范圍。針對(duì)關(guān)系檢測(cè)這一步驟,最開始Yao和Van Durme通過手工構(gòu)建問題與候選答案路徑的特征,構(gòu)造分類器對(duì)問句中的關(guān)系謂詞進(jìn)行識(shí)別,再與候選答案路徑進(jìn)行相似度匹配。為減少人工成本bordes等人[8]將問題和答案路徑都映射到低維空間,通過模型的訓(xùn)練,學(xué)習(xí)到它們的向量化表示,向量相似度最高的那條答案路徑對(duì)應(yīng)的節(jié)點(diǎn)作為問題的答案。
2 ?模型概述
自然語(yǔ)言問句表示為q,答案表示為a。模型先通過實(shí)體鏈接找到對(duì)應(yīng)的候選答案知識(shí)庫(kù)子圖,然后對(duì)這些候選答案求概率分布,即求 ,概率最高的即為問題的答案。本文將整個(gè)問答系統(tǒng)分解成問句與釋義語(yǔ)義相似度評(píng)估模塊和問答系統(tǒng)模塊,將 分解為公式1。
5 ?結(jié)論
