文摘評(píng)估方法

2014-10-21 20:07王曉霞

電腦迷 2014年17期

王曉霞

摘要本文主要闡述了文摘的三大評(píng)估方法以及機(jī)械文摘質(zhì)量自動(dòng)評(píng)估的實(shí)現(xiàn)，通過對(duì)各種方法的具體介紹來選擇合適的文摘評(píng)估方法。

關(guān)鍵詞摘要評(píng)估評(píng)價(jià)方法

中圖分類號(hào)：TP391 文獻(xiàn)標(biāo)識(shí)碼：A

自動(dòng)文摘的評(píng)價(jià)方法大致可分為三大類：（1）直接（direct）評(píng)價(jià)方法；（2）基于任務(wù)的評(píng)價(jià)（task based）方法；（3）基于目標(biāo)的評(píng)估（target-based）方法。以下為具體介紹：

1直接評(píng)價(jià)方法

在自動(dòng)文摘研究的初期，主要是系統(tǒng)的開發(fā)者對(duì)文摘系統(tǒng)進(jìn)行評(píng)價(jià)測(cè)試，根據(jù)評(píng)測(cè)結(jié)果來指導(dǎo)研究工作。因此，他們大多采用直接分析文摘質(zhì)量的方法來對(duì)系統(tǒng)性能進(jìn)行評(píng)價(jià)。如下方法：

（1）與“理想摘要”進(jìn)行比較

這種方法的核心思想是將獲得的摘要與“理想摘要”進(jìn)行對(duì)比，根據(jù)兩者的相似性進(jìn)行評(píng)價(jià)。與“理想摘要”越接近，則說明摘要的質(zhì)量越高。

（2）其他方法

提問回答評(píng)價(jià)方法認(rèn)為好的摘要必須能夠闡述原文中的關(guān)鍵要點(diǎn)，因此，該方法要求首先對(duì)文章進(jìn)行分析，取出其中的要點(diǎn)，根據(jù)摘要中是否包含這些要點(diǎn)來進(jìn)行評(píng)價(jià)研究。他認(rèn)為用于考試而提出的問題通常反映了文章的主題。

2基于任務(wù)的評(píng)價(jià)方法

為了克服直接評(píng)價(jià)方法的弱點(diǎn)，近年來一些研究者提出應(yīng)采用基于任務(wù)的評(píng)價(jià)方法來對(duì)自動(dòng)文摘系統(tǒng)進(jìn)行評(píng)價(jià)，即將摘要應(yīng)用于特定的任務(wù)，根據(jù)文摘系統(tǒng)對(duì)該任務(wù)的促進(jìn)作用來評(píng)價(jià)文摘系統(tǒng)的性能。Brandow嘗試在IR（information retrieval）任務(wù)中評(píng)價(jià)文摘系統(tǒng)。對(duì)比采用摘要進(jìn)行檢索與原文進(jìn)行檢索的準(zhǔn)確度，來確定是否可以在IR中利用摘要來代替原文。Mike（1994）嘗試在一個(gè)新聞分析任務(wù)中，根據(jù)利用摘要進(jìn)行新報(bào)分析的效果來進(jìn)行評(píng)價(jià)。此外，由于情報(bào)處理領(lǐng)域中有許多具體任務(wù)，因而不斷有研究者提出新的任務(wù)、用于基于任務(wù)的評(píng)價(jià)方法。

3基于目標(biāo)的評(píng)估方法

這里只介紹Edmundson方法。Edmundson的評(píng)估是典型的基于目標(biāo)的評(píng)估方法，他的評(píng)估目的是比較各種自動(dòng)文摘方法的優(yōu)劣：標(biāo)題關(guān)鍵詞法，位置法，文中關(guān)鍵詞法，指示性詞語以及這四備戰(zhàn)方法的組合。Edmundson采用了3種評(píng)估方法，分別為客觀評(píng)估、主觀評(píng)估、統(tǒng)計(jì)錯(cuò)摘的句子。下面重點(diǎn)介紹方法的基本原理及其實(shí)現(xiàn)技術(shù)。

評(píng)測(cè)的內(nèi)容選擇以原文為依據(jù)，評(píng)估文摘是否比較準(zhǔn)確全面地表達(dá)了原文的中心意思，其實(shí)質(zhì)就是文章質(zhì)量評(píng)測(cè)。通常，人們一般對(duì)文摘有長(zhǎng)度限制，在表達(dá)同樣意思的前提下，認(rèn)為短文較長(zhǎng)文摘要好。這樣，好的機(jī)械文摘便可定義為“選取了最少的句子數(shù)，并全面表達(dá)了原文中心意思的機(jī)械文摘?！?/p>

語篇語言學(xué)的理論認(rèn)為，語篇在意義上存在一種層次關(guān)系，即：

語篇的中心意思=各組成意義段的中心意思按一定邏輯關(guān)系的組合

意義段的中心意思=各組成子意義段的中心意思按一定邏輯關(guān)系的組合。

子意義段的中心意思=各組成下位子意義段的中心意思按一定邏輯關(guān)系的組合。

直至不能再劃分為更小的子意義段。

需要指出的是，在任何具體語篇中，這種分層是有窮的，而且由于受長(zhǎng)度限制，到子意義段的文摘已屬少見，一般文摘到意義段已足夠。

這種意義上的層次關(guān)系必然要在形式上體現(xiàn)出來，即文章的句子之間大致存在一種層次關(guān)系，構(gòu)成一種樹形（金字塔形）結(jié)構(gòu)。層次越高所含的句子數(shù)目越少。

4機(jī)械文摘質(zhì)量自動(dòng)評(píng)估的實(shí)現(xiàn)

（1）機(jī)械文摘質(zhì)量自動(dòng)評(píng)估的模型，在這個(gè)模型中，主動(dòng)要有3個(gè)方面的工作要做：

①原文（相當(dāng)于考試的題目）的選擇。

②評(píng)價(jià)（這是評(píng)估的核心）。

③專家文摘的獲得。

（2）原文的選擇

這一部分工作只能由人來完成，最重要的選擇標(biāo)準(zhǔn)是原文對(duì)于參加比較的各文摘系統(tǒng)具有可比性。

（3）評(píng)價(jià)

評(píng)價(jià)是文摘自動(dòng)評(píng)測(cè)的核心部分。在進(jìn)行評(píng)價(jià)時(shí)，有以下幾個(gè)基本規(guī)定：

①專家文摘和機(jī)械文摘都存入文中文件中。

②為使專家文摘與機(jī)械文摘具有可比性，只允許專家從原文中抽取句子，而不允許專家根據(jù)自己對(duì)原文的理解重新生成句子。

③專家文摘和機(jī)構(gòu)文摘的句子都按照在原文中出現(xiàn)的先后順序給出。

④定義

重合率p=匹配句子數(shù)/專家文摘句子數(shù)？00%

每一個(gè)機(jī)械文摘的重合率為按n個(gè)專家給出的文摘得到的重合率的平均值。

平均重合率=pi/n？00%

其中，pi為相對(duì)于第i個(gè)專家的重合率； N為專家的數(shù)目。

（4）在系統(tǒng)的實(shí)現(xiàn)中，有以下兩個(gè)因素會(huì)給評(píng)測(cè)帶來一定的困難；

①文摘中的句子長(zhǎng)度不定，有的句子過長(zhǎng)。

②文摘的句子數(shù)目過多。

據(jù)觀察，這兩個(gè)問題可以解決的。

第一個(gè)問題在一篇文章里，任意互不相同的每句話的前15個(gè)字均不相同，而句子只能從原文中摘取，因此每句話的前15個(gè)字可用來代替該句子。即若機(jī)械文摘句子的前15個(gè)字組成的字串與專家文摘中句子的前15個(gè)字組成的字串相同，則認(rèn)為該機(jī)械文摘句與專家文摘句重合。

第二個(gè)問題的解決方案在于對(duì)文摘長(zhǎng)度的限制。在實(shí)踐中，如果文摘過長(zhǎng)，就會(huì)失去其作為摘要的意義?？梢砸?guī)定：機(jī)械文摘除了規(guī)定摘取率外還規(guī)定一個(gè)指標(biāo)即文摘的總字?jǐn)?shù)不能多于1000個(gè)漢字。設(shè)漢語句平均長(zhǎng)度大于10個(gè)字，所以句子數(shù)目最多只有100。

（5）專家文摘的獲得

進(jìn)行系統(tǒng)評(píng)價(jià)所必需的專家文摘應(yīng)具有以下條件；

①專家文摘應(yīng)與機(jī)械文摘有相同的摘取率

②專家文摘應(yīng)該是機(jī)器可讀的。

③專家文摘的句序應(yīng)與原文中的句序相一致。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

文摘評(píng)估方法