国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于用戶反饋的統(tǒng)計(jì)機(jī)器翻譯短語表優(yōu)化方法

2016-09-01 01:32:26尹瑞程蔡?hào)|風(fēng)
關(guān)鍵詞:置信度語料短語

尹瑞程,葉 娜,蔡?hào)|風(fēng)

(沈陽航空航天大學(xué) 人機(jī)智能研究中心,沈陽 110136)

?

基于用戶反饋的統(tǒng)計(jì)機(jī)器翻譯短語表優(yōu)化方法

尹瑞程,葉娜,蔡?hào)|風(fēng)

(沈陽航空航天大學(xué) 人機(jī)智能研究中心,沈陽 110136)

近年來,統(tǒng)計(jì)機(jī)器翻譯技術(shù)取得了長足進(jìn)展,然而在譯文質(zhì)量要求較高的領(lǐng)域,機(jī)器翻譯系統(tǒng)產(chǎn)生的譯文仍不夠理想。隨著計(jì)算機(jī)輔助翻譯和交互式機(jī)器翻譯技術(shù)的出現(xiàn),研究人員開始利用用戶反饋,從中學(xué)習(xí)翻譯知識(shí),對翻譯系統(tǒng)的各項(xiàng)參數(shù)進(jìn)行優(yōu)化。由于不同用戶的翻譯經(jīng)驗(yàn)不同,所以他們反饋翻譯知識(shí)的置信度也不同。通過分析影響用戶置信度的特征,得到用戶置信度評(píng)價(jià)模型,并利用該模型將不同用戶反饋的翻譯知識(shí)進(jìn)行區(qū)分,實(shí)時(shí)調(diào)整更新短語表的參數(shù)。修改的參數(shù)包括正向短語翻譯概率、正向詞匯化翻譯概率、逆向短語翻譯概率、逆向詞匯化翻譯概率。實(shí)驗(yàn)結(jié)果表明,對不同用戶反饋的翻譯知識(shí)進(jìn)行區(qū)分,改進(jìn)短語表的參數(shù),得到的譯文質(zhì)量比不區(qū)分用戶得到的譯文質(zhì)量更好。

統(tǒng)計(jì)機(jī)器翻譯;用戶反饋;用戶置信度;短語表;參數(shù)優(yōu)化

目前,統(tǒng)計(jì)機(jī)器翻譯技術(shù)取得了長足進(jìn)展,然而在譯文質(zhì)量要求較高的領(lǐng)域(例如技術(shù)出版物或?qū)@g等),翻譯系統(tǒng)產(chǎn)生的譯文仍不夠理想。在這樣的應(yīng)用背景下,大部分的機(jī)器翻譯系統(tǒng)仍然采用譯后編輯獲得高質(zhì)量的譯文。在統(tǒng)計(jì)機(jī)器翻譯方面的研究領(lǐng)域,利用用戶反饋的學(xué)習(xí)方法,對用戶進(jìn)行譯后編輯得到的譯文進(jìn)行驗(yàn)證和校改并反饋給系統(tǒng)一直是國內(nèi)外研究熱點(diǎn)。系統(tǒng)對用戶反饋的翻譯知識(shí)充分利用,能有效地修改對數(shù)線性模型的各項(xiàng)參數(shù),不斷完善翻譯系統(tǒng)內(nèi)的翻譯知識(shí)體系,提高翻譯性能[1]。

由于不同翻譯人員的翻譯經(jīng)驗(yàn)不同,擅長的翻譯領(lǐng)域不同,導(dǎo)致他們翻譯的譯文質(zhì)量也會(huì)不同。因此利用用戶反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)的性能時(shí),對不同用戶進(jìn)行區(qū)分具有重要意義。

本文通過分析影響用戶置信度的因素,引入用戶的基本特征和用戶的翻譯狀態(tài)特征。用戶的基本特征包括用戶從事翻譯領(lǐng)域的工作時(shí)間和在翻譯公司的職位等。用戶的翻譯狀態(tài)特征包括對一個(gè)句子的用戶翻譯平均時(shí)間、用戶翻錯(cuò)單詞平均數(shù)、用戶譯文校驗(yàn)的平均次數(shù)等。根據(jù)不同用戶的相似度分析,我們設(shè)計(jì)出用戶置信度評(píng)價(jià)函數(shù)。并利用該函數(shù),得到用戶置信度評(píng)價(jià)模型,將不同用戶反饋的翻譯知識(shí)區(qū)別對待,重新修改短語表的各項(xiàng)參數(shù),包括正向短語翻譯概率、正向詞匯化翻譯概率、逆向短語翻譯概率、逆向詞匯化翻譯概率等。

為了驗(yàn)證本文提出方法的有效性,在英漢航空技術(shù)出版物的語料上進(jìn)行實(shí)驗(yàn),利用20 000句帶有校驗(yàn)人員標(biāo)注信息的語料,統(tǒng)計(jì)出不同用戶的翻譯狀態(tài)特征,用以構(gòu)建用戶置信度評(píng)價(jià)模型。用10萬句平行語料,訓(xùn)練出了對應(yīng)的短語表,每次加入5 000句不同用戶反饋的譯文,進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明,構(gòu)建用戶置信度評(píng)價(jià)模型,對不同用戶反饋的翻譯知識(shí)區(qū)別對待,能夠有效提高翻譯系統(tǒng)的優(yōu)化效果。

1 相關(guān)工作

目前國內(nèi)外利用用戶反饋改進(jìn)翻譯系統(tǒng)的研究主要集中在兩方面:一種是基于規(guī)則的方法,另一種是基于機(jī)器學(xué)習(xí)的方法。

基于規(guī)則的方法是一種將用戶譯后編輯的修改作為反饋,以模板或者規(guī)則的形式表示翻譯知識(shí),修改譯文的方法。Guzman[2]等人利用用戶譯后編輯的信息,人工制定一些規(guī)則用以修改譯文。Groves[3]等人利用機(jī)器翻譯生成的譯文和譯后編輯的結(jié)果,記錄達(dá)到正確譯文時(shí)需要修改最小編輯距離,從中自動(dòng)提取規(guī)則。該方法能夠提高用戶譯后編輯的工作效率。由于受到規(guī)則形式的限制,所以對翻譯系統(tǒng)的優(yōu)化程度有限。

利用機(jī)器學(xué)習(xí)方法改進(jìn)翻譯系統(tǒng)的研究上,Simard[4]等人將譯后編輯結(jié)果作為目標(biāo)語言,翻譯系統(tǒng)生成的譯文為源語言,訓(xùn)練出一個(gè)自動(dòng)譯后編輯系統(tǒng)。利用該系統(tǒng)對得到的譯文進(jìn)行再翻譯,而該方法對譯文的調(diào)序錯(cuò)誤作用不太明顯。Llitjos[5]等人通過實(shí)時(shí)查找譯文中錯(cuò)誤的位置,對原機(jī)器翻譯系統(tǒng)中的規(guī)則庫和詞典進(jìn)行修改并優(yōu)化翻譯引擎。Martinez[6]等人提出,利用在線學(xué)習(xí)的技術(shù),對譯后編輯的譯文進(jìn)行處理,實(shí)時(shí)調(diào)整和更新統(tǒng)計(jì)機(jī)器翻譯模型的各項(xiàng)參數(shù),如語言模型中的歷史計(jì)數(shù)N1+(*ω)等。通過用戶數(shù)據(jù)的不斷加入,實(shí)現(xiàn)翻譯系統(tǒng)內(nèi)各項(xiàng)參數(shù)的優(yōu)化。

然而,研究人員利用用戶反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)時(shí),忽略了用戶的差異性。不同用戶的翻譯狀態(tài)和翻譯水平都會(huì)有所不同。因此,建立用戶置信度評(píng)價(jià)模型,對不同用戶進(jìn)行區(qū)分,可以更好地融合多名用戶的翻譯知識(shí),提高翻譯系統(tǒng)的優(yōu)化效果。

2 構(gòu)建用戶置信度評(píng)價(jià)模型

本文挖掘出多個(gè)特征用以構(gòu)建用戶置信度評(píng)價(jià)模型,并將這些特征分成兩大類:基礎(chǔ)特征和翻譯特征。其中基礎(chǔ)特征是指用戶自身具備的屬性,如用戶從事翻譯工作的時(shí)間等。而翻譯狀態(tài)特征是校驗(yàn)人員對不同用戶后編輯的結(jié)果進(jìn)行標(biāo)注的語料中記錄的信息,從中統(tǒng)計(jì)能夠影響用戶翻譯狀態(tài)的變量,如翻譯一個(gè)句子的平均時(shí)間等。在本文中我們對這些特征進(jìn)行分析處理,利用用戶置信度的評(píng)價(jià)函數(shù)得到用戶置信度評(píng)價(jià)模型。

2.1特征

(1)用戶基礎(chǔ)特征

針對用戶固有的屬性,挖掘出用戶的基礎(chǔ)特征,包括用戶從事翻譯工作的時(shí)間,用戶在翻譯公司的職位,可以從翻譯公司記錄下來的翻譯人員的信息獲得。

(2)用戶的翻譯特征

(a)用戶翻譯平均時(shí)間如式(1)所示:

(1)

通過譯后編輯語料中記錄的信息,得到用戶翻譯每個(gè)句子的起始時(shí)間和結(jié)束時(shí)間,這里Si代表用戶翻譯當(dāng)前句子的起始時(shí)間,Ei表示翻譯該句子的結(jié)束時(shí)間,n表示該用戶翻譯句子的總數(shù)。

(b)用戶翻錯(cuò)單詞平均數(shù)如式(2)所示:

(2)

通過譯后編輯語料中校驗(yàn)人員的批注,統(tǒng)計(jì)出用戶翻譯當(dāng)前句子中錯(cuò)誤單詞的個(gè)數(shù)Ri,以及該用戶翻譯句子的數(shù)目n,最終得到對應(yīng)某個(gè)用戶每個(gè)句子翻錯(cuò)單詞的平均個(gè)數(shù)。

(c)用戶譯文校驗(yàn)的平均次數(shù)如式(3)所示:

(3)

通過在譯后編輯語料中得到某個(gè)用戶翻譯句子時(shí)批注人修改的次數(shù)Ci,以及該用戶翻譯句子的數(shù)目n,可以得到用戶翻譯修改次數(shù)的平均數(shù)。

(d)用戶翻譯每句錯(cuò)誤率的方差如式(4)所示:

(4)

(e)用戶的翻譯總量

選取標(biāo)注有用戶姓名的大批量語料,該語料記錄的是不同用戶翻譯一個(gè)月的總量,得到每個(gè)用戶翻譯句子的總數(shù)。利用不同特征向量描述用戶翻譯狀態(tài),對特征向量進(jìn)行歸一化,其中計(jì)算公式如式(5)所示:

(5)

在這里,T代表某個(gè)用戶的某項(xiàng)翻譯特征,Min代表所有用戶在該對應(yīng)特征下的最小值,Max代表所有用戶在該對應(yīng)特征下的最大值。此處用于構(gòu)建用戶置信評(píng)價(jià)模型的用戶特征向量如公式(6)所示:

(6)

2.2用戶置信度的評(píng)價(jià)函數(shù)

人工選取最好的用戶,認(rèn)為該用戶的置信度最高,通過計(jì)算該用戶與其他用戶特征向量的相似度,設(shè)置不同用戶的置信區(qū)間,最終得到用戶置信度評(píng)價(jià)模型,其中用戶相似度如式(7)所示:

C(PUseri,PUserj)=cosθ=

(7)

利用該公式得到不同用戶的特征向量與人工選定用戶的特征向量相似度的計(jì)算結(jié)果。由于進(jìn)行譯后編輯工作的用戶多數(shù)都是專業(yè)翻譯人員,他們反饋的譯文質(zhì)量差別并不是很大,因此我們根據(jù)相似度水平,把用戶分成三類:相似度在(0.7,1.0]的用戶我們設(shè)定為A檔,是置信度高的用戶群體;相似度在(0.3,0.7]的用戶設(shè)定為B檔,是置信度較高的用戶群體;而相似度在(0,0.3]的用戶為C檔,是置信度一般的用戶群體。

3 短語表的優(yōu)化方法

通過用戶置信度評(píng)價(jià)模型得到分類的結(jié)果,對不同用戶設(shè)置不同的權(quán)重,優(yōu)化翻譯系統(tǒng)中短語表的各項(xiàng)參數(shù),提高譯文質(zhì)量。

3.1用戶權(quán)重的設(shè)定

通過計(jì)算,我們依據(jù)置信度將用戶分為A、B、C三個(gè)用戶群體,下一步還需為不同用戶群體賦予不同的權(quán)重,以表示用戶反饋的翻譯知識(shí)的重要程度。由于用戶都是專業(yè)翻譯人員,總體上反饋的翻譯知識(shí)都有一定的參考價(jià)值,所以將用戶權(quán)重范圍設(shè)定在(1,2]之間。通過在開發(fā)集上的反復(fù)實(shí)驗(yàn),最后將A、B、C三個(gè)用戶群體的權(quán)重系數(shù)分別設(shè)定為1.8、1.6、1.2。

3.2短語表參數(shù)的優(yōu)化

短語表的質(zhì)量是影響機(jī)器翻譯系統(tǒng)性能的重要因素,短語表的獲取大多都是建立在雙語句對詞對齊關(guān)系上的,按照一定的規(guī)則抽取出短語對。短語表的結(jié)構(gòu)形式如表1所示:

表1 短語表的結(jié)構(gòu)形式

下面將介紹短語表的四個(gè)翻譯概率的計(jì)算及優(yōu)化方法。

(1)正向短語翻譯概率如式(8)所示:

(8)

(2)正向詞匯化翻譯概率如式(9)所示:

(9)

(10)

即源語言到目標(biāo)語言詞匯化加權(quán)概率,將源語言和目標(biāo)語言的短語對拆分成詞匯,通過詞匯化概率公式的計(jì)算,得出短語對中詞匯化的匹配程度。

公式(9)是一個(gè)二重循環(huán)問題:在外層循環(huán)中,從目標(biāo)語言端第一個(gè)詞匯遍歷至最后一個(gè)詞匯,將概率值進(jìn)行連乘;在內(nèi)層循環(huán)中,當(dāng)前目標(biāo)語言端詞匯為ei,計(jì)算不同fj翻譯為ei的概率和的均值。在這里a表示的是雙語平行語料中對應(yīng)的詞對齊關(guān)系。從公式(10)中看出詞匯化概率中count(fj,ei)表示短語對中源語言與目標(biāo)語言(fj,ei)詞匯化對在大規(guī)模平行語料中出現(xiàn)的次數(shù),∑eicount(fj,ei)表示以fj為源語言端詞匯化在大規(guī)模平行語料中出現(xiàn)的次數(shù)。與前面介紹的計(jì)算方式類似,這里countuserk(fj,ei)表示不同的用戶群體翻譯的平行句對中詞對(fj,ei)出現(xiàn)的次數(shù)?!芿icountuserk(fj,ei)表示以fj為源語言端在用戶翻譯的平行句對出現(xiàn)的次數(shù)。對應(yīng)的權(quán)重系數(shù)與之前介紹的相同。

(3)逆向短語翻譯概率如式(11)所示:

(11)

(4)逆向詞匯化翻譯概率如式(12)所示:

(13)

即目標(biāo)語言到源語言詞匯化加權(quán)概率,將短語拆分成詞匯,通過雙語詞對齊結(jié)果統(tǒng)計(jì)出詞匯化的概率,此處具體計(jì)算方式的解釋與前面的正向詞匯化翻譯概率類似,在此不再贅述。

由于短語翻譯概率系統(tǒng)大多都是基于對數(shù)線性模型進(jìn)行建模,因此將以上四個(gè)翻譯概率作為特征加入到對數(shù)線性模型中。

4 實(shí)驗(yàn)結(jié)果與分析

4.1實(shí)驗(yàn)數(shù)據(jù)

構(gòu)建用戶置信度評(píng)價(jià)模型時(shí),我們采集翻譯公司內(nèi)翻譯人員的基本個(gè)人信息作為基礎(chǔ)特征向量。我們得到20 000句標(biāo)注有校驗(yàn)人員修改信息的語料,這部分語料記錄了用戶在翻譯過程的各種信息,語料的結(jié)構(gòu)形式如表2所示:

表2 語料的結(jié)構(gòu)形式

在這里原文的語言是中文,譯文的語言是英語,作者是該譯文翻譯人員的姓名,翻譯時(shí)間記錄翻譯當(dāng)前句子的時(shí)間,形式如“201307020812”,意思是2013年7月2日8點(diǎn)12分開始翻譯該句子。批注人是修改人員的姓名,批注的形式如<螺桿,翻譯成threaded rod,應(yīng)改為 screw rod>,最終譯文是經(jīng)過修改后的標(biāo)準(zhǔn)譯文。在這里批注人有多個(gè),而對應(yīng)的批注為當(dāng)前批注人修改的信息,同樣該批注也會(huì)有多個(gè)。

本文評(píng)價(jià)優(yōu)化算法的語料來源于航空技術(shù)出版物,該語料中的主要信息如表3所示。利用該語料得到對應(yīng)的詞對齊模型、翻譯概率模型、語言模型、調(diào)序模型等。在這里詞匯數(shù)為雙語平行句對中不同單詞的數(shù)目。

表3 評(píng)價(jià)語料的統(tǒng)計(jì)

另外再抽取6萬對平行句對用于優(yōu)化短語表,該語料記錄翻譯人員的姓名,用以區(qū)分不同的翻譯人員;分詞工具采用的是中科院的ICTCLAS;詞對齊工具采用GIZA++[8];翻譯概率模型的生成來自于東北大學(xué)研發(fā)的NiuTrans工具包[9]。

4.2實(shí)驗(yàn)結(jié)果及分析

為了驗(yàn)證提出方法的有效性,本文做了兩組實(shí)驗(yàn),分別為翻譯概率模型直接優(yōu)化實(shí)驗(yàn)(基線方法)和加入用戶權(quán)重的翻譯概率模型優(yōu)化實(shí)驗(yàn)(本文方法)。

圖1為加入用戶權(quán)重和直接改進(jìn)翻譯概率模型時(shí)得到的兩組BLEU值[10]的變化情況。圖2為對應(yīng)的NIST值[11]的變化情況。通過觀察實(shí)驗(yàn)數(shù)據(jù)可以看到,利用60 000對中英文平行句對,改進(jìn)翻譯概率模型時(shí),加入用戶權(quán)重對應(yīng)的 BLEU值提升9.56%,NIST值提升1.87%。而直接利用用戶反饋的翻譯知識(shí)改進(jìn)翻譯概率模型時(shí),對應(yīng)的BLEU值提升8.24%,NIST值提升0.92%。

圖1 加入不同用戶權(quán)重和不加用戶權(quán)重時(shí)BLEU值的變化情況

圖2 加入不同用戶權(quán)重和不加用戶權(quán)重時(shí)NIST值的變化情況

從圖1和圖2的實(shí)驗(yàn)結(jié)果可以看出,利用用戶反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)時(shí),譯文質(zhì)量得到了提高,原因是該語料的翻譯人員都是專業(yè)的,對應(yīng)的譯文質(zhì)量都比較高,反饋的翻譯知識(shí)都是正向有價(jià)值的。無論有沒有用戶權(quán)重,翻譯系統(tǒng)的引擎都得到優(yōu)化。而加入用戶權(quán)重,譯文質(zhì)量得到更大的提升,原因是不同用戶的翻譯經(jīng)驗(yàn)不同,而A、B、C三檔用戶翻譯的譯文確實(shí)有所差別,A檔用戶翻譯的譯文要更準(zhǔn)確一些。對不同用戶進(jìn)行分類,能夠更加有效地利用用戶反饋的翻譯知識(shí)來改進(jìn)翻譯系統(tǒng)。隨著用戶反饋數(shù)據(jù)量的增加,譯文質(zhì)量的提升速度變慢了,這是因?yàn)橄到y(tǒng)性能的提升受到了其他因素的制約。本文提出的方法側(cè)重于短語表的優(yōu)化,而調(diào)序模型、語言模型等模型參數(shù)的優(yōu)化問題還無法得到有效的解決。

5 總結(jié)和展望

當(dāng)前統(tǒng)計(jì)機(jī)器翻譯的譯文質(zhì)量仍然不夠理想,人們開始關(guān)注如何利用用戶反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)。不同用戶的翻譯經(jīng)驗(yàn)不同,本文通過深入分析影響用戶翻譯狀態(tài)的因素,挖掘不同用戶的特征,得到用戶置信度評(píng)價(jià)模型,實(shí)現(xiàn)對不同用戶分類,并利用分類結(jié)果修改翻譯系統(tǒng)內(nèi)短語表的參數(shù)。實(shí)驗(yàn)結(jié)果表明,對用戶進(jìn)行區(qū)分,改進(jìn)翻譯概率模型比直接改進(jìn)翻譯概率模型得到的譯文質(zhì)量要高。

未來的工作將進(jìn)一步深入探討用戶置信度模型及用戶權(quán)重的優(yōu)化方法,也將尋找更多能夠描述用戶翻譯狀態(tài)的特征,實(shí)現(xiàn)對用戶的更精確描述。

[1]A ARUN,P KOEHN.Online learning methods for discriminative training of phrase based statistical machine translation[J].Machine Translation,2007,XI:15-20.

[2]RGUZMAN.Automating MT Post-editing using Regular Expressions[J].Multilingual Computing,2007,18(6):49-52.

[3]D GROVES,D SCHMIDTKE.Identification and Analysis of Post-Editing Patterns for MT[C].Proceedings of MT Summit XII,2009,Ottawa,Canada.

[4]MSIMARD,CGOUTTE,PISABELLE.Statistical Phrase-based Post-Editing[C].Proceedings of NAACL,2007,2007:508-515,Rochester,USA.

[5]AFLLITJOS,JGCARBONELL.Automating Post-Editing to Improve MT Systems[C].Proceedings of the AMTA Automated Post-Editing Technique and Applications Workshop,2006,Cambridge,USA.

[6]DORTIZ-MARTINEZ,IGARCIA-VAREA,FCASACUBERTA.Online Learning for Interactive Statistical Machine Translation[C].Proceedings of NAACL,2010,2010:546-554,Los Angeles,USA.

[7]P KOEHN,FJ OCH,D MARCU.Statistical Phrase-Based Translation[C].Proceedings of HLT/NAACL,2003,2003:127-133,Edmonton,Canada.

[8]FJ OCH,H Ney.A systematic comparison of various statistical alignment models[J].Computational Linguistics,29(1):19-51.

[9]T XIAO,J ZHU,H ZHANG,QLI.Niutrans:An open source toolkit for phrase-based and syntax-based machine translation[C].Proceedings of ACL,2012,2012:19-24,Jeju,Korea.

[10]KPAPINENI,S ROUKOS,T WARD.BLEU:a method for automatic evaluation of machine translation[C].Proceedings of ACL,2002,2002:311-318,Philadelphia,USA.

[11]G DODDINGTON.Automatic Evaluation of Machine Translation Quality Using N-gram Co-Occurrence Statistics[C].Proceedings of HLT,2002,2002:138-145,San Diego,USA.

(責(zé)任編輯:劉劃英文審校:趙亮)

Optimization method for statistical machine translation of phrase table based on user feedback

YIN Rui-cheng,YE Na,CAI Dong-feng

(Human-computer Intelligence Research Center,Shenyang Aerospace University,Shenyang 110136,China)

In recent years,a substantial progress is achieved in the study of statistical machine translation.However,in the domains with high translationquality requirements,the machine translation output still cannotbe satisfied.With the advent of computer-assisted translation and interactive machine translation technology,researchers begin to learn translation from users′ feedback to optimize the parameters of the machine translation systems.Since users′ translation experiences are different,the confidences of the translation knowledge learned from users are different.This paper analyzed the factors that influence the user′s confidence and proposed a model to evaluate it.This model can be used to distinguish the translation knowledge from different users,and update the parameters of phrase table in real time.The modified parameters included the probabilityof forward phrase translation,forward lexical translation,reverse phrase translation and reverse lexical translation.Experimental results show that by distinguishing the translation knowledge from different users′ feedback,an optimized performance is achieved compared to non-distinguishing users.

statistical machine translation;user feedback;user confidence;phrase table;parameter optimization

2095-1248(2016)03-0073-06

2016-01-25

國家自然科學(xué)基金(項(xiàng)目編號(hào):61402299)

尹瑞程(1988-),男,河南洛陽人,碩士研究生,主要研究方向:機(jī)器翻譯,E-mail:925910322@qq.com;葉娜(1981-),女,遼寧沈陽人,講師,主要研究方向:機(jī)器翻譯,E-mail:yena_1@126.com;蔡?hào)|風(fēng)(1958-),男,遼寧沈陽人,教授,主要研究方向:人工智能、自然語言處理,E-mail:caidf@vip.163.com。

TP391.7

A

10.3969/j.issn.2095-1248.2016.03.012

猜你喜歡
置信度語料短語
硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
置信度條件下軸承壽命的可靠度分析
軸承(2015年2期)2015-07-25 03:51:04
《苗防備覽》中的湘西語料
國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
多假設(shè)用于同一結(jié)論時(shí)綜合置信度計(jì)算的新方法?
武威市| 南部县| 高碑店市| 莎车县| 同心县| 顺昌县| 奎屯市| 重庆市| 上蔡县| 汕尾市| 湄潭县| 鹰潭市| 德昌县| 巧家县| 沁水县| 长泰县| 竹溪县| 治县。| 信阳市| 莒南县| 上饶市| 瑞金市| 武强县| 侯马市| 辛集市| 宁河县| 溆浦县| 静乐县| 刚察县| 彭水| 基隆市| 安丘市| 万荣县| 兴山县| 五原县| 沾益县| 乌审旗| 东乌珠穆沁旗| 临洮县| 新河县| 南宫市|