国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于統(tǒng)計機器翻譯理論的格律詩自動生成研究

2018-06-29 09:28朱騏
文學教育·中旬版 2018年4期
關(guān)鍵詞:格律詩

內(nèi)容摘要:當前我國與世界各國之間的溝通合作日益密切使得語言這一溝通橋梁作用的重要性得到了凸顯。在這一背景下,機器翻譯在當前環(huán)境下也得到了迅猛的發(fā)展。機器翻譯理論作為計算機技術(shù)中一大新興技術(shù)理論,對于文本類信息資源的整合處理以及當前多數(shù)行業(yè)領(lǐng)域內(nèi)面向語言文字類信息資源的綜合需求存在著較高的契合度,因此在實際應(yīng)用過程中加強對于統(tǒng)計機器翻譯理論的應(yīng)用存在著積極價值?,F(xiàn)以格律詩的自動生成研究為主要方向,淺析基于統(tǒng)計機器翻譯理論的格律詩自動生成問題。

關(guān)鍵詞:統(tǒng)計機器翻譯 機器翻譯理論 格律詩 中文詩歌 生成研究

格律詩作為我國詩歌文化的重要內(nèi)涵,在我國長遠的文化歷史發(fā)展中存在著較為重要的實際影響。在詩歌文化中,格律詩由于其重要的文學地位以及獨特的文化內(nèi)涵而在我國漢語言文學領(lǐng)域具備著極高的文學價值。就格律詩的題材類型來看,格律詩包括了律詩以及絕句兩種,均在我國存在著較為久遠的歷史背景。就此看來,在當前漢語言文化傳承過程中通過現(xiàn)有的新興技術(shù)種類來完成對傳統(tǒng)文化的傳承是當前我國統(tǒng)計機器翻譯理論的應(yīng)用目的之一。

同時,就我國現(xiàn)階段計算機算法及翻譯相關(guān)理論多元化發(fā)展的現(xiàn)狀來看,在格律詩的自動生成之中進行機器翻譯理論不僅有利于我國傳統(tǒng)文化在當前社會的有效弘揚,更是在信息爆炸的時代之中進行詩歌創(chuàng)作與生成的一條嶄新途徑?,F(xiàn)就筆者觀點,對于格律詩生成系統(tǒng)中有關(guān)關(guān)鍵詞檢索以及統(tǒng)計機器翻譯理論的應(yīng)用思路加以簡要分析。

一.格律詩生成與統(tǒng)計機器翻譯理論的結(jié)合思路分析

詩詞文化作為我國傳統(tǒng)文學的重要內(nèi)涵之一,在其發(fā)展歷程之中對于語言文學的韻律以及美感較為重視,在詩詞創(chuàng)作的過程中往往在題材以及格式上存在著較為嚴格的規(guī)范。同時作為語言藝術(shù)的具體內(nèi)涵之一,格律詩相對于傳統(tǒng)的詩詞藝術(shù)而言在創(chuàng)作過程中具有著更大的實際難度以及對于藝術(shù)靈感更高的依賴性,因而近年來我國在進行計算機輔助為媒介的格律詩創(chuàng)作體系建設(shè)上進程較為緩慢。

就格律詩等特殊性語言文學自動生成體系建設(shè)在近年來的發(fā)展歷程來看,微軟亞洲研究院自然語言計算機組研發(fā)的自動對聯(lián)系統(tǒng)可謂是格律詩自動生成研究中的一大突破性進展。由于對聯(lián)在實際格式上與格律詩存在著較大的相似之處,尤其是在對仗、押韻以及各式、寓意方面的需求存在著較大的共通之處,因此在格律詩自動生成系統(tǒng)中同樣可以應(yīng)用這一體系的運行特點來在思路方面帶來突破。自動對聯(lián)系統(tǒng)在實際統(tǒng)計翻譯理論的結(jié)合以及統(tǒng)計翻譯理論應(yīng)用的思路方面在于通過現(xiàn)有數(shù)字建模技術(shù)來對對聯(lián)信息中的源語句、格式類型進行建模,通過較為復(fù)雜的運算進行創(chuàng)作格式以及創(chuàng)作思路的規(guī)律模擬;同時通過數(shù)字建模系統(tǒng)能夠有效的對作品之中大多數(shù)案例中上下文之間的語義關(guān)系進行模擬,找出目標語句之間的對應(yīng)關(guān)系。這一運作機制能夠有效避免在創(chuàng)作過程中傳統(tǒng)的統(tǒng)計翻譯理論運行過程中對創(chuàng)作內(nèi)容的嚴謹性造成影響。就此看來,對聯(lián)自動生成系統(tǒng)在自身的運作機制上與本文所探討的格律詩自動生成研究存在著較大的關(guān)聯(lián)性,在思路方面可以通過對對聯(lián)自動生成系統(tǒng)進行參考來完成當前所需自動生成系統(tǒng)的具體環(huán)節(jié)設(shè)計。

同時在格律詩的自動生成系統(tǒng)設(shè)計之中對于統(tǒng)計機器翻譯理論的研究并不僅僅局限于在對聯(lián)自動生成系統(tǒng)基礎(chǔ)之上的發(fā)展建設(shè),而是應(yīng)當在借鑒其建設(shè)思路的同時在自身統(tǒng)計機器翻譯系統(tǒng)之中加以相應(yīng)調(diào)整。眾所周知,格律詩相對于對聯(lián)在自身語法語義、對仗押韻以及實際表達出的思想內(nèi)涵均存在著質(zhì)的增長,因此想要在進行格律詩的生成時在格律、意境方面同樣能夠達到自動生成的相應(yīng)目的,就需要在進行統(tǒng)計機器翻譯系統(tǒng)的建設(shè)過程中對于技術(shù)進行一定的革新。這里同樣以對聯(lián)的自動生成系統(tǒng)為例,在實際應(yīng)用過程中進行生成主要依賴于對于源文件內(nèi)容以及語句格式進行算法建模,進而盡可能多的進行譯文的生成、并應(yīng)用生成的譯文與需求信息進行比對,進而完成最優(yōu)解的最終確認。同時統(tǒng)計機器翻譯理論在進行對數(shù)據(jù)的模擬建模以及分析生成時存在著一個較為主要的缺陷,即無法參照輸入信息來對詩詞的第一句進行生成。在這一背景下,想要針對實際需求來完成對于格律詩的自動生成往往需要使用者根據(jù)自身需求來進行第一句的選擇與自主創(chuàng)作,這明顯與我們進行格律詩自動生成系統(tǒng)建設(shè)的目的存在出入。因此未解決這一弊端,筆者認為可以通過一定的技術(shù)手段加以彌補,即通過添加一個能夠結(jié)合節(jié)奏模板以及語言模型的詩詞素材庫,來面向格律詩創(chuàng)作自動生成的首句需求。

通過上述思路流程,筆者認為能夠針對當前我國計算機統(tǒng)計機器翻譯理論的發(fā)展現(xiàn)狀有效建立起面向格律詩的自動生成體系,就體系自身的實際職能以及構(gòu)成元素來看這一體系同樣能夠針對用戶的多元化需求提供具有一定針對性的格律詩生成。

二.基于統(tǒng)計機器翻譯理論的格律詩自動生成流程分析

(一)流程概述

絕句作為詩歌類型中的重要內(nèi)容之一,是當前格律詩自動生成系統(tǒng)中的主要需求所在。想要應(yīng)用統(tǒng)計機器翻譯理論來完成對格律詩的自動生成就需要在實際生成流程上對流程做到盡可能的把握。就筆者研究分析,當前以絕句詩為主的格律詩自動生成流程主要包括首句生成以及二、三、四句生成兩大環(huán)節(jié)。在用戶想要進行詩歌的具體生成時,首先應(yīng)當確定自身格律詩生成需求,即五言絕句或是七言絕句,并針對這一需求類型來完成對于表達內(nèi)容進行關(guān)鍵詞的輸入,進而由計算機進行首句生成。在完成了首句生成的環(huán)節(jié)過后,計算機通過參考用戶輸入的實際信息來完成后續(xù)內(nèi)容的自動生成。

在用戶輸入目標信息這一流程中,系統(tǒng)應(yīng)當為用戶提供與格律詩題材相關(guān)的諸多選項,來完成用戶對詩歌語義類別的具體選擇。諸如“時令類”、“遠眺類”、“思鄉(xiāng)類”等語義類別在供用戶進行選擇的同時還應(yīng)在每個語義類別的下方添加與該語義類別存在關(guān)聯(lián)的關(guān)鍵詞,并嚴格按照《詩學含英》中的分類體系進行參考。眾所周知,《詩學含英》一書中在語義類別的具體分類上面向不同的詩詞類型共存在著40大類、1016個關(guān)鍵詞、41248個詞匯(其中不重復(fù)的有34290個)。在其中詞匯長度同樣存在著較大劃分,從兩個字節(jié)到五個字節(jié)不等。這就為格律詩的自動生成提供了較大的便利性。當用戶確定好詩的具體形式以及選擇好按照語義劃分的具體關(guān)鍵詞后系統(tǒng)便會按照源語言與目標語言的對應(yīng)關(guān)系來利用用戶的選擇進行系統(tǒng)結(jié)果的優(yōu)化改進。在這一流程之中系統(tǒng)能夠有效的完成優(yōu)質(zhì)格律詩作品的自動生成,同時最大限度的滿足用戶實際需求。

(二)首句及二、三、四句生成

就五言絕句為例,在實際應(yīng)用過程中五言絕句在節(jié)奏韻律方面主要存在著七種實際的節(jié)奏格式,分別在不同的詩詞意境、表現(xiàn)內(nèi)容中存在著相應(yīng)體現(xiàn)。由于實際體系能夠通過對用戶的實際需求參照來完成關(guān)鍵詞的最終生成,因此只需通過將得出的關(guān)鍵詞結(jié)果進行排列組合便可完成對于絕句首句的生成工作。當前在《詩學含英》中近95%的詩句均可按照其中的構(gòu)詞及組句規(guī)律來完成對于整句詩句的構(gòu)建,因此首句的自動生成完全可以參照該書中的語句生成格式來完成最終的確定工作。

而通過對絕句詩詞的第一句、第二句進行統(tǒng)計研究筆者發(fā)現(xiàn),九成的絕句詩詞存在著上下句式內(nèi)容特點以及結(jié)構(gòu)完全相同的特點,同時三四句之間的關(guān)聯(lián)性與一二句類似,同樣在近九成的詩詞之中都存在著句式一樣的情況。就此看來想要完成對于二三四句的自動生成可以使一三句的生成放在首位,而二四句的生成則完全參照一三句的建模算法,即可完成對于整首詩詞的自動創(chuàng)作。

統(tǒng)計機器翻譯理論與格律詩的自動生成體系建設(shè)具有著較高的協(xié)同發(fā)展價值,同時就統(tǒng)計機器翻譯理論的實際發(fā)展來看這一理論在自動生成等技術(shù)領(lǐng)域的實際應(yīng)用已然具備了一定的成熟度,因此當前相關(guān)研究人員在進行格律詩的自動生成體系建設(shè)工作時還應(yīng)加強對于該理論的具體應(yīng)用,進而達到創(chuàng)作的嚴謹性以及語言的藝術(shù)性等最終目的。

參考文獻

[1].杜金華,張萌,宗成慶,孫樂.中國機器翻譯研究的機遇與挑戰(zhàn)——第八屆全國機器翻譯研討會總結(jié)與展望[J].中文信息學報,2016,(07):15-16

[2].蔣銳瀅,崔磊,何晶,周明,潘志庚.基于主題模型和統(tǒng)計機器翻譯方法的中文格律詩自動生成[J].計算機學報,2017,(16):30-34

(作者介紹:朱騏,鹽城工學院副教授,從事計算機應(yīng)用與教學、中國古典文學研究)

猜你喜歡
格律詩
梁文源格律詩的語意表達
自由詩與格律詩之間
用典與格律詩創(chuàng)作
從關(guān)聯(lián)翻譯理論看漢語格律詩英譯中形式的趨同*——以《春望》三個譯本為例
兩本新格律詩選