国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx

朝鮮語自然語言處理問題探究

2021-10-09 07:39:27張詩悅
科教創(chuàng)新與實踐 2021年31期
關(guān)鍵詞:朝鮮語處理

摘要:朝鮮語作為人類語種中的一員,雖使用人數(shù)不多,但卻依然為人類文明的傳承,作出了重要貢獻。基于此情,文章將對朝鮮語自然語言的處理問題進行探究,望所述為朝鮮語自然語言處理的發(fā)展,提供些許可參考依據(jù)。

關(guān)鍵詞:自然語言;朝鮮語;處理

引言

我國早在上世紀就開始對自然語言的處理進行探究,但是主要集中在英語、日語等語種方面,涉及朝鮮語的自然語言處理問題探究相對要少很多,而自然語言又是一種由人蓄意為某些特定目的而創(chuàng)造的語言,故而在翻譯方面難度較大,因此,下文將對朝鮮語自然語言處理問題進行探究。

一、朝鮮語自然語言處理的主要內(nèi)容

1、句法學(xué)

句法學(xué)是朝鮮語自然語言處理中的重要內(nèi)容,其主要是對語言中不同成分組成句子的規(guī)則和句子結(jié)構(gòu)中各成分之間的相互關(guān)系進行探究,長久以來,受各種客觀和主觀因素影響,其研究進展緩慢,但近幾年,關(guān)于句法學(xué)的研究,卻在穩(wěn)步推進,并取得了一定的成果。

目前,我國在朝鮮語句法學(xué)方面,主要分兩個方面對復(fù)句進行了探究,即復(fù)句的自動識別、提取與復(fù)句的句法結(jié)構(gòu)、語義結(jié)構(gòu)的相似度計算。其一,在復(fù)句的自動識別、提取方面,采用借助一階謂詞邏輯表示法與框架表示法,這種方法需要人工進行編碼,工作量十分龐大,且耗時較長,但卻為后續(xù)的復(fù)句識別研究提供了借鑒,其二,是通過借助連接副詞對復(fù)句進行“解構(gòu)化”處理,但這種方法有一定的局限性,其主要針對朝鮮語單重復(fù)句,而對句子結(jié)構(gòu)復(fù)雜的長句和多重復(fù)句不太適用,其三,結(jié)合朝鮮語復(fù)句語法特點和標注特征,歸納了130余類連接語尾使用語境和4類潛在關(guān)系標記,構(gòu)建了詳細的復(fù)句識別特征集,實驗結(jié)果表明復(fù)句的識別率能達到87%以上,為朝鮮語的復(fù)句處理提供了基礎(chǔ)資源,存在的不足是數(shù)據(jù)樣本的規(guī)模較小,特征集還有待進一步完善,多重復(fù)句的識別準確率不高。

2、形態(tài)學(xué)

形態(tài)學(xué)是語言學(xué)的一個分支,其主要的研究內(nèi)容是詞的內(nèi)部結(jié)構(gòu),包括曲折變化、構(gòu)詞法。目前,針對朝鮮語的自然語言處理,我國的起步相對較晚,因此,尚未有什么顯著成就,而在這方面研究成果較為突出的當屬韓國,如首爾的高麗大學(xué),通過構(gòu)建詞綴詞典和制定詞綴規(guī)則體制來進行形態(tài)素分析,構(gòu)建了韓國語形態(tài)分析模型,另外,延世大學(xué)、梨花女子大學(xué)等,也均開發(fā)了形態(tài)素分析器,當然,還有一些其他高等學(xué)府在其處理方面也取得了一定的成果。

3、語義學(xué)

語義學(xué),顧名思義,即探究語言意義的學(xué)科。對于不同的語言單位,語義分析的任務(wù)各不相同。在詞的層次上,語義分析主要是進行詞義消歧(WSD),在句子層面上,主要任務(wù)是語義角色標注,而在篇章層面上,指代消歧、篇章語義分析則是目前研究的重點。

我國在朝鮮語予以分析方面,主要集中在詞匯及句子層面的語義角色標注、語義知識庫建立。目前,對朝鮮語可能存在的語義結(jié)構(gòu)進行了全面系統(tǒng)的總結(jié),最終構(gòu)擬出朝鮮語事件語義結(jié)構(gòu)的層次推演系統(tǒng),初步建立了現(xiàn)代朝鮮語的語義角色清單,該語義角色清單共包含了35個具體的語義角色,比韓國的“世宗計劃”,還要多出21個,這也為朝鮮語語義研究奠定了基礎(chǔ),而在此基礎(chǔ)上,又將謂詞的句法、語義屬性結(jié)合,進而建立了“朝鮮語句法語義知識庫”,為我國朝鮮語的自然語言處理作出了巨大貢獻。

二、朝鮮語自然語言處理的基本方法

從當前的朝鮮語自然語言處理的研究來看,其主要以理性主義和經(jīng)驗主義兩種研究方法為主,采取規(guī)則和統(tǒng)計相結(jié)合的形式。而為了能夠提高計算機翻譯的準確度,在基于韓國“世宗計劃”標注語料庫中的20萬句語料的基礎(chǔ)上,對朝鮮語以連接詞尾結(jié)尾的特殊短語結(jié)構(gòu)、以冠形詞轉(zhuǎn)成詞尾結(jié)尾的特殊短語以及以一般副詞結(jié)尾的特殊短語分別進行語言特征分析,確定其左右邊界,構(gòu)建規(guī)則庫,以迭代方式提取出56216個短語結(jié)構(gòu),建立了特殊短語庫,最后以5000句訓(xùn)練語料為基礎(chǔ),通過中心詞對信息提取系統(tǒng)進行召回率和正確率的評價,最終召回率達到了100%,正確率為93.8%。采用規(guī)則與統(tǒng)計相結(jié)合的方法,對韓國語的定語從句進行了句法特征的分析及自動識別。通過分析動詞類AM定語從句,形容詞類AM定語從句,系詞類AM定語從句的句法結(jié)構(gòu)特征,歸納總結(jié)其左右邊界和內(nèi)部構(gòu)成的共現(xiàn)關(guān)系,構(gòu)建了定語從句識別集,在語料庫中進行匹配運算,實現(xiàn)了定語從句的自動識別。通過提取句子的骨架結(jié)構(gòu),然后與實例庫中句子匹配,并運用數(shù)學(xué)模型計算出兩個句子間的結(jié)構(gòu)相似度,最后以1萬句單句為實驗對象,抽取骨架結(jié)構(gòu),按上述數(shù)學(xué)模型對句子進行遍歷比較,最終得到相似度計算結(jié)果,驗證了該方法的可行性,但是正確率只要76%,有進一步提升的空間。

結(jié)束語

綜上所述,朝鮮語的自然語言處理,雖然已經(jīng)取得一些成就,但仍然有很多地方需要完善,只有這樣,才能更加準確無誤的實現(xiàn)不同語言之間的有效互譯,消除語言障礙,實現(xiàn)國家、地區(qū)及民族之間的溝通,促進兩者的共同進步,為人類文明的延續(xù),作出應(yīng)有的貢獻。

參考文獻:

[1]畢玉德.朝鮮語特殊短語結(jié)構(gòu)的語言特征分析及自動提取[D].廣西科學(xué)院學(xué)報,2018(34)

[2]江一赫.朝鮮語民俗語言的翻譯方法探討[J].科教導(dǎo)刊(電子版),2021(12)

[3]畢玉德.朝鮮語自然語言處理研究管窺[J].中文信息學(xué)報,2011(25)

作者姓名:張詩悅,出生日期:1999.2.17,性別:女,籍貫:遼寧省遼中縣,專業(yè):朝鮮語,學(xué)校:遼東學(xué)院

猜你喜歡
朝鮮語處理
朝鮮語專業(yè)實踐教學(xué)模式改革初探
《古今釋林》朝鮮語漢字詞征引文獻勘誤
中國朝鮮語外來詞詞匯結(jié)構(gòu)和使用考察
影響油田污水處理水質(zhì)因素分析
視頻后期剪輯制作中鏡頭時長的處理
戲劇之家(2016年19期)2016-10-31 18:38:40
聲樂演唱中藝術(shù)與情感的深入處理
戲劇之家(2016年19期)2016-10-31 18:04:18
東風(fēng)4B型內(nèi)燃機車C6級維修后冷卻風(fēng)扇不動作原因及解決辦法
關(guān)于朝鮮語“-?-”句式和漢語“是”字句的對比
橋梁軟土基礎(chǔ)處理應(yīng)用
如何辦好散居地區(qū)朝鮮語廣播
新聞傳播(2016年4期)2016-07-18 10:59:20
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
泾阳县| 商水县| 镇江市| 夏河县| 玛沁县| 瓮安县| 保山市| 博罗县| 宁波市| 绵阳市| 抚顺市| 长阳| 嘉祥县| 隆化县| 陆川县| 河间市| 平阴县| 安乡县| 册亨县| 弥渡县| 石家庄市| 阳朔县| 乡城县| 理塘县| 隆回县| 罗源县| 遂昌县| 铜陵市| 黑河市| 桃园市| 永德县| 威海市| 安塞县| 商丘市| 沛县| 秀山| 牡丹江市| 资兴市| 陕西省| 大理市| 旬邑县|