国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向語料庫機(jī)助辭書編纂系統(tǒng)的設(shè)計與實(shí)現(xiàn)

2021-08-09 08:21張永偉顧曰國胡欽諳曹新龍
辭書研究 2021年4期
關(guān)鍵詞:設(shè)計與實(shí)現(xiàn)語料庫

張永偉 顧曰國 胡欽諳 曹新龍

摘 要 “面向語料庫機(jī)助辭書編纂系統(tǒng)”由中國社會科學(xué)院語言所和中國多語言多模態(tài)語料庫暨大數(shù)據(jù)研究中心研發(fā),是一個可以充分地利用各種語料庫、辭書庫和其他相關(guān)資源庫輔助漢語辭書編纂的平臺。文章介紹了該系統(tǒng)的研發(fā)背景、目標(biāo)、系統(tǒng)設(shè)計與實(shí)現(xiàn)。此外,對系統(tǒng)的技術(shù)選型也進(jìn)行了簡單介紹,為辭書編纂或相關(guān)系統(tǒng)的研制提供借鑒。

關(guān)鍵詞 辭書編纂系統(tǒng) 語料庫 設(shè)計與實(shí)現(xiàn)

一、 引言

隨著信息技術(shù)的不斷發(fā)展,計算機(jī)輔助辭書編纂已經(jīng)逐漸成為趨勢。辭書編纂系統(tǒng)可以提升辭書編纂效率,縮短辭書編纂周期,節(jié)約辭書編纂成本,提高辭書質(zhì)量。(張亞斌,趙勝男等2017)近些年來,許多機(jī)構(gòu)都研制了功能豐富的辭書編纂系統(tǒng),但是在有關(guān)漢字的處理上仍存在不少問題,不完全適應(yīng)漢語辭書的編纂需求。如華燁、李亮(2012)對IDM DPS、ABBYY Lingvo Content、TLex等幾款在國際上有影響的辭書輔助編纂系統(tǒng)進(jìn)行了對比,指出這些系統(tǒng)在漢字處理、漢字樣式設(shè)定、漢語界面支持、漢語有關(guān)自動化支持以及漢語語料庫支持等方面尚存在許多不足。張永偉(2020)也從漢字錄入、存儲與顯示,漢字樣式設(shè)置,漢語條目輔助注音,漢語條目自動排序,漢語條目內(nèi)容自動檢查等方面對比了TLex、FLEx、Termbases、DEBWrite、Léacslann等國外辭書編纂系統(tǒng),指出這些系統(tǒng)在漢字處理上存在不足。

為了輔助《現(xiàn)代漢語詞典》《新華字典》等系列語文辭書的編纂,中國社會科學(xué)院語言研究所研制了“人機(jī)交互式的漢語辭書編纂系統(tǒng)”(傅愛平,吳杰等2013),但是該系統(tǒng)研發(fā)時間較早,在兼容性、功能性、安全性等方面都需要進(jìn)一步改進(jìn)。為此,我們又重新研制了“面向語料庫機(jī)助辭書編纂系統(tǒng)”(Corpus-Oriented Computer-Assisted Lexicography,簡稱COCAL),期望COCAL能夠充分地利用各種語料庫、辭書庫和其他相關(guān)資源庫,輔助進(jìn)行各種漢語辭書的編纂。

二、 整體功能架構(gòu)設(shè)計

COCAL主要由后臺管理、前臺編纂以及公共應(yīng)用三個系統(tǒng)組成。其中,后臺管理系統(tǒng)包括辭書管理、資源管理、用戶管理、系統(tǒng)管理四個模塊,主要面向辭書管理人員(比如主編)、資源管理人員和系統(tǒng)管理人員。前臺編纂系統(tǒng)包括辭書編纂、語料庫檢索、辭書檢索、詞表檢索和在線資源檢索五個模塊,主要面向辭書編纂和審稿人員。公共應(yīng)用系統(tǒng)包括輸入助手、修改密碼、登錄/登出三個模塊,面向所有用戶。COCAL整體功能架構(gòu)設(shè)計框圖如圖1所示:

公共應(yīng)用系統(tǒng)中修改密碼、登錄/登出等是常見的功能,本文不詳細(xì)介紹。輸入助手是本系統(tǒng)實(shí)現(xiàn)的關(guān)鍵技術(shù)之一,本文將在第六部分介紹。為了更直接地展示系統(tǒng)實(shí)現(xiàn)結(jié)果,我們對重點(diǎn)功能給出了相應(yīng)的圖示。

三、 技術(shù)選型與數(shù)據(jù)庫實(shí)現(xiàn)

(一) 技術(shù)選型

COCAL使用了主流MVC[1]框架開發(fā),采用B/S(Browser-Server,瀏覽器服務(wù)器)體系架構(gòu)。用戶無需安裝任何軟件,僅通過瀏覽器就可以使用系統(tǒng)的全部功能。所有數(shù)據(jù)均保存在中心服務(wù)器中。

COCAL使用Java、FreeMarker、JavaScript、HTML等作為程序主要開發(fā)語言,使用CSS、Bootstrap、JQuery、Ajax等前端網(wǎng)頁樣式顯示和控制技術(shù)。COCAL使用的第三方開發(fā)框架主要有SpringMVC 模型視圖控制框架、Hibernate數(shù)據(jù)庫持久化框架、Apache Lucene全文索引工具包、Apache Shiro權(quán)限管理框架、FreeMarker頁面模板等。根據(jù)保存數(shù)據(jù)類型的不同,COCAL使用了兩種數(shù)據(jù)庫,分別是MySQL關(guān)系型數(shù)據(jù)庫和MongoDB文檔數(shù)據(jù)庫。

(二) 數(shù)據(jù)庫實(shí)現(xiàn)

COCAL管理的數(shù)據(jù)包括三種類型,分別存儲在不同數(shù)據(jù)庫中。詞表的詳細(xì)信息、條目編纂歷史、操作日志等數(shù)據(jù)量大、動態(tài)增長速度快、結(jié)構(gòu)復(fù)雜多變的數(shù)據(jù)保存在MongoDB文檔數(shù)據(jù)庫中;需要全文檢索高級查詢的數(shù)據(jù)經(jīng)過分詞等處理后保存在Lucene的索引中;其他數(shù)據(jù)保存在MySQL關(guān)系型數(shù)據(jù)庫中。MongDB具有更好的伸縮性和靈活性,適用于海量數(shù)據(jù)的管理;Lucene適用于全文檢索。

COCAL各類數(shù)據(jù)在不同數(shù)據(jù)庫中的存儲的情況如圖2所示:

四、 后臺管理系統(tǒng)的設(shè)計與實(shí)現(xiàn)

(一) 辭書管理

辭書管理模塊是后臺管理系統(tǒng)的重點(diǎn),涉及體例、條目與人員分組等管理要素,主要由辭書管理人員操作,具體包括以下6個子模塊:

1. 模板管理

模板管理子模塊管理辭書體例。它管理編寫辭書條目時需要填寫哪些內(nèi)容(例如詞目、拼音、釋義、配例等),這些內(nèi)容使用什么編輯器編輯,編纂人員編纂條目內(nèi)容時需要受到怎樣的約束限制以及條目內(nèi)容如何排版顯示等。每部辭書的體例不同,條目內(nèi)容和排版顯示均可能存在差異。條目編纂模板和內(nèi)容顯示模板均可以自定義,使得系統(tǒng)能夠用于編纂各種辭書,并且還能支持這些辭書的個性化內(nèi)容顯示。模板管理界面如圖3所示。

模板管理界面包括條目編輯器、條目編纂模板、內(nèi)容顯示預(yù)覽、內(nèi)容顯示模板等區(qū)域。其中條目編纂模板使用Json語言定義了條目編輯器包括哪些表單元素、表單元素如何排列、編纂人員編纂條目內(nèi)容時受到哪些約束限制等。COCAL自動解析條目編纂模板的內(nèi)容,生成條目編輯器。內(nèi)容顯示模板使用JavaScript語言定義了條目內(nèi)容應(yīng)如何排版顯示,JavaScript語言的靈活性決定了條目內(nèi)容可以被靈活地排版顯示。條目編輯器的輸出是Json格式(由Json語言定義)的條目,COCAL自動執(zhí)行內(nèi)容顯示模板定義的JavaScript語句,接受Json格式的條目作為輸入,輸出HTML格式或者純文本格式的條目內(nèi)容,最終顯示在內(nèi)容顯示預(yù)覽區(qū)。

不難看出,辭書管理人員需要根據(jù)辭書體例為新建的辭書項目設(shè)計條目編纂模板和內(nèi)容顯示模板,這雖然對辭書管理人員的操作提出了較高的要求,但也確保了COCAL具備足夠的靈活性。為了降低辭書管理人員設(shè)計模板時的難度,我們提供了豐富的參考示例。此外,辭書的條目編纂模板和內(nèi)容顯示模板一旦設(shè)計完畢,后期將無需再頻繁維護(hù),避免了辭書管理人員的持續(xù)投入。基于這樣的設(shè)計,COCAL不僅可以用于編纂漢語辭書,也可以用于編纂各種外語辭書,甚至多語辭書,具備極大的靈活性。

2. 分類管理

分類管理子模塊管理辭書條目的類別信息,為任務(wù)分工做準(zhǔn)備。類別是條目的靜態(tài)屬性,與辭書參編人員的分組一一對應(yīng)。辭書管理人員需事先定義辭書條目的類別。類別名稱和數(shù)量沒有限制,編纂過程中隨時可以進(jìn)行增刪和修改。比如條目可以分為“A—C母”“D—F母”等類別,也可以分為“語文”“哲社”“科技”等類別。在分類管理界面可以新增、查看、編輯、刪除、查詢條目類別信息。

3. 參編人員管理

參編人員管理子模塊管理辭書的編纂人員和審稿人員。辭書管理人員從系統(tǒng)注冊用戶列表中選取參與辭書編纂的工作人員。在參編人員管理界面可以添加、移除參編人員。

4. 收詞管理

收詞管理子模塊管理辭書收錄哪些條目,以及各屬于哪些類別。COCAL的條目來源有三種: 完全新增、從系統(tǒng)其他辭書條目中復(fù)制和從系統(tǒng)外導(dǎo)入。辭書管理人員通過收詞管理子模塊確定辭書收詞規(guī)模和范圍,為條目指定類別(分配分組)。收詞管理界面如圖4所示:

在收詞管理界面可以新增、編輯、復(fù)制、刪除、恢復(fù)、導(dǎo)入、導(dǎo)出(Word和XML兩種格式)、查詢條目,對條目進(jìn)行分類。為防止誤刪除,我們將刪除分為臨時刪除和永久刪除兩種,臨時刪除的條目可以恢復(fù),永久刪除的條目不可以。臨時刪除的條目依然對編纂人員可見,以文字增加刪除線的形式顯示。收詞管理界面新增、編輯的信息只包含詞目、拼音、分類等基本信息,條目詳細(xì)的釋義需要在前端編纂界面進(jìn)行編纂。

5. 分工管理

分工管理子模塊由人員分組和任務(wù)分工兩個更小的子模塊組成。辭書管理人員創(chuàng)建條目類別后,系統(tǒng)自動依據(jù)條目類別為參編人員創(chuàng)建同名分組,人員分組名稱和條目類別名稱一一對應(yīng)。在人員分組子模塊中,辭書管理人員可以添加組員,任命或解任組長。組長可以查看、編輯、審核、管理組員承擔(dān)的條目,同一個參編人員可以分屬不同分組,也可以同時作為多個分組的組長。人員分組界面如圖5所示:

在人員分組界面可以添加、移除每個分組的組員,指定、取消組長。任務(wù)分工子模塊主要用于為條目分配編纂人員。辭書管理人員可以為每個條目分配具體的編纂人員(我們稱之為分工),取消指定的編纂人員等。任務(wù)分工界面如圖6所示:

在任務(wù)分工界面選擇待分工條目后,點(diǎn)擊“分工”按鈕,在條目所屬分組的人員列表中選擇具體的參編人員即可實(shí)現(xiàn)條目的分工。條目分工后,辭書編纂人員可以在編纂時看到所分配的條目。

6. 統(tǒng)計

統(tǒng)計子模塊統(tǒng)計辭書各分組、參編人員、編纂進(jìn)度、編纂時長的詳細(xì)情況,以圖表形式直觀顯示,便于辭書管理人員隨時掌握辭書收詞的整體狀況、編纂進(jìn)度,各參編人員的工作狀況等信息。統(tǒng)計界面如圖7所示:

在統(tǒng)計界面,人員分組(條目分類)、參編人員、編纂進(jìn)度等作為過濾條件可以自由組合。比如,可以統(tǒng)計整部辭書各分組條目比例,統(tǒng)計某個編纂人員分配的不同條目類別比例,統(tǒng)計某個分組下成員們各自的編纂進(jìn)度,等等。

(二) 資源管理

COCAL的特色之一是集成了豐富的語言資源。資源管理模塊主要由資源管理人員操作,具體包括以下3個子模塊:

1. 語料庫管理

辭書編纂越來越離不開語料庫。資源管理人員可以通過語料庫管理子模塊管理辭書編纂時需要參考的文本語料庫,為編纂條目提供參考例句。語料庫管理界面如圖8所示:

在語料庫管理界面可以新增、編輯、刪除語料庫基本信息(包括語料庫的名稱、版本、來源等),用戶上傳語料后,單擊“重建索引”或“刪除索引”按鈕,為語料庫建立或者刪除索引。

2. 詞表管理

這里的詞表并非指詞目列表,而是指供辭書編纂?yún)⒖嫉陌ㄔ~目、拼音、釋文等內(nèi)容在內(nèi)的弱結(jié)構(gòu)化數(shù)據(jù)。之所以稱為詞表,是為了和利用COCAL系統(tǒng)編纂的辭書相區(qū)分。資源管理人員可以將需要參考的紙本辭書數(shù)字化,分離出詞目、拼音、釋文等內(nèi)容后,使用條目管理子模塊導(dǎo)入系統(tǒng),供編纂條目時參考使用。資源管理人員創(chuàng)建一個詞表后,可以進(jìn)入該詞表的條目管理界面,管理該詞表內(nèi)的條目。某詞表的條目管理界面如圖9所示:

在條目管理界面,可以新增、編輯、刪除和批量導(dǎo)入詞表條目。

3. 在線資源管理

辭書編纂需要參考許多互聯(lián)網(wǎng)資源,辭書編纂人員編纂條目時需要在不同的互聯(lián)網(wǎng)資源中反復(fù)切換和查詢,耗時耗力。資源管理人員可以在在線資源管理子模塊中添加在線資源,便于編纂人員在編纂條目時參考。在線資源管理界面如圖10所示:

在在線資源管理界面,可以添加、編輯、刪除在線資源。

(三) 賬號管理

賬號管理模塊包括權(quán)限管理、角色管理、用戶管理三個子模塊,主要由系統(tǒng)管理人員為不同角色的用戶分配權(quán)限。同一角色具有相同權(quán)限,每個角色可以擁有多個權(quán)限,每個用戶可以分屬不同角色。辭書管理人員、資源管理人員、系統(tǒng)管理人員、辭書編纂人員和審稿人員等都是系統(tǒng)內(nèi)置的角色,已經(jīng)為他們分配了相應(yīng)的權(quán)限。COCAL也支持添加新的角色,以及為角色指定不同的權(quán)限。權(quán)限、角色、用戶分離的設(shè)計既保證了系統(tǒng)功能分配的靈活性,又保證了系統(tǒng)的安全性。

(四) 系統(tǒng)管理

系統(tǒng)管理模塊包括日志管理、上傳文件管理等子模塊。其中,日志是用戶在系統(tǒng)中操作的記錄。系統(tǒng)管理員可以通過日志管理子模塊查詢自動保存的用戶操作記錄,通過上傳文件管理子模塊查看、刪除或者下載文件。由于系統(tǒng)管理模塊的各項功能較為常見,本文不展開介紹。

五、 前臺編纂系統(tǒng)的設(shè)計與實(shí)現(xiàn)

(一) 資源檢索

資源檢索模塊包括語料庫檢索、辭書庫檢索、詞表檢索和在線資源檢索四個子模塊。其中,語料庫檢索子模塊用于檢索文本語料庫中的例句,辭書庫檢索子模塊用于檢索系統(tǒng)內(nèi)在編或已經(jīng)編纂完成的辭書,詞表檢索子模塊用于檢索詞表中的條目,在線資源檢索子模塊用于檢索常用的互聯(lián)網(wǎng)資源。資源檢索模塊主要為辭書編纂人員編纂條目時提供參考,提高編纂效率。

(二) 辭書編纂

辭書編纂模塊是前臺編纂系統(tǒng)的重點(diǎn),主要包括條目列表和條目編纂兩個子模塊。用戶登錄前臺編纂系統(tǒng)后,首先看到的是待編辭書列表,列表中列出了所有分配了編纂任務(wù)的辭書,在辭書列表中選擇某一部辭書后,即可進(jìn)入條目列表界面。

1. 條目列表

條目列表子模塊顯示了所有分配的條目,編纂人員可以新增、刪除、恢復(fù)、編纂條目,優(yōu)化條目排序,統(tǒng)計個人編纂情況,批量保存、提交、審閱、退回條目等。其中,組長可以查看或編纂所有組員的條目。條目列表界面如圖11所示:

編纂人員可以在條目列表界面看到條目內(nèi)容、分類(分組)、進(jìn)程、版本等信息。單擊條目后面的“編纂”按鈕就可以進(jìn)入條目編纂界面。

2. 條目編纂

條目編纂子模塊是辭書編纂人員使用最多的功能,辭書編纂的主要工作就在條目編纂界面中完成。條目編纂界面分為條目列表區(qū)、預(yù)覽區(qū)、編纂?yún)^(qū)以及資料區(qū)四個區(qū)域。辭書編纂人員可以在條目列表區(qū)查看相關(guān)條目,在預(yù)覽區(qū)查看條目排版后的文本,在編纂?yún)^(qū)編纂條目內(nèi)容,在資料區(qū)查詢和瀏覽參考資料。

條目編纂進(jìn)度分為未編、待編、在編、完成、閱畢五種。未分配任務(wù)時,條目編纂進(jìn)度為未編;分配任務(wù)后,編纂進(jìn)度改為待編。在條目編纂界面,編纂人員可以保存、提交編纂結(jié)果,組長可以保存、提交、退回或閱畢編纂結(jié)果。編纂人員、組長均可編纂待編條目。條目編纂完成后保存,編纂進(jìn)度改為在編;編纂完成后提交,編纂進(jìn)度改為完成。組長審閱編纂進(jìn)度為完成的條目后,決定退回編纂人員或者認(rèn)可編纂結(jié)果并將其進(jìn)度標(biāo)記為閱畢。完成或閱畢的條目只有組長有權(quán)限再修改提交、退回或者閱畢。編纂人員可以繼續(xù)編纂被退回的條目,編纂完成后再次保存或提交,但不可以修改已經(jīng)被組長閱畢的條目。條目編纂界面如圖12所示:

條目列表區(qū)列出了與當(dāng)前條目相關(guān)的條目(比如相同字頭的條目),點(diǎn)擊某條目后即可進(jìn)入相應(yīng)條目的編纂界面。編纂?yún)^(qū)為條目編輯器,由后臺管理系統(tǒng)的條目編纂模板定義。預(yù)覽區(qū)中顯示的條目內(nèi)容由后臺管理系統(tǒng)的內(nèi)容顯示模板依據(jù)條目編輯器中的內(nèi)容自動生成。資料區(qū)除了語料庫檢索、辭書庫檢索、詞表檢索、在線資源檢索以外,還包括當(dāng)前條目的修改記錄。用戶編纂某個條目時,系統(tǒng)自動將詞目作為檢索詞在各個資源庫中搜索,并在資料區(qū)中顯示檢索結(jié)果,辭書編纂人員可以直接點(diǎn)擊查看。

此外,在條目編纂界面,COCAL還提供了許多便捷功能,比如可以快速進(jìn)入上一組或下一組條目(比如相同字頭條目或者同一個語義類的條目等)的編纂界面,對比條目內(nèi)容、恢復(fù)條目歷史版本、劃詞查詢當(dāng)前辭書是否收錄該詞目等,這些都是COCAL在使用過程中由編纂人員建議增加的實(shí)用功能。

六、 公共應(yīng)用功能的設(shè)計與實(shí)現(xiàn)

公共應(yīng)用功能包括輸入助手、修改密碼、登錄/登出等功能。修改密碼、登錄/登出是常見功能,本文不展開介紹。輸入助手用于查詢、輸入缺字,是COCAL的特色功能,也是漢語辭書編纂系統(tǒng)的一個難點(diǎn)。

缺字(又稱外字)包括Unicode標(biāo)準(zhǔn)已編碼但尚無字體字模支持的漢字以及Unicode標(biāo)準(zhǔn)尚未編碼的漢字。國外辭書編纂系統(tǒng)和一些國內(nèi)辭書編纂系統(tǒng)對缺字的支持不夠友好(張永偉2020),COCAL解決了這個問題,能夠支持全部漢字的處理。

缺字的基本信息包括編碼、拼音、筆順、筆畫數(shù)、字形圖片等。這些信息是普通語文辭書條目排序需要的基本信息,也是查找缺字所需要的基礎(chǔ)信息。COCAL支持缺字的新增、編輯、刪除、查詢,還會將字形圖片自動轉(zhuǎn)換為SVG和WOFF字體格式[2]。此外,COCAL還研制了輸入助手,用于查詢和輸入缺字。輸入助手輸入、顯示缺字的原理是: (1) 自動記錄光標(biāo)在系統(tǒng)表單中的位置,在輸入助手中選擇某個缺字后,將缺字信息(“+缺字編碼+”形式)填入相應(yīng)位置;(2) 識別所有頁面中“+缺字編碼+”形式的符號串,根據(jù)不同頁面的需要,自動將其替換為名為@font-face的CSS@規(guī)則[3]或者缺字字形圖片。

COCAL界面右側(cè)始終顯示“輸入助手”按鈕,單擊后打開或關(guān)閉輸入助手。錄入缺字信息后,所有用戶均可以隨時通過輸入助手查詢、輸入缺字。目前,輸入助手支持筆畫數(shù)查詢和拼音查詢兩種查詢方式。輸入助手的拼音查詢界面如圖13所示。

七、 結(jié)語

COCAL提供豐富的語料庫資源,支持協(xié)同編纂各種漢語辭書,提升了辭書編纂效率,提高了辭書質(zhì)量,初步達(dá)到了研發(fā)目的。但是COCAL仍有許多地方需要改進(jìn)。

首先,COCAL主要是為編纂原創(chuàng)辭書研發(fā),注重“編”而未強(qiáng)調(diào)“查”,COCAL對有相同或類似特征的條目進(jìn)行有針對性的專項核查尚存在改進(jìn)空間。其次,COCAL只支持文本語料庫查詢,提供例句,但未利用自然語言處理技術(shù)充分挖掘語料,提供諸如詞頻表、搭配列表、語塊列表等功能。最后,人工智能技術(shù)已經(jīng)同許多領(lǐng)域結(jié)合,產(chǎn)生了革命性的智能產(chǎn)品和服務(wù),但在包括COCAL在內(nèi)的辭書編纂系統(tǒng)中的應(yīng)用相對滯后。利用人工智能技術(shù)可以進(jìn)行義項的自動劃分,“舊詞新義”的自動發(fā)現(xiàn),例句的輔助生成,條目內(nèi)容自動檢查等。在辭書編纂時集成這些人工智能技術(shù)將是COCAL下一階段的目標(biāo)。

附 注

[1]MVC是Model View Controller的縮寫,是一種經(jīng)典且實(shí)用的軟件開發(fā)框架模式。

[2]之所以選擇SVG和WOFF這兩種字體格式,是因?yàn)樗鼈兛梢员唤^大多數(shù)瀏覽器支持,具有更好的兼容性。

[3]CSS的@font-face規(guī)則允許網(wǎng)頁開發(fā)者為其網(wǎng)頁指定自定義的在線字體。

參考文獻(xiàn)

1. 傅愛平,吳杰,張弘,等.人機(jī)交互式的漢語辭書編纂系統(tǒng).辭書研究,2013(6).

2. 華燁,李亮.國際計算機(jī)輔助詞典編纂系統(tǒng)管窺.辭書研究,2012(5).

3. 陸汝占.漢語詞典編纂一體化環(huán)境(上).辭書研究,2000a(2).

4. 陸汝占.漢語詞典編纂一體化環(huán)境(下).辭書研究,2000b(3).

5. 張亞斌,趙勝男,何朝輝,等.數(shù)字化辭書協(xié)同編纂系統(tǒng)的設(shè)計.辭書研究,2017(6).

6. 張永偉. 辭書編纂系統(tǒng)的漢字處理: 挑戰(zhàn)與解決方案.辭書研究,2020(1).

(張永偉 顧曰國 胡欽諳 中國社會科學(xué)院語言研究所/

辭書編纂研究中心 北京 100732)

(顧曰國 曹新龍 中國多語言多模態(tài)語料庫暨

大數(shù)據(jù)研究中心 北京 100089)

(責(zé)任編輯 馬 沙)

猜你喜歡
設(shè)計與實(shí)現(xiàn)語料庫
《語料庫翻譯文體學(xué)》評介
基于語料庫“隱秘”的詞類標(biāo)注初步探究
配調(diào)一體配網(wǎng)自動化系統(tǒng)的設(shè)計與實(shí)現(xiàn)
校園電商平臺的設(shè)計與實(shí)現(xiàn)
高校文化建設(shè)中視覺識別系統(tǒng)的設(shè)計和實(shí)現(xiàn)
科研院所科研信息化管理系統(tǒng)的設(shè)計與應(yīng)用
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
基于網(wǎng)絡(luò)語料庫的“給力”研究
語料庫語言學(xué)未來發(fā)展趨勢
凤城市| 政和县| 鲁甸县| 德昌县| 花垣县| 临海市| 太白县| 新巴尔虎左旗| 方正县| 施甸县| 阿城市| 松阳县| 惠州市| 永昌县| 包头市| 松原市| 灵璧县| 建宁县| 鹤岗市| 香河县| 尼玛县| 周至县| 钦州市| 舞钢市| 宣恩县| 峡江县| 沛县| 凤阳县| 云南省| 乌拉特前旗| 黄浦区| 嘉峪关市| 嘉鱼县| 汉阴县| 沧州市| 尤溪县| 汕头市| 酒泉市| 新源县| 双柏县| 鹿邑县|