国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字化辭書協(xié)同編纂系統(tǒng)的設(shè)計(jì)

2017-11-28 15:32張亞斌趙勝男
辭書研究 2017年6期
關(guān)鍵詞:辭書條目關(guān)聯(lián)

張亞斌 趙勝男

摘要數(shù)字化辭書協(xié)同編纂系統(tǒng)是一個(gè)集數(shù)字化編輯加工、內(nèi)容資源管理、內(nèi)容資源修訂為一體的數(shù)字編纂平臺(tái)。該系統(tǒng)基于數(shù)字化業(yè)務(wù)流程對(duì)辭書的內(nèi)容編輯和生產(chǎn)流程進(jìn)行改造,充分利用全媒體語料庫,采用基于XML的在線編排技術(shù),實(shí)現(xiàn)內(nèi)容的協(xié)同創(chuàng)作和審校,可使編輯人員擺脫大量機(jī)械性的工作,集中精力于智力創(chuàng)造工作,并在實(shí)際應(yīng)用與逐步發(fā)展中充分利用已有出版資源,避免重復(fù)工作,提高工作效率,加快生產(chǎn)速度,節(jié)省成本。

關(guān)鍵詞協(xié)同編纂辭書語料庫流程管理輔助編纂

一、 引言

數(shù)字化辭書協(xié)同編纂系統(tǒng)是面向作者和編輯的內(nèi)容生產(chǎn)創(chuàng)作平臺(tái),實(shí)現(xiàn)結(jié)構(gòu)化內(nèi)容的編纂、審校、管理和動(dòng)態(tài)出版等全流程的數(shù)字化內(nèi)容采編和辭書生產(chǎn)。協(xié)同編纂系統(tǒng)可以提升出版業(yè)務(wù)水平和生產(chǎn)能力、縮短辭書出版的周期、減少成本、節(jié)省人力資源。同時(shí),在數(shù)字化、碎片化的基礎(chǔ)上深度挖掘知識(shí)元,建設(shè)語料庫,能夠在實(shí)際應(yīng)用與逐步發(fā)展中充分利用已有出版資源,避免重復(fù)工作,使出版社從傳統(tǒng)的資源提供商向知識(shí)服務(wù)商轉(zhuǎn)變,實(shí)現(xiàn)資源和知識(shí)的增值。

二、 概述

數(shù)字化辭書協(xié)同編纂系統(tǒng)的最重要目的是為辭書的編寫做技術(shù)支撐。因此系統(tǒng)建設(shè)包含以下幾個(gè)目標(biāo):

第一,設(shè)有協(xié)同編撰系統(tǒng),為作者、編輯、設(shè)計(jì)和審核專家提供一個(gè)多人協(xié)同編輯、編排、批注、審核的工作環(huán)境,實(shí)現(xiàn)辭書生產(chǎn)精神勞動(dòng)階段的全面數(shù)字化轉(zhuǎn)型升級(jí)。

第二,構(gòu)建辭書編纂平臺(tái)系列標(biāo)準(zhǔn),主要包括為編纂工作構(gòu)建條目元數(shù)據(jù)標(biāo)準(zhǔn)、XML格式標(biāo)準(zhǔn)、內(nèi)容標(biāo)引規(guī)范、知識(shí)描述體系標(biāo)準(zhǔn)、元數(shù)據(jù)應(yīng)用規(guī)范,以及為編輯流程中的各項(xiàng)工作設(shè)定相應(yīng)的各種規(guī)范。

第三,建設(shè)辭書語料庫,直接支持協(xié)同編纂過程中的查詢、引用,并及時(shí)回收資料素材和新版辭書資源及其元數(shù)據(jù)。

第四,建設(shè)專項(xiàng)檢查工具集,最大限度地減少編纂活動(dòng)的機(jī)械性工作量,利用計(jì)算機(jī)的運(yùn)算能力,最大限度地提高所編纂辭書的質(zhì)量。

為實(shí)現(xiàn)上述目標(biāo),辭書協(xié)同編纂系統(tǒng)平臺(tái)主要包含內(nèi)容創(chuàng)作編輯子系統(tǒng)、自動(dòng)化流程管理子系統(tǒng)、全媒體語料庫管理子系統(tǒng)、輔助編輯工具。它的主要框架結(jié)構(gòu)如圖1所示:

從圖1可見,辭書協(xié)同編纂系統(tǒng)從內(nèi)容資源、工作流程和工作方式等方面為辭書的編纂出版實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型做好了充分的準(zhǔn)備。

三、 內(nèi)容創(chuàng)作編輯子系統(tǒng)

內(nèi)容創(chuàng)作編輯子系統(tǒng)是最為核心的子系統(tǒng),主要面向辭書內(nèi)容生產(chǎn)業(yè)務(wù)。整個(gè)子系統(tǒng)由全數(shù)字化的生產(chǎn)流程組成,基于XML元數(shù)據(jù)標(biāo)準(zhǔn)通過在線或離線方式完成辭書稿件,在平臺(tái)上完成審稿、編輯加工、審定發(fā)稿流程,并進(jìn)行結(jié)構(gòu)化、碎片化加工處理,然后輸出版式文件對(duì)接印刷型辭書生產(chǎn),再輸出文件到內(nèi)容管理平臺(tái)統(tǒng)一存儲(chǔ)和管理,為辭書的數(shù)字出版服務(wù)。其核心功能以業(yè)務(wù)流程為主線將各個(gè)功能模塊組合,各個(gè)功能模塊之間相互協(xié)同和通信,完成一部辭書的內(nèi)容生產(chǎn)過程。整個(gè)平臺(tái)有一個(gè)集中工作平臺(tái),其示意界面如圖2所示:

(一) 協(xié)同編輯

協(xié)同編輯是本子系統(tǒng)的核心功能模塊,主要供多個(gè)作者進(jìn)行協(xié)同創(chuàng)作和編輯人員處理稿件內(nèi)容。編輯在選題立項(xiàng)后,首先是按選題策劃報(bào)告的設(shè)想聯(lián)系辭書主編,進(jìn)行組稿。在主編提出辭書的詞目單(或編纂方案)并經(jīng)出版社審核通過后,編輯會(huì)同主編選擇具體的撰稿作者,給各名作者分配編寫任務(wù)。

作者可以登錄平臺(tái)在線編寫條目;也可以離線利用格式模板文件按固定的格式寫好稿件,再上傳到系統(tǒng)。

1. 在線編寫

作者登錄系統(tǒng)以后進(jìn)入個(gè)人工作界面,可以看到自己參與的選題列表。選擇其中一個(gè)進(jìn)入編輯界面后,系統(tǒng)自動(dòng)顯示分配的任務(wù)目錄(詞目單)列表,作者選擇詞目進(jìn)行在線編寫或修改。系統(tǒng)按段落編輯內(nèi)容,支持圖片、視頻等內(nèi)容的插入。

作者在線編寫條目的過程中,系統(tǒng)可以適當(dāng)開放出版社已有的內(nèi)容資源庫,包括圖片庫、視頻庫和已有辭書條目庫,供作者參考、借鑒和引用。

2. 離線編寫

離線編寫時(shí),作者可以先從平臺(tái)上下載一個(gè)已經(jīng)根據(jù)XML結(jié)構(gòu)預(yù)設(shè)了部分內(nèi)容域的模板。利用此模板,作者可直接在與Word軟件類似的編輯界面上編寫條目內(nèi)容。完成編寫的稿件上傳到系統(tǒng)中后,系統(tǒng)會(huì)根據(jù)標(biāo)注內(nèi)容自動(dòng)對(duì)稿件進(jìn)行解析,生成半結(jié)構(gòu)化的XML文檔。

(二) 進(jìn)度管理

進(jìn)度管理主要是以項(xiàng)目管理的理念和方式對(duì)各個(gè)選題作者的創(chuàng)作過程和編輯工作過程進(jìn)行全程監(jiān)控和管理。責(zé)任編輯和出版社管理人員可以按書名、作者、時(shí)間多個(gè)維度實(shí)時(shí)查看各個(gè)選題的總體進(jìn)展及各個(gè)作者的寫作進(jìn)度,查看他們完成的詞條數(shù)量及其字?jǐn)?shù)。系統(tǒng)能夠?qū)M(jìn)度滯后的項(xiàng)目進(jìn)行自動(dòng)提示,并向相關(guān)作者發(fā)出提醒消息,督促按時(shí)完成編寫任務(wù)。

(三) 合稿管理

合稿管理是把所有作者編寫好的條目匯總組合起來,生成統(tǒng)一的初稿,提請(qǐng)主編審核、統(tǒng)稿、修改。

如果作者都是在線編寫,則條目已經(jīng)XML化,所以合稿時(shí)系統(tǒng)會(huì)根據(jù)模板自動(dòng)生成固定格式的全書條目稿件,并輸出為PDF文檔或者Word文檔,也可以用網(wǎng)頁的形式輸出。

作者離線用前述模板文件編寫的條目,以用XML表示的內(nèi)容單元存在。合稿時(shí),系統(tǒng)先根據(jù)內(nèi)容單元的從屬關(guān)系,自動(dòng)合并生成完整的XML格式的條目稿件,然后再組合成全書稿件。如果作者上傳的稿件并非用前述模板文件編寫,則需要先對(duì)稿件文檔進(jìn)行預(yù)處理,識(shí)別格式并從中抽取相關(guān)內(nèi)容保存成XML文檔,再由系統(tǒng)組合。

(四) 內(nèi)容審校

內(nèi)容審校模塊包含眾多子功能,用于對(duì)作者全部完成(即主編也已經(jīng)審核過)的稿件進(jìn)行在線審校。各級(jí)審稿人員填寫的審稿意見都在線保存,后一級(jí)審稿人員可以查看前面各級(jí)審稿意見。

責(zé)任編輯進(jìn)行初審時(shí),可以先調(diào)用自動(dòng)校對(duì)模塊對(duì)稿件進(jìn)行一次類似通讀校對(duì)的校訂。該模塊基于海量的專業(yè)詞典、錯(cuò)別字知識(shí)庫和詞語搭配知識(shí)庫,對(duì)稿件進(jìn)行全面掃描后,將發(fā)現(xiàn)的語言文字性錯(cuò)誤按性質(zhì)以不同的顏色顯示,有助于編輯改正語言文字方面的簡單差錯(cuò),從而節(jié)省大量的時(shí)間。責(zé)任編輯按照稿件初審的規(guī)范要求,通讀審核條目內(nèi)容和體例后,再提交復(fù)審和終審。每一級(jí)審核人員對(duì)不合格的內(nèi)容和體例都可以做出批注,甚至予以退稿。責(zé)任編輯根據(jù)終審意見進(jìn)行處理: 凡是做退稿處理的稿件,聯(lián)系辭書主編告知審稿意見,并在系統(tǒng)中進(jìn)行撤銷選題的操作;需要退修的稿件,告知修改意見或建議,請(qǐng)主編進(jìn)行相應(yīng)處理后,重新進(jìn)入審稿流程;對(duì)經(jīng)審稿同意出版的稿件,則進(jìn)行編輯加工整理。完成編輯加工整理的稿件,再次提交復(fù)審者審核通過后,就可進(jìn)入發(fā)稿程序。endprint

(五) 稿件管理

稿件管理模塊主要是對(duì)選題的稿件內(nèi)容進(jìn)行管理和維護(hù)。包括兩個(gè)方面,其一是對(duì)不同階段和不同版本的稿件進(jìn)行管理和維護(hù),其二是對(duì)提交正式出版的最終版本稿件的XML內(nèi)容進(jìn)行管理。

作者每次提交稿件,系統(tǒng)就會(huì)自動(dòng)根據(jù)日期生成一個(gè)新版本,并按時(shí)間先后順序?qū)⒏鱾€(gè)版本的稿件關(guān)聯(lián),方便作者和責(zé)任編輯進(jìn)行查看和管理。

責(zé)任編輯可以管理自己負(fù)責(zé)的所有選題,對(duì)各個(gè)選題的稿件內(nèi)容進(jìn)行更新和修改。社領(lǐng)導(dǎo)可以查看所有的選題稿件,可以查看不同版本的稿件,但對(duì)稿件對(duì)象和內(nèi)容不能維護(hù)和管理。

(六) 發(fā)稿管理

發(fā)稿管理模塊是對(duì)完成編輯加工并經(jīng)過復(fù)審以后的稿件進(jìn)行最終的內(nèi)容審核。發(fā)稿一般是由總編或者社長一級(jí)的出版社領(lǐng)導(dǎo)來操作,具體由哪個(gè)人員執(zhí)行,由后臺(tái)的流程配置來設(shè)定。

發(fā)稿模塊會(huì)形成一個(gè)稿件生產(chǎn)報(bào)告,展示整個(gè)編輯過程的相關(guān)統(tǒng)計(jì)數(shù)據(jù),列出所有的稿件版本和各級(jí)審稿人員的審稿報(bào)告等,方便發(fā)稿人員對(duì)選題稿件有全面、詳細(xì)的了解。

四、 全媒體語料庫管理子系統(tǒng)

全媒體語料庫是數(shù)字化辭書協(xié)同編纂系統(tǒng)的資源基礎(chǔ),直接支持協(xié)同編輯平臺(tái)從中取用各種資源,并直接回收素材和資源及它們的元數(shù)據(jù),進(jìn)行有效管理和維護(hù)。其中的原始資源庫包括排版文件、圖片、書目、光盤數(shù)據(jù)、音頻、視頻、其他文件等。

全媒體語料庫管理子系統(tǒng)可以有效收集、管理原始數(shù)據(jù),還可根據(jù)不斷更新的應(yīng)用需求將加工好的成品數(shù)據(jù)分類歸檔,以方便日后更多應(yīng)用。其主要特點(diǎn)包括:

1. 建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),實(shí)現(xiàn)建庫、信息發(fā)布、元數(shù)據(jù)管理、多庫統(tǒng)一檢索等功能。利用該管理系統(tǒng),可將各種來源的文本、圖片、視頻、音頻等不同媒體的信息從原始資源中分離出來,并統(tǒng)一保存到相應(yīng)類型的核心資源數(shù)據(jù)庫中。

2. 借助建成的核心資源數(shù)據(jù)庫對(duì)所有的數(shù)字資源進(jìn)行管理,實(shí)現(xiàn)查詢和統(tǒng)計(jì)。

3. 利用自然語言理解技術(shù)與人工智能技術(shù)為各種數(shù)據(jù)設(shè)置合理的索引方式,使用戶可以方便、快捷地在資源利用階段對(duì)數(shù)字資源進(jìn)行檢索和利用。

(一) 字庫管理模塊

字庫管理模塊由三部分組成——由多種規(guī)格和字體的標(biāo)準(zhǔn)字庫構(gòu)成的字庫群,與系統(tǒng)字庫結(jié)構(gòu)相適應(yīng)的取字模程序和字模變換程序。

字庫是漢字信息處理系統(tǒng)的重要組成部分,直接關(guān)系到漢字信息處理系統(tǒng)的性能。字庫管理子系統(tǒng)面向程序員的接口功能是根據(jù)機(jī)內(nèi)碼、字體要求和字形要求把相應(yīng)的字模信息送到指定的緩沖區(qū)。

(二) XML資源管理模塊

XML資源管理模塊主要對(duì)庫中以XML文件格式儲(chǔ)存的各種資源進(jìn)行管理,具有多方面的功能。

1. XML存儲(chǔ)

高性能地存儲(chǔ)XML文檔及片段數(shù)據(jù)。通過精巧的存儲(chǔ)模式設(shè)計(jì)及壓縮技術(shù)等實(shí)現(xiàn)對(duì)XML數(shù)據(jù)的原生、高效存儲(chǔ)。

2. XML驗(yàn)證

在XML數(shù)據(jù)錄入、更新,或者發(fā)出驗(yàn)證請(qǐng)求時(shí),可以根據(jù)綁定的模式數(shù)據(jù),對(duì)XML數(shù)據(jù)的合法性、完整性等數(shù)據(jù)語義信息進(jìn)行驗(yàn)證。

3. XML索引

針對(duì)不同的應(yīng)用需求和數(shù)據(jù)特點(diǎn),為XML數(shù)據(jù)構(gòu)建各種索引,包括基于數(shù)據(jù)內(nèi)容的、基于數(shù)據(jù)結(jié)構(gòu)的、面向全文的,等等。

4. XML查詢

兼容標(biāo)準(zhǔn)化的XML查詢語言,即XPath和XQuery,并針對(duì)具體業(yè)務(wù)需求提供個(gè)性化的擴(kuò)展支持。

5. XML數(shù)據(jù)支持

XML可定義自我描述的文檔架構(gòu),并且有RDF、XQL、DOM等附加標(biāo)準(zhǔn)的支持,通過XML可以實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫之間的相互操作,并可保持原有數(shù)據(jù)庫的獨(dú)立性。

6. XML備份與恢復(fù)

提供對(duì)數(shù)據(jù)的備份與恢復(fù)的完整解決方案,確保數(shù)據(jù)的安全與穩(wěn)定。

7. XML安全管理

通過使用數(shù)據(jù)加密技術(shù)、基于角色的訪問控制技術(shù)等,全方位地保護(hù)數(shù)據(jù)安全。

(三) 條目關(guān)聯(lián)模塊

條目關(guān)聯(lián)模塊主要以關(guān)聯(lián)挖掘技術(shù)為核心,對(duì)采集到的條目元數(shù)據(jù)進(jìn)行全面的智能分析和挖掘處理,揭示各條目信息之間、各知識(shí)元之間的顯式關(guān)聯(lián)關(guān)系和隱性關(guān)聯(lián)關(guān)系,從而高效地進(jìn)行條目的自動(dòng)標(biāo)引、關(guān)聯(lián)與比較,并進(jìn)行上下文分析,構(gòu)建辭書各個(gè)版本之間的比對(duì)。同時(shí)對(duì)用戶的訪問日志進(jìn)行挖掘分析,從而更好地為用戶提供主動(dòng)推送和精確檢索等信息服務(wù)。

1. 與歷版辭書條目的關(guān)聯(lián)

依照通用關(guān)聯(lián)規(guī)則進(jìn)行分析后,從歷版辭書數(shù)據(jù)庫中調(diào)取相同或者相似的資源,供條目編寫人員或編輯加工人員參考、借鑒。

2. 與網(wǎng)絡(luò)百科條目的關(guān)聯(lián)

依照通用關(guān)聯(lián)規(guī)則進(jìn)行分析后,自動(dòng)對(duì)網(wǎng)絡(luò)上的維基百科、百度百科、互動(dòng)百科等網(wǎng)絡(luò)資源進(jìn)行搜索,提取相同或相似的內(nèi)容信息資源,供條目編寫人員或編輯加工人員參考、借鑒。

3. 關(guān)聯(lián)挖掘

通用關(guān)聯(lián)規(guī)則分析能夠深入挖掘知識(shí),有效地發(fā)現(xiàn)大量數(shù)據(jù)間的隱匿狀關(guān)聯(lián)關(guān)系。應(yīng)用支持海量數(shù)據(jù)的關(guān)聯(lián)規(guī)則分析,系統(tǒng)可以完成以下幾個(gè)方面的關(guān)聯(lián)分析,以向編輯提示條目之間的內(nèi)容交叉關(guān)系:

(1) 關(guān)鍵詞關(guān)聯(lián)分析。通過挖掘分析關(guān)鍵詞的同現(xiàn)關(guān)系和權(quán)重,挖掘出各個(gè)關(guān)鍵詞之間的聯(lián)系,從而通過關(guān)鍵詞對(duì)標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行導(dǎo)航。

(2) 詞條之間建立關(guān)聯(lián)。在不同條目之間根據(jù)內(nèi)容相關(guān)度、關(guān)鍵詞(主題詞)等建立關(guān)聯(lián)。

(3) 上下文關(guān)聯(lián)分析。提取辭書中的重復(fù)字串,并進(jìn)行上下文分析,充分考慮同音、缺詞、別字等,過濾掉常用高頻的詞匯,保留不常用的詞匯,然后比較這些字串的上下文,篩選出互相矛盾的地方供人工判斷。

4. 內(nèi)容揭示

內(nèi)容揭示是在內(nèi)容碎片化、關(guān)聯(lián)挖掘的基礎(chǔ)上,在條目內(nèi)容單元上建立網(wǎng)狀的關(guān)系,進(jìn)一步揭示內(nèi)容單元之間的關(guān)系,建立多維度的知識(shí)網(wǎng)絡(luò)。endprint

五、 自動(dòng)化流程管理子系統(tǒng)

自動(dòng)化流程管理子系統(tǒng)為適應(yīng)不同種類書刊在編輯生產(chǎn)過程中的業(yè)務(wù)多樣性需求而提供靈活定制的功能。系統(tǒng)將各項(xiàng)業(yè)務(wù)拆分成最小的獨(dú)立單元,結(jié)構(gòu)性強(qiáng),性能穩(wěn)定,用戶可自由設(shè)置業(yè)務(wù)模式、業(yè)務(wù)環(huán)節(jié)和任務(wù)功能。

用戶首先需要按照業(yè)務(wù)類型新建一個(gè)流程或者編輯已有的一個(gè)流程。創(chuàng)建新流程以后,配置流程的各個(gè)階段,并對(duì)各個(gè)階段從流程節(jié)點(diǎn)庫中選擇節(jié)點(diǎn)進(jìn)行配置,再配置節(jié)點(diǎn)提交的表單信息,并分配操作人員權(quán)限。

業(yè)務(wù)流程創(chuàng)建之后,系統(tǒng)通過業(yè)務(wù)流引擎的運(yùn)用,按流程分別對(duì)各個(gè)業(yè)務(wù)項(xiàng)目實(shí)時(shí)監(jiān)控,關(guān)注每個(gè)任務(wù)所處節(jié)點(diǎn)及其狀態(tài),查看每個(gè)節(jié)點(diǎn)上操作者的操作過程信息,分節(jié)點(diǎn)進(jìn)行統(tǒng)計(jì),并提示出現(xiàn)問題的相關(guān)環(huán)節(jié),幫助管理者及時(shí)發(fā)現(xiàn)問題,解決問題。

監(jiān)控模塊還為其他業(yè)務(wù)系統(tǒng)提供接口,其他系統(tǒng)可以方便地查詢到流程狀態(tài)和各個(gè)節(jié)點(diǎn)上的過程信息。如在協(xié)同編纂過程中,責(zé)任編輯調(diào)用此功能模塊就可以看到如圖3所示的數(shù)據(jù),以方便監(jiān)控選題的進(jìn)度。

流程管理中涉及的節(jié)點(diǎn)管理、表單管理、角色管理等功能,系統(tǒng)都設(shè)有專門的模塊予以實(shí)現(xiàn)。這里就不展開細(xì)述了。

六、 輔助編纂工具集

輔助編纂工具集中集成參見條目檢查工具、成套條目檢查工具、明暗重復(fù)條目檢查工具、專項(xiàng)檢查工具、規(guī)范性檢查工具、詞目比較工具、統(tǒng)計(jì)工具、索引制作工具等一系列工具軟件,輔助作者和編輯進(jìn)行辭書的編纂。

(一) 參見條目檢查工具

設(shè)置參見系統(tǒng)是辭書編纂中的一個(gè)重要環(huán)節(jié)。辭書要在異名同實(shí)條目之間、上下層次條目之間、成套條目之間、意義相近或相關(guān)條目之間建立參見關(guān)系。這項(xiàng)工作在辭書編寫階段實(shí)施,責(zé)任編輯需要對(duì)參見系統(tǒng)的設(shè)置進(jìn)行復(fù)核、檢查。參見條目檢查工具主要幫助檢查被參見條目是否存在、所使用的參見標(biāo)記是否符合體例統(tǒng)一規(guī)定。發(fā)現(xiàn)問題及時(shí)提請(qǐng)作者或編輯進(jìn)行處理。

(二) 成套條目檢查工具

成套條目檢查工具主要針對(duì)一個(gè)學(xué)科或者具體某個(gè)學(xué)科方向的一整套條目,檢查其中是否有重復(fù)或遺漏,是否設(shè)置了必要的參見,體例與表述形式是否相對(duì)一致等。

系統(tǒng)建立成套詞語表,用戶可以直接在成套詞語表中填充、刪除和修改;還提供在線檢索功能和在線瀏覽功能,用戶可以在線瀏覽,建立詞語知識(shí)體系。

(三) 明暗重復(fù)條目檢查工具

對(duì)同名同實(shí)的明交叉條目,在條目稿件集中拼合后,系統(tǒng)就可以很方便地進(jìn)行處理,做出標(biāo)記,提請(qǐng)主編或責(zé)任編輯解決。

對(duì)異名同實(shí)的暗交叉條目,處理的難度較大。系統(tǒng)利用前述關(guān)聯(lián)挖掘技術(shù),對(duì)條目釋文內(nèi)容進(jìn)行與其他條目釋文的比對(duì)分析,找出疑似暗交叉的條目,提請(qǐng)編輯核實(shí)處理。

(四) 專項(xiàng)檢查工具

專項(xiàng)檢查工具用于對(duì)辭書中涉及的歷史紀(jì)年、古今地名、外國地名、機(jī)構(gòu)名稱等進(jìn)行檢查。

系統(tǒng)設(shè)有各種專門詞語的標(biāo)準(zhǔn)數(shù)據(jù)庫。專項(xiàng)檢查工具可從條目中提取需核查的詞語與數(shù)據(jù)庫中的記錄比對(duì),將不匹配的條目提取出來,提請(qǐng)編輯進(jìn)一步核實(shí)。經(jīng)編輯確認(rèn)后自動(dòng)按數(shù)據(jù)庫中的正確詞語修改條目。

專項(xiàng)檢查工具可以將拼音、外文、圖片等相關(guān)數(shù)據(jù)臨時(shí)組合在一起,以便檢查。

(五) 規(guī)范性檢查工具

規(guī)范性檢查工具主要用于檢查異形詞(包括普通語詞中的異形詞和科技名詞的異形詞)。將異形詞與對(duì)應(yīng)的規(guī)范詞語存儲(chǔ)在規(guī)范數(shù)據(jù)庫(該數(shù)據(jù)庫是開放性的,允許用戶在使用過程中不斷增加新的數(shù)據(jù))中,規(guī)范性檢查工具對(duì)條目釋文進(jìn)行檢查,把其中疑似異形詞的詞語搜找出來,提請(qǐng)編輯處理。編輯確認(rèn)必須修改的,系統(tǒng)能自動(dòng)根據(jù)規(guī)范數(shù)據(jù)庫中的記錄把異形詞更改成規(guī)范詞。

(六) 條目比較工具

條目比較工具的功能主要是將兩套或多套條目進(jìn)行相互比較。系統(tǒng)在需要進(jìn)行比較的那套條目中,逐條按詞目直接調(diào)取本辭書前幾個(gè)版本中或者其他類似辭書中的多個(gè)相應(yīng)條目的內(nèi)容,直觀地展示在界面上,方便編輯進(jìn)行內(nèi)容的對(duì)比和修改。

(七) 索引制作工具

系統(tǒng)提供的索引制作工具,能夠按照音序、部首序、筆畫序、四角號(hào)碼序和義序等制作相應(yīng)的索引。前四種順序的索引,依照相應(yīng)的漢字定序方法設(shè)置有不同的索引模板,而義序索引需要事先依照知識(shí)體系建立意義分類表。

系統(tǒng)同時(shí)提供索引的編輯工具,編輯人員可以方便地按照不同情況設(shè)置不同的索引規(guī)則和索引符號(hào)。

辭書的編纂是一項(xiàng)耗費(fèi)大量人力和物力的工作,計(jì)算機(jī)和信息技術(shù)在辭書編纂上的應(yīng)用可為辭書出版提供一個(gè)新的平臺(tái),實(shí)現(xiàn)工具書全產(chǎn)業(yè)鏈的數(shù)字化改造。借助計(jì)算機(jī)處理速度快、存儲(chǔ)容量大、檢索能力強(qiáng)的優(yōu)勢(shì),編輯人員得以擺脫了大量繁瑣的機(jī)械性工作困擾,提高工作效率,從而為編輯人員贏得了更多的時(shí)間從事智力創(chuàng)意性的工作。

參考文獻(xiàn)

1. 李黎.參見系統(tǒng)的專項(xiàng)檢查——以《辭海》(第六版)科技條目為例.//上海市辭書學(xué)會(huì)秘書處編.辭書論集(二).上海: 辭書出版社,2012.

2. 李宇明.關(guān)于辭書現(xiàn)代化的思考.//曹右琦,孫茂松主編.中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集.北京: 清華大學(xué)出版社,2006.

3. 楊季文,呂強(qiáng),朱巧明.字庫管理子系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).中文信息,1995(2).

4. 張國強(qiáng).數(shù)據(jù)庫化的辭書編纂.//中國辭書學(xué)會(huì)學(xué)術(shù)委員會(huì)編.中國辭書論集2000.北京: 中國大百科全書出版社,2000.

(同方知網(wǎng)數(shù)字出版集團(tuán)北京100093)

(責(zé)任編輯郎晶晶)endprint

猜你喜歡
辭書條目關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
大型辭書疑難字考釋七則
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
《詞詮》互見條目述略
奇趣搭配
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
智趣
科舉干祿與語文辭書編纂
對(duì)縣級(jí)二輪修志采用結(jié)構(gòu)體式的思考
あたらずといえどもとおからず
元朗区| 芦溪县| 敦煌市| 丹寨县| 中西区| 阜城县| 静安区| 陆河县| 新蔡县| 孟州市| 彭山县| 和林格尔县| 定襄县| 新宁县| 波密县| 阿荣旗| 龙里县| 延长县| 蓝田县| 得荣县| 常德市| 霍邱县| 平定县| 吴堡县| 大冶市| 玉环县| 苏州市| 微博| 澄迈县| 望江县| 习水县| 静海县| 博罗县| 米泉市| 进贤县| 治县。| 基隆市| 廊坊市| 砀山县| 洮南市| 武穴市|