華燁 李亮
(華燁 廣東外語外貿(mào)大學外國語語言學及應用語言學研究中心 廣州 510420)
(李亮 廣東外語外貿(mào)大學詞典學研究中心 廣州 510420)
計算機具有文字容量大、處理速度快和檢索方便等技術優(yōu)勢,國內(nèi)外早已把它當作詞典編纂不可或缺的工具。詞典編纂平臺或計算機輔助詞典編纂系統(tǒng)在國際上叫作“Dictionary Writing System”(詞典編寫系統(tǒng),簡稱DWS),有時也叫“Dictionary Production/Publishing System”(詞典生成/出版系統(tǒng),簡稱DPS)。它是專門用于詞典編纂的計算機軟件——編輯器,設置有詞典語料庫以及語料庫導入和詞典數(shù)據(jù)導出接口,可以實現(xiàn)詞典語料、詞典編纂、詞典編輯、數(shù)據(jù)存儲和成果輸出等一條龍服務功能。
在國內(nèi),20世紀90年代就開始了詞典編纂平臺的研究和開發(fā),有關該問題的研究論文和開發(fā)成果也不少,比較有代表性的有:南京大學雙語詞典研究中心開發(fā)的“基于語料庫的雙語詞典編纂系統(tǒng)——CONULEXID”、廣東外語外貿(mào)大學詞典學研究中心開發(fā)的“基于語料庫的WEB詞典編纂&自動生成系統(tǒng)”、外語教學與研究出版社與北京大學合作開發(fā)的“基于語料庫的雙語詞典編纂平臺”,以及北京大學的“詞典編纂的計算機輔助開發(fā)與管理系統(tǒng)”、教育部語言文字應用研究所的“基于語料庫的數(shù)字化辭書編纂平臺”,商務印書館的“辭書編輯編纂系統(tǒng)”。這些系統(tǒng)大多以大規(guī)模語料庫為基礎,利用語言信息處理計算機技術等,研究詞典信息的獲取、微觀數(shù)據(jù)項的標注和生成、數(shù)據(jù)結構關系和檢測、數(shù)據(jù)的獲取和詞典的生成等,以突破傳統(tǒng)的辭書編纂概念,建立一種新型的辭書編纂模式。商務印書館還進一步探討數(shù)字辭書出版和百種精品工具書數(shù)據(jù)庫,實現(xiàn)了詞典間的互文或整合,形成了以詞條為單元的詞匯知識系統(tǒng)。
此外,還有其他不少單位正在嘗試開發(fā)詞典編纂平臺,但大多是科研機構的一種科研嘗試或為了某一詞典項目而開發(fā)的專用工具,只在內(nèi)部使用,至今還沒有一家能投入商業(yè)運營。而在西方,由于語料庫的建設和使用比較早,一些詞典出版機構從20世紀七八十年代就有了詞典編纂、編輯的專用平臺,如牛津、朗文、柯林斯系列詞典都是在專用平臺上編纂和編輯的。同時,還有一些電子出版機構或軟件公司開發(fā)了一些商業(yè)編纂平臺,現(xiàn)在已經(jīng)廣泛應用于詞典編纂領域。比較有代表性的有:法國IDM的 DPS、俄羅斯的ABBYY Lingvo Content、南非的TshwaneLex、SIL國際的 Lexique Pro和法日合作的彩蝶Papillion等。下面就對其中幾個做一簡要介紹。
IDM詞典生成系統(tǒng)(Dictionary Production System,簡稱DPS)是法國多媒體傳播工程公司(Ingénierie Diffusion Multimédia,簡稱IDM)開發(fā)的。DPS可以使各類參編人員在主編的指令下協(xié)同一致、有條不紊地進行詞典的編纂、信息檢索和審校工作。
IDM公司從1999年開始,先后與朗文和牛津出版機構合作,開始了詞典生成系統(tǒng)的研發(fā),完成了詞典標注文本從SGML向XML的轉換,大大提高了詞典編纂和出版的工作效率。該公司現(xiàn)有五款與辭書有關的產(chǎn)品,分布在500多家用戶中,主要涉及詞典編纂和詞典的出版與傳播(網(wǎng)絡形式與光盤形式),其中包括:“Dictionary Authoring XML Editor/XML詞典文本編輯器”和“extensible Dictionary Configuration Chain/詞典文本格式轉換鏈接器”等,構成了系統(tǒng)的詞典編纂、編輯和出版工具。
該系統(tǒng)采用模塊化設計,由“用戶編輯模塊(Authoring XML Editor)”、“搜索模塊(Search Engine)”、“工作分配和流程管理模塊(Work Allocation and Workflow Manager,簡稱工作流模塊)”和“校對模塊(Proofing Tool)”等組成了一個系統(tǒng)的詞典工具框架。每個模塊具有特定的功能,又能相互補充和配合,可大大提高詞典編纂的工作效率??梢?,該系統(tǒng)具有網(wǎng)絡化、協(xié)作性、可索性和可控性,因為它有強大的搜索引擎和明確的工作流方式,強調(diào)通過“中央數(shù)據(jù)庫”來實現(xiàn)成員間的協(xié)作編纂。從詞典編纂的角度講,它具有多語種、多功能的特點,可用于單語詞典、雙語詞典、義類詞典(thesaurus)、引文詞典或百科詞典等的編纂。系統(tǒng)全面支持Unicode編碼、XML格式和多種文檔類型定義(DTD)格式,可以方便詞典信息的導入、導出和傳播。目前,該系統(tǒng)在世界上擁有500多個客戶,并被朗文等專業(yè)詞典出版公司所采用(McNamara 2003)。
用戶編輯模塊可進行雙屏雙文檔同步顯示、XML元素屬性的安全和快速修改、自動保持元素間相互參照的更新與安全保障、段落的自動編號和文本塊的拖放式移動、批注和附加標簽、XML模板的自定義等。
搜索模塊可以進行簡潔高效的語言查詢、多個詞典數(shù)據(jù)庫的同步搜索、XML格式的輸出;另外,它還支持多語種檢索、模糊查詢,能做到XML與關系型數(shù)據(jù)庫的完美整合。
工作流模塊是由進程(process)、步驟(step)和任務(task)三個方面構成的工作流,能夠進行任務的分配控制、任務的進展監(jiān)測、任務文檔的宏觀管理、日程事務的安排等。
校對模塊能夠幫助編纂人員從“用戶視角”進行閱讀和理解,包括三個階段:編纂階段(composing)、關鍵審讀階段(critical reading)和付印前審讀階段(pass for press validation),能夠生成PDF文檔,并與Adobe公司的InDesign排版軟件進行無縫銜接。
DPS系統(tǒng)的各大模塊都有相對獨立的操作界面,限于篇幅這里只對用戶編輯界面做簡單介紹。編輯模塊是基于微軟的MSXML 4.0開發(fā)的,其界面是用XML格式構建的。新安裝的編輯器由于沒有加載任何詞典文本,界面上各功能區(qū)沒有任何編輯對象。加載文本后,在四個功能區(qū),有三個區(qū)域顯示出編輯內(nèi)容(見圖1)。
從左到右的四個功能區(qū)分別是:1)詞目總覽區(qū),顯示編輯文檔內(nèi)所包含的全部詞條的詞目詞;2)詞條預覽區(qū),顯示編輯區(qū)域當前詞條的編輯現(xiàn)狀和修改結果;3)XML樹形結構信息編輯區(qū),是編輯主要操作區(qū)域,編輯可以直接增刪和修改詞條內(nèi)容;4)當前被選中的樹形結構節(jié)點的屬性顯示區(qū)。
圖1 DPS系統(tǒng)的界面功能分區(qū)
由于有些詞條的內(nèi)容比較多,一個頁面難以展示全部內(nèi)容,因此四個區(qū)域都設有水平滾動條和垂直滾動條,方便操作者查看編輯內(nèi)容。第三區(qū)域為主操作功能區(qū),其上方有三個按鈕,用于隱藏或顯示主功能區(qū)外的其他功能區(qū);由于有些詞條的內(nèi)容比較多,一個頁面難以展示全部內(nèi)容,因此四個區(qū)域都設有水平滾動條和垂直滾動條,方便操作者查看編輯內(nèi)容。在第三功能區(qū)上方有三個按鈕,左邊按鈕可以隱藏或顯示詞目總覽區(qū),中間按鈕可以隱藏或顯示詞條預覽區(qū),右邊按鈕可以隱藏或顯示樹形結構節(jié)點的屬性顯示區(qū)。這樣設計是為了方便使用者在編寫過程中擴展主要編輯界面,并在需要時調(diào)出其他界面。此外,用戶把鼠標放在四個區(qū)之間的“間隔條”上的時候,鼠標會變成“水平雙向箭頭”,按下左鍵便可以任意調(diào)節(jié)當前區(qū)域的寬度,十分方便。
在默認情況下,“詞目總覽區(qū)”將會加載在編的全部詞條的詞目,用鼠標左鍵單擊“詞目總覽區(qū)”的任一詞,第二和第三功能區(qū)會即刻顯示出該詞條的信息內(nèi)容,編者便可以進行閱覽或編輯。
在編輯器中央的最上方,并行排列有五個工具按鈕,分別是:NEW、PRINT、PROTECT、TEMPLATE和FIND,鼠標移至這些按鈕上方可顯示快捷鍵提示;其下方是五個主菜單項目,分別是:FILE、EDIT、CONFIG、STATS和HELP,這些都是為詞典編纂和編輯設置的文本操作功能。
1)“NEW”按鈕是新建XML的節(jié)點,用于“新建詞條”,即增加“詞目總覽區(qū)”所沒有的詞條。點擊該按鈕,會彈出一個小窗口,按照窗口內(nèi)容提示操作即可完成詞條的增添。
2)“PRINT”按鈕是用來進行打印輸出的,點擊該按鈕會彈出一個對話框,詢問是“Print tree/打印樹”還是“Print preview/打印詞條預覽”,選擇其中之一,點擊打印按鈕就能調(diào)用系統(tǒng)的打印機輸出所選內(nèi)容。
3)“PROTECT”的功能是“保護詞條”,是對某些詞條在某些時刻進行內(nèi)容鎖定,避免編者在某些情況下因誤操作而導致編纂數(shù)據(jù)改動或丟失。
4)“TEMPLATE”用于模版調(diào)整,即對整個詞條編纂模板設置進行修改,以調(diào)整詞典的微觀結構及其內(nèi)容分布,使其詞匯知識的組織結構不斷完善。
5)“FIND”的功能是對現(xiàn)有編纂內(nèi)容進行多種檢索,可以向上向下檢索,也可以指定大小寫敏感性,還可以對每個詞條的“釋義”或“例證”之類的局部結構進行檢索。
在主菜單中,“File”只有一個子項目“Save”,是對當前文檔進行“另存為”操作;“Edit”按鈕有11個子項,可以對當前文本進行“復制”、“粘貼”、“撤銷上一步操作”、“剪切”、“刪除”等常規(guī)編輯操作;“Config”是對編輯器的啟動和運行參數(shù)進行調(diào)整,包括幾個功能區(qū)的顯示形式;“Stats”是對所有詞條信息的統(tǒng)計;“Help”提供對一些重要操作方法和常用快捷鍵的描述,這樣有利于操作者提高編纂效率。此外,在主菜單和五個功能按鈕的左側有一個“+”按鈕(見圖2),它的功能是提供所有詞條的“語體信息統(tǒng)計”,如有多少個醫(yī)學、生物學、數(shù)學、通訊等詞目的信息,以及顯示當前編寫操作是處于整個工作流中的哪一個步驟。
通過分析可以看出,該詞典生成系統(tǒng)過分強調(diào)網(wǎng)絡化和中央數(shù)據(jù)庫,可能導致較小的詞典或較小的詞典編纂團隊在集約式的環(huán)境下無法便捷地操作;在編輯界面方面,主菜單和工具按鈕顯得過于單薄,一些常用的工具按鈕沒有凸顯出來。建議適當增加在單機和小團隊情形下的編纂需求,如設計出“離線版”或“迷你單機版”等;增加常用按鈕如“剪切”、“復制”、“粘貼”等,提供不同風格和顏色的界面(“皮膚”)供編者選擇,這樣既能滿足個性化需求,又能避免長時間操作可能產(chǎn)生的視覺疲勞。
泰比詞典編寫系統(tǒng)的英文全稱為ABBYY Lingvo Content,是一款專為詞典編纂、修訂和管理而設計的詞典編寫系統(tǒng),詞典數(shù)據(jù)可以導出為不同的格式出版,無論是紙質(zhì)詞典還是電子詞典(含光盤、網(wǎng)絡和掌上詞典)。其用戶面向出版機構和個人,主要功能有:分析、處理和存儲語言數(shù)據(jù)、詞典編纂任務的分工、詞典的審校(拼寫和參考文獻等)、詞典編纂各階段的支持、各種版本辭書的出版。其詞典數(shù)據(jù)能以各種格式導出,用于紙質(zhì)詞典、電子詞典(含手機詞典)和網(wǎng)絡詞典的出版。
“ABBYY”(泰比)有“敏銳的眼光”的含義,該公司的重點發(fā)展領域是文檔識別和語言技術。2003年,泰比開發(fā)出詞典編纂系統(tǒng),開始應用于自己公司的詞典項目,后來便投入商業(yè)運營。截至2011年1月,泰比已經(jīng)是一家擁有1000名員工的國際化公司,產(chǎn)品銷往全球130多個國家,在9個國家設有辦事處。迄今,泰比已經(jīng)出版了40部詞典,包括普通詞典、專業(yè)詞典、詞匯手冊等,其中《當代英俄詞典》收詞超過10萬條,并提供了大量生活中常用的例句。
該系統(tǒng)采用客戶機/服務器架構,能進行分布式運算。系統(tǒng)的界面友好、功能較強,能夠編輯、更新、補充詞典內(nèi)容,并能輸出不同格式的文件,如DSL和LSD格式(這種格式運用于泰比電子詞典軟件)。主要功能特點有:
1)基于XML技術,采用DTD格式定義,容許用戶設定詞典編纂結構,能保證詞典文本結構的可調(diào)性和一致性;支持多語種編纂和多部詞典同時管理。
2)實行工作流管理模式,能保障存儲數(shù)據(jù)的安全性,并能跟蹤詞條的版本變化情況,如哪一個人編哪些詞典或詞條,詞典編纂的進度和質(zhì)量如何等,還可以跟蹤和監(jiān)控詞條的相互參照關系。
3)詞條編輯功能可使編輯人員在校對詞典稿或修訂詞典時,根據(jù)需要利用拖動的方法直接調(diào)整詞條內(nèi)的義項次序。
4)有詞條編纂工作的歷史記錄,主編或編輯人員能查看文本的修改、補充、刪除的內(nèi)容;如果有必要還可以進行數(shù)據(jù)還原。
5)有詞條信息過濾功能,可利用日志——過濾工具和一些必要參數(shù),如語詞的拼寫、意義、標簽和處理狀態(tài)等,找出特定的內(nèi)容,并對它們進行處理或分配給其他編寫人員處理。
6)能對詞典數(shù)據(jù),包括詞目詞、例證、復合詞、習語、同義詞、反義詞、參見、標簽、有聲句子、有聲文件等數(shù)據(jù),進行多角度、多層面的統(tǒng)計。
系統(tǒng)既可以用來編纂全新的詞典,也可以從多部現(xiàn)有詞典中提取所需信息,然后再按新的設計方案補充新的內(nèi)容,從而合并成一部新的詞典。舊信息的提取是通過一個精密搜索和過濾引擎實現(xiàn)的,用戶若想編一部經(jīng)濟學詞典,就可以根據(jù)文本類型來提取現(xiàn)有詞典的經(jīng)濟類詞匯或義項,然后加入到新編的詞典中;當然,也可以把多部專科詞典合并成綜合科技詞典。(提取界面見圖2)
圖2 新舊詞典對比和信息提取窗口
圖2左邊窗口是新編詞典的內(nèi)容,右邊窗口是幾部舊詞典,通過選擇功能可以把A組中的營銷(詞典)和政治(詞典)、B組中的法律(詞典)移入左邊的窗口;然后,按下創(chuàng)建(Create)按鈕,便把相關信息提取出來,合并到新詞典中去。
泰比系統(tǒng)的界面與IDM公司的編輯模塊有些類似,也分為詞目總覽區(qū)、詞條預覽區(qū)、XML詞條樹形結構編輯區(qū)和標注編輯區(qū)(見圖3)。所不同的是,右下角的“特殊符號插入面板”,這是一個很貼心的人性化設計。泰比系統(tǒng)的四個工作區(qū)也有水平滾動條和垂直滾動條,可以進行各個區(qū)的寬度和高度的手工調(diào)節(jié);這樣,編者在面對大量信息項時能根據(jù)需要進行臨時性界面調(diào)節(jié)。
在界面窗口的上部是主菜單和一列工具按鈕。菜單從左至右是:文件、詞條、編輯、詞典組、工具、用戶管理、選擇項、幫助??梢钥闯?a)該系統(tǒng)設置了更多的菜單和工具按鈕,表明其功能更多、更細;b)工具按鈕不僅有文字,還有圖形按鈕,這體現(xiàn)了人性化和用戶友好的一面;c)詞典組(Dictionary Group)的設置表明該軟件確實能進行“多部詞典的同時編纂”和管理;d)標題欄上依稀可見的“server”字樣和工具欄上的“Assign to”(帶有頭像圖示),表明該軟件是“具有高權限的控制端”或者“已經(jīng)登錄為高權限的客戶端”,并且在高權限的情況下可以進行“詞條分配”之類的“群組操作”,體現(xiàn)了分布式編纂的工作方式,這與產(chǎn)品說明中的“可以進行用戶組的創(chuàng)建與協(xié)調(diào)”是一致的。
詞目總覽區(qū)顯示出詞典的總詞表及其編輯狀態(tài),點擊其中任何一個詞項便可激活編輯功能,并查看其信息內(nèi)容;詞條預覽區(qū)顯示當前詞條在詞典中的版面格式,對詞條內(nèi)容的增刪或修改都會在這里得到反映;詞條樹形結構編輯區(qū)顯示詞目詞及其主義項和次義項的相對位置,如果有必要,可以用鼠標拖曳的方法調(diào)整義項次序;標注編輯區(qū)是主要的文字編輯平臺,可以在這里進行詞條內(nèi)容的編寫,義項、例證和同義詞等的增減,參見其他詞條,用專用符號注音等。
圖3 泰比詞典編纂系統(tǒng)的界面結構
在已經(jīng)加載詞條的情況下,編者可以進行以下的文字操作:a)在詞目總覽區(qū)進行詞目的選擇和跳轉;b)在跳轉到相應的詞目之后,就能看到“詞條預覽區(qū)”和“樹形結構區(qū)域”已經(jīng)同時發(fā)生了變化;c)如果需要對某一詞條的某個微觀結構項進行編輯或具體修改,則直接用鼠標單擊樹形結構區(qū)的相應節(jié)點;d)在節(jié)點被激活并處于等待編輯狀態(tài)之后,編者便可在標注編輯區(qū)輸入或修改詞條信息了;同時,如果編者希望看到更加詳細的XML的結構信息代碼的話,則可以用鼠標點擊“XML節(jié)點編輯區(qū)”,在這里編輯相關信息即可。一般來說,由于泰比的結構與IDM編輯器類似,它應該也有豐富的右鍵功能,如對樹形結構節(jié)點的合并、新增、刪除、對調(diào)、刷新等。同一詞條的微觀結構中的各種信息項,可以用鼠標進行拖動來實現(xiàn)相對位置的調(diào)整,十分方便。(參見圖3中的樹形結構編輯區(qū))
此外,服務器端也具有類似“考勤系統(tǒng)”的功能,即記錄各個編纂者的系統(tǒng)登錄時間與注冊時間,且形成歷史記錄。詞條編纂、編輯版本的歷史也有“記錄”,便于出現(xiàn)問題時進行必要的回溯追蹤。
目前,該公司主頁上的產(chǎn)品介紹已不再包括這款軟件,我們懷疑是該公司放棄了詞典編纂系統(tǒng)的商業(yè)開發(fā),因為ABBYY公司的產(chǎn)品線很廣,員工的數(shù)量有千余人,其ABBYYLingvo系列電子詞典和OCR識別軟件都十分暢銷,導致了“詞典編纂軟件”的開發(fā)力量不斷向“電子詞典”的開發(fā)轉移。希望他們能重視詞典編纂平臺的改進,開發(fā)出有特色的詞典編纂系統(tǒng)。
TshwaneLex(簡稱TLex)是由南非TshwaneDJe公司研制的一款基于XML的詞典編纂系統(tǒng)。該公司專門從事語言技術研究和開發(fā),包括翻譯記憶軟件、語料庫及索引軟件、數(shù)據(jù)庫編輯器、詞典編寫系統(tǒng)、詞典出版系統(tǒng)、數(shù)據(jù)轉換和術語管理軟件等。特別是其詞典編纂與詞典出版系統(tǒng),有許多替代人工操作的專業(yè)性能,能縮短詞典編纂時間、節(jié)省費用、提高辭書質(zhì)量。主要性能包括:內(nèi)置語料查詢系統(tǒng)、實時預覽、用戶設置、智能互參、自動跟蹤升級、自動詞目逆序排列、自動排序統(tǒng)計、導入Word文檔或排版系統(tǒng)、多用戶支撐管理等。該軟件似乎有成為國際專業(yè)詞典編纂行業(yè)標準的可能,它幾乎能支持世界上大多數(shù)語言,已經(jīng)與牛津大學出版社、朗文公司、麥克米倫公司、培生公司、西班牙皇家醫(yī)學院、加拿大司法部等眾多出版機構和政府部門建立起了業(yè)務關系,編纂出各種類型的詞典。
TLex詞典系統(tǒng)由三大部分構成:詞典編纂系統(tǒng)(TLex Dictionary Production System)、電子詞典出版系統(tǒng)(Electronic Dictionary Publishing System)和在線詞典發(fā)布系統(tǒng)(Online Dictionary Publishing System)。詞典編纂系統(tǒng)具有強大、友好、實用的特征;在線詞典出版系統(tǒng)能夠?qū)ΜF(xiàn)有的詞典進行靜態(tài)頁面和動態(tài)頁面兩種方式的發(fā)布,也能提供專門收集用戶反饋的頁面功能;電子詞典出版系統(tǒng)是一個相對獨立而靈活的模塊,可以把現(xiàn)有詞典制作成光盤或發(fā)布在網(wǎng)絡上供用戶下載,而且實現(xiàn)了與微軟的Office產(chǎn)品的良好整合,也可以駐留在Windows的系統(tǒng)托盤區(qū)隨時彈出。
詞典編纂系統(tǒng)的詳細功能包括:語料查詢功能和提取、實時詞條預覽、多種界面風格和可自定義界面、智能的“參見系統(tǒng)”跟蹤、自動編號與排序等,還能夠以多種格式將特定部分或全部詞條導出為微軟的Word文檔或主流排版軟件,如InDesign、Quark、XPP等。多用戶和多語言的支持,音標輸入便捷,獨特的Ruler Tool功能可以進行各方面的編纂平衡性的監(jiān)測,內(nèi)建的腳本語言可以進行各種批量操作。
TLex系統(tǒng)界面結構比較復雜,其文字說明是英語和法語兩種。編輯界面有四大功能區(qū)(見圖4):1)詞條總覽區(qū)(左側),提供詞目詞列表,供編者瀏覽和選擇;2)樹形結構編纂?yún)^(qū)(中上),編者可以在下拉菜單上選定預先定義的值,然后按樹形結構上的微觀信息項進行編纂;3)節(jié)點屬性編輯區(qū)(中下),可以編輯和調(diào)整相關信息項;4)詞條預覽區(qū)(右側),查看當前編纂詞條的真實效果。這些設置與上述兩個編纂系統(tǒng)大同小異,只是具體操作項目多一些。
在界面窗口的上部是主菜單和一列工具按鈕。菜單從左至右是:文件、編輯、視圖、詞目、詞典、格式、工具、窗口、幫助。工具按鈕主要是文本編輯所必須的一些功能,包括多媒體圖片、藝術字體等,甚至可以直接轉換到Word文檔??梢哉f,詞典編輯平臺的文字處理功能是十分強大的;另外,“詞典”(Dictionaire)下拉菜單表明該系統(tǒng)也可以同時管理和操控多部詞典。
圖4 TLex詞典編纂系統(tǒng)的界面結構
根據(jù)我們下載的試用版本的測試情況來看,TLex的編纂操作是從“新建工程”開始的。編者首先要選擇是“單語詞典”還是“雙語詞典”,以及“詞典的名稱與描述”、“詞典的DTD文件路徑”、“詞典的聲音和圖像的存放位置”等。然后,就要選擇用“單語編纂”還是“雙語編纂”模式。如果是雙語模式,則調(diào)出“左右兩個區(qū)域”的窗口布局;如果是單語模式,則只是傳統(tǒng)的四大窗口的布局。
其次,TLex還可以讓編纂者選擇界面的“橫向模式”或是“縱向模式”;前者顯示范圍寬,一個詞條的信息可以一覽無余,對于專注于單個詞目或較少相關詞目而言比較有利;后者顯示面窄(只有橫向的一半),但詞條數(shù)目多,需要借助滾動條查看,對于關注一系列詞條的對比分析比較有利。
一旦進入編纂狀態(tài),TLex則與其他的詞典編纂軟件極其相似,即在“詞目總覽區(qū)”進行詞目的瀏覽和選擇,在“樹形結構區(qū)”或“節(jié)點屬性編輯區(qū)”進行編纂,同時在“詞條預覽區(qū)”實時查看編纂或修改的效果。不同的節(jié)點之間的關系可以用鼠標拖動來進行調(diào)整,也可以點擊右鍵來選擇“刪除”或“刷新”等選項。值得一提的是,該系統(tǒng)有一“相互參見對照”功能,編者能把“cross-reference/參見”窗口調(diào)出來,查看參見和被參見的信息內(nèi)容,可以對所有參見關系進行系統(tǒng)查閱、管理和校改。
Tlex的詞典編纂、電子詞典出版和在線發(fā)布系統(tǒng)三個模塊的功能之間有些重疊,可能是出于將三個模塊進行獨立銷售的考慮所致,但是也會給購買一套完整系統(tǒng)的用戶帶來麻煩。另外,缺乏對在線語料庫和豐富的網(wǎng)絡資源的利用功能,而龐大的互聯(lián)網(wǎng)語言資源也是詞典語料和數(shù)據(jù)的主要來源。要解決這些問題其實也不難,如在三個模塊內(nèi)部設計出“自動屏蔽重疊功能”的子模塊,就能解決功能重復的問題;提供一些諸如直接查詢在線BNC、ANC或COCA語料檢索功能,也可以設置選擇必要的網(wǎng)上參考詞典和詞庫(如Moby Thesaurus和Wordnet等)的功能,能方便地跳轉到這些網(wǎng)站進行必要的信息提取,以解決網(wǎng)絡資源利用的問題。
上述幾個詞典輔助編纂和出版系統(tǒng)作為商業(yè)軟件已經(jīng)有10~20年的歷史了,這些軟件現(xiàn)已廣泛用于世界各大辭書出版社的詞典編纂與出版過程中,并取得令人矚目的成果。目前在我國市場上的國外英語詞典大多是利用這類軟件加工或編輯的。有了這些輔助平臺,詞典編纂語料的搜集、加工處理和提取,詞典信息的編寫和編輯過程中的文字處理、統(tǒng)計和校改,以及建立詞典數(shù)據(jù)庫等都變得輕松和容易了。在提高詞典編纂效率和質(zhì)量的同時,還能節(jié)省大量的人力、物力和時間。可以說,在辭書出版界,誰擁有了這些現(xiàn)代化數(shù)字平臺和基于這些平臺的詞典語料庫和數(shù)據(jù)庫,誰就掌握了辭書編纂和出版的主動,就能編纂出版高質(zhì)量的辭書,在市場競爭中立于不敗之地。
附 注
[1]由于版權問題,無法獲得ABBYY公司編纂系統(tǒng)的樣本或免費試用的機會,只能從其網(wǎng)上公布的產(chǎn)品說明和相關文章中找到一些截圖,并據(jù)此對其功能和結構進行描寫,內(nèi)容有很大的局限性,僅供參考。
1.De Schryver G M,Prinsloo D J.Dictionary-Making Process with“Simultaneous Feedback”from the Target Users to the Compilers.∥ Heid U.et al(eds.)Proceedings of the Ninth EURALEX International Congress.Stuttgart:Institut für Maschinelle Sprachverarbeitung,Universit?t Stuttgart,2000.
2.McNamara M.Dictionaries for All:XML to Final Product.∥XML Conference,Philadelphia,USA,2003.
3.ABBYY ? LingvoTMContent Dictionary Production System:An Instruction(Russia:ABBYY).
4. IDM's Dictionary Publishing System: Dictionary Editor Tutorial(France: Ingénierie Diffusion Multimédia).
5.IDM's Dictionary Publishing System:Technical Overview(France:Ingénierie Diffusion Multimédia).
6.IDM's Dictionary Publishing System:A Demo(France:Ingénierie Diffusion Multimédia).
7.TshwaneLex 4.0:A Demo(South Africa:TshwaneDJe).