国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

巧用標(biāo)準(zhǔn)題錄信息校對企業(yè)專業(yè)術(shù)語

2017-07-24 18:09張廣慶孫旺先岳琪佳
質(zhì)量探索 2017年2期
關(guān)鍵詞:實詞分詞術(shù)語

張廣慶,孫旺先,岳琪佳

(1.青島市標(biāo)準(zhǔn)化研究院,青島 266071;2.青島市建筑節(jié)能協(xié)會,青島 266071;3.山東省青島第五十八中學(xué),青島 266100)

巧用標(biāo)準(zhǔn)題錄信息校對企業(yè)專業(yè)術(shù)語

張廣慶1,孫旺先2,岳琪佳3

(1.青島市標(biāo)準(zhǔn)化研究院,青島 266071;2.青島市建筑節(jié)能協(xié)會,青島 266071;3.山東省青島第五十八中學(xué),青島 266100)

外向型企業(yè)編寫產(chǎn)品說明書或宣傳材料常常需要借助術(shù)語中英文對照表,但表中術(shù)語的中英文翻譯是否準(zhǔn)確,卻沒有恰當(dāng)?shù)呐袛喾椒ɑ驑?biāo)準(zhǔn)?;诖耍疚慕柚袊鴩覙?biāo)準(zhǔn)的中英文題錄信息,提出了校對企業(yè)術(shù)語的參考方法,并通過實驗檢驗了校對效果。

術(shù)語;標(biāo)準(zhǔn)題錄;校對;術(shù)語校對庫;術(shù)語對照表

隨著我國市場經(jīng)濟(jì)的不斷發(fā)展和完善,企業(yè)經(jīng)營的國際化和規(guī)范化水平正日益提高。據(jù)海關(guān)統(tǒng)計,2016年我國貨物出口總值達(dá)到13.84萬億元人民幣,越來越多的中國產(chǎn)品走向世界。企業(yè)在出口產(chǎn)品和提供服務(wù)中經(jīng)常使用各類專業(yè)術(shù)語,通常而言,企業(yè)會借助翻譯公司或科技翻譯軟件制作專業(yè)術(shù)語中英文對照表(以下簡稱術(shù)語對照表),實現(xiàn)產(chǎn)品和服務(wù)名稱的一致化和標(biāo)準(zhǔn)化[1],并依據(jù)術(shù)語對照表編寫說明書和宣傳手冊,以幫助客戶更容易理解這些產(chǎn)品和服務(wù)。術(shù)語對照表的重要性可見一斑,但表中術(shù)語的中英文翻譯是否準(zhǔn)確,目前卻沒有恰當(dāng)?shù)呐袛喾椒ɑ驑?biāo)準(zhǔn)?;诖?,本文介紹如何利用中國國家標(biāo)準(zhǔn)題錄中英文信息,來校對、補(bǔ)充和糾正術(shù)語對照表的方法,并通過樣本術(shù)語的校對數(shù)據(jù)查看實驗效果。

1 校對范圍及流程

筆者收集整理了中國國家標(biāo)準(zhǔn)約6.1萬條(其中,含中英文題錄信息的約4.7萬條,僅有中文題錄信息的約1.4萬條),以此為基礎(chǔ)構(gòu)建中國國家標(biāo)準(zhǔn)中英文術(shù)語校對庫(以下簡稱術(shù)語校對庫)。另采集某企業(yè)在用的524條術(shù)語,組成樣本術(shù)語對照表。存放這些信息的數(shù)據(jù)庫,則采用常見的關(guān)系型數(shù)據(jù)庫SQL Server。

從術(shù)語對照表中,選取術(shù)語中文詞和英文詞,同時匹配術(shù)語校對庫中的標(biāo)準(zhǔn)題錄中文名和英文名,匹配成功說明該專業(yè)術(shù)語翻譯正確,稱雙語匹配;只選取術(shù)語中文詞,匹配術(shù)語校對庫中的標(biāo)準(zhǔn)題錄中文名,匹配成功的,稱中文匹配;只選取術(shù)語英文詞,匹配術(shù)語校對庫中的標(biāo)準(zhǔn)題錄英文名,匹配成功的,稱英文匹配。術(shù)語中文詞或英文詞與術(shù)語校對庫匹配成功的數(shù)量稱匹配度。未實現(xiàn)雙語匹配的術(shù)語,用其他方法改造后再次匹配術(shù)語校對庫,稱二次匹配;每次去除未實現(xiàn)雙語匹配的術(shù)語,逐一用其他方法改造后,再匹配術(shù)語校對庫,稱累加匹配。

2 校對方法

利用術(shù)語校對庫校對這些樣本術(shù)語的方法有:快速法、單詞法、實詞法、分詞法、英文變形法、綜合法。

2.1 快速法

使用關(guān)系型數(shù)據(jù)庫中模糊查詢語句直接匹配術(shù)語的方法。結(jié)構(gòu)化查詢語言(簡稱SQL)是關(guān)系型數(shù)據(jù)庫中最常用的查詢語言,模糊查詢語句的格式通常是“SELECT 字段 FROM 表 WHERE某字段 LIKE 條件”,當(dāng)“條件”使用通配符“%”時,表示模糊查詢。如模糊查詢含“標(biāo)準(zhǔn)”字樣的題錄信息時,SQL語句是“SELECT 中文名字段 FROM 國家標(biāo)準(zhǔn)題錄表 WHERE 中文名字段LIKE ‘%標(biāo)準(zhǔn)%’”。該方法的缺點(diǎn)是英文匹配不嚴(yán)謹(jǐn),如“bus”用“%bus%”查詢時,含“bush”和“business”的題錄信息也會當(dāng)成查詢結(jié)果,產(chǎn)生誤匹配。但該方法操作簡單、查詢快,在本文中除單詞法外,均使用本法完成初次匹配。

在術(shù)語校對庫中使用本法,實現(xiàn)雙語匹配的術(shù)語有143條,中文匹配的術(shù)語有238條,英文匹配的術(shù)語有225條,能匹配成功(取消重復(fù)計數(shù)的)的術(shù)語總計288條,占全部術(shù)語的55.0%,本法匹配成功的術(shù)語超過全部術(shù)語的一半。匹配度較高的部分術(shù)語見表1。

表1 匹配成功的部分術(shù)語

2.2 單詞法

術(shù)語的中文詞按照快速法校對,英文詞按照單詞形式嚴(yán)格匹配標(biāo)準(zhǔn)題錄信息的方法。校對方法是先用快速法將能匹配術(shù)語中文詞和英文詞的題錄信息全部找出,再從這些題錄信息中挑出能按照單詞形式匹配術(shù)語英文詞。在軟件程序中,匹配英文單詞的簡易算法可以采用該英文單詞在題錄信息的前后字符均不是英文字母的方式。

本法實現(xiàn)雙語匹配的術(shù)語有119條,中文匹配的術(shù)語有238條,英文匹配的術(shù)語有190條,能匹配成功的術(shù)語總計276條,占全部術(shù)語的52.7%。

2.3 實詞法

將術(shù)語中文詞或英文詞中的虛詞取消,只校對余下的實詞的方法。

在中文語法中,詞是由語素組成的最小的造句單位,按詞性可以分為實詞和虛詞。實詞指有實際意義的詞,包括名詞、動詞、形容詞、數(shù)詞、量詞、代詞等;虛詞是指沒有實在意義的詞,包括副詞、介詞、連詞、助詞、嘆詞、擬聲詞等。未能實現(xiàn)匹配成功的術(shù)語中文詞取消虛詞后再校對余下的實詞,可以提高校對成功率。如“標(biāo)定中”在術(shù)語校對庫中不能匹配,取消虛詞“中”,只匹配實詞“標(biāo)定”,快速法的匹配度可以達(dá)到52次。

在英文語法中,實詞指在句子中獨(dú)立擔(dān)任成分,包括名詞、動詞、形容詞、數(shù)詞、代詞、副詞等;虛詞指不能在句子中獨(dú)立擔(dān)任任何成分,包括冠詞、介詞、連詞、感嘆詞等。同樣的,對于不能匹配成功的術(shù)語英文詞,也可以取消虛詞只校對實詞。如”beam off”不能匹配成功,取消虛詞”off”后,只匹配實詞”beam”,快速法的匹配度是90次。

快速法沒有實現(xiàn)雙語匹配的術(shù)語使用本法進(jìn)行二次匹配,實現(xiàn)雙語匹配的術(shù)語合計153條,中文匹配的術(shù)語合計249條,英文匹配的術(shù)語合計243條,能匹配成功的術(shù)語總計305條,占全部術(shù)語的58.2%。

2.4 分詞法

利用分詞技術(shù)將術(shù)語中文詞和英文詞分解成相互獨(dú)立的兩組或多組,再進(jìn)行校對的方法。如將“電磁波”分詞為“電磁”和“波”,將”Electromagnetic Waves”分詞為”Electromagnetic”和”Waves”,形成兩組新術(shù)語“電磁(Electromagnetic)”和“波(Waves)”。分解后的術(shù)語中文詞和英文詞都能匹配術(shù)語校對庫中的中英文題錄信息,稱雙語匹配,任一中文分詞能匹配中文題錄信息的稱部分中文匹配,任一英文分詞匹配英文題錄信息的稱部分英文匹配,全部中文分詞都能匹配中文題錄信息的稱全中文匹配,全部英文分詞都能匹配英文題錄信息的稱全英文匹配。對術(shù)語進(jìn)行分詞應(yīng)遵循一些原則,如中文與英文成對分詞原則、已校對成功的英文(或中文)優(yōu)先分詞原則、中文分詞換位原則等。

快速法沒有實現(xiàn)雙語匹配的術(shù)語使用本法進(jìn)行二次匹配,采用全分詞匹配方式時,實現(xiàn)雙語匹配的術(shù)語合計178條,全中文匹配的術(shù)語合計295條,全英文匹配的術(shù)語合計300條,能匹配成功的術(shù)語總計368條,占全部術(shù)語的70.2%。

采用部分分詞匹配方式時,雙語匹配術(shù)語數(shù)量仍為178條,部分中文匹配的術(shù)語合計471條,部分英文匹配的術(shù)語合計468條,能匹配成功的術(shù)語總計506條,占全部術(shù)語的96.6%。

2.5 英文變形法

將英文實詞的變形詞與術(shù)語校對庫中的英文題錄信息進(jìn)行校對的方法。英文題錄信息中的名詞有時會以復(fù)數(shù)形式存在,使用單詞法就不能查詢到術(shù)語英文詞,此時應(yīng)使用術(shù)語英文詞的復(fù)數(shù)形式;同樣,術(shù)語英文詞中屬于動詞的,如果不能匹配成功,則可以使用該動詞的第三人稱單數(shù)、-ing形式、各種時態(tài)詞(過去時、進(jìn)行時、完成時)進(jìn)行二次匹配。該方法對于1個或2個詞語組成的術(shù)語英文詞較為實用,超過3個詞語(含3個)的,因組合出來的變形詞較多,不再推薦使用本法,本文沒有使用本法做樣本庫的校對實驗。

2.6 綜合法

將以上方法中的一種或多種方法采用累加匹配的方式,實現(xiàn)術(shù)語雙語匹配的匹配度最高的方法。除英文變形法外,將其他方法取得的實驗結(jié)果統(tǒng)計后,本法實現(xiàn)雙語匹配的術(shù)語合計187條,中文匹配的術(shù)語合計473條,英文匹配的術(shù)語合計475條,取消重復(fù)計數(shù)的術(shù)語總計511條,占全部術(shù)語的97.5%。

表2列出了以上方法的校對結(jié)果??梢钥闯?,綜合法合成了其它方法的實驗結(jié)果,達(dá)到最高的匹配效果,雖然雙語匹配(187條)占全部樣本術(shù)語的35.7%,沒有超過一半,但中文匹配、英文匹配、合計匹配分別達(dá)到90.3%、90.7%、97.5%,匹配度非常高,能實現(xiàn)較好的校對效果。單一方法中,分詞法的校對效果最好,合計匹配比例可以達(dá)到70.2%(全匹配)或96.6%(部分匹配)。

表2 各種方法校對術(shù)語樣本庫的實驗結(jié)果

沒有實現(xiàn)雙語匹配僅能實現(xiàn)中文或英文匹配的術(shù)語,通過查找對應(yīng)的英文題錄或中文題錄信息,可以糾正翻譯不準(zhǔn)確的術(shù)語,或者作為不同科學(xué)領(lǐng)域的術(shù)語備用詞,完善術(shù)語對照表。

3 結(jié)語

中國國家標(biāo)準(zhǔn)的題錄信息作為權(quán)威的中英文對照,不僅可以當(dāng)做查詢常用標(biāo)準(zhǔn)的工具,還能滿足企業(yè)標(biāo)準(zhǔn)人員編制專業(yè)術(shù)語對照表的需要。使用常規(guī)術(shù)語翻譯方式翻譯的專業(yè)術(shù)語,通過使用國家標(biāo)準(zhǔn)題錄信息進(jìn)行校對和檢查,可以達(dá)到糾正和完善這些專業(yè)術(shù)語的效果。結(jié)合使用術(shù)語類標(biāo)準(zhǔn)中術(shù)語的中英文信息,既能豐富標(biāo)準(zhǔn)工作者在術(shù)語領(lǐng)域的應(yīng)用,也可為開發(fā)新式術(shù)語工具軟件提供數(shù)據(jù)基礎(chǔ)[2]。

[1] 金倩.術(shù)語應(yīng)用標(biāo)準(zhǔn)化建設(shè)加快步伐——中國標(biāo)準(zhǔn)術(shù)語數(shù)據(jù)庫開發(fā)正式啟動[J].產(chǎn)品安全與召回, 2000,(3):40-40.

[2] 郭劍.術(shù)語數(shù)據(jù)庫建設(shè)之我見[J].中國科技術(shù)語, 2015,17(5):57-60.

Application of Chinese Word Segmentation in Standard Information Retrieval

ZHANG Guang-qing1, SUN Wang-xian2, YUE Qi-jia3
(1. Qingdao Institute of Standardization, Qingdao, Shandong 266071, China; 2. Qingdao Building Energy Conservation Association, Qingdao, Shandong 266071, China; 3. Qingdao NO.58 High School Shandong Province, Qingdao, Shandong 266100, China)

Export-oriented enterprises often need to use the terms of the English and Chinese comparison table to write product brochures or promotional materials, but the terms of the Chinese and English translation is accurate or not, there is no appropriate method or standard of judgment. Based on this, with the help of China national standards in English bibliographic information, this paper puts forward a reference method for proofreading enterprise terminology, and proves the proofreading effect through the experiment.

term; standard title; proofreading; terminology library; glossary of terms

G254.37

A

1672-6286(2017)02-0042-05

張廣慶(1971-),男,山東巨野人。質(zhì)量高級工程師,本科,主要從事組織機(jī)構(gòu)代碼、軟件、信息化、標(biāo)準(zhǔn)等領(lǐng)域研究。

猜你喜歡
實詞分詞術(shù)語
分詞在英語教學(xué)中的妙用
基于大數(shù)據(jù)分析的初中文言常用實詞確定的研究
——以部編版教材為例
結(jié)巴分詞在詞云中的應(yīng)用
結(jié)巴分詞在詞云中的應(yīng)用
文言文實詞詞義推斷的基本策略
文言實詞50例
文言實詞推斷法
有感于幾個術(shù)語的定名與應(yīng)用
從術(shù)語學(xué)基本模型的演變看術(shù)語學(xué)的發(fā)展趨勢
聚焦現(xiàn)在完成進(jìn)行時