国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

臨床醫(yī)療英語應(yīng)用文語料庫建設(shè)與實(shí)施

2018-01-21 09:25:26張文奕盧喆宋雪姣
中國(guó)校外教育(下旬) 2018年12期
關(guān)鍵詞:應(yīng)用文語料語料庫

張文奕 盧喆 宋雪姣

【摘要】臨床醫(yī)療英語屬于科技英語的一個(gè)分支。對(duì)醫(yī)學(xué)生而言,學(xué)習(xí)和掌握臨床醫(yī)療英語應(yīng)用文語言特點(diǎn)與寫作技巧尤其重要。在我國(guó)將語料庫技術(shù)與專門用途英語相結(jié)合的研究正方興未艾。在簡(jiǎn)述二者結(jié)合的必要性和重要性的基礎(chǔ)上,探討臨床醫(yī)療英語應(yīng)用文語料庫的創(chuàng)建原則、建庫步驟與建設(shè)方法。

【關(guān)鍵詞】臨床醫(yī)療英語 應(yīng)用文語料庫 建設(shè)方法作為一種科技文體,臨床醫(yī)療英語具有嚴(yán)謹(jǐn)規(guī)范、邏輯嚴(yán)密、客觀簡(jiǎn)明的語言特色,其遣詞造句、語法結(jié)構(gòu)具有獨(dú)特的詞匯體系和句法特征。隨著全球化的進(jìn)程,醫(yī)學(xué)生必需具有國(guó)際化的學(xué)術(shù)視野,經(jīng)常了解國(guó)內(nèi)外領(lǐng)域的最新動(dòng)態(tài),不動(dòng)查閱醫(yī)學(xué)文獻(xiàn)。在本科階段,對(duì)醫(yī)學(xué)生而言,學(xué)習(xí)和掌握臨床醫(yī)療英語應(yīng)用文語言特點(diǎn)與寫作技巧尤其重要。因此,建設(shè)臨床醫(yī)療英語應(yīng)用文語料庫,開展基于醫(yī)療英語的醫(yī)療行業(yè)英語語言的研究更具有緊迫性。語料庫不同于電子文檔或數(shù)據(jù)庫,語料庫的建設(shè)有特定的研究目的和具體用途,臨床醫(yī)療英語應(yīng)用文語料庫主要用于研究臨床醫(yī)療英語詞匯,分析臨床醫(yī)療英語應(yīng)用文語言特點(diǎn),完善和開發(fā)相關(guān)教材等。

一、臨床醫(yī)療英語應(yīng)用文語料庫創(chuàng)建原則

臨床醫(yī)療英語應(yīng)用文語料庫的總體建庫原則是建立一個(gè)能全面反映臨床醫(yī)療英語語言事實(shí)的語料庫。該語料庫的建設(shè)應(yīng)遵循隨機(jī)抽樣法、內(nèi)容真實(shí)性、語料代表性、庫容適度性等原則。

1.隨機(jī)抽樣

語料庫是在隨機(jī)采樣的基礎(chǔ)上收集的有代表性的真實(shí)語言材料的集合,是語言運(yùn)用的樣本。因此,臨床醫(yī)療英語應(yīng)用文語料庫在語料抽樣范圍和主題覆蓋方面都力求取得平衡,在收集語料時(shí)按比例分層抽樣,需要考慮到每一主題類型的抽樣比例,在分布上應(yīng)盡可能均勻。主題涵蓋禮儀文書、求職文書、醫(yī)務(wù)文件、公務(wù)文書和科研文書五個(gè)方面。

2.真實(shí)性

真實(shí)性是建設(shè)語料庫的基本前提,無此前提,語料庫就不能反映真實(shí)的語言面貌,基于語料庫的研究及得出的結(jié)論也必然是毫無意義的。具體而言,一要收集實(shí)際使用中的文本,而不能是研究者杜撰的;二要收集符合條件的文本,不符合的一律剔除。為了確保語料的真實(shí)性,應(yīng)以復(fù)印、掃描或拍照等方式收集最原始的語料,從源頭上保證語料的真實(shí)性。

3.代表性

語料庫的代表性,即研究中所使用的語料是否能夠代表我們需要研究的語言。它對(duì)建成語料庫應(yīng)用語言研究結(jié)果的可信度至關(guān)重要,這是建設(shè)臨床醫(yī)療英語應(yīng)用文語料庫的首要原則,是區(qū)分語料庫與語料檔案庫的重要標(biāo)準(zhǔn)。一個(gè)語料庫是否有代表性首先要看語料庫所代表的總體。總體而言,臨床醫(yī)療英語應(yīng)用文語料庫代表的往往是理論上有限而實(shí)際上無限的總體?,F(xiàn)實(shí)中建庫者不可能將所有的臨床醫(yī)療英語應(yīng)用文語料全部收集起來。為了提高語料的代表性,必須借助統(tǒng)計(jì)學(xué)抽樣方法,確保建立的語料庫中的語料樣本能最大限度地反映總體的特征。

4.庫容適度性

語料庫規(guī)模并不是越大越好。總體而言,10萬詞次的語料庫可以滿足音韻學(xué)研究,形態(tài)學(xué)研究的語料庫需要達(dá)到50萬詞次,而句法學(xué)研究則需要50萬到100萬詞次的語料庫。我校建設(shè)的臨床醫(yī)療英語應(yīng)用文語料庫初步庫容為50萬詞,各主題均占20%,約10萬字。該語料庫具有開放性、動(dòng)態(tài)性和擴(kuò)容性的特點(diǎn),爭(zhēng)取在語料庫初步建成3年之后進(jìn)一步擴(kuò)展到100萬詞。

二、臨床醫(yī)療英語應(yīng)用文語料庫建庫步驟

臨床醫(yī)療英語應(yīng)用文語料庫的建庫步驟主要涉及語料的來源、采集、整理、標(biāo)注、統(tǒng)計(jì)等內(nèi)容。具體說來臨床醫(yī)療應(yīng)用文語料庫的建設(shè)要經(jīng)歷下列18道工序:語料庫設(shè)計(jì)、確定語料收集范圍、先導(dǎo)語料采集取樣論證、編制語料收集要求和工作流程、培訓(xùn)語料采集人員、語料正式采集、回收語料并分類保存、紙質(zhì)語料文本轉(zhuǎn)為txt文本、校對(duì)、語料清潔整理、抽檢語料樣本、對(duì)所有文本進(jìn)行文件頭部元信息標(biāo)注、校對(duì)、分詞、語料標(biāo)注和詞性賦碼、校對(duì)、復(fù)查抽檢、對(duì)語料進(jìn)行統(tǒng)計(jì)分析等。

三、建設(shè)方法

1.建立語料庫

建立語料庫涉及到文本的掃描、錄入和反復(fù)校對(duì)。每個(gè)取樣存為一個(gè)單獨(dú)文件,文件名以學(xué)科領(lǐng)域等因素命名。完成文本的數(shù)字化后進(jìn)行文本整理,它是語料庫建庫的關(guān)鍵環(huán)節(jié),涉及文本的備份、文本的清潔整理、語料元信息的標(biāo)注等環(huán)節(jié)。整理后的文本要進(jìn)行文本加工,文本加工涉及分詞、詞性標(biāo)注及其他語言信息標(biāo)注等環(huán)節(jié)。在臨床醫(yī)療英語應(yīng)用文語料庫中,標(biāo)注主要包括頭部元信息標(biāo)注和詞性標(biāo)注。元信息主要包括:文本說明信息(序號(hào)、文本分類等)、文獻(xiàn)信息(作者、時(shí)間、標(biāo)題等)、文本結(jié)構(gòu)信息(章節(jié)、段落等)等。元信息標(biāo)注是后期語料庫檢索、查詢、分析、構(gòu)建子語料庫的重要依據(jù)和條件。臨床醫(yī)療英語應(yīng)用文語料庫的最終標(biāo)注格式是XML。即可擴(kuò)展標(biāo)記語言。它具有跨平臺(tái)的優(yōu)勢(shì),一般用于數(shù)據(jù)存儲(chǔ)。

2.實(shí)現(xiàn)檢索軟件的自動(dòng)抽取

為了能夠抽取研究者感興趣的語言單位,需要運(yùn)用自動(dòng)檢索工具,這些工具為可單獨(dú)運(yùn)行的檢索軟件。單語純文本語料庫支持WordSmith、AntConc、Editplus等檢索工具對(duì)文本各種信息和語言特色的檢索分析。

四、可能遇到的問題和解決辦法

臨床醫(yī)療英語應(yīng)用文語料庫的建設(shè)重點(diǎn)是語料庫的代表性,即語料能否代表所要研究的語言。語料庫的代表性主要涉及語料庫的設(shè)計(jì)容量、語料來源以及取樣的平衡。解決辦法是在具體語料采集環(huán)節(jié)之前要進(jìn)行取樣論證,根據(jù)設(shè)計(jì)容量和語料來源、獲得途徑、著作權(quán)法等相關(guān)法律法規(guī)明確取樣準(zhǔn)則和標(biāo)準(zhǔn)。然后根據(jù)取樣準(zhǔn)則進(jìn)行隨機(jī)簡(jiǎn)單抽樣、先導(dǎo)分析并進(jìn)而制定臨床醫(yī)療英語應(yīng)用文語料庫的工作計(jì)劃和工作流程。建設(shè)難點(diǎn)是語料庫的標(biāo)注。即把表示各種語言特征的附碼添加到相應(yīng)的語言成分上,以便于計(jì)算機(jī)對(duì)特定語料進(jìn)行識(shí)別和提取。標(biāo)注工作的加工深度直接影響整個(gè)語料庫的質(zhì)量和應(yīng)用價(jià)值。解決辦法為實(shí)施標(biāo)注工作前確定標(biāo)注環(huán)境、工具、標(biāo)注內(nèi)容和規(guī)則、制定標(biāo)注標(biāo)記集等,確保語料標(biāo)注的一致性和準(zhǔn)確性。限于篇幅,筆者將另文贅述。

臨床醫(yī)療英語應(yīng)用文語料庫的建設(shè)和相關(guān)研究,一方面,可提升語料庫研究在國(guó)內(nèi)專業(yè)領(lǐng)域理論研究基礎(chǔ)。另一方面,可以通過在臨床醫(yī)學(xué)領(lǐng)域的應(yīng)用,有利于解決該領(lǐng)域國(guó)內(nèi)外科研技術(shù)交流中的語言障礙,提升本領(lǐng)域的學(xué)術(shù)交流合作。此外,也可促進(jìn)臨床醫(yī)學(xué)在詞典編纂、術(shù)語研究、語篇分析、文本資料分析、教材編寫和語言教學(xué)等方面發(fā)展,此領(lǐng)域的研究工作具有重要的理論和現(xiàn)實(shí)意義。

參考文獻(xiàn):

[1]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.

[2]Kennedy.G.An Introduction to Corpus Linguistics[M].London:Addison Wesley Longman Limited,1998.187.

[3]梁茂成.語料庫英語教程[M].北京:外語教學(xué)與研究出版社,2010.37.

[4]何安平.語料庫輔助英語教學(xué)入門(修訂版)[M].北京:外語教學(xué)與研究出版社,2017.204.

課題項(xiàng)目:臨床醫(yī)療應(yīng)用文語料庫建設(shè)和研究;項(xiàng)目類別:2016年中青年項(xiàng)目;項(xiàng)目編號(hào):ZQN2016-10。

猜你喜歡
應(yīng)用文語料語料庫
應(yīng)用文寫作:語言簡(jiǎn)練、得體、有效
《語料庫翻譯文體學(xué)》評(píng)介
高職應(yīng)用文寫作教學(xué)改革與創(chuàng)新
活力(2019年21期)2019-04-01 12:18:24
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
高職應(yīng)用文教學(xué)方法初探
新課程研究(2016年3期)2016-12-01 05:54:16
關(guān)于高職《應(yīng)用文寫作》教學(xué)改革的思考
華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
《苗防備覽》中的湘西語料
怀宁县| 明星| 高淳县| 泰安市| 仁化县| 扎兰屯市| 若尔盖县| 镇江市| 封开县| 广宗县| 菏泽市| 双流县| 柯坪县| 寿阳县| 安义县| 大厂| 和林格尔县| 巧家县| 合川市| 田东县| 清涧县| 桂林市| 泗水县| 忻州市| 广西| 易门县| 承德市| 苗栗市| 剑河县| 湛江市| 普洱| 郎溪县| 张掖市| 遂溪县| 宜君县| 淮安市| 宁远县| 揭阳市| 繁昌县| 鸡东县| 福清市|