国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語料庫的應用語言學詞塊及詞塊表的構建研究

2019-01-24 07:27
關鍵詞:詞塊語料語言學

(齊齊哈爾工程學院 黑龍江 齊齊哈爾 161000)

詞塊是語言應用的重要單位,在理解語言、產(chǎn)生語言中發(fā)揮重要的作用。語料庫則為詞塊的使用提供了存儲的條件與環(huán)境,使詞塊使用者無需依據(jù)語法規(guī)則對語言進行生成,從而,有效提升語言表達的準確性與連貫性。以英語為例,英語中有很多兼有詞匯、兼有語法雙重語言結構,這些結構可作為一個總體內(nèi)容在人類大腦中進行儲存。在人們應用詞匯時,可通過詞塊的擴大使其有效掌握詞匯語言結構,從而實現(xiàn)語言知識的拓展以及交際水平的提升。因此,針對語料庫的應用語言學詞塊進行研究,并對詞塊表進行構建,對語言發(fā)展來說具有重要的意義。

1.基于語料庫的應用語言學詞塊使用現(xiàn)狀

針對詞塊的研究已有多年的歷史,詞塊理論也得到廣大語言研究者的認可,但在詞塊實際應用中卻存在不足之處。各類詞匯表都未曾展現(xiàn)出詞塊的理念,也沒有將詞塊納入語言學習計劃中,導致很多語言應用者對詞塊的認知過于薄弱。同時,在進行語言教學時,也沒有將詞塊學習作為教學重點,對詞塊的應用與發(fā)展缺乏積極性。結合語料庫來看,可知語料庫對部分語言的翻譯存在較為明顯的問題,甚至會對語言使用者帶來直接的誤導,導致其在翻譯、交際過程中存在語言應用不嚴謹?shù)默F(xiàn)象。以英語為例,常有部分需要單數(shù)的詞語被拼寫成復數(shù)(例:infrastructure-infrastructures),雖然錯誤較為簡單,但還是要對其加以重視,減輕語用誤解,同時,語料庫還存在標點符號、語法性錯誤等現(xiàn)象。以英語為例,中英文標點符號混淆,易對翻譯過程帶來影響,也易導致部分單詞錯誤的排列,影響語言的理解過程。而詞塊中冠詞與主謂不一致、名詞單復數(shù)等錯誤,則易導致語用過程存在混淆現(xiàn)象,翻譯文本也易被理解的支離破碎。此外,也有部分語料庫編撰人員沒有對資料進行仔細審核,導致語用者在對語言進行翻譯、應用發(fā)展的時候,會出現(xiàn)不足之處。

2.基于語料庫的應用語言學詞塊表構建原則

在利用語料庫進行應用語言學詞塊表構建時,需要遵循視覺設計合理、詞塊分類明確、語料庫檢索內(nèi)容豐富、詞塊語用信息完善等原則。因此,在進行詞塊表構建時首先要對視覺設計加以重視,對語用詞塊內(nèi)容進行優(yōu)化,重視視覺效果,使其充分符合語用人員的思維與習慣。在視覺設計上則需突出詞塊表的特色與重點,還需突出學術語言特色,對影響力較大的學術文獻進行深入介紹,引導語用人員對學術的全面了解。其次,還需對詞塊進行分類,對詞塊應用排序有所側(cè)重。主要由于不同國家具有不同文化,所以詞塊表在構建時需要設置合理的檢索欄目,并以正確的目的語語序、習慣為主,找尋母語與目的語之間的契合點,從而提高詞塊表的實用性。再次,在針對語料庫詞塊表在線檢索設計時,需要結合傳統(tǒng)檢索方法,了解其不足之處,從而進行創(chuàng)新,使語用人員在檢索時能得到不同詞塊所擁有的豐富語義,并呈現(xiàn)出詞塊的語用實例,為語用人員帶來詳細的參考資料。

3.基于語料庫的應用語言學詞塊表的構建過程

3.1 語料收集及分析

本次研究所利用的目的語語料皆是2005年至今語言學應用專業(yè)人員參與的實證研究結果,包含國際九種SSCI語言學雜志中學術論文,例如:Applied Linguistics、Language for specific purposes 等,語料較為權威且準確,經(jīng)過核查,共計語料約為300000詞。涉及目的語教學、二語教學等多樣化話題。并采取隨機挑選策略,將文章正文納入語料庫中,為詞塊表的構建奠定基礎。本次研究的首要問題時應用語言學詞塊表的構建,為解決這一問題,首先需要設定頻率域值域標準,從而安排應用語言學詞塊。詞塊頻率域值域的設置與選擇參考Ellis編制詞塊表的提取標準,大致設為20次/百萬字,值域標準大致設為十分之一文本中出現(xiàn)的詞塊,利用Antconc多功能檢索工具進行設計。其次,還需將語料庫內(nèi)輸入檢索工具,設定檢索長度、最低頻數(shù),得到總類符及總字符的數(shù)量。并利用Excel工具針對語料庫內(nèi)文章進行隨機抽取,選取高頻應用類符詞塊,并對其中占位符進行篩選,去除非語言單位、語法不合內(nèi)容等,得到涵蓋使用頻率較高的應用語言學詞塊表。此外,本次研究還需設定詞塊頻率排序,并豐富高頻詞塊的語用功能與結構特點內(nèi)容。為此,可將詞塊分為指示性、態(tài)度性、話語組織性三類,結合不同類別進行劃分。

3.2 詞塊提取及詞頻分析

在構建應用語言學詞塊表時還需對詞塊進行提取,針對詞塊的提取可利用多方印證法進行,將文獻集中,利用語料庫及人工識別工具等對詞塊進行提取。保障詞塊的提取可按照lemma(詞條)進行,與參考文獻與目的語語料充分結合,從而設計出詞條列表(lemma matches list,以下簡稱 LML),例如 Be 動詞(am、is、are/was、were)等。利用詞條功能,去除屈折形式,且不設頻點,提取詞塊,加載列表,從而將其合并,做標準化處理,保障檢索結果的準確性。同時,詞塊出現(xiàn)頻率是詞塊表構建的決定性特點,當提取率達到40次/百萬詞時,此提取頻點為較高頻點。而提取率達到20次/百萬詞時,此提取頻點為標準頻點。因此,可將詞塊提取頻點設定為10到40次/百萬詞,本次研究設定為10次/百萬詞。保障200個提取頻率最高的詞塊中有163個及以上的較高頻點詞塊,而此200個詞塊則是本次研究的重中之重。

語料庫中出現(xiàn)最高頻率的詞塊中,每200個中有百分之二十的詞塊被包含入應用語言學詞塊表的構建中,但需要注意這些詞塊中須有百分之十的詞塊出現(xiàn)40次以上,實驗表明,語料庫詞塊對學術語言教學、寫作、翻譯中具有重要的作用。這也代表研究人員在構建詞塊表以及語用人員在檢索詞塊表時還需充分了解這些詞塊的必要性及應用價值,因此,需要將語料庫與應用語言學詞塊表的構建緊密相連,從而編制具有語言應用特色的詞塊表。

3.3 應用語言學詞塊功能分類

依照詞塊語用功能分類方法,可將詞塊表中詞塊分為指示性、態(tài)度性、話語組織性詞塊三類。在設計應用語言學詞塊表時,需保證指示性詞塊可占詞塊表的69.7%,充分展示出指示性詞塊的重點語用功能。同時,指示性詞塊是語用范圍內(nèi)使用頻率最高的詞塊,因此需對其加以重視。而態(tài)度性詞塊與話語組織性詞塊二者在語用范圍內(nèi)使用頻率相似,與指示性詞塊共同構成語用范圍最長應用的詞塊內(nèi)容。因此,在進行應用語言學詞塊語用功能分類時,可將指示性詞塊作為基礎。指示性、態(tài)度性、話語組織性詞塊功能劃分見表1。

表1 應用語言學詞塊(三類)功能劃分

指示性詞塊在語料庫與詞塊表的分布規(guī)律相似,但在詞塊表中,指示性詞塊的應用頻率明顯較高,主要針對語用篇目、語用情景中的時間與空間的指代。此塊表中則需主要展示指示性詞塊所應用的內(nèi)容與主題。 例如 teacher and student(師生)、teach and learn(教與學)等。其在詞塊表中的結構多以介詞短語及名詞短語為主,例如:at the end、the same words等。此外,語料庫將對彼此快納入指示性詞塊的劃分,而詞塊表中也將其實用性充分展現(xiàn)。態(tài)度性詞塊與話語組織性詞塊大多針對語料庫中語篇指示、話題介紹等進行設計,在構建詞塊表時需要結合學術論文中常出現(xiàn)的詞塊內(nèi)容進行編撰,保障詞塊使用頻率與真實頻率相符。最后,還需針對應用語言學詞塊的結構繼續(xù)擰分析,從而確定其在詞塊表中語用功能。有語用學者會利用大量的名詞詞組來確定學術語用意義的廣泛內(nèi)涵,例如數(shù)量詞(number)、地點詞(end of the...)、質(zhì)量詞(nature of)等,最終保障詞塊表中詞塊的主題可充分闡釋語用功能。

4.結語

結合大量應用語言學SSCI學術論文,編制應用語言學詞塊表,同時針對詞塊進行分析與研究,探索語言應用中詞塊的使用,充分重視語用條件,將語料庫作為詞塊應用一大措施,以提高語用水平,減少語用偏誤現(xiàn)象的出現(xiàn),有效避免語用交際、翻譯、閱讀等出現(xiàn)的誤解,并為語言學的研究提供更多參考資料。

猜你喜歡
詞塊語料語言學
體認社會語言學芻議
《復制性研究在應用語言學中的實踐》評介
高中英語詞塊教學現(xiàn)狀調(diào)查研究及應用策略分析
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
認知語言學與對外漢語教學
詞塊中心教學法在高職英語教學中的應用初探
詞塊理論與高職英語翻譯教學研究
華語電影作為真實語料在翻譯教學中的應用
詞塊在初中英語寫作教學中的應用研究
《苗防備覽》中的湘西語料