国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

復雜科技術語構詞中的語素化

2015-05-11 09:29于東等
中國科技術語 2015年2期

于東等

摘 要:復雜術語通常作為整體使用,具有詞的特征,其中包含的其他術語或通用詞的詞匯地位下降為語素,即語素化。在該視角下,具體學科的復雜術語構詞可描述為三層模型:首先學科基本概念由學科基元語素表征,然后由學科基元語素擴展構成固有語素組,最終由固有語素組擴展構成復雜術語。統(tǒng)計顯示,在通信學科中超過80%的術語均包含學科基元語素,幾乎所有術語均包含固有語素組。

關鍵詞:復雜科技術語,語素化,學科基元語素,固有語素組

中圖分類號:H083;N04 文獻標識碼:A 文章編號:1673-8578(2015)02-0015-06

Morphemization in Complex Terms Constitution

YU Dong RAO Gaoqi TANG Gongbo XUN Endong

Abstract: In Chinese, complex terms are usually used as one word, so other terms or general words that constitute the term can be seen as morphemes, so called morphemization. Under this view, complex term formation can be described as a three layer model: firstly, basic concepts of a subject can be described by a number of domain element morphemes; then, inherent morpheme groups are extended based on domain element morphemes; finally, complex terms are formed by using inherent morpheme groups. Statistics show that more than 80% terms in communication science contain domain element morphemes and almost all terms contain inherent morpheme groups.

Keywords: complex term, morphemization, domain element morpheme, inherent morpheme group

收稿日期:2014-12-11

基金項目:國家自然科學基金項目(61300081,61170162);國家科技支撐項目(2012BAH16F00);北京語言大學中央高?;究蒲袠I(yè)務專項資金(15YJ030006)

作者簡介:于東(1982—) ,男,山東日照人,博士,講師,研究方向為計算語言學。通信方式:yudong_blcu@126.com。

引 言

隨著科技不斷發(fā)展,新概念不斷涌現(xiàn),作為概念載體的科技術語的數(shù)量飛速增長。在中文中,由于無法為每個概念創(chuàng)造全新的詞語,由多個“單詞”復合構成的復雜術語成為概念表示的主要形式。研究復雜術語的構詞結構,不僅可以發(fā)展對中文術語的認識,在實踐上還能夠為概念相似度計算、新術語發(fā)現(xiàn)、語義分析、機器翻譯和信息檢索等提供理論支撐。

在《現(xiàn)代術語學引論》[1]中,將“采用原有單詞構成詞組表示新的概念(的術語)”定義為“詞組型術語”,比如“碼分多址”“赫夫曼編碼”“高斯最小頻移鍵控”等。與詞組型術語相對應的則是“單詞型術語”,例如“比特”。而實際上,術語無論內部結構復雜或者簡單,其所指必然只有一個概念,從語法功能和語義的角度上看都是一個整體。

在構詞理論中,造詞材料一旦組合成詞,根據(jù)同類性原則彼此均要以“語素”的身份出現(xiàn)[2-3]。從這個角度而言,“詞組型術語”并非真正詞組或短語,詞組型術語定義中“采用原有單詞”所指的單詞,在復雜術語中應不再具有詞匯屬性,而成為構詞的語素。而且,“單詞型術語”本身經(jīng)常用作“詞組型術語”的組成部分。其自身又分為兩類:可以單獨做術語和不能單獨做術語。這與合成詞中語素的表現(xiàn)十分相似。另一方面,構成術語的諸多“單元”(不僅僅是單詞)與其獨立使用時有所不同,出現(xiàn)了“語素化”的現(xiàn)象。原有單詞在術語中常出現(xiàn)語義壓縮、形態(tài)縮略、詞性變換等。將復雜術語看成為若干詞的組合,不如看成是若干語素或語素組的組合。因此,從語素角度分析術語構詞特征,更符合實際情況和語言理論。本文將具有內部結構的術語視為整體,姑且稱為復雜術語。在該視角下,我們從語素構詞角度研究復雜術語中語素形態(tài)和構詞特征。

此外,對于一個學科而言,學科中的術語和它本身表征的概念系統(tǒng)具有等價關系。概念系統(tǒng)的復雜性將體現(xiàn)在術語構詞中,具體表現(xiàn)為構成復雜術語的語素之間存在內在聯(lián)系和規(guī)律。以通信科學為例,選擇全國科學技術名詞審定委員會發(fā)布的《通信科學技術名詞》(2008版)[4]作為研究對象,并對其中的2107條術語進行了包括語素切分、語素類型在內的標注。通過分析這些復雜術語的語素類型和來源,并對其進入術語形成語素過程中的語素化現(xiàn)象進行分析和討論,我們發(fā)現(xiàn)特定學科術語紛繁復雜、數(shù)量巨大的背后是少數(shù)基元概念組合構成概念組,由概念組再組成術語概念的過程。具體到物質層面就是學科基元語素組成語素組,由語素組組合構成大量復雜術語。

一 科技術語構詞的語素化機制

邱艷萍在《概念整合在語素化構詞中的作用》中指出[5],語素化主要分為兩類:音節(jié)語素化和詞的語素化。前者指本來不表義的音節(jié)變成了表義的語素;后者則指漢語中已經(jīng)存在的詞,它們的詞匯地位發(fā)生變化,由詞下調為一個構詞語素,以便派生新詞。本文的研究主要集中在后一種,即詞的語素化方面。endprint

對于復雜術語中,語素化現(xiàn)象又可以進一步分為兩種:第一種,是直接將詞語作為新詞的一部分使用。這樣的例子如“比特滑動”“插入損耗”“接入?yún)f(xié)議”等,這種現(xiàn)象在我們標注的術語中占較大比例。第二種,是將詞語進行若干形式變換和處理后,形成構成新術語的語素。這主要表現(xiàn)在語義和形態(tài)兩方面。在本文研究對象中,語義方面的語素化主要表現(xiàn)為語義范圍的縮小與轉化,如:

(1)瀏覽器——萬維網(wǎng)(Web)服務的客戶端瀏覽程序??上蛉f維網(wǎng)服務器發(fā)送各種請求,并對從服務器發(fā)來的超文本信息和各種多媒體數(shù)據(jù)格式進行解釋、顯示和播放。(語義縮小)

(2)游牧性——用戶或終端慢速移動,或無需跨區(qū)切換的特性。(語義轉化)

其中,(1)內語素“瀏覽”的語義縮小為了“瀏覽網(wǎng)頁”,(2)“游牧”則完全脫離了其本義。

在形態(tài)上的表現(xiàn)有位移(相對于定義中的表達順序)和縮略,如:

(3)比特劫取——泛指借用分配給某些信息傳輸用的比特來傳送另外功能的操作。(位移)

(4)跳頻——無線傳輸中,射頻頻率按照某種特定算法發(fā)生的重復變化……(縮略與位移)

其中,(3)的原始定義中的實際動作是“截取”,“比特”是動作的受事,通常應出現(xiàn)在動作的后面。但語素化過程中“比特”出現(xiàn)了位移。(4)中“跳”所指稱的動作是“跳轉”,“頻”指稱“頻率”, 是“跳轉”的主語。它在語素化中發(fā)生了縮略,且同時發(fā)生了位移。

另一方面,術語和它本身表征的概念都具有系統(tǒng)性,這樣的系統(tǒng)性同樣反映在術語構詞的語素集合中??梢哉J為語素在術語內和術語間也具有語義上的聯(lián)系。具體來說,科技術語是具體概念的表征,對于一個特定概念而言,根據(jù)概念層級不同,一般存在上位概念、下位概念,實際上是學科概念體系中的一個分支節(jié)點。整個學科中,所有的概念可以形成樹狀結構,如圖1所示,“通信”和它的4種下位概念,構成該學科內概念體系的一棵子樹。

圖1 術語“通信”構成的概念樹

對于某個學科的術語而言,新術語的構詞與術語概念在概念體系中所處的層級高度相關。較上位的概念出現(xiàn)較早,往往是學科中的基本概念,因此其對應術語的構詞形式大多比較簡單,可認為是學科基本術語。而較下位概念,往往是上位概念在某種情形下的擴展或限定,其對應術語的構詞較多采用“上位概念+限定語/補充成分”的形式加以描述。這樣的情況在我們標注的數(shù)據(jù)中占83.4%。在這樣的結構中,上位概念往往由學科基本術語演化而得到,而限定語的來源則頗為廣泛。

從語素角度來看,術語“圖像通信”中,“圖像”和“通信”是詞匯語素化的典型,其中“圖像”是基本概念“通信”的限定成分。兩者均可進一步劃分為單字語素“通”“信”和“圖”“像”。而在該術語中,它們實際上能夠作為語素組整體出現(xiàn)。學界通常認為語素組具有和語素同樣的構詞、造詞功能[6]。為區(qū)別二者,本文將“信”“圖”這樣的單字語素稱為學科基元語素。復雜術語中學科基元語素和語素組在構詞中的作用將在第二部分進行詳細介紹。

二 從語素到復雜術語

對于大部分學科,隨著學科研究不斷深入,該學科的術語會逐漸增多,這是詞匯系統(tǒng)開放性的一個縮影。但通過觀察可以發(fā)現(xiàn),特定學科中,大部術語都是復雜術語或者“詞組型術語”,其內部仍存在細分結構。正是這樣的細分結構,使得學科術語數(shù)量巨大,同時所使用的語素和語素組卻十分有限,即術語構詞中體現(xiàn)出語言宏觀的“有限單元形成無限組合”的特性。

為了描述這樣的有限單元,我們對通信學科數(shù)據(jù)集合進行了最小語素單元的劃分,以“最小音義結合單位”為依據(jù),將術語集中的每條術語進行劃分,得到的語素可認為是該學科中不可再分概念(原子概念)的體現(xiàn),我們稱之為原子語素。如(5)至(8)所示。

(5)通信——通(交流、溝通)+ 信(信息)

(6)雙工——雙(雙向)+工(工作模式)

(7)香農(nóng)熵——香農(nóng)(Shannon)+熵(熱力學標量)

(8)長波——長(長的)+波(電磁波)

通過觀察發(fā)現(xiàn),類似(5)(6)(8)的術語雖是多語素復合詞,但也經(jīng)常作為整體被語素化,成為復雜科技術語內部的一個語素組。相反,復雜科技術語并不直接操作原子語素,而是在語義上對原子語素進行了整合,通過使用語義更加明確的語素組實現(xiàn)構詞。

同時,語素組還可以有效減少語素多義同形的現(xiàn)象。語素組所表示的復合概念直接參與構成復雜科技術語所指稱的概念。且語素組在學科內重復使用,對整個術語的學科性起到基礎的構建作用。每種語素組和構成它們的原子語素間的對應關系又相對固定。如(9)(10)所示。

(9)高斯噪聲——高斯+噪聲(噪+聲)

(10)通信衛(wèi)星——通信(通+信)+衛(wèi)星(衛(wèi)+星)

上述過程中,原子語素往往先組合成為語素組,然后再由這些語素組經(jīng)過組合和變換,形成形式更為復雜的術語。其構詞層次結構如圖2所示。

必須強調的是,雖然語素組在語義和構詞上有重要作用,但是其并非一種新的語法單位:它只是語素之間的一種緊密結合。因此語素組也可以和語素直接構成詞,而不違背相似性原則。

圖2 復雜科技術語的構詞層次結構

對通信學科術語進行統(tǒng)計發(fā)現(xiàn),原子語素的數(shù)量遠遠少于由其構成的語素組的數(shù)量,能產(chǎn)性也遠遠小于語素組。語素組的高能產(chǎn)性背后是少數(shù)學科基本概念組合構成大量概念組,然后再由概念組組成更復雜的概念的過程。因此可以認為,語素組這一中間層次的存在是復雜術語巨大能產(chǎn)性的基礎和關鍵。

此外,在術語構成成分中,根據(jù)語素來源不同,還可以進一步分析語素組成與學科概念體系之間的聯(lián)系,這樣的分析有助于學科術語制定和規(guī)范化,本文在第三、四部分對此進行討論。

三 學科基元語素endprint

構成學科術語集合的眾多原子語素也存在來源的差異。如例(8)中,“波”指代的概念是“電磁波”,符合通信學科的語境。類似還有“信”“頻”“香農(nóng)”等。這些原子語素都具有通信學科的特征,即不(常)出現(xiàn)在非通信學科詞語中。本文將具有這樣性質的原子語素定義為學科基元語素,后文簡稱基元語素。而例(8)中語素“長”的語義和其在普通詞匯中無異,均表示“兩端之間距離大”。類似還有“雙”“短”“系統(tǒng)”“模型”等。這些語素常作為學科術語的限定成分出現(xiàn),在構造復雜術語的過程中不可或缺,只是它們自己的語義不具有學科性,可認為是學科無關的通用語素。

表1中給出了通信學科術語集中統(tǒng)計得到的高頻基元語素示例及其頻率數(shù)據(jù)。通過標注和統(tǒng)計2107條術語,本文最終確定該學科的基元語素共130個。這些基元語素可以進一步分為音譯基元語素(如“香農(nóng)”)和基本基元語素。在通信術語中音譯基元語素43條,基本基元語素87條。它們在術語中的分布情況如圖3所示。

統(tǒng)計發(fā)現(xiàn),在術語集中包含基元語素的術語共有1694條,占全部術語的80.4%,其中由基本基元語素單獨生成的有1670條,音譯基元語素單獨生成的有120條。從統(tǒng)計來看,基元語素構造了學科中大部分的術語,說明學科相關的語義表示在術語這一詞匯系統(tǒng)中占據(jù)主導地位。

同時也注意到,仍存在一部分術語不包含任何基元語素,如“每戶平均收入”(電信運營商用于測定來自每個用戶收入的指標)。從字面上看,此類術語的學科特征不明顯,較難判斷其必然屬于通信學科。這是因為此類術語經(jīng)常與學科內其他術語共同出現(xiàn)和使用,其代表學科屬性的部分在使用中為避免贅述而省略。

基元語素生成術語的能力差異巨大,如“網(wǎng)”共出現(xiàn)在214條術語中?!熬W(wǎng)”多次和“絡”組合并穩(wěn)定出現(xiàn)在許多術語中。第四部分將對其進行詳細介紹。

四 學科固有語素組

和基元語素類似,本文將術語集中穩(wěn)固組合、表達學科特定概念的語素組稱為學科固有語素組。在基元語素的基礎上,筆者進一步篩選出學科固有語素組。表2為通信學科術語集中統(tǒng)計得到的高頻固有語素組。

固有語素組并非完全由基元語素構成。如“無線”,“無”就是一個非學科基元語素,但是和基元語素“線”一同構成了在大量術語中穩(wěn)定重復使用的語素組“無線”,并且表達了通信學科的學科語義。因此固有語素組的強大構詞能力不僅來源于基元語素的組合,也來源于基元語素和非基元語素的組合。

由圖4可以發(fā)現(xiàn),出現(xiàn)頻率不小于10次的語素組有36條,在所有的語素組中占11.43%,說明少量固有語素組具有強大構詞能力。如(11)所示。

(11)數(shù)字(參與構建68條術語)

數(shù)字——數(shù)字 通信

數(shù)字——數(shù)字 信號

數(shù)字——數(shù)字 化

數(shù)字——數(shù)字 差錯

數(shù)字——數(shù)字 線 對 增益

……

較之基元語素,語素組的構詞能力分布表現(xiàn)出了更加明顯的長尾現(xiàn)象。這也從一個側面反映了學科術語的概念集中程度。此外,基元語素生成學科固有語素組的能力,也表現(xiàn)了類似的現(xiàn)象,如表3和圖5所示。

在術語集中,復雜科技術語的語素組平均長度為5.4(包括非固有語素組)。但是所蘊含的固有語素組大多為一個。這進一步表明了固有語素組對學科概念具有較好的表征特性,即復雜術語多由一個上位概念和其他非學科限定語復合構成。如圖6為“微波通信系統(tǒng)”這一術語從語素到語素組再到術語本身的構成過程。

五 語素化視角下的術語構詞

從語素化的視角出發(fā),復雜科技術語的構詞更能體現(xiàn)術語所對應概念體系的特點。本文所提出的學科基元語素、學科固有語素組的概念,實質上就是學科概念體系在復雜術語中的映射過程。可以看出,學科術語的構詞就是概念組合的過程,表現(xiàn)在物質層面就是從學科基元語素到復雜科技術語的構建過程。

基元語素對于一個特定學科而言,起到基礎性作用,是構建該學科概念和術語的核心。并且我們有理由稍微大膽地認為它們也是構建整個學科知識的核心。如圖7中,圍繞基元語素“頻”,能夠構建出通信學科若干復雜術語。

對于術語規(guī)范化而言,制定術語集進行科技名字規(guī)范可以使用同樣的方法,即從基元語素出發(fā),進行規(guī)范。一個理想的科技術語應當包含有學科基元語素或學科固有語素組,使得術語的學科性語義表征更為具體,亦不會引起混淆。

另一方面,隨著學科交叉的空前深入,不同學科的語素和語素組以前所未有的速度和規(guī)?;ハ酀B透。而科技進步又使得大量學科概念成為日常生活中的一般概念。學科與學科之間和學科與通用之間的界限日益模糊。因而從基元語素和固有語素組的層面上對術語進行規(guī)范和界定將對術語工作提供有益的幫助。

參考文獻

[1] 馮志偉. 現(xiàn)代術語學引論[M]. 北京:商務印書館, 2011.

[2] 曹德和. 語速研究的性質、方法及語料來源[J]. 復旦學報:社會科學版,2003 (6):134-140.

[3] 劉力堅. 復合詞造詞材料的語素化問題[J]. 浙江師范大學學報:社會科學版,2005 (4):20-24.

[4] 科學技術名詞[M]. 北京:科學出版社,2008.

[5] 邱艷萍. 概念整合在語素化構詞中的作用[J].西南民族大學學報:社會科學版,2012 (S1):178-181.

[6] 丁建川.“語素組合體”述要[J]. 廣西社會科學,2005(7):162-165.endprint

南皮县| 会同县| 北安市| 乌审旗| 衢州市| 万荣县| 黔南| 潮州市| 高邮市| 潼南县| 都昌县| 扶风县| 潍坊市| 台中县| 晋江市| 石门县| 毕节市| 泾源县| 遵化市| 霞浦县| 井研县| 柳州市| 冷水江市| 韩城市| 贡山| 仁布县| 宜川县| 潢川县| 伊金霍洛旗| 鄂尔多斯市| 玛多县| 盐边县| 北安市| 永福县| 杭锦后旗| 西昌市| 洛川县| 彰化县| 榆林市| 德保县| 蕉岭县|