国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)言信息處理與普通話水平測(cè)試語(yǔ)法研究

2015-03-28 18:40方永斌魏剛
紅河學(xué)院學(xué)報(bào) 2015年1期
關(guān)鍵詞:信息處理普通話方言

方永斌,魏剛

(云南師范大學(xué)文學(xué)院,昆明 650500)

語(yǔ)言信息處理與普通話水平測(cè)試語(yǔ)法研究

方永斌,魏剛

(云南師范大學(xué)文學(xué)院,昆明 650500)

普通話水平測(cè)試進(jìn)入計(jì)算機(jī)處理階段已經(jīng)成為一種趨勢(shì)和可能,然而在對(duì)普通話水平測(cè)試進(jìn)行計(jì)算機(jī)處理的過(guò)程當(dāng)中卻困難重重,語(yǔ)法問(wèn)題是首要解決的問(wèn)題。立足語(yǔ)言信息處理對(duì)普通話水平測(cè)試的影響,重點(diǎn)闡述語(yǔ)法問(wèn)題在普通話水平測(cè)試的計(jì)算機(jī)處理中的作用和地位,結(jié)合實(shí)際,對(duì)現(xiàn)實(shí)存在的語(yǔ)法問(wèn)題進(jìn)行分析和探究,并試圖從中找到解決對(duì)策,以更加完善信息化的普通話水平測(cè)試。

語(yǔ)法;語(yǔ)言信息處理;普通話水平測(cè)試

前言

隨著現(xiàn)代技術(shù)的發(fā)展,各領(lǐng)域都或多或少地進(jìn)入了信息化和知識(shí)化階段,語(yǔ)言學(xué)也進(jìn)入了信息化階段,也就誕生了語(yǔ)言信息處理這門學(xué)科。“語(yǔ)言信息處理,是用計(jì)算機(jī)對(duì)語(yǔ)言信息(包括口語(yǔ)和書(shū)面語(yǔ))進(jìn)行編碼、轉(zhuǎn)換、傳輸、解碼、存儲(chǔ)、分析等進(jìn)行加工處理的科學(xué)?!保?]語(yǔ)言信息處理技術(shù)在現(xiàn)代化及信息化建設(shè)中的作用越來(lái)越引起人們的重視,它對(duì)現(xiàn)代漢語(yǔ)的研究也提出了更高的要求。

我國(guó)是一個(gè)多民族的國(guó)家,各民族的交流就需要民族間的共通語(yǔ),我國(guó)的通用語(yǔ)是漢語(yǔ)普通話,漢語(yǔ)普通話(以北方方言為基礎(chǔ))就成為了我國(guó)五十六個(gè)民族間交流的通用語(yǔ),與此同時(shí),普通話水平測(cè)試也就顯得更為重要。隨著我國(guó)語(yǔ)言信息處理技術(shù)的不斷進(jìn)步,語(yǔ)言信息處理已經(jīng)應(yīng)用到了普通話水平測(cè)試上,面對(duì)國(guó)家倡導(dǎo)的努力學(xué)習(xí)普通話,大力推廣、普及和使用普通話,完善和優(yōu)化語(yǔ)言信息處理基礎(chǔ)上的普通話水平測(cè)試已成為一項(xiàng)十分重要而迫切的任務(wù)。推廣、普及和使用普通話一直是我國(guó)推行的基本語(yǔ)言國(guó)策,普通話水平測(cè)試又是這項(xiàng)國(guó)策的重要組成部分,而加快和促進(jìn)普通話水平測(cè)試手段的現(xiàn)代化進(jìn)程則具有重要的歷史意義。

在現(xiàn)代科技的發(fā)展和支持下,語(yǔ)言信息處理應(yīng)用到普通話水平測(cè)試上已成為可能,而當(dāng)下的問(wèn)題則是調(diào)和語(yǔ)言信息處理與普通話水平測(cè)試的“矛盾”,例如語(yǔ)音、語(yǔ)匯、語(yǔ)法、“說(shuō)話”、地區(qū)間的不兼容等問(wèn)題。在實(shí)行計(jì)算機(jī)式的普通話水平測(cè)試以來(lái),雖然體現(xiàn)了普通話水平測(cè)試的進(jìn)步以及測(cè)試手段的科學(xué)化和客觀化,也在很大程度上減輕了測(cè)評(píng)員的工作負(fù)擔(dān),但也存在諸多問(wèn)題,而語(yǔ)法問(wèn)題尤為突出,尤其是在“說(shuō)話”部分。在語(yǔ)言現(xiàn)象飛速發(fā)展的今天,語(yǔ)言現(xiàn)象也隨之在“語(yǔ)言杠桿”周圍徘徊,新語(yǔ)言現(xiàn)象的頻繁出現(xiàn),致使語(yǔ)法手段的“更新”,由此導(dǎo)致的語(yǔ)法問(wèn)題也層出不窮。比如“很man”,“你走,先”等,因此導(dǎo)致在計(jì)算機(jī)在對(duì)測(cè)試對(duì)象進(jìn)行測(cè)試時(shí)很難正確判斷其說(shuō)話內(nèi)容的語(yǔ)法規(guī)則,同時(shí),也不適合不同地區(qū)、不同地域的普通話水平測(cè)試,因此,在對(duì)普通話水平測(cè)試(PSC)進(jìn)行計(jì)算機(jī)處理的過(guò)程當(dāng)中,語(yǔ)法問(wèn)題就顯得尤為重要。

一 語(yǔ)言信息處理在普通話水平測(cè)試中的作用和地位

普通話水平測(cè)試(PSC)開(kāi)始于國(guó)家語(yǔ)言文字工作委員會(huì)、原國(guó)家教育委員會(huì)、原廣播電影電視部在1994年10月聯(lián)合發(fā)出的《關(guān)于開(kāi)展普通話水平測(cè)試工作的決定》的通知,2000年又通過(guò)立法手段對(duì)普通話水平測(cè)試加以強(qiáng)調(diào)。經(jīng)過(guò)多年的努力,普通話水平測(cè)試工作取得了重大的進(jìn)展和突破,普通話水平測(cè)試的各方面都得到了改進(jìn)和完善,然而,普通話水平測(cè)試作為我國(guó)新興而復(fù)雜的語(yǔ)言測(cè)試工程,與我國(guó)的漢語(yǔ)水平考試(HSK)及國(guó)內(nèi)外其他一些著名的語(yǔ)言測(cè)試相比還顯得不是很成熟,研究成果也不夠豐碩,研究的領(lǐng)域也不是太透徹,還有許多方面需要我們區(qū)探尋和研究。在發(fā)展過(guò)程中,形勢(shì)和任務(wù)的迫切性要求我們能夠跨領(lǐng)域合作,采用新的研究手段和方法,解決在推廣普通話工作中遇到的突出的理論問(wèn)題與實(shí)踐問(wèn)題。

1986年1月召開(kāi)的全國(guó)語(yǔ)言文字工作會(huì)議提出:“信息處理是一門新興的邊緣科學(xué),有廣闊的前景,加強(qiáng)這方面的研究,對(duì)經(jīng)濟(jì)、文化、科學(xué)技術(shù)的發(fā)展具有長(zhǎng)遠(yuǎn)的意義,因此,當(dāng)前語(yǔ)言文字工作的任務(wù)必須包括這項(xiàng)內(nèi)容。”在語(yǔ)言文字工作當(dāng)中要包括漢語(yǔ)漢字的信息處理,在普通話水平測(cè)試中同樣也應(yīng)該包含語(yǔ)言信息處理這一內(nèi)容。在當(dāng)前的社會(huì)形勢(shì)之下,語(yǔ)言信息處理必須或應(yīng)該納入到普通話水平測(cè)試中,作為普通話水平測(cè)試的輔助手段,以響應(yīng)國(guó)家對(duì)普通話推廣工作的重視以及各項(xiàng)政策、法規(guī),在提高普通話水平測(cè)試效率的同時(shí)強(qiáng)化其科學(xué)性和客觀性。

隨著推廣普通話工作以及語(yǔ)言信息技術(shù)的進(jìn)步,大部分地區(qū)已經(jīng)采用實(shí)驗(yàn)語(yǔ)音學(xué)、語(yǔ)音識(shí)別技術(shù)和計(jì)算機(jī)技術(shù)作為輔助手段來(lái)進(jìn)行普通話水平測(cè)試及評(píng)分。與此同時(shí),把普通水平測(cè)試的考試管理工作接入現(xiàn)代化信息技術(shù)已成為趨勢(shì)。然而,“雖有上海、湖北、黑龍江等省市在普通話水平測(cè)試科研和管理工作中引入現(xiàn)代化信息技術(shù),但出現(xiàn)各地獨(dú)立開(kāi)發(fā),重復(fù)建設(shè)、互不兼容、技術(shù)水平參差的不協(xié)調(diào)局面?!保?]這就需要解決各地方音與普通話語(yǔ)音的辯證分析,研發(fā)出一套完整而又適合全國(guó)各地普通話水平測(cè)試的信息管理系統(tǒng)。隨著實(shí)驗(yàn)語(yǔ)音學(xué)、語(yǔ)音識(shí)別技術(shù)和計(jì)算機(jī)技術(shù)在普通話水平測(cè)試中的不斷完善,國(guó)內(nèi)已經(jīng)開(kāi)始著手語(yǔ)音庫(kù)的建立,而且取得了豐碩的成果,“但這些語(yǔ)音數(shù)據(jù)庫(kù)大多是面向信息處理領(lǐng)域。建立普通話培訓(xùn)和水平測(cè)試用標(biāo)準(zhǔn)語(yǔ)音語(yǔ)料庫(kù)和‘中介語(yǔ)’語(yǔ)音語(yǔ)料庫(kù),盡快填補(bǔ)國(guó)內(nèi)這方面的空白,并為深入開(kāi)展測(cè)試研究提供一個(gè)技術(shù)平臺(tái),具有特殊的重要意義?!保?]由此可以看出,普通話水平測(cè)試在語(yǔ)音方面得到了較大的發(fā)展和重視,同時(shí)也在研究領(lǐng)域取得了重大的成就,但是相對(duì)于詞匯、語(yǔ)法方面的研究就顯得較為薄弱,在信息處理基礎(chǔ)上的詞匯、語(yǔ)法研究就更顯薄弱。在此,可能會(huì)有人認(rèn)為普通話水平測(cè)試是對(duì)字、詞、語(yǔ)調(diào)等方面的語(yǔ)音的考察,語(yǔ)法便失去了應(yīng)有的重要地位。在2003年頒布的《普通話水平測(cè)試大綱》就明確闡釋了“普通話水平測(cè)試的內(nèi)容包括普通話語(yǔ)音、詞匯和語(yǔ)法”,語(yǔ)法在普通話水平測(cè)試中同樣具有重要作用,在“說(shuō)話”部分,除了考察語(yǔ)音、語(yǔ)匯外,同樣也考察了語(yǔ)法,只是限于現(xiàn)在計(jì)算機(jī)信息處理的缺失,各方面還有待提高,尤其是需要計(jì)算機(jī)信息處理智能技術(shù)以及機(jī)器翻譯的智能化技術(shù)的支持,因?yàn)椤皺C(jī)器翻譯系統(tǒng)是典型的自然語(yǔ)言處理系統(tǒng)”[3]。

綜上,語(yǔ)言信息處理在普通話水平測(cè)試中具有重要的作用和地位。首先,語(yǔ)言信息處理技術(shù)的發(fā)展,一定程度上反映著我國(guó)信息化水平的提高,而運(yùn)用到普通話水平測(cè)試中則大幅提升了測(cè)試的效率,促進(jìn)普通話水平測(cè)試“質(zhì)量”的提高,同時(shí)也減輕了測(cè)評(píng)員的負(fù)擔(dān)。其次,目前而言,語(yǔ)言信息處理對(duì)普通話水平測(cè)試的語(yǔ)音考核已具備了較完整的管理系統(tǒng),對(duì)測(cè)試中遇到的方音辯證問(wèn)題起到了重要作用,用時(shí)也為語(yǔ)音數(shù)據(jù)庫(kù)的建立提供了堅(jiān)實(shí)的實(shí)踐基礎(chǔ)。再次,“信息、知識(shí)最大最直接的表示就是自然語(yǔ)言”[4],因此通過(guò)語(yǔ)言信息處理的發(fā)展,普通話水平測(cè)試的詞語(yǔ)和語(yǔ)法問(wèn)題同樣會(huì)得到解決,而且,通過(guò)數(shù)據(jù)庫(kù)的建立和計(jì)算機(jī)信息處理技術(shù)的智能化,“自然語(yǔ)言理解”也將取得成功。另外,語(yǔ)言信息處理技術(shù)的發(fā)展,促進(jìn)著全國(guó)通用的普通話水平測(cè)試信息管理系統(tǒng)的建立,隨著語(yǔ)言的發(fā)展而規(guī)范各種語(yǔ)法偏誤,同時(shí)也與時(shí)俱進(jìn),時(shí)刻“更新”和容納新產(chǎn)生的語(yǔ)法現(xiàn)象,進(jìn)一步推進(jìn)我國(guó)的普通話推廣工作。

二 普通話水平測(cè)試(PSC)語(yǔ)法研究的必要性

普通話水平測(cè)試的內(nèi)容包括語(yǔ)音、詞語(yǔ)、語(yǔ)法,但是在實(shí)際測(cè)試當(dāng)中,測(cè)評(píng)員有意無(wú)意地將重心放在了語(yǔ)音部分,考察詞語(yǔ)朗讀、短文閱讀是都傾向于語(yǔ)音的考核。在“說(shuō)話”中,由測(cè)評(píng)員實(shí)際測(cè)試還好,他們或多或少的會(huì)注意語(yǔ)法問(wèn)題,而在計(jì)算機(jī)測(cè)試當(dāng)中,計(jì)算機(jī)是依據(jù)語(yǔ)音、語(yǔ)調(diào)來(lái)確定漢字、詞和句子,再借助語(yǔ)圖來(lái)判斷字詞語(yǔ)音,而后再?gòu)亩嘧只蛏僮謥?lái)判斷連貫與否便評(píng)定成績(jī),語(yǔ)法問(wèn)題的重要性的不到體現(xiàn)。

在實(shí)際的普通話水平測(cè)試中,把語(yǔ)音放在首位是合理的,因?yàn)椤皯?yīng)試人普通話的口語(yǔ)水平首先體現(xiàn)在語(yǔ)音這個(gè)外顯的物質(zhì)外殼上,相對(duì)于語(yǔ)音,詞匯、語(yǔ)法是更深層的兩個(gè)系統(tǒng),特別是語(yǔ)法直覺(jué)性小,隱蔽性最大。”[5]正因?yàn)樵~語(yǔ)、語(yǔ)法是兩個(gè)深層次的系統(tǒng),而語(yǔ)法又是直覺(jué)性小,隱蔽性最大的一個(gè)系統(tǒng),這就更能說(shuō)明,語(yǔ)法是考核不可或缺的一部分,通過(guò)對(duì)語(yǔ)法的考核才能真正體現(xiàn)普通話水平測(cè)試是一種以北方方言為基礎(chǔ),以“北方話詞匯”作為基本詞匯規(guī)范,“以典范的現(xiàn)代白話文著作作為語(yǔ)法規(guī)范”的漢語(yǔ)口語(yǔ)測(cè)試。

普通話水平測(cè)試是一種漢語(yǔ)口語(yǔ)測(cè)試,人們可能會(huì)進(jìn)入一個(gè)誤區(qū),認(rèn)為只要能夠與會(huì)說(shuō)漢語(yǔ)普通話的人進(jìn)行普通話交流便達(dá)到目的。在日常生活中的交際中,人們可能不會(huì)太注重語(yǔ)法問(wèn)題,而就算出現(xiàn)語(yǔ)法上的失誤,人們也能夠理解對(duì)方所要表達(dá)的意義,這主要是基于說(shuō)話雙方對(duì)于某一話題的前提和預(yù)設(shè),這些都是說(shuō)話雙方在潛意識(shí)中就已經(jīng)明了的東西,看來(lái)似乎語(yǔ)法的偏誤在日常生活中并沒(méi)有嚴(yán)重的不良影響。然而,在計(jì)算機(jī)進(jìn)行的普通話水平測(cè)試當(dāng)中卻會(huì)出現(xiàn)很多問(wèn)題。

普通話水平測(cè)試研究的現(xiàn)狀及揭露的問(wèn)題,應(yīng)當(dāng)引起對(duì)語(yǔ)言信息處理基礎(chǔ)上普通話水平測(cè)試語(yǔ)法研究的重視?!镀胀ㄔ捤綔y(cè)試大綱》明確闡釋了“普通話水平測(cè)試的內(nèi)容包括普通話語(yǔ)音、詞匯和語(yǔ)法”,但是自普通話水平測(cè)試借助計(jì)算機(jī)及語(yǔ)音識(shí)別等技術(shù)以來(lái),語(yǔ)法在測(cè)試中就體現(xiàn)得不完整,這主要是由計(jì)算機(jī)技術(shù)的局限性所致。然而,“語(yǔ)法直覺(jué)性小,隱蔽性最大”,且又是《普通話水平測(cè)試大綱》明確闡釋的內(nèi)容,對(duì)普通話水平的考核具有重要的參考價(jià)值,又對(duì)中文信息處理及“自然語(yǔ)言理解”起到了極大的推進(jìn)作用,因此,對(duì)計(jì)算機(jī)基礎(chǔ)上普通話水平測(cè)試的語(yǔ)法研究就很有意義。

三 普通話水平測(cè)試語(yǔ)法研究對(duì)策及建議

推普工作已經(jīng)成為了我國(guó)的一項(xiàng)基本國(guó)策,而普通話水平測(cè)試則又是推普工作的重要組成部分,語(yǔ)言信息技術(shù)的發(fā)展又為普通話水平測(cè)試提供了極為重要的輔助手段,促進(jìn)著推普工作的不斷完善。目前的普通話水平測(cè)試基本上都是以計(jì)算機(jī)為輔助手段,測(cè)試過(guò)程中遇到了諸多問(wèn)題,而語(yǔ)法問(wèn)題最為明顯,針對(duì)這一問(wèn)題,筆者結(jié)合前人的研究成果提出以下對(duì)策及建議。

(一)語(yǔ)言邏輯語(yǔ)法系統(tǒng)的建立

隨著計(jì)算機(jī)的發(fā)展,人們對(duì)語(yǔ)言信息處理的要求越來(lái)越高,而語(yǔ)言信息處理的智能化則成為了人們的共同期望和要求,在普通話水平測(cè)試的計(jì)算機(jī)處理過(guò)程中,面對(duì)日益突出的語(yǔ)法問(wèn)題,計(jì)算機(jī)的智能化成為了無(wú)數(shù)語(yǔ)言研究學(xué)者的共同期盼,語(yǔ)言邏輯語(yǔ)法系統(tǒng)的建立則能夠?yàn)樽匀徽Z(yǔ)言理解提供些許幫助,更能為普通話水平測(cè)試提供一個(gè)完善的語(yǔ)法系統(tǒng)。

“近30年來(lái),邏輯的應(yīng)用范圍從數(shù)學(xué)和哲學(xué)擴(kuò)大到語(yǔ)言學(xué)和計(jì)算機(jī)人工智能科學(xué)等領(lǐng)域,形成了所謂邏輯、語(yǔ)言和信息計(jì)算等學(xué)科的交叉研究。這種研究在西方被稱作形式語(yǔ)義學(xué)或邏輯語(yǔ)法,自上個(gè)世紀(jì)70年代以來(lái),其發(fā)展態(tài)勢(shì)極為迅猛,以著名的蒙太格語(yǔ)法為開(kāi)端,形成了廣義量詞理論、話語(yǔ)表現(xiàn)理論、情境語(yǔ)義學(xué)和類型—邏輯語(yǔ)法等理論?!保?]邏輯、語(yǔ)法、計(jì)算機(jī)技術(shù)的交叉和融合已成為當(dāng)今語(yǔ)言信息處理的趨勢(shì),而且對(duì)于語(yǔ)言信息的智能具有重要作用。

就目前而言,普通話水平測(cè)試注重的是語(yǔ)音部分,詞匯和語(yǔ)法部分相對(duì)薄弱,在“說(shuō)話”的考核中也同樣沒(méi)有注重語(yǔ)法,語(yǔ)音同樣占有了絕對(duì)的主要地位。造成這一結(jié)果的主要原因是當(dāng)今計(jì)算機(jī)技術(shù)的局限性,計(jì)算機(jī)在對(duì)普通話水平測(cè)試進(jìn)行語(yǔ)音識(shí)別等相關(guān)處理時(shí),并不能靈活而又準(zhǔn)確的判斷其“說(shuō)話”內(nèi)容的語(yǔ)法問(wèn)題,并能夠做出相關(guān)分析和評(píng)判,最終對(duì)測(cè)試對(duì)象進(jìn)行客觀合理而又科學(xué)的考核和評(píng)定。語(yǔ)言邏輯語(yǔ)法系統(tǒng)是在計(jì)算機(jī)基礎(chǔ)上進(jìn)行并完成的,它是以自然語(yǔ)言作為對(duì)象,通過(guò)語(yǔ)言的邏輯語(yǔ)法來(lái)進(jìn)行信息處理。在普通話水平測(cè)試中,以測(cè)試對(duì)象的錄像作為對(duì)象,對(duì)其進(jìn)行語(yǔ)法邏輯的信息處理,結(jié)合語(yǔ)音分析,綜合評(píng)判測(cè)試對(duì)象的“語(yǔ)法”能力。

邏輯語(yǔ)法系統(tǒng)是一個(gè)極為復(fù)雜而龐大的系統(tǒng),如果想在目前就達(dá)到自然語(yǔ)言理解,實(shí)現(xiàn)語(yǔ)法的人工智能,準(zhǔn)確輔助普通話水平測(cè)試似乎還不可能,因?yàn)椤白匀徽Z(yǔ)言遠(yuǎn)比人工符號(hào)語(yǔ)言復(fù)雜豐富得多, 很難在一個(gè)框架內(nèi)對(duì)它的句法、語(yǔ)義乃至語(yǔ)用的方方面面進(jìn)行統(tǒng)一處置” [8],同時(shí)也很難將這個(gè)復(fù)雜、龐大的語(yǔ)法系統(tǒng)融合在語(yǔ)言信息處理當(dāng)中。實(shí)現(xiàn)龐雜的語(yǔ)法系統(tǒng)信息化還需要艱難的努力,更需要計(jì)算機(jī)的人工智能技術(shù)的支持,短時(shí)期達(dá)到是極為困難的,但構(gòu)建反映漢語(yǔ)語(yǔ)義特征的系統(tǒng)卻又是勢(shì)在必行。

(二)方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)的建立

漢語(yǔ)普通話具有一定程度的地域性,全國(guó)分為七大方言區(qū):北方方言區(qū)、吳方言區(qū)、粵方言區(qū)、閩方言區(qū)、湘鄂方言區(qū)、客家方言區(qū)、贛方言區(qū),五大官話區(qū):華北官話、中原官話、西北官話、西南官話、江淮官話。普通話水平測(cè)試雖說(shuō)是以標(biāo)準(zhǔn)的漢語(yǔ)普通話作為評(píng)判標(biāo)準(zhǔn),但是在針對(duì)不同官話區(qū)、不同方言區(qū)的普通話水平測(cè)試時(shí),定會(huì)受到地方方言語(yǔ)用習(xí)慣的影響,從而出現(xiàn)了與標(biāo)準(zhǔn)漢語(yǔ)普通話具有差異性的語(yǔ)法現(xiàn)象。漢語(yǔ)普通話是建立在北方方言的基礎(chǔ)上,恪守“以典范的現(xiàn)代白話文著作作為語(yǔ)法規(guī)范”的語(yǔ)法規(guī)則,在出現(xiàn)具有差異性的方言語(yǔ)法現(xiàn)象時(shí),往往計(jì)算機(jī)是無(wú)法準(zhǔn)確處理的。“要真正有效地提高詞義知識(shí)庫(kù)的質(zhì)量,需要在詞類劃分基礎(chǔ)上,增加詞義的語(yǔ)法功能分析和語(yǔ)義搭配限制,綜合利用現(xiàn)有的語(yǔ)法、語(yǔ)義資源,提取多義詞的每個(gè)意義在不同層級(jí)上的各種分布特征”[7],那么,方言詞匯、語(yǔ)法庫(kù)的建立就顯得很重要。

根據(jù)各地的漢語(yǔ)使用差異,構(gòu)建實(shí)用的漢語(yǔ)方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)。在此數(shù)據(jù)庫(kù)基礎(chǔ)上,針對(duì)不同方言區(qū)的測(cè)試對(duì)象進(jìn)行信息處理,雖不可能完全準(zhǔn)確給予評(píng)定,但至少在信息處理上給予了普通話水平測(cè)試極大的幫助,使得普通話水平測(cè)試信息處理系統(tǒng)更加完善。建立具有地方特色的數(shù)據(jù)庫(kù)就需要普通話水平測(cè)試及相關(guān)研究者的努力,建立漢語(yǔ)方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)同樣是一個(gè)浩瀚的工程,它需要語(yǔ)言實(shí)體和計(jì)算機(jī)技術(shù)的支持,而要實(shí)現(xiàn)普通話水平測(cè)試信息系統(tǒng)的通用和全面兼容則更需要各方言區(qū)的漢語(yǔ)方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)的支持和糅合。構(gòu)建漢語(yǔ)方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)的同時(shí)還要建立標(biāo)準(zhǔn)普通話的詞匯、語(yǔ)法數(shù)據(jù)庫(kù),對(duì)方言詞匯、語(yǔ)法的錯(cuò)誤現(xiàn)象給予糾正。只有在標(biāo)準(zhǔn)普通話的詞匯、語(yǔ)法數(shù)據(jù)庫(kù)和各地漢語(yǔ)方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)的共同支持下,普通話水平測(cè)試“語(yǔ)法考核”的信息化才會(huì)成為可能。

(三)人機(jī)互動(dòng)

《普通話水平測(cè)試大綱》雖然列舉了普通話與方言常用詞語(yǔ)對(duì)照表以及常見(jiàn)的語(yǔ)法差異,而各地的方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)也為普通話水平測(cè)試提供了方言語(yǔ)法的規(guī)范,但是在實(shí)際測(cè)試中卻經(jīng)常出現(xiàn)普通話與方言界定不清的情況,計(jì)算機(jī)又如何識(shí)別和處理呢?

“人工智能無(wú)論怎樣發(fā)達(dá), 卻沒(méi)有一臺(tái)計(jì)算機(jī)能夠完全代替翻譯人才, 沒(méi)有一個(gè)機(jī)器人能夠接管嚴(yán)復(fù)、魯迅、傅雷等翻譯家的工作。其根本原因在于語(yǔ)言是文化的載體, 作為翻譯對(duì)象的原文本所承載的種種涉及語(yǔ)言甚至超越語(yǔ)言的文化信息, 是人工智能所不能理解和表達(dá)的?!保?]普通話水平測(cè)試的本質(zhì)是口語(yǔ)測(cè)試,口頭語(yǔ)言不同于書(shū)面語(yǔ),書(shū)面語(yǔ)嚴(yán)格遵守著語(yǔ)法規(guī)則,而口頭語(yǔ)卻是一邊想一邊說(shuō),“想”和“說(shuō)”之間并不會(huì)有一個(gè)嚴(yán)格的邏輯分析,常常出現(xiàn)“反常語(yǔ)法”的現(xiàn)象,導(dǎo)致計(jì)算機(jī)進(jìn)行信息處理時(shí)出現(xiàn)失誤,這是人工智能或者是近期的計(jì)算機(jī)信息處理技術(shù)不可能解決的問(wèn)題。語(yǔ)言本身就是一個(gè)復(fù)雜的系統(tǒng),而運(yùn)用在實(shí)際生活中則更顯得復(fù)雜,想要在短時(shí)期內(nèi)就處理和解決這一問(wèn)題幾乎是不可能的。此時(shí),只能人工彌補(bǔ)這一缺漏,雖然說(shuō)人機(jī)互動(dòng)沒(méi)有達(dá)到語(yǔ)言信息處理的目的,語(yǔ)言信息處理本質(zhì)是脫離人工處理,進(jìn)入純信息處理的階段,但目前的計(jì)算機(jī)技術(shù)并不可能達(dá)到這一目的,只有在普通話水平測(cè)試的各系統(tǒng)都達(dá)到完善,計(jì)算機(jī)信息處理達(dá)到相當(dāng)水平的智能化方可實(shí)現(xiàn)。然而,人機(jī)互動(dòng)同樣也提高了普通話水平測(cè)試的效率,也減輕了測(cè)評(píng)員的負(fù)擔(dān),在有利的系統(tǒng)支持下,將使得普通話水平測(cè)試更加科學(xué)化和客觀化。

(四)語(yǔ)法觀念的規(guī)范

普通話水平測(cè)試中,測(cè)評(píng)員只是一個(gè)測(cè)試的監(jiān)督人員和評(píng)定人員,對(duì)普通話水平測(cè)試的信息化過(guò)程的推動(dòng)并不能起到關(guān)鍵作用,先進(jìn)的計(jì)算機(jī)信息處理技術(shù)和相關(guān)語(yǔ)法系統(tǒng)的建立,以及方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)的構(gòu)建只是一個(gè)輔助的工具,而測(cè)試對(duì)象語(yǔ)法觀念的規(guī)范才能起到關(guān)鍵作用。

在進(jìn)行普通話水平測(cè)試過(guò)程中,測(cè)試對(duì)象自覺(jué)遵守語(yǔ)法規(guī)則,自覺(jué)培養(yǎng)語(yǔ)用規(guī)范意識(shí),那就使得對(duì)普通話水平測(cè)試的計(jì)算機(jī)信息處理事半功倍,加快其信息化進(jìn)程,促進(jìn)普通話水平測(cè)試的完善,同時(shí)加快其語(yǔ)法規(guī)范系統(tǒng)化和信息化進(jìn)程。

綜上所述,在計(jì)算機(jī)基礎(chǔ)上的普通話水平測(cè)試中,要自覺(jué)培養(yǎng)語(yǔ)用規(guī)范意識(shí),借助語(yǔ)言邏輯語(yǔ)法系統(tǒng)和方言詞匯、語(yǔ)法數(shù)據(jù)庫(kù)的構(gòu)建,在此基礎(chǔ)上,人機(jī)互動(dòng),以彌補(bǔ)目前語(yǔ)言信息處理技術(shù)的局限,進(jìn)而規(guī)范計(jì)算機(jī)基礎(chǔ)上的普通話水平測(cè)試的語(yǔ)法現(xiàn)象。

結(jié)語(yǔ)

在推普工作進(jìn)行得如火如荼的今天,普通話水平測(cè)試越來(lái)越成為人們工作、生活、學(xué)習(xí)中必不可少的部分,而語(yǔ)言信息處理與普通話水平測(cè)試的融合則進(jìn)一步推進(jìn)了推廣普通話工作的進(jìn)程。在普通話水平測(cè)試的信息處理過(guò)程中,語(yǔ)法問(wèn)題日益明顯,進(jìn)行語(yǔ)法的規(guī)范研究就顯得十分重要。

面對(duì)日益突出的語(yǔ)法問(wèn)題,應(yīng)當(dāng)在語(yǔ)法的規(guī)范意識(shí)基礎(chǔ)上構(gòu)建語(yǔ)言邏輯語(yǔ)法系統(tǒng),建立以方言詞匯、語(yǔ)法為主的數(shù)據(jù)庫(kù),以辨認(rèn)和識(shí)別方言語(yǔ)法與標(biāo)準(zhǔn)普通話語(yǔ)法的差異,同時(shí)在必要的時(shí)候人機(jī)互動(dòng),以處理口語(yǔ)測(cè)試過(guò)程中出現(xiàn)的復(fù)雜的語(yǔ)法現(xiàn)象,達(dá)到普通話水平測(cè)試語(yǔ)法考核的科學(xué)化和客觀化。然而,語(yǔ)法的直覺(jué)性小,隱蔽性最大,而且“語(yǔ)法知識(shí)的抽象程度較高, 規(guī)則和詞語(yǔ)的語(yǔ)法屬性信息對(duì)實(shí)際語(yǔ)言現(xiàn)象的覆蓋面較廣……為了實(shí)現(xiàn)自然語(yǔ)言理解, 最終當(dāng)然要利用語(yǔ)義信息以及包括常識(shí)在內(nèi)的語(yǔ)境信息?!保?]相信在不久的將來(lái),普通話水平測(cè)試信息處理系統(tǒng)一定會(huì)更加完善,對(duì)語(yǔ)音、詞匯和語(yǔ)法等進(jìn)行的信息處理也會(huì)得到規(guī)范。

[1]楊瑞鯤,王渝光.語(yǔ)言信息處理與普通話水平測(cè)試[M].昆明:云南大學(xué)出版社,2010:6.

[2]王暉.普通話水平測(cè)試研究的現(xiàn)狀及構(gòu)想[DB/OL].中國(guó)語(yǔ)言文字網(wǎng).http://www.china-language.gov.cn/89/2007_6_20/1_8 9_1177_0_1182321067328.html.

[3]俞士汶.自然語(yǔ)言理解與語(yǔ)法研究[M]//.馬慶株.語(yǔ)法研究入門北京:商務(wù)印書(shū)館,1999:241.

[4]畢玉德.面向語(yǔ)言信息處理的朝鮮語(yǔ)知識(shí)庫(kù)研究[J].中文信息學(xué)報(bào),2004,(3):28.

[5]王暉.普通話水平測(cè)試研究的詞匯、語(yǔ)法問(wèn)題探究[C]//.第二屆全國(guó)普通話水平測(cè)試學(xué)術(shù)研討會(huì)論文集,2004:167-168.

[6]黃新華,金立.面向信息處理的自然語(yǔ)言邏輯研究—皺崇理《邏輯、語(yǔ)言和信息》評(píng)介[J].哲學(xué)研究,2003,(3):92.

[7]王慧.機(jī)器翻譯中基于語(yǔ)法、語(yǔ)義知識(shí)庫(kù)的漢語(yǔ)詞義消歧策略[C]//.第七屆中國(guó)人工智能聯(lián)合學(xué)術(shù)會(huì)議,2002:2-3.

[8]李傳玲.語(yǔ)言符號(hào)和副語(yǔ)言符號(hào)的文化信息處理[J].遼寧醫(yī)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2009,(4):96.

[9]謝四蓮.語(yǔ)法知識(shí)在語(yǔ)言信息處理中的作用[J].婁底師專學(xué)報(bào),2004,(2):30.

[責(zé)任編輯 魯海菊]

Study on the Grammar problems in PSC on the Language Information Processing

FANG Yong-bin,WEI Gang
(Chinese language and literature college of Yunnan Normal University, Kunming 650500,China)

PSC in computer processing stages has become a trend and may, however, in the process of computer processing of PSC is difficult, grammar is the primary problem. Language information processing based on the influence of PSC, emphasis on grammar problem in mandarin level test of the effect and status of computer processing, combined with the actual, analyze the grammar problems of reality and explore, and tries to find the solution, with more complete information of PSC.

grammar;PSC;language information processing

H08

A

1008-9128(2015)01-0093-04

2014-04-20

方永斌(1989—),男,云南羅平人,碩士,研究方向:應(yīng)用語(yǔ)言學(xué)。

猜你喜歡
信息處理普通話方言
方嚴(yán)的方言
東營(yíng)市智能信息處理實(shí)驗(yàn)室
方言
基于Revit和Dynamo的施工BIM信息處理
說(shuō)說(shuō)方言
留住方言
地震烈度信息處理平臺(tái)研究
CTCS-3級(jí)列控系統(tǒng)RBC與ATP結(jié)合部異常信息處理
我教爸爸說(shuō)普通話
17