提 要 中國語言產(chǎn)業(yè)的歷史進(jìn)程可概括為三次浪潮:第一波約始于1990年,是傳統(tǒng)語言產(chǎn)業(yè)的快速增長期;第二波約始于2000年,是語言信息技術(shù)產(chǎn)業(yè)的興盛期;第三波約始于2010年,是“語言信息技術(shù)平臺(tái)(互聯(lián)網(wǎng)、智能手機(jī)、語言智能)+語言產(chǎn)業(yè)”的發(fā)展期。三次浪潮前后呼應(yīng)、彼此融合,每一波發(fā)展都以某種方式匯入新的浪潮之中。第一次浪潮主要由社會(huì)開放所致,第二、三次浪潮則為語言信息技術(shù)革命所引領(lǐng)。未來語言產(chǎn)業(yè)將是“人工語言智能+語言產(chǎn)業(yè)”的時(shí)代。
關(guān)鍵詞 當(dāng)代中國語言產(chǎn)業(yè);傳統(tǒng)語言產(chǎn)業(yè);語言信息產(chǎn)業(yè);智能語言產(chǎn)業(yè)
Abstract Chinas Language Industry has witnessed three waves of development in the past three decades. The first wave appeared in around 1990, a time when the traditional Language Industry experienced a rapid expansion. The second wave started in around 2000, a time often seen as the rise of Language Information Industry. The third wave arrived in around 2010, a period when “l(fā)anguage information technology platforms” (e.g., internet, cell phones and language intelligence) became a major media for press, education and speech synthesis. The three waves are three continuous developmental phases, showing the upgrading trajectory of the language industry in China. With regard to the driving forces of such developments, this paper contends that the first wave can be attributed to the opening up of the Chinese society, while the second and the third waves are the results of the revolution of Language Information Technology. It is predicted that the next phase in China will be “Artificial Intelligence plus Language Industry” .
Key words contemporary Chinas Language Industry; traditional Language Industry; Language Information Industry; Intelligence Language Industry
一、前言:中國語言產(chǎn)業(yè)的興起
在國內(nèi),大約自2010年起,語言產(chǎn)業(yè)概念開始引起比較廣泛的關(guān)注。我們把語言產(chǎn)業(yè)概念初步界定為生產(chǎn)各種語言產(chǎn)品或提供各種語言服務(wù)的規(guī)?;漠a(chǎn)業(yè)形態(tài)。語言產(chǎn)品則是以語言為內(nèi)容、材料,或是以語言為加工、處理對象的產(chǎn)品形態(tài)。目前,較為典型的語言產(chǎn)業(yè)業(yè)態(tài)主要包括語言翻譯、語言文字信息處理、語言培訓(xùn)、語言出版、語言能力測評(píng)等(賀宏志、陳鵬 2012)。在德國語言技術(shù)中心(The Language Technology Center)提供,歐盟翻譯總司2009年發(fā)布的《歐盟語言產(chǎn)業(yè)規(guī)模研究報(bào)告》(Study on the Size of the Language Industry in the EU)中,語言產(chǎn)業(yè)業(yè)態(tài)主要包括8個(gè)領(lǐng)域:筆譯、口譯、語言技術(shù)工具、語言教學(xué)、字幕翻譯和配音、軟件本地化、網(wǎng)站全球化和會(huì)議組織及咨詢,其概念內(nèi)涵是以語言翻譯及本地化服務(wù)為核心。本文采用的則是以語言產(chǎn)品供給為核心的外延更加廣泛的語言產(chǎn)業(yè)概念,它在邏輯上包含相關(guān)的所有業(yè)態(tài)。
從語言產(chǎn)業(yè)研究的角度看,語言產(chǎn)業(yè)及其相關(guān)的語言服務(wù)概念興起于歐美。1999年1月美國語言學(xué)學(xué)會(huì)第73屆年會(huì)的主題定為:“語言事業(yè):未預(yù)料到的機(jī)會(huì)”(Linguitic Enterprises: Unexpected Opportunities)。在此次年會(huì)上,斯坦福大學(xué)語言學(xué)教授、語音學(xué)家Williame Leben做了題為“命名產(chǎn)業(yè)”(The Naming Industy)的專題學(xué)術(shù)報(bào)告。美國語言行業(yè)協(xié)會(huì)(the Association of Language Companies,ALC)于2004年起發(fā)布年度語言服務(wù)行業(yè)調(diào)查報(bào)告。美國卡門森公司(Common Sense Advisory,CSA)自2005年起發(fā)布《語言服務(wù)全球市場年度報(bào)告》(Annual Survey on the Global Language Services and Technology Market),據(jù)2005年年度報(bào)告顯示,當(dāng)年全球外包語言服務(wù)市場總額預(yù)計(jì)達(dá)88億美元,報(bào)告按年均增長率7.5%估算,2006年將達(dá)90億美元,2010年將達(dá)120億美元。報(bào)告發(fā)布了全球35強(qiáng)語言服務(wù)企業(yè)名單及其簡介,中國的海輝公司、統(tǒng)一數(shù)位翻譯和傳神聯(lián)合信息技術(shù)公司榜上有名。在歐洲,瑞士語言經(jīng)濟(jì)學(xué)家弗朗斯瓦·格林教授及其團(tuán)隊(duì)2008年的研究表明,語言產(chǎn)業(yè)每年為瑞士約創(chuàng)造500億瑞士法郎的收入,約占瑞士國內(nèi)生產(chǎn)總值的10%。瑞士有著獨(dú)特的語言政策和語言環(huán)境,德語、法語、意大利語、羅曼什語四種語言都被認(rèn)定為官方語言,瑞士還是眾多重要國際機(jī)構(gòu)的所在地,巨大的語言需求促成了這樣的產(chǎn)業(yè)規(guī)模(李宇明 2012)。《歐盟語言產(chǎn)業(yè)規(guī)模研究報(bào)告》顯示,2008 年歐盟成員國的語言市場總產(chǎn)值達(dá)84 億歐元,該報(bào)告當(dāng)時(shí)預(yù)測,歐盟2015年語言市場產(chǎn)值可達(dá)到165 億歐元。①
從實(shí)際的語言經(jīng)營活動(dòng)來說,語言培訓(xùn)、語言出版、語言翻譯、語言測試早已有之,但國內(nèi)這些經(jīng)營活動(dòng)開始被稱為規(guī)模化的語言產(chǎn)業(yè),應(yīng)該是在20世紀(jì)90年代之后。概念反映總比實(shí)際事件要滯后一些,從21世紀(jì)起,這個(gè)業(yè)態(tài)系統(tǒng)開始作為語言產(chǎn)業(yè)引起人們的關(guān)注,國內(nèi)開始有人提及語言產(chǎn)業(yè)的概念。2010年前后語言產(chǎn)業(yè)概念開始受到較大范圍的關(guān)注,一些研究機(jī)構(gòu)成立,一系列研究成果產(chǎn)生(李宇明 2004;黃少安等 2012)。這在一定程度上是因?yàn)槭艿搅藝鈹?shù)據(jù)信息輸入的影響,但在根本上是國內(nèi)語言產(chǎn)業(yè)發(fā)展到一定程度的自然結(jié)果。隨著改革開放的歷史進(jìn)程,語言的基礎(chǔ)性地位、社會(huì)文化地位以及市場地位日益突顯,各方面的語言需求被激發(fā)出來,中國規(guī)模化的語言產(chǎn)業(yè)才得以呈現(xiàn)。概括起來,主要有以下幾個(gè)方面:
其一,社會(huì)的開放與流動(dòng)激發(fā)語言需求。新時(shí)期以來中國社會(huì)進(jìn)入一個(gè)全新的快速發(fā)展期,隨著社會(huì)開放程度和活躍程度的加強(qiáng),語言在社會(huì)交往和經(jīng)濟(jì)發(fā)展中的作用日益突顯,開放、流動(dòng)的社會(huì)對個(gè)人和團(tuán)體的語言交往不斷提出新的要求。
其二,市場化進(jìn)程促使語言能力成為一種重要的競爭力。從個(gè)體說,語言技能成為一種重要的人力資本,它是個(gè)體職業(yè)競爭力的重要組成部分。從企業(yè)說,語言能力(企業(yè)的命名、宣傳、網(wǎng)站、廣告語言設(shè)計(jì)、說明書等)是一個(gè)企業(yè)的重要競爭力(徐大明 2010)。
其三,語言類考試的剛性地位決定了語言經(jīng)濟(jì)活動(dòng)最基本的市場地位。在新的職前職后教育體系中,語文、英語以及其他語言類考試占有相當(dāng)重要的地位,考試結(jié)果直接關(guān)乎升學(xué)、就業(yè)、升職、出國等,由此帶來強(qiáng)勁不衰的語言學(xué)習(xí)需求。夸張一點(diǎn)說,改革開放以來第一輪語言產(chǎn)業(yè)的興起就是由兩類語言考試決定的,一類是與升學(xué)有關(guān)的中高考中的語文、英語類考試;一類是與出國有關(guān)的托福、GRE、雅思等考試。
其四,國際化、全球化進(jìn)程激發(fā)外語需求。隨著全球化進(jìn)程的不斷深入,各種形式的跨國交流日益頻繁,多語交際能力已成為國家、單位和個(gè)人語言能力的重要組成部分。個(gè)人和單位出國學(xué)習(xí)、工作、交流、旅游等需求不斷增加,逐漸引發(fā)了一個(gè)包括語言培訓(xùn)、語言翻譯、語言出版、語言測試等業(yè)態(tài)的具有相當(dāng)規(guī)模的語言產(chǎn)業(yè)。
其五,信息化導(dǎo)致新型語言產(chǎn)業(yè)的興起。語言技術(shù)特別是語言信息技術(shù)的發(fā)展,改變了語言學(xué)習(xí)和應(yīng)用的傳統(tǒng)方法,造就了新型語言產(chǎn)業(yè),使語言產(chǎn)業(yè)可以在全新技術(shù)平臺(tái)上實(shí)現(xiàn)新的整合和繁榮。
其六,綜合國力的提升促使?jié)h語的國際化需求迅速增長。海內(nèi)外以漢語為母語的人大約有13億,漢語是世界上使用人口最多的語言之一,中國綜合國力和國際地位的提升,使?jié)h語具有更重要的文化地位和經(jīng)濟(jì)地位,越來越多的外國人、外國企業(yè)開始重視漢語。漢語水平考試已成為世界上最重要的第二語言或外語水平測試之一,美國等許多國家已把漢語作為主要外語納入國民教育體系。
上面的因素聚合起來,加上國內(nèi)的人口規(guī)模和市場規(guī)模,中國語言產(chǎn)業(yè)的興起和持續(xù)增長就成了必然。其中,全球化(多語需求)和信息化(語言技術(shù)進(jìn)步)是兩個(gè)最重要的引擎(李宇明 2011)。
值得注意的是,從全球視野看,并非先有一個(gè)全球的語言產(chǎn)業(yè),然后中國的語言產(chǎn)業(yè)才在它的刺激和影響下興起,實(shí)質(zhì)上是,伴隨著中國社會(huì)、經(jīng)濟(jì)的市場化、全球化、信息化進(jìn)程,中國語言產(chǎn)業(yè)的興起勢在必行,中國的市場地位、市場規(guī)模以及漢語人口、漢語文化的地位就決定了中國語言產(chǎn)業(yè)的市場地位。當(dāng)然,我們并不否認(rèn)國外語言產(chǎn)業(yè)和語言服務(wù)業(yè)對中國語言產(chǎn)業(yè)的積極影響。
近30年,中國語言產(chǎn)業(yè)的發(fā)展勢頭一浪高過一浪,表現(xiàn)為三次浪潮。三次浪潮不同于三個(gè)發(fā)展階段,它們是前一波推著后一波,后一波在某種程度上疊加了前一波的內(nèi)容,或者說每一波都以某種方式匯入到新的浪潮之中。
二、第一次浪潮(1990年起):傳統(tǒng)語言產(chǎn)業(yè)的發(fā)展
傳統(tǒng)語言產(chǎn)業(yè)業(yè)態(tài)主要包括語言培訓(xùn)(面對面課堂培訓(xùn))、語言出版(紙質(zhì)圖書)、語言翻譯(人口翻譯)、語言測試(卷面測試)等,它是指語言信息技術(shù)廣泛應(yīng)用之前的語言產(chǎn)業(yè)形態(tài)。改革開放以后,市場經(jīng)濟(jì)快速發(fā)展,對外開放程度不斷增加,個(gè)人和單位的各類語言需求被空前地激發(fā)出來,因而導(dǎo)致了中國語言產(chǎn)業(yè)的第一波發(fā)展,這一波發(fā)展的主體是傳統(tǒng)語言產(chǎn)業(yè)。在這一波發(fā)展中,外語需求最為顯著:一類是個(gè)人的外語學(xué)習(xí)和外語考試需求,它的目標(biāo)是提升個(gè)人的外語能力;一類是企業(yè)的外語需求,無論是中方企業(yè)“走出去”,還是外方企業(yè)“走進(jìn)來”,都需要專業(yè)的多語種服務(wù)。以下分別從培訓(xùn)、出版和測試三個(gè)方面加以扼要說明。
(一)語言培訓(xùn)
自1990年以來,在培訓(xùn)需求的不斷刺激下,中國培訓(xùn)市場產(chǎn)生了多元化的產(chǎn)品結(jié)構(gòu),以語言培訓(xùn)、電腦培訓(xùn)和中小學(xué)生課外培訓(xùn)為三大支柱。中國語言培訓(xùn)自20世紀(jì)末開始進(jìn)入快速增長期,比如,外語培訓(xùn)第一企業(yè)的新東方教育科技集團(tuán)于1993年11月成立;1994年,李陽創(chuàng)辦國際英語推廣工作室,開啟了“瘋狂英語”的培訓(xùn)產(chǎn)業(yè)進(jìn)程;著名英語培訓(xùn)機(jī)構(gòu)華爾街英語于2000年進(jìn)入中國培訓(xùn)市場。1995年以后,語言培訓(xùn)業(yè)市場規(guī)模每年以20%左右的速度遞增;2010 年,中國語言培訓(xùn)行業(yè)產(chǎn)值已達(dá) 300 億元,到 2016 年中國語言培訓(xùn)行業(yè)產(chǎn)值超過800億元。①
新東方的發(fā)展歷程可以看作語言培訓(xùn)在這一波發(fā)展中的縮影。1993年俞敏洪創(chuàng)辦了北京市新東方學(xué)校。1995年底新東方學(xué)員突破1.5萬人次。1998年新東方英語人才培訓(xùn)體系初具規(guī)模并建立實(shí)用英語學(xué)院。到2000年,新東方學(xué)校就已經(jīng)占據(jù)了北京約80%、全國50%的出國外語培訓(xùn)市場。2003年成立新東方教育科技集團(tuán),2006年在紐約證券交易所正式上市,成為中國大陸在美國上市的第一家教育培訓(xùn)機(jī)構(gòu)。
(二)語言出版
語言出版的快速增長也出現(xiàn)在20世紀(jì)90年代后半段。外研社是中國最大的外語出版機(jī)構(gòu),也是全國規(guī)模最大的大學(xué)出版社,被認(rèn)為是“英語圖書市場上真正意義的產(chǎn)業(yè)領(lǐng)導(dǎo)者”,其出版地位很大程度上就是靠這一階段的迅猛發(fā)展來奠定的。從1991年到2005年,外研社發(fā)行碼洋從1000多萬元增長到13億元。目前,它旗下有九大分社、12個(gè)獨(dú)立法人企業(yè),以及分布全國的16個(gè)信息中心。《英語周報(bào)》的輝煌歷程更是報(bào)業(yè)出版的一個(gè)傳奇,這個(gè)誕生于山西師范大學(xué)的曾經(jīng)的英語小報(bào),自20世紀(jì)90年代以后,每年的發(fā)行量都上一個(gè)新臺(tái)階,1995年他們在同行業(yè)中率先自辦發(fā)行網(wǎng)絡(luò),創(chuàng)新發(fā)行體制,至2000年它的期發(fā)行量已突破千萬。2006年,《英語周報(bào)》達(dá)到1600多萬份的期發(fā)行量巔峰,此后開始下降。同樣誕生于山西師范大學(xué)的《語文報(bào)》系列產(chǎn)品覆蓋了語文教學(xué)的各個(gè)層次,它鼎盛時(shí)期的期發(fā)行量也逾500萬份。綜合書、報(bào)、刊,保守估計(jì),2005年全國語言出版的產(chǎn)值應(yīng)該接近100億。
(三)語言測試
由于升學(xué)、出國、評(píng)職稱等的剛性需求,相關(guān)語言測試也就越來越火爆。托福、雅思、GRE等在中國市場不斷膨脹;英語四、六級(jí)的考生規(guī)模也是逐年遞增。同時(shí),隨著中國經(jīng)濟(jì)實(shí)力的不斷提高以及“軟實(shí)力”的增長,“漢語熱”開始在全世界范圍流行開來,對外漢語測試也發(fā)展迅速??梢哉f,各種語言測試的不斷發(fā)展催生了一個(gè)新型測試產(chǎn)業(yè)。
據(jù)《中國教育考試年鑒》,“十一五”規(guī)劃(2006—2010)期間,參加海外考試的考生達(dá)到455萬人,相當(dāng)于 “十一五”規(guī)劃前整個(gè)海外考試歷年考生人數(shù)總和的1.4倍。以雅思考試為例,自1989年雅思進(jìn)入中國,迄今已28年,參加雅思考試的中國考生數(shù)量逐漸遞增(見圖1)。據(jù)統(tǒng)計(jì),2013年共有超過35萬人次在中國參加雅思考試。
另一個(gè)大規(guī)模的英語類考試是大學(xué)英語四、六級(jí)考試,該考試于1987年開始,當(dāng)時(shí)每年只有10萬人次,至2000年就已發(fā)展到500萬人次,2010年接近1800萬人次。與此同時(shí),海外漢語水平測試(HSK)的規(guī)模也逐年增加:2008年,海外考試規(guī)模為67 558人次,到2009年為76 088人次,增長幅度為12.63%(羅民等 2011)。
總體上說,傳統(tǒng)語言產(chǎn)業(yè)的這一波發(fā)展浪潮大致起于1990年,在2005年前后達(dá)到高峰。之后,它雖然仍有一定的規(guī)模性增長,但從宏觀上來看,傳統(tǒng)形態(tài)的語言產(chǎn)業(yè)已經(jīng)增長乏力,如紙質(zhì)出版、面對面的課堂培訓(xùn)、人工翻譯以及卷面測試等產(chǎn)業(yè)形態(tài)已經(jīng)不可能對語言產(chǎn)業(yè)的內(nèi)部結(jié)構(gòu)產(chǎn)生根本性影響,也很難激發(fā)出新一輪的語言需求。
語言產(chǎn)業(yè)的發(fā)展并未止息,與這一波浪潮相隔不久,由于語言信息技術(shù)的全面開發(fā)和應(yīng)用,語言產(chǎn)業(yè)很快迎來了新的興盛時(shí)期。
三、第二次浪潮(2000年起):語言信息技術(shù)產(chǎn)業(yè)的興盛
中國是幸運(yùn)的,近30余年中國產(chǎn)業(yè)的發(fā)展趕上了信息化和全球化雙重歷史機(jī)遇,在這個(gè)歷史進(jìn)程中,信息技術(shù)和信息產(chǎn)業(yè)塑造了全球產(chǎn)業(yè)的基本結(jié)構(gòu)和總體走向。對于語言產(chǎn)業(yè)來說,信息技術(shù)的影響直接且深刻,因?yàn)槿魏我环N語言技術(shù)都是信息技術(shù),反過來,信息技術(shù)的基礎(chǔ)性領(lǐng)域還是語言技術(shù)。傳統(tǒng)的語言技術(shù)不過是紙、筆、圖書,再好一點(diǎn)的就是打字機(jī)、話筒、錄音機(jī)、投影儀之類,而隨著計(jì)算機(jī)、網(wǎng)絡(luò)平臺(tái)和移動(dòng)終端技術(shù)的產(chǎn)生和發(fā)展,語言技術(shù)也迎來它的信息化時(shí)代,使得我們習(xí)得語言、運(yùn)用語言的方式均發(fā)生了革命性的變化。如果說語言產(chǎn)業(yè)的第一次浪潮主要是社會(huì)開放、語言交往的直接需求所導(dǎo)致的,那么語言產(chǎn)業(yè)的第二次浪潮則是語言信息技術(shù)革命所引領(lǐng)的。
簡要地說,語言信息技術(shù)是運(yùn)用計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)字化技術(shù)以及移動(dòng)技術(shù)等現(xiàn)代信息技術(shù)來處理自然語言的技術(shù)。從語言要素的角度,語言信息技術(shù)大致可以分為以下幾種類型:(1)語料技術(shù):對語言材料(字詞、語段、語篇等)進(jìn)行分類、整理、檢索、貯存等處理的技術(shù);(2)語形技術(shù):將文字作為圖形的信息處理技術(shù),如文字輸入、語形識(shí)別等;(3)語音技術(shù),對語音進(jìn)行信息處理的技術(shù),如語音識(shí)別、語音合成等;(4)語義技術(shù),對自然語言進(jìn)行內(nèi)容處理的信息技術(shù),如機(jī)器翻譯、自動(dòng)文摘、人機(jī)對話等,語義技術(shù)是人工智能的關(guān)鍵環(huán)節(jié);(5)語言綜合處理技術(shù),如語言能力測評(píng)、語言機(jī)能康復(fù)等。因此,所謂語言信息技術(shù)產(chǎn)業(yè)就是運(yùn)用計(jì)算機(jī)、網(wǎng)絡(luò)等信息技術(shù)對自然語言進(jìn)行信息化處理和運(yùn)用的產(chǎn)業(yè)形態(tài),在這個(gè)產(chǎn)業(yè)形態(tài)中,語言信息技術(shù)及設(shè)備本身就是語言產(chǎn)品。以下我們以輸入法、智能翻譯、語音處理為代表來描述這一波語言信息產(chǎn)業(yè)的新浪潮。
(一)輸入法產(chǎn)業(yè)
從20世紀(jì)80年代中期到90年代末,中文信息處理研究進(jìn)入了一個(gè)萬“碼”奔騰的時(shí)期。在聯(lián)想漢卡、四通中文電腦打字機(jī)之后,五筆字型、鄭碼、自然碼、智能ABC、拼音輸入法等不斷涌現(xiàn)。也正是從這個(gè)時(shí)期開始,中國的漢字輸入法產(chǎn)業(yè)逐漸形成規(guī)模,進(jìn)入了繁榮發(fā)展期。進(jìn)入21世紀(jì)以后,輸入法從電腦時(shí)代進(jìn)入手機(jī)時(shí)代,迎來了新一輪爆炸式增長。工信部的統(tǒng)計(jì)數(shù)據(jù)顯示,2001年,中國手機(jī)用戶1.45億,此后幾乎每年都以近億的速度快速增長,截至2014年5月底,中國的手機(jī)用戶數(shù)量已達(dá)到12.56億人,相當(dāng)于中國90.8%的人都在使用手機(jī),其中手機(jī)網(wǎng)民的規(guī)模十分驚人(見圖2)。2015年,中國手機(jī)市場銷量3.86億部,再加上個(gè)人電腦每年近億的出貨量,這樣的數(shù)量意味著龐大的輸入法市場。有人估計(jì),基于輸入法整合的手機(jī)應(yīng)用平臺(tái)所產(chǎn)生的相關(guān)收入將高達(dá)8000億元。①
十多年之前,80%以上的手機(jī)植入的漢字輸入法的知識(shí)產(chǎn)權(quán)屬于外國公司,中國企業(yè)每年需為此支付6億至7億元專利費(fèi),被稱為“洋碼奔騰”。經(jīng)過十多年的努力,這種情況已大有改觀。搜狗、百度、訊飛、QQ等輸入法均表現(xiàn)不俗,搜狗輸入法在2009年的裝機(jī)量已過億。作為首家支持語音輸入的輸入法,豐富的語音功能已成為訊飛輸入法的獨(dú)特標(biāo)志。近期,訊飛輸入法的語音識(shí)別率提升至98%,可以適應(yīng)不同場景,不同語速、音高,而且支持21種方言,訊飛輸入法越來越受到用戶的青睞。在移動(dòng)互聯(lián)領(lǐng)域,訊飛輸入法用戶達(dá)4億。③
(二)智能翻譯產(chǎn)業(yè)
傳統(tǒng)翻譯是人工翻譯,主要是口譯和筆譯。計(jì)算機(jī)的出現(xiàn)促使人們探索新的翻譯技術(shù),可以稱之為機(jī)器翻譯。到20世紀(jì)70年代,機(jī)器翻譯的技術(shù)日趨成熟,基于統(tǒng)計(jì)和實(shí)例的機(jī)器翻譯逐漸替代了過去簡單的語言字面轉(zhuǎn)換。最近二三十年來,隨著計(jì)算語言學(xué)的發(fā)展,計(jì)算機(jī)處理語言的能力不斷增強(qiáng),翻譯技術(shù)有了顯著的發(fā)展和進(jìn)步。最新的翻譯技術(shù)已經(jīng)是計(jì)算機(jī)輔助翻譯、翻譯語料庫、大數(shù)據(jù)、云翻譯、語音語義處理等的信息技術(shù)整合,可以稱之為智能翻譯。智能翻譯技術(shù)對傳統(tǒng)翻譯形成很大沖擊,當(dāng)前幾乎再也找不到一家大型翻譯公司可以完全依賴于傳統(tǒng)作坊式的翻譯模式而成功運(yùn)作。在此,我們以文思海輝和中國傳神兩家公司為例簡要描述這一歷程。
1995年,文思海輝公司成立。隨著第一批跨國科技企業(yè)陸續(xù)進(jìn)入中國,IT服務(wù)市場開始出現(xiàn)語言翻譯服務(wù)需求,文思海輝抓住機(jī)遇,將公司的語言服務(wù)從最初單一的中文擴(kuò)充到如今囊括亞、非、拉、歐美主要語種的147種語言,從基礎(chǔ)的語言翻譯擴(kuò)展到如今涵蓋本地化咨詢、技術(shù)研發(fā)、內(nèi)容翻譯和營銷、測試、語音轉(zhuǎn)錄、商務(wù)會(huì)議同傳等一站式服務(wù)體系;服務(wù)團(tuán)隊(duì)從最初的20人發(fā)展到今天分布在100多個(gè)國家的10 000多人。其產(chǎn)值從2009年9億美元提高到2013的36億美元。美國著名語言調(diào)查機(jī)構(gòu)卡門森公司的研究顯示,2009至2016年,文思海輝連續(xù)八年入選“全球語言服務(wù)企業(yè)25強(qiáng)”,位列中國第一、全球第十六。
2005年3月,傳神公司成立,同年成功開發(fā)中國首個(gè)基于互聯(lián)網(wǎng)的協(xié)同翻譯及流程管理平臺(tái)系列軟件。2010年,傳神公司打造“云翻譯服務(wù)平臺(tái)”,公司總部正式遷入武漢,建立中國第一家翻譯產(chǎn)業(yè)園——“全球多語言處理中心”。公司通過互聯(lián)網(wǎng)技術(shù)和產(chǎn)品建立網(wǎng)絡(luò)化的語言服務(wù)平臺(tái)——“語聯(lián)網(wǎng)”,該平臺(tái)整合中國乃至全球的個(gè)人譯員和翻譯機(jī)構(gòu)等各種翻譯資源,將用戶的語言需求分類聚合,借助語聯(lián)網(wǎng)平臺(tái)的智能基因匹配技術(shù),將需求和產(chǎn)能進(jìn)行快速精準(zhǔn)的分層對接,向用戶輸出各種不同種類的高質(zhì)量的語言服務(wù)或產(chǎn)品。2012年產(chǎn)值突破80億元。據(jù)市場調(diào)查報(bào)告顯示:目前傳神(中國)網(wǎng)絡(luò)技術(shù)有限公司已經(jīng)成為亞洲第七、全球第三十三的語言服務(wù)供應(yīng)商。傳神公司表示,計(jì)劃用3年時(shí)間,成為全球最大的中文翻譯服務(wù)提
供商。①
(三)智能語音產(chǎn)業(yè)
從語言技術(shù)的角度講,語言信息產(chǎn)業(yè)的最高級(jí)形態(tài)就是語言智能產(chǎn)業(yè),而語音智能產(chǎn)業(yè)是它的重要支柱,現(xiàn)稱智能語音產(chǎn)業(yè)。智能語音產(chǎn)業(yè)是指以智能語音技術(shù)為核心,提供智能語音技術(shù)、產(chǎn)品和服務(wù)的產(chǎn)業(yè)形態(tài)。智能語音技術(shù)主要包括語音增強(qiáng)、語音合成、語音識(shí)別、自然語言處理和理解等技術(shù),特別是相關(guān)人機(jī)自然對話技術(shù)的發(fā)展突破了傳統(tǒng)語音技術(shù)的范圍,為其在日常生活中的應(yīng)用打開了無限廣闊的空間。中國智能語音產(chǎn)業(yè)起步時(shí)間基本上與國外同步,以語音識(shí)別技術(shù)研究開發(fā)為起點(diǎn),大致經(jīng)歷了技術(shù)萌芽階段(20世紀(jì) 50—70 年代)、技術(shù)突破階段(20 世紀(jì) 80—90 年代)和產(chǎn)業(yè)化階段(20 世紀(jì) 90 年代末—21 世紀(jì)初)。自20世紀(jì)90年代末,科大訊飛、捷通華聲等智能語音企業(yè)相繼成立,智能語音技術(shù)逐步在通信、交通、教育、金融、郵政、電力等各行業(yè)推廣應(yīng)用,開啟了國內(nèi)智能語音的產(chǎn)業(yè)化時(shí)代。根據(jù)工信部的數(shù)據(jù),2011至2015年中國智能語言產(chǎn)業(yè)規(guī)模每年都有較高增長(見圖3)。
科大訊飛公司的發(fā)展歷程可謂中國智能語音產(chǎn)業(yè)發(fā)展的一個(gè)縮影。1999年,科大訊飛公司成立。2001年11月,訊飛推出第一塊語音合成單芯片,同年12月,又推出了具有語音合成和語音編解碼功能的板卡。在公司成立后的短短3年時(shí)間內(nèi),訊飛就獲得了國內(nèi)電信、證券等語音合成技術(shù)主流應(yīng)用市場80%的份額。2007年,科大訊飛成功上市,成為中國語音產(chǎn)業(yè)的唯一上市企業(yè)。 2009年,科大訊飛實(shí)現(xiàn)營業(yè)總收入3.07億元,同比增長19.25%;2010年實(shí)現(xiàn)營業(yè)總收入4.36億元,比2009年增長41.98%。正是由于以科大訊飛為代表的一批國內(nèi)語音企業(yè)的崛起,以及信息技術(shù)發(fā)展進(jìn)程中“智能語音時(shí)代”的來臨,2012 年 8 月在工信部指導(dǎo)下,中國智能語音產(chǎn)業(yè)聯(lián)盟正式成立,這是中國語言信息產(chǎn)業(yè)發(fā)展史中的一個(gè)里程碑。
我們正著手收集、整理2010年以來中國整體語言產(chǎn)業(yè)的發(fā)展?fàn)顩r,這個(gè)“語言產(chǎn)業(yè)整體”力圖涵蓋語言出版、語言培訓(xùn)、語言翻譯、語言信息、語言測試等多個(gè)語言產(chǎn)業(yè)業(yè)態(tài)并且盡可能明確這個(gè)產(chǎn)業(yè)的基本邊界。當(dāng)然,無論是厘清邊界,還是獲取數(shù)據(jù)都非常困難。以2010年為例,據(jù)估算,國內(nèi)包含語言翻譯、語言培訓(xùn)、語言出版、語言信息技術(shù)等的整個(gè)語言產(chǎn)業(yè)的總產(chǎn)值應(yīng)不少于2000億。其中嚴(yán)格意義上的語言信息技術(shù)產(chǎn)業(yè)應(yīng)不少于300億,至于其他與語言信息技術(shù)應(yīng)用直接相關(guān)的語言教育、語言出版等產(chǎn)值應(yīng)占有更大的比例(陳鵬 2016)。
四、第三次浪潮(2010年起):基于全方位語言信息技術(shù)的語言產(chǎn)業(yè)
一波未平,一波又起,在語言產(chǎn)業(yè)的第二次浪潮和第一次浪潮之間產(chǎn)生融合效應(yīng)之后(不是簡單疊加),當(dāng)互聯(lián)網(wǎng)技術(shù)和智能手機(jī)終端深度整合成新的應(yīng)用平臺(tái)時(shí),便催生了語言產(chǎn)業(yè)發(fā)展的第三次浪潮,即基于全方位語言信息技術(shù)平臺(tái)的語言產(chǎn)業(yè),換一種說法就是專業(yè)語言服務(wù)或語言產(chǎn)業(yè)的信息化時(shí)代。語言信息技術(shù)的發(fā)展首先是催生了新型的語言信息產(chǎn)業(yè),諸如輸入法產(chǎn)業(yè)、智能語音產(chǎn)業(yè)、機(jī)器翻譯產(chǎn)業(yè)、語義智能產(chǎn)業(yè)等;同時(shí),這些語言信息技術(shù)不斷滲透到培訓(xùn)、出版、翻譯、測試等傳統(tǒng)語言產(chǎn)業(yè)之中,形成一個(gè)基于現(xiàn)代信息技術(shù)的語言產(chǎn)業(yè)形態(tài);尤其是互聯(lián)網(wǎng)技術(shù)和智能手機(jī)終端的廣泛應(yīng)用,使得語言產(chǎn)業(yè)的新一輪發(fā)展不再是規(guī)模性數(shù)量上的增長,而是質(zhì)的變化。與傳統(tǒng)語言產(chǎn)業(yè)相比,我們可以把這個(gè)基于信息技術(shù)的語言產(chǎn)業(yè)稱為語言產(chǎn)業(yè)2.0版。這一波浪潮將長期引領(lǐng)語言產(chǎn)業(yè)的發(fā)展。下面我們以數(shù)字出版、在線語言教育以及“語音智能+”為例來說明這一輪語言產(chǎn)業(yè)的發(fā)展。
(一)數(shù)字出版
受益于互聯(lián)網(wǎng)特別是移動(dòng)互聯(lián)網(wǎng)、移動(dòng)終端的全面應(yīng)用,中國數(shù)字版權(quán)產(chǎn)業(yè)蓬勃發(fā)展,年增長速度穩(wěn)居30%之上,遠(yuǎn)遠(yuǎn)超越了其他行業(yè)。根據(jù)中國出版科學(xué)研究所《2015年度中國數(shù)字出版產(chǎn)業(yè)年度報(bào)告》的統(tǒng)計(jì), 2009年中國數(shù)字出版業(yè)總值達(dá)795億元人民幣,首度超越傳統(tǒng)紙質(zhì)書、報(bào)、刊出版物的生產(chǎn)總值。到2015年中國數(shù)字出版產(chǎn)業(yè)整體收入規(guī)模為4403.85億元,其中包括移動(dòng)出版(手機(jī)彩鈴、鈴音、移動(dòng)游戲等)、網(wǎng)絡(luò)游戲、互聯(lián)網(wǎng)期刊、電子書、數(shù)字報(bào)紙(不含手機(jī)報(bào))、在線音樂、在線教育等。當(dāng)然,這是廣義的出版行業(yè),游戲、廣告、鈴音也占據(jù)相當(dāng)大的份額。需要注意的是,2015年互聯(lián)網(wǎng)期刊、電子圖書、數(shù)字報(bào)紙的總收入只有74.45億元,在數(shù)字出版總收入中所占比例僅為1.69%,這說明傳統(tǒng)出版行業(yè)在數(shù)字化融合發(fā)展、數(shù)字化轉(zhuǎn)型升級(jí)方面仍有巨大的增長空間。
有數(shù)據(jù)顯示,人們的閱讀方式正在發(fā)生根本性的變化,調(diào)查顯示:2014 年,以手機(jī)閱讀、網(wǎng)上在線閱讀為代表的數(shù)字化閱讀方式的接觸率為58.1%,較2013 年上升了8.0 個(gè)百分點(diǎn),首次超過了圖書閱讀率。①這在相當(dāng)程度上說明了數(shù)字出版方式將逐漸取代傳統(tǒng)紙質(zhì)印刷出版而成為主流出版方式。
在語言出版領(lǐng)域,語言工具書的出版一直占有相當(dāng)大的份額,有些金牌工具書甚至被比喻為印書如印鈔,但是它仍然要應(yīng)對數(shù)字化出版。隨著智能手機(jī)全覆蓋式的普及以及在線工具書的使用,紙質(zhì)工具書的地位不斷下降。比如,2008年至2010年間,上海譯文出版社的《新法漢詞典》年銷量從13 000冊下降到3000冊。根據(jù)開卷公司的調(diào)查,2013年紙質(zhì)工具書銷量比去年下降5%,除了中小學(xué)生常用的《新華字典》《現(xiàn)代漢語詞典》銷量平穩(wěn)以外,語言類工具書總體下降9.2%,外文工具書總體下降9.3%。外研社有關(guān)人士也提到該社紙質(zhì)字典銷售呈逐年下降之勢,年均下降7%至8%。越來越嚴(yán)峻的現(xiàn)實(shí)逼迫傳統(tǒng)工具書進(jìn)行數(shù)字化變革。商務(wù)印書館《新華字典》紙質(zhì)圖書發(fā)行量迄今已有近6億冊,但它仍不能高枕無憂。在國內(nèi)出版社中,商務(wù)印書館較早著力于數(shù)字化出版的打造。2006年商務(wù)印書館與方正集團(tuán)合作啟動(dòng)“工具書在線”,為自己豐富的工具書資源打造數(shù)字化平臺(tái)。商務(wù)印書館可以提供總計(jì)1000余種工具書,商務(wù)版工具書的權(quán)威性和專業(yè)性都是不容置疑的,這些數(shù)字資源可以提供在線使用、電子書、資源庫、手機(jī)APP等多種服務(wù)。目前商務(wù)印書館數(shù)字出版的利潤當(dāng)然無法與傳統(tǒng)出版相比擬,但前景是無比開闊的,作為中國現(xiàn)代出版發(fā)源地的商務(wù)必須跟上時(shí)代的步伐。
一些信息企業(yè)正在成為另一種意義上的出版企業(yè)。以方正集團(tuán)為例,2000年起,在漢字激光照排技術(shù)的基礎(chǔ)上方正集團(tuán)著手研發(fā)適應(yīng)互聯(lián)網(wǎng)時(shí)代的數(shù)字出版系統(tǒng)。2007年,方正集團(tuán)發(fā)布數(shù)字出版戰(zhàn)略,向全媒體的數(shù)字復(fù)合出版技術(shù)發(fā)展,積極研發(fā)包括數(shù)字印刷、手持閱讀、互聯(lián)網(wǎng)出版等在內(nèi)的數(shù)字復(fù)合出版技術(shù),被稱為方正的“第二次技術(shù)革命”。方正阿帕比(Apabi)公司已發(fā)展成為全球領(lǐng)先的數(shù)字出版技術(shù)提供商,阿帕比以因特網(wǎng)為紐帶,將傳統(tǒng)出版的供應(yīng)鏈有機(jī)地聯(lián)結(jié)起來,實(shí)現(xiàn)完全數(shù)字化的出版。
(二)在線語言教育
在線教育是一種通過信息科技和互聯(lián)網(wǎng)進(jìn)行教育和學(xué)習(xí)的方法,在線教育的顯著特征是任何人在任何時(shí)間、地點(diǎn),選擇任何課程,從任何章節(jié)開始的一種完全超現(xiàn)實(shí)的學(xué)習(xí)或教育方法。它超越了課堂、教室、書本等實(shí)體條件的限制,帶來一種非常自由、靈活的學(xué)習(xí)狀態(tài)。在線教育改變了人們的學(xué)習(xí)方式,尤其是自主學(xué)習(xí)這一塊。在語言教育這一領(lǐng)域,艾瑞咨詢公司的調(diào)查顯示,在線語言學(xué)習(xí)正在成為語言學(xué)習(xí)的主流方式(見圖4)。
據(jù)該公司的調(diào)查報(bào)告,2010 年之后,在線語言教育市場每年都保持高于 20%的增長速度,到 2017 年將達(dá)到 360億元。2016 年中國在線語言培訓(xùn)占互聯(lián)網(wǎng)教育市場份額的21%,在投資領(lǐng)域,語言培訓(xùn)占據(jù) 35% 的市場份額。報(bào)告顯示,至2016年,80%的用戶選擇通過智能手機(jī)進(jìn)行語言學(xué)習(xí),智能手機(jī)已成為在線語言學(xué)習(xí)的第一終端工具,用戶比例已超過PC終端(見圖5)。在線語言培訓(xùn)已與傳統(tǒng)語言培訓(xùn)分庭抗禮,它遲早會(huì)取代后者而占據(jù)主流地位。
(三)“語音智能+”
根據(jù)《2013年智能語音產(chǎn)業(yè)白皮書》的介紹,目前智能語音完整的產(chǎn)業(yè)鏈基本形成,智能語音技術(shù)已在移動(dòng)互聯(lián)網(wǎng)語音搜索服務(wù)、智能手機(jī)、平板電腦等移動(dòng)終端設(shè)備、汽車電子和車載終端、智能家電、智能家居等方面得到廣泛應(yīng)用。同時(shí),智能語音技術(shù)應(yīng)用及服務(wù)在公共服務(wù)、智慧城市、教育、醫(yī)療、法律等領(lǐng)域不斷滲入,市場前景無可比擬。僅從智能手機(jī)終端來看,預(yù)計(jì)到 2017 年底,全球移動(dòng)終端 90%以上將配備語音功能,智能語音用戶規(guī)模將超過 20 億,其中中國用戶規(guī)模達(dá)將達(dá)到 10 億。
以科大訊飛的語音智能發(fā)展為例。它始終包含兩個(gè)線索,一是語音技術(shù)的發(fā)展,一是語音技術(shù)的廣泛應(yīng)用所帶來的產(chǎn)業(yè)整合效應(yīng)??拼笥嶏w起家的核心技術(shù)是語音識(shí)別、語音合成和語音評(píng)測,目前占有中文主流語音市場70%以上市場份額。隨著人工智能時(shí)代的來臨,2014年,科大訊飛發(fā)布“訊飛超腦”計(jì)劃,核心就是讓機(jī)器從“能聽會(huì)說”到“能理解會(huì)思考”,努力實(shí)現(xiàn)語音處理和語義智能的融合。在語音識(shí)別和語義理解方向上,針對人與人之間自由交流的語音轉(zhuǎn)寫正確率已突破85%的實(shí)用門檻,針對會(huì)議演講等實(shí)際場景應(yīng)用已達(dá)到95%以上的識(shí)別率,并且已經(jīng)研制完成軟硬件一體化的遠(yuǎn)場語音識(shí)別系統(tǒng)。在機(jī)器評(píng)測方向上,訊飛的技術(shù)從口語評(píng)測進(jìn)一步向紙筆試卷評(píng)測延伸,在正式承擔(dān)了廣東英語高考的全部口語評(píng)測任務(wù)后,基于試卷掃描識(shí)別的中英文作文自動(dòng)評(píng)分技術(shù)在重點(diǎn)考試的實(shí)際數(shù)據(jù)驗(yàn)證上已達(dá)到與人工專家評(píng)分高度吻合的水平。此外,其語音—語義智能技術(shù)在醫(yī)療、汽車、法院、電視娛樂等許多方面都有應(yīng)用。
隨著萬物互聯(lián)時(shí)代的到來,越來越多的設(shè)備沒有屏幕了,越來越多的設(shè)備需要我們在幾米之外來操控它,比如說機(jī)器人,它必須在幾米之外能夠?qū)崿F(xiàn)交互,并能夠隨時(shí)打斷。在這種大趨勢下,語音聯(lián)通將是重要入口,語音合成和識(shí)別就成為萬物互聯(lián)時(shí)代人機(jī)交互的最主要的方式。2016年底,科大訊飛首先在發(fā)布會(huì)上提出信息產(chǎn)業(yè)已經(jīng)從“互聯(lián)
網(wǎng)+時(shí)代”進(jìn)入“人工智能+”時(shí)代,訊飛認(rèn)為,未來5到10年,人工智能會(huì)像水和電一樣,進(jìn)入我們每個(gè)人的生活。
從全球角度看,中國的語言產(chǎn)業(yè)進(jìn)程基本與世界同步,這主要是因?yàn)橹袊プ×巳蚧?、信息化的產(chǎn)業(yè)發(fā)展機(jī)遇。從語言產(chǎn)業(yè)的內(nèi)在進(jìn)程看,語言產(chǎn)業(yè)的發(fā)展就是與信息技術(shù)不斷融合的過程。由于自然語言本身就是一種信息形態(tài),導(dǎo)致語言產(chǎn)業(yè)的“信息技術(shù)+”與其他產(chǎn)業(yè)的“信息技術(shù)+”有著根本的不同。語言產(chǎn)業(yè)的最新發(fā)展將圍繞人工語言智能展開。從技術(shù)的角度,人工智能是一種用智能機(jī)器(如計(jì)算機(jī)、翻譯機(jī)器、機(jī)器人等)來模擬人的某些思維過程和智能行為(如學(xué)習(xí)、推理、思考、規(guī)劃、行為活動(dòng)等)的技術(shù);從計(jì)算機(jī)科學(xué)的角度,人工智能研究包括語言識(shí)別、圖像識(shí)別、自然語言處理、核心算法、專家系統(tǒng)和機(jī)器人等??梢钥闯?,語言智能是人工智能的重要組成部分,甚
至是基礎(chǔ)性的部分。從實(shí)際應(yīng)用的角度,使用自然語言的人機(jī)對話將是未來萬物互聯(lián)的基本方式,人工智能不僅會(huì)聽會(huì)說我們的語言,而且能最大限度地模仿和聚合我們的語言智能。不同形態(tài)的語言產(chǎn)品都將不同程度地融入語言智能這一新的技術(shù)平臺(tái),未來語言產(chǎn)業(yè)的發(fā)展無疑將是“語言智能+”的時(shí)代。
參考文獻(xiàn)
陳 鵬 2016 《語言產(chǎn)業(yè)經(jīng)濟(jì)貢獻(xiàn)度研究的若干理論問題》,《語言文字應(yīng)用》第3期。
賀宏志主編 2012 《語言產(chǎn)業(yè)導(dǎo)論》,北京:首都師范大學(xué)出版社。
黃少安 蘇 劍 張衛(wèi)國 2012 《語言經(jīng)濟(jì)學(xué)與中國的語言產(chǎn)業(yè)戰(zhàn)略》,《光明日報(bào)》3 月2日。
李宇明 2004 《強(qiáng)國的語言與語言的強(qiáng)國》,《光明日報(bào)》7月28日。
李宇明 2011 《語言也是硬實(shí)力》,《華中師范大學(xué)學(xué)報(bào)》(人文社會(huì)科學(xué)版)第5期。
李宇明 2012 《認(rèn)識(shí)語言的經(jīng)濟(jì)學(xué)屬性》,《語言文字應(yīng)用》第3期。
羅 民 張晉軍 謝歐航 黃賀臣 2011 《新漢語水平考試(HSK)海外實(shí)施報(bào)告》,《中國考試》第4期。
徐大明 2010 《關(guān)于語言經(jīng)濟(jì)學(xué)的七個(gè)問題》,《云南師范大學(xué)學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)第9期。
責(zé)任編輯:戴 燃