摘要: 語言作為一種“資源”,具有重要的經(jīng)濟(jì)屬性,能夠促成語言產(chǎn)業(yè)的形成與發(fā)展。在數(shù)字經(jīng)濟(jì)時(shí)代,語言還是數(shù)據(jù)生產(chǎn)要素的主要體現(xiàn)形式與重要組成部分,具有泛生產(chǎn)要素性質(zhì),語言數(shù)據(jù)的產(chǎn)業(yè)化趨勢(shì)催生了語言產(chǎn)業(yè)發(fā)展的新模式——語言數(shù)據(jù)產(chǎn)業(yè)。處于初創(chuàng)發(fā)展期的語言數(shù)據(jù)產(chǎn)業(yè)存在諸多問題,對(duì)此,可以從學(xué)術(shù)上加強(qiáng)研究、管理上加大扶持與引導(dǎo)、監(jiān)管上強(qiáng)化產(chǎn)權(quán)立法、發(fā)展上突顯鏈?zhǔn)剿季S、學(xué)習(xí)上借鑒國際經(jīng)驗(yàn)等措施加以化解突破。
關(guān)鍵詞:數(shù)字經(jīng)濟(jì);生產(chǎn)要素;語言產(chǎn)業(yè);語言數(shù)據(jù)產(chǎn)業(yè)
中圖分類號(hào):F062.9
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1673-4513(2023)-02-074-07
作者簡(jiǎn)介:
毛現(xiàn)樁(1981-),男,河南平頂山人,副教授,博士,主要研究方向:語言產(chǎn)業(yè)、語言經(jīng)濟(jì)。
基金項(xiàng)目:
2022年河南省教育科學(xué)規(guī)劃項(xiàng)目“新文科背景下省屬普通本科高校外語專業(yè)產(chǎn)教融合協(xié)同育人機(jī)制研究”(2022YB0116);2022 年河南省本科高校研究性教學(xué)改革研究與實(shí)踐項(xiàng)目(2022SYJXLX046);河南財(cái)經(jīng)政法大學(xué)2021年教改項(xiàng)目“智慧教學(xué)模式下大學(xué)英語跨文化類課程線上線下混合式金課建設(shè)研究與實(shí)踐”。
引言
數(shù)字經(jīng)濟(jì)是以信息技術(shù)的革命與發(fā)展為驅(qū)動(dòng),以數(shù)據(jù)作為核心生產(chǎn)要素的新興經(jīng)濟(jì)形態(tài)。黨的十九大報(bào)告提出加快建設(shè)數(shù)字中國,指明了我國經(jīng)濟(jì)社會(huì)發(fā)展的方向。2021年11月1日,中國正式提出申請(qǐng)加入DEPA,標(biāo)志著我國數(shù)字經(jīng)濟(jì)發(fā)展進(jìn)入了新時(shí)期,具有里程碑式的重要意義。
在信息通信技術(shù)與傳統(tǒng)產(chǎn)業(yè)融合的影響下,我國的數(shù)字經(jīng)濟(jì)近年來一直呈現(xiàn)飛速發(fā)展的態(tài)勢(shì)。2021年4月,中國信息通信研究院發(fā)布《中國數(shù)字經(jīng)濟(jì)發(fā)展白皮書》,2019年我國數(shù)字經(jīng)濟(jì)規(guī)模占GDP總量的36.2%,對(duì)經(jīng)濟(jì)增長的貢獻(xiàn)為67.7%,2020年較2019年又提升了2.4%,占GDP總量的38.6%,數(shù)字經(jīng)濟(jì)已成為拉動(dòng)我國經(jīng)濟(jì)增長的新動(dòng)力。數(shù)字經(jīng)濟(jì)最核心的生產(chǎn)要素是數(shù)據(jù),而在人類觀察世界所形成的可供計(jì)算機(jī)處理的數(shù)據(jù)中,80%都是語言數(shù)據(jù),故語言數(shù)據(jù)是數(shù)字經(jīng)濟(jì)時(shí)代最為重要的數(shù)據(jù)。數(shù)字經(jīng)濟(jì)的高質(zhì)量發(fā)展有賴于語言數(shù)據(jù)的高質(zhì)量收集、挖掘、存儲(chǔ)、管理、加工及應(yīng)用,這為語言產(chǎn)業(yè)的新發(fā)展——語言數(shù)據(jù)產(chǎn)業(yè),帶來了機(jī)遇,也提出了挑戰(zhàn)。
一、語言的經(jīng)濟(jì)學(xué)屬性與語言產(chǎn)業(yè)
(一) 語言的經(jīng)濟(jì)學(xué)屬性
語言的經(jīng)濟(jì)學(xué)屬性來源于語言的“資源”本質(zhì),語言具有一般經(jīng)濟(jì)資源的稀缺性與成本收益性。從個(gè)體層面而言,語言資源不是與生俱來,而是通過后天的成本(時(shí)間或金錢)投入逐漸習(xí)得,而且因個(gè)體與投入差異,對(duì)該資源的獲取程度因人而異。研究發(fā)現(xiàn),個(gè)體通過“成本投入”所獲得的語言能力提升程度或掌握的多語種數(shù)量與其工資收入水平和社會(huì)經(jīng)濟(jì)地位具有較強(qiáng)的關(guān)聯(lián)性,存在著顯著的正相關(guān)關(guān)系,語言資本投資是一種重要的人力資本投資形式。此外,作為人類認(rèn)知與思維的工具,個(gè)人的語言能力很大程度上決定著其個(gè)體獲得其他人力資本(如知識(shí)、科技、技能等)的程度,從這個(gè)角度上講,語言是個(gè)體提升自身其他人力資本的一種重要的中介資本。另一方面,從國家或社會(huì)維度而言,語言的“資源”本質(zhì)體現(xiàn)在語言的文化負(fù)載性上。語言是文化的重要載體,不同語言之間或同一語言不同方言之間存在比較明顯的文化差異,文化差異會(huì)造成人與人之間的誤會(huì)、偏見乃至歧視等負(fù)面效果,從而造成交流障礙,降低交流意愿,影響地區(qū)間的經(jīng)濟(jì)互動(dòng)。國家之間的“語言距離”不僅會(huì)阻礙科學(xué)技術(shù)的全球傳播,不利于技術(shù)落后國“后發(fā)優(yōu)勢(shì)”的發(fā)揮,而且還增加了貿(mào)易往來的交易成本,影響了外商投資的進(jìn)入模式。綜上,語言不僅是一種能給個(gè)體帶來經(jīng)濟(jì)利益的特殊人力資本形式,而且也是一種能夠影響整個(gè)國家或民族發(fā)展的重要經(jīng)濟(jì)資源。
(二)語言產(chǎn)業(yè)及其業(yè)態(tài)發(fā)展
語言一旦有了經(jīng)濟(jì)價(jià)值,便會(huì)進(jìn)入市場(chǎng),開始發(fā)生經(jīng)濟(jì)行為。個(gè)體通過自學(xué)或是參加語言培訓(xùn)提升了自身語言技能,在勞動(dòng)力市場(chǎng)獲得了求職的競(jìng)爭(zhēng)優(yōu)勢(shì)、在職場(chǎng)提升了工資水平,從而在語言資本中獲利;不同語言文化中的企業(yè)開展經(jīng)貿(mào)往來需要有語言翻譯服務(wù)來消除語言障礙、拉近語言距離、處理貿(mào)易摩擦等事務(wù),從而有了語言消費(fèi)需求。隨之,市場(chǎng)上便出現(xiàn)了語言培訓(xùn)、語言翻譯、語言出版等一些專門提供語言產(chǎn)品或服務(wù)的企業(yè),當(dāng)語言消費(fèi)與語言供給達(dá)到一定的成熟度和規(guī)模后便形成了語言產(chǎn)業(yè)。
關(guān)于語言產(chǎn)業(yè)的內(nèi)涵,不同學(xué)者給出了不同的界定,比較具有代表性的幾個(gè)意見如下。李宇明(2016)認(rèn)為“語言產(chǎn)業(yè)是以生產(chǎn)和提供語言產(chǎn)品,利用語言賺取紅利的產(chǎn)業(yè)。”陳鵬(2012)認(rèn)為“語言產(chǎn)業(yè)是以語言為內(nèi)容、材料,或是以語言為加工、處理對(duì)象,生產(chǎn)出各種語言產(chǎn)品以滿足各種語言需求的產(chǎn)業(yè)形態(tài)。”黃少安等(2012)認(rèn)為“語言產(chǎn)業(yè)是一種采取市場(chǎng)化的經(jīng)營方式生產(chǎn)語言類產(chǎn)品或者語言服務(wù),從而滿足國家或者個(gè)人對(duì)各種語言產(chǎn)品或語言服務(wù)需求的產(chǎn)業(yè)?!辟R宏志(2012)認(rèn)為“語言產(chǎn)業(yè)是以語言文字作為原料和內(nèi)容(語言本體),或是以語言文字作為加工處理的對(duì)象(語言作為工具),生產(chǎn)各種語言產(chǎn)品或提供各種語言服務(wù)的產(chǎn)業(yè)?!币陨蠈?duì)語言產(chǎn)業(yè)的界定雖各有側(cè)重,但語言產(chǎn)品的生產(chǎn)或語言服務(wù)的提供是其核心內(nèi)容。因此,根據(jù)語言產(chǎn)品或服務(wù)的形態(tài)或方式,我們可以將語言產(chǎn)業(yè)下分為三大類別:語言能力產(chǎn)業(yè)、語言內(nèi)容產(chǎn)業(yè)與語言處理產(chǎn)業(yè),又可具體化為語言培訓(xùn)、語言康復(fù)、語言測(cè)評(píng)、語言出版、語言翻譯、語言創(chuàng)意、語言會(huì)展、語言文字信息處理、語言藝術(shù)等九大業(yè)態(tài)類型。
但是,隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展與普及,尤其是近兩年受疫情影響,網(wǎng)絡(luò)空間的語言產(chǎn)業(yè)各業(yè)態(tài)所占比例越來越高,如在線語言教育與測(cè)評(píng)、在線會(huì)議翻譯、在線語言展覽、在線智能寫作、在線語音識(shí)別、合成、輸入等在線語言處理業(yè)態(tài)。網(wǎng)絡(luò)空間的語言產(chǎn)業(yè)與傳統(tǒng)語言產(chǎn)業(yè)相比最大區(qū)別在于,在網(wǎng)絡(luò)空間,計(jì)算機(jī)是以數(shù)據(jù)的形式運(yùn)行處理語言內(nèi)容,從而形成新的語言產(chǎn)品或語言服務(wù),語言數(shù)據(jù)在網(wǎng)絡(luò)空間語言產(chǎn)業(yè)中起著至關(guān)重要的作用。
二、數(shù)字經(jīng)濟(jì)中的語言數(shù)據(jù)生產(chǎn)要素
數(shù)字經(jīng)濟(jì)以信息技術(shù)發(fā)展為必要條件,以數(shù)據(jù)為關(guān)鍵的生產(chǎn)要素,用數(shù)字呈現(xiàn)信息內(nèi)容。在數(shù)字經(jīng)濟(jì)中,語言作為信息技術(shù)創(chuàng)新和互聯(lián)網(wǎng)應(yīng)用創(chuàng)新的基礎(chǔ)要素,在很大程度上已超越語音、詞匯與語法系統(tǒng)的傳統(tǒng)范疇和語言文化差異,已超越語言思維和數(shù)據(jù)思維的傳統(tǒng)框架和戰(zhàn)略認(rèn)知,成為了數(shù)字經(jīng)濟(jì)中具有戰(zhàn)略意義的數(shù)據(jù)系統(tǒng)。數(shù)字經(jīng)濟(jì)中的語言數(shù)據(jù)分為三個(gè)層級(jí):自然語言、人工語言與數(shù)字語言。
(一)自然語言
自然語言,即語言的應(yīng)然狀態(tài)。自然語言體現(xiàn)著人類交流的豐富性與多樣性。語言雖是信息的載體,但是,每一種自然語言都有其獨(dú)特的語音、詞匯、語法、文字等表意系統(tǒng)。所以,相同的信息在不同的語言系統(tǒng)中有著迥然不同的表達(dá)形式。這使得不同語言之間的信息傳遞存在障礙,亦即“語言效率”存在差異。信息交流是語言的第一屬性,但當(dāng)交流的信息彼此間呈現(xiàn)標(biāo)準(zhǔn)不一致時(shí),人們就需要通過語言學(xué)習(xí)或語言翻譯以達(dá)到交流的彼岸。
自然語言雖屬語言數(shù)據(jù)的較低形態(tài),但是語言數(shù)據(jù)的重要組成部分,并且是計(jì)算機(jī)處理語言數(shù)據(jù)中最難的一種。計(jì)算機(jī)對(duì)自然語言的處理程度,如漢字識(shí)別、語音檢索、語言(聲音、文字)翻譯、機(jī)器客服語言訓(xùn)練等都決定著人工智能的發(fā)展進(jìn)程。
(二)人工語言
自然語言在為人類創(chuàng)造了一個(gè)多彩語言世界的同時(shí),也為世界范圍內(nèi)的信息交流與溝通帶來了天然的認(rèn)知障礙。隨著交通工具與信息技術(shù)的進(jìn)步與發(fā)展,這種障礙愈加明顯,因此,人們開始設(shè)想創(chuàng)造一種具有通用效果的“人工語言”,以掃除語言差異在認(rèn)知中的障礙。在知識(shí)傳播史上,數(shù)學(xué)語言便是成功的一例。數(shù)學(xué)運(yùn)算符號(hào)以及數(shù)學(xué)公式的統(tǒng)一,極大化解了自然科學(xué)知識(shí)傳播過程中的語言障礙,使得伽利略用數(shù)學(xué)語言撰寫的關(guān)于天體、宇宙的著作成為后來物理學(xué)、化學(xué)、工程設(shè)計(jì)等學(xué)科發(fā)展的重要基礎(chǔ)知識(shí)。有了對(duì)已有知識(shí)系統(tǒng)化和標(biāo)準(zhǔn)化的語言處理,后人可直接對(duì)接前人成果,實(shí)現(xiàn)一次又一次的技術(shù)創(chuàng)新。除了數(shù)學(xué)語言,我們還有樂譜語言、盲文、聾啞人的手語、旗語、燈語、電話號(hào)碼、銀行卡號(hào)碼等形式的人工語言。人工語言可以是自然語言的符號(hào)化,體現(xiàn)自然語言規(guī)則,也可以自成體系,擁有內(nèi)部運(yùn)行規(guī)則;對(duì)人工語言的理解有時(shí)需要自然語言輔助,有時(shí)需用自然語言闡釋??傊?,人工語言與自然語言具有天然的密切關(guān)系。
當(dāng)今社會(huì),經(jīng)濟(jì)發(fā)展是人類的主題,而語言是能夠影響從知識(shí)生產(chǎn)到技術(shù)創(chuàng)新再到經(jīng)濟(jì)績效的最微觀的因子,隨著計(jì)算機(jī)信息技術(shù)與互聯(lián)網(wǎng)滲入所有的經(jīng)濟(jì)行為,我們急需一種通用語言,以極高的效率進(jìn)行信息流動(dòng)和知識(shí)獲取,從而促進(jìn)經(jīng)濟(jì)更快更好發(fā)展,這便是數(shù)字語言。
(三)數(shù)字語言
當(dāng)人類大腦面對(duì)實(shí)踐對(duì)象的復(fù)雜性與豐富性時(shí),傳統(tǒng)語言文字難以出色完成對(duì)其全面認(rèn)知與深度分析加工,表現(xiàn)出了認(rèn)知效率不佳。此時(shí),一種高效的媒介技術(shù)即機(jī)器語言出現(xiàn)了,它由形式語言所形成的虛擬計(jì)算機(jī)大腦來開展我們?nèi)祟惔竽X在某些領(lǐng)域所完不成的工作。機(jī)器語言的發(fā)展推動(dòng)了數(shù)字技術(shù)的進(jìn)一步發(fā)展,數(shù)字技術(shù)可以將社會(huì)運(yùn)行進(jìn)行數(shù)據(jù)化重構(gòu),形成海量數(shù)據(jù)。海量數(shù)據(jù)被各種軟件、數(shù)字平臺(tái)捕獲后,傳輸給由計(jì)算機(jī)機(jī)器語言構(gòu)成的虛擬人類大腦進(jìn)行機(jī)器學(xué)習(xí)。所以,海量數(shù)據(jù)越大越豐富,機(jī)器學(xué)習(xí)的效果越好,算法越精準(zhǔn),產(chǎn)出結(jié)果的適用性與指導(dǎo)性就越強(qiáng)。在機(jī)器語言階段,計(jì)算機(jī)分析的對(duì)象均是經(jīng)過數(shù)字技術(shù)處理過后的數(shù)字信息,此時(shí)的語言數(shù)據(jù)是被數(shù)字化了的語言,即數(shù)字語言。數(shù)字語言是語言數(shù)據(jù)的高級(jí)形態(tài),具有普適性與統(tǒng)一性,可以用來描述所有的人類活動(dòng)。
這里需要說明的是,語言數(shù)據(jù)的三個(gè)層級(jí),是按照計(jì)算機(jī)對(duì)語言處理的方便程度以及“語言效率”的高低程度對(duì)語言的劃分,并不是語言進(jìn)化的三個(gè)階段。在數(shù)字信息時(shí)代的今天,三種語言數(shù)據(jù)是并存的,都是數(shù)字經(jīng)濟(jì)的重要生產(chǎn)要素。
三、語言的泛生產(chǎn)要素性
語言的獨(dú)特生產(chǎn)要素性不僅來源于語言的本質(zhì)屬性,語言是人類最重要的交際和思維工具,也是人類文化和信息的最重要負(fù)載者,同時(shí)還是人類文化最重要的建構(gòu)者和闡釋者。同時(shí),語言與其他幾種生產(chǎn)要素有著非常的特殊關(guān)系,在其中發(fā)揮著重要作用,語言具有泛生產(chǎn)要素性(如圖1)。
首先,語言經(jīng)濟(jì)學(xué)的邏輯起點(diǎn)是視語言為人力資本。語言是人的重要?jiǎng)趧?dòng)力,對(duì)于服務(wù)行業(yè)或是智力型崗位,情況尤為如此,一個(gè)人的語言能力遠(yuǎn)比其體力更為重要。從世界或我國發(fā)展經(jīng)驗(yàn)來看,語言能力薄弱或脆弱的地區(qū)通常是貧困地區(qū),有語言障礙的人群通常會(huì)是貧困的群體。
其次,語言不僅是一種“符號(hào)系統(tǒng)”,是人們彼此交流的一種重要工具,語言還是信息的載體,承載著“知識(shí)”?,F(xiàn)代漢語詞典中對(duì)“知識(shí)的”定義是“人們?cè)诟脑焓澜绲膶?shí)踐中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和?!边@種“認(rèn)識(shí)與經(jīng)驗(yàn)”可能以書面語言的形式儲(chǔ)存于書籍雜志或媒體之中,也可能以概念或經(jīng)驗(yàn)的形式儲(chǔ)存于人類大腦,而大腦中概念與經(jīng)驗(yàn)的釋解仍然需要腦神經(jīng)語言或認(rèn)知語言的參與。因此,語言與知識(shí)生產(chǎn)要素關(guān)系密切。
再次,就狹義技術(shù)而言,語言技能本身就是一項(xiàng)技術(shù)本領(lǐng),擁有較高語言能力的人其語言技術(shù)(技能)就高。從廣義技術(shù)而言,以語言作為現(xiàn)代技術(shù)加工處理對(duì)象的現(xiàn)代語言技術(shù),如多語網(wǎng)絡(luò)翻譯技術(shù)、語音識(shí)別技術(shù)、文字輸入技術(shù)等,在整個(gè)現(xiàn)代技術(shù)體系中占據(jù)著重要位置。此外,各個(gè)產(chǎn)業(yè)領(lǐng)域中技術(shù)發(fā)明專利的申請(qǐng)、技術(shù)的傳授學(xué)習(xí)都需要借助于語言來呈現(xiàn)或達(dá)成。語言是技術(shù)生產(chǎn)要素的伴隨者。
再次,作為生產(chǎn)要素的管理指的是某種管理章程或制度,或是某種管理行為。對(duì)于前者,張衛(wèi)國(2008)指出:“語言既是一種特殊的社會(huì)制度,具有規(guī)范人們言說表達(dá)的功能,同時(shí)語言也是人類其他制度的信息承載物,人類的一切政治、經(jīng)濟(jì)、社會(huì)等制度都需要通過語言文字來記載或通過語言言說所表達(dá)。”對(duì)于后者,在各種管理制度的基礎(chǔ)上,有效的管理行為還需要嚴(yán)謹(jǐn)?shù)乃季S與準(zhǔn)確的言語表達(dá),語言是人類表達(dá)思維的重要方式,高超的語言表達(dá)能力也是管理能力的重要體現(xiàn)。在人力資源管理中,語言能力以及以語言能力為基礎(chǔ)的溝通能力是企業(yè)在招聘、測(cè)試、培養(yǎng)、考績等全過程中對(duì)員工考察評(píng)估的重要核心指標(biāo),是高績效人力資源管理系統(tǒng)的基礎(chǔ),對(duì)員工產(chǎn)出與收益產(chǎn)生直接影響。
最后,語言本身是一種資本,可以為個(gè)人或群體帶來經(jīng)濟(jì)價(jià)值。然而,撇開語言的資本屬性,從其一般社會(huì)屬性而言,語言與資本、土地的關(guān)系也十分密切。語言能夠影響資本的流動(dòng)與走向,為土地生產(chǎn)資料賦值。曾毅平(1998)研究指出:“社會(huì)語言文字使用的總體面貌對(duì)實(shí)現(xiàn)投資效益有著相當(dāng)?shù)挠绊懀Z言環(huán)境是資金得以有效運(yùn)營的一個(gè)不容忽視的外部條件,語言環(huán)境也是一種投資環(huán)境?!痹谕馍虒?duì)華投資中,“語言距離不僅會(huì)直接削弱外商對(duì)華直接投資,而且還會(huì)通過雙邊貿(mào)易額間接影響外商對(duì)華直接投資?!?/p>
四、語言產(chǎn)業(yè)發(fā)展新模式——語言數(shù)據(jù)產(chǎn)業(yè)
(一)語言數(shù)據(jù)產(chǎn)業(yè)的內(nèi)涵與外延
依照語言數(shù)據(jù)的屬性與功能,我們嘗試將語言數(shù)據(jù)產(chǎn)業(yè)定義為,視語言數(shù)據(jù)為數(shù)字經(jīng)濟(jì)生產(chǎn)要素的重要組成部分,對(duì)各類語言數(shù)據(jù)進(jìn)行收集儲(chǔ)存、管理經(jīng)營、加工應(yīng)用,以生產(chǎn)各類語言數(shù)據(jù)產(chǎn)品或提供語言數(shù)據(jù)服務(wù)的產(chǎn)業(yè)。該定義的前提是語言數(shù)據(jù)是數(shù)字經(jīng)濟(jì)生產(chǎn)要素的重要組成部分,發(fā)展語言數(shù)據(jù)產(chǎn)業(yè)的目的就是通過語言數(shù)據(jù)產(chǎn)品的生產(chǎn),或?qū)婋s的語言數(shù)據(jù)進(jìn)行管理、加工與應(yīng)用,從而更好地為數(shù)字經(jīng)濟(jì)的健康發(fā)展提供高質(zhì)量的數(shù)據(jù)生產(chǎn)要素,并為其它生產(chǎn)要素提供應(yīng)有的語言服務(wù)。語言數(shù)據(jù)產(chǎn)業(yè)是一個(gè)長鏈條、寬口徑的新型產(chǎn)業(yè)模式,涉及多種業(yè)態(tài)類型。語言數(shù)據(jù)的挖掘與收集、語言數(shù)據(jù)庫的建設(shè)與維護(hù)、語言數(shù)據(jù)的存儲(chǔ)與傳輸、語言數(shù)據(jù)的計(jì)算機(jī)分析、語言數(shù)據(jù)產(chǎn)品的營銷、語言數(shù)據(jù)管理服務(wù)標(biāo)準(zhǔn)的制定、語言數(shù)據(jù)人才的培養(yǎng)等都將是伴隨語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關(guān)業(yè)態(tài)。
(二)語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展中的問題
作為語言產(chǎn)業(yè)發(fā)展的新模式,語言數(shù)據(jù)產(chǎn)業(yè)還處于產(chǎn)業(yè)發(fā)展的初期階段,加之語言數(shù)據(jù)本身的特征與屬性,該產(chǎn)業(yè)目前發(fā)展顯露出一些問題。
1.語言數(shù)據(jù)的產(chǎn)權(quán)確立問題。語言數(shù)據(jù)的來源口徑較多,既有從現(xiàn)實(shí)空間搜集到的語言資料所構(gòu)建的語料庫數(shù)據(jù),如醫(yī)患多模態(tài)對(duì)話數(shù)據(jù)庫、公共空間的語言景觀數(shù)據(jù)庫、教師課堂話語語料庫等,也有從互聯(lián)網(wǎng)獲得的各種網(wǎng)絡(luò)語言數(shù)據(jù)產(chǎn)品或服務(wù),如網(wǎng)絡(luò)字體、表情包、網(wǎng)絡(luò)配音等,還有日常生活中個(gè)人在進(jìn)行電子登錄或各種操作中,被各種應(yīng)用軟件后臺(tái)獲取的個(gè)人語言數(shù)據(jù),如賬號(hào)信息、地址信息、人臉識(shí)別的電子信息等。語言數(shù)據(jù)的廣來源性造成數(shù)據(jù)產(chǎn)權(quán)的難確定性。在產(chǎn)權(quán)難以確定的情況下,產(chǎn)權(quán)的保護(hù)就成了空談。然而,在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)成為極其重要的生產(chǎn)要素,對(duì)數(shù)據(jù),尤其是語言數(shù)據(jù)的知識(shí)產(chǎn)權(quán)保護(hù)尤為重要,是保障數(shù)字經(jīng)濟(jì)健康發(fā)展的重要舵手。
2.語言數(shù)據(jù)的安全問題。語言數(shù)據(jù)的安全性主要是指語言本身的質(zhì)量安全性和使用過程中有可能對(duì)他人造成的安全性傷害。語言數(shù)據(jù)收集渠道多、來源廣,通過各個(gè)渠道獲取而來的語言數(shù)據(jù)質(zhì)量參差不齊。那些質(zhì)量較差,甚至惡劣的語言數(shù)據(jù)會(huì)嚴(yán)重影響語言數(shù)據(jù)庫的使用安全。比如,通過網(wǎng)絡(luò)獲取的語言數(shù)據(jù)可能會(huì)是不同時(shí)代、不同國度、不同文化的語言數(shù)據(jù),還有可能是人工智能產(chǎn)生的語言數(shù)據(jù)。這些語言數(shù)據(jù)混雜了不同的意識(shí)形態(tài)偏見、文化習(xí)俗偏見,帶有較多不文明用語,甚至違反了倫理道德,如果對(duì)該類語言數(shù)據(jù)不加“潔洗”就加以應(yīng)用,必定會(huì)對(duì)生產(chǎn)的語言數(shù)據(jù)產(chǎn)品或提供的語言數(shù)據(jù)服務(wù)產(chǎn)生極大的負(fù)面影響。其次,語言數(shù)據(jù)在存儲(chǔ)、傳輸、應(yīng)用過程中如不加強(qiáng)防護(hù)措施,極易造成數(shù)據(jù)的泄露問題。泄露的語言數(shù)據(jù)關(guān)乎個(gè)體或社團(tuán)的隱私,甚至國家的語言安全,若不引以重視,將對(duì)個(gè)人或國家造成難以挽回的重大損失。
3.語言數(shù)據(jù)的對(duì)接共享問題。語言數(shù)據(jù)有可能來源于不同的語料庫,而現(xiàn)行研究范式并沒有對(duì)語料庫的標(biāo)注體系進(jìn)行規(guī)范化統(tǒng)一,并未規(guī)定同類型的語料庫使用同系統(tǒng)的標(biāo)注規(guī)范,這就造成了即便是取自同類別的兩個(gè)不同語料庫的語言數(shù)據(jù)也難以直接進(jìn)行同類對(duì)比分析,更難以將兩個(gè)語料庫研究結(jié)果直接對(duì)接。此外,當(dāng)前語言數(shù)據(jù)的“孤立”現(xiàn)象比較嚴(yán)重。同類研究機(jī)構(gòu)之間、政府各部門之間、甚至課題組之間都有可能建有自己的(語言)數(shù)據(jù)庫,但是出于各種原因,相關(guān)或同類(語言)數(shù)據(jù)庫資源未能實(shí)現(xiàn)共享,同類數(shù)據(jù)的反復(fù)采集不僅對(duì)個(gè)體帶來不便,增加了泄露風(fēng)險(xiǎn),而且未能對(duì)(語言)數(shù)據(jù)實(shí)現(xiàn)綜合利用。
4.語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的思維模式問題。如前所述,語言數(shù)據(jù)產(chǎn)業(yè)涉及語言數(shù)據(jù)的收集挖掘、語言數(shù)據(jù)的存儲(chǔ)、語言數(shù)據(jù)的管理、語言數(shù)據(jù)的加工、語言數(shù)據(jù)的應(yīng)用以及語言數(shù)據(jù)的產(chǎn)品開發(fā)等多個(gè)環(huán)節(jié)、多道工序。每一個(gè)環(huán)節(jié)工序上出現(xiàn)問題都將影響后續(xù)環(huán)節(jié)的正常進(jìn)行,嚴(yán)重者影響整個(gè)語言數(shù)據(jù)產(chǎn)品的生產(chǎn)或語言數(shù)據(jù)服務(wù)提供的質(zhì)量。因此,可以說,語言數(shù)據(jù)產(chǎn)業(yè)是一個(gè)由多個(gè)語言數(shù)據(jù)產(chǎn)業(yè)業(yè)態(tài)構(gòu)成的鏈?zhǔn)疆a(chǎn)業(yè),其發(fā)展呈現(xiàn)鏈狀模式,這與傳統(tǒng)語言產(chǎn)業(yè)的簇狀發(fā)展模式不同。倘若各語言數(shù)據(jù)業(yè)態(tài)只是自顧獨(dú)自發(fā)展,沒有全局觀念、鏈?zhǔn)剿季S,那么不可能提升整個(gè)語言數(shù)據(jù)產(chǎn)業(yè)的發(fā)展質(zhì)量,更不可能發(fā)揮出語言數(shù)據(jù)對(duì)數(shù)字經(jīng)濟(jì)應(yīng)有的支撐作用。
(三)相關(guān)規(guī)劃與建議
1.加強(qiáng)對(duì)語言數(shù)據(jù)產(chǎn)業(yè)的研究。在我國,語言產(chǎn)業(yè)的發(fā)展也不過十年左右的時(shí)間。學(xué)界、業(yè)界對(duì)它的認(rèn)識(shí)仍在不斷地深化與拓寬,對(duì)其內(nèi)涵的界定、產(chǎn)業(yè)邊界的確定、業(yè)態(tài)分類標(biāo)準(zhǔn)的敲定、統(tǒng)計(jì)指標(biāo)的確定等方研究至今未形成統(tǒng)一共識(shí)。而作為語言產(chǎn)業(yè)發(fā)展的新模式,語言數(shù)據(jù)產(chǎn)業(yè)更是一個(gè)嶄新的研究領(lǐng)域。需要盡快加強(qiáng)對(duì)其進(jìn)行學(xué)理與實(shí)踐研究,形成一批具有理論指導(dǎo)性和實(shí)踐操作性的研究成果,為制定語言數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展對(duì)策提供依據(jù)。
2.加大政府扶持與引導(dǎo)。政府應(yīng)從國家戰(zhàn)略高度為語言數(shù)據(jù)產(chǎn)業(yè)創(chuàng)設(shè)更加開放創(chuàng)新的產(chǎn)業(yè)環(huán)境,加大對(duì)相關(guān)研究的支持力度,制定語言數(shù)據(jù)產(chǎn)業(yè)與市場(chǎng)的法規(guī)政策,建立語言數(shù)據(jù)產(chǎn)業(yè)人才培養(yǎng)機(jī)制,重視語言數(shù)據(jù)產(chǎn)業(yè)各鏈條業(yè)態(tài)人員的培養(yǎng)與管理,建立語言數(shù)據(jù)職業(yè)規(guī)范與倫理道德等條例引導(dǎo)語言數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展。同時(shí),加強(qiáng)政府各相關(guān)部門之間的合作,建立相應(yīng)的協(xié)調(diào)溝通機(jī)制,倡導(dǎo)語言數(shù)據(jù)的互通共享。
3.強(qiáng)化對(duì)語言數(shù)據(jù)產(chǎn)業(yè)的知識(shí)產(chǎn)權(quán)保護(hù)。我國的知識(shí)產(chǎn)權(quán)意識(shí)較過去有了顯著提高,但是對(duì)于高度網(wǎng)絡(luò)化的語言數(shù)據(jù)產(chǎn)業(yè)來說尚缺乏清晰的產(chǎn)權(quán)意識(shí),如網(wǎng)絡(luò)字體、網(wǎng)絡(luò)主頁的獨(dú)創(chuàng)性、網(wǎng)絡(luò)表情包的使用、網(wǎng)絡(luò)段子的著作權(quán)等類型的語言數(shù)據(jù)都發(fā)生過產(chǎn)權(quán)爭(zhēng)議或糾紛。因此,應(yīng)從政府指導(dǎo)、行業(yè)監(jiān)管、法律建構(gòu)等層面對(duì)語言數(shù)據(jù)產(chǎn)品和語言數(shù)據(jù)服務(wù)進(jìn)行產(chǎn)權(quán)保護(hù),對(duì)于難以確權(quán)的現(xiàn)實(shí)公共空間和網(wǎng)絡(luò)空間的語言數(shù)據(jù)進(jìn)行合理化產(chǎn)權(quán)明晰,避免引發(fā)產(chǎn)權(quán)爭(zhēng)議。對(duì)于涉及個(gè)人隱私的語言數(shù)據(jù)要加強(qiáng)保護(hù),加大對(duì)泄露、侵犯?jìng)€(gè)人隱私語言數(shù)據(jù)的違法犯罪行為的懲處力度。
4.培養(yǎng)語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的鏈?zhǔn)剿季S。產(chǎn)業(yè)鏈不僅是實(shí)際存在的一種產(chǎn)業(yè)集,更是一種思維方式。產(chǎn)業(yè)要想做大做強(qiáng),就不能停留在“單兵作戰(zhàn)”的階段,必須具有產(chǎn)業(yè)鏈的產(chǎn)業(yè)全局觀。鏈?zhǔn)桨l(fā)展思維對(duì)于語言數(shù)據(jù)產(chǎn)業(yè)而言尤為重要。語言數(shù)據(jù)產(chǎn)業(yè)鏈上的各業(yè)態(tài)產(chǎn)業(yè)聯(lián)系緊密,相互影響,每一個(gè)鏈條業(yè)態(tài)的發(fā)展出現(xiàn)問題都直接影響后續(xù)各業(yè)態(tài)的發(fā)展及整個(gè)產(chǎn)業(yè)的發(fā)展。鏈?zhǔn)桨l(fā)展思維要求語言數(shù)據(jù)產(chǎn)業(yè)監(jiān)管部門要抓好產(chǎn)業(yè)發(fā)展的全局指導(dǎo)與安排,產(chǎn)業(yè)鏈上的各業(yè)態(tài)行業(yè)從業(yè)者要融入語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展的大框架,做好鏈條上的鏈接環(huán),守好一段渠,種好責(zé)任田。
5.借鑒國際先進(jìn)經(jīng)驗(yàn)。數(shù)字經(jīng)濟(jì)較發(fā)達(dá)的國家相比,我國的數(shù)字經(jīng)濟(jì)發(fā)展無論在數(shù)字基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)安全保護(hù)還是數(shù)字貿(mào)易的規(guī)則制定等方面都還存在較大差距。語言數(shù)據(jù)產(chǎn)業(yè)是數(shù)字經(jīng)濟(jì)時(shí)代的一個(gè)重要產(chǎn)業(yè)模式。我們要在數(shù)據(jù)保護(hù)分級(jí)分類精細(xì)化管理、數(shù)據(jù)市場(chǎng)一體化建設(shè)、個(gè)人隱私數(shù)據(jù)保護(hù)的立法、相關(guān)人才培養(yǎng)管理模式等方面借鑒國際先進(jìn)經(jīng)驗(yàn),揚(yáng)長避短,促進(jìn)我國語言數(shù)據(jù)產(chǎn)業(yè)快速發(fā)展。
參考文獻(xiàn):
[1]李宇明.數(shù)據(jù)時(shí)代與語言產(chǎn)業(yè)[J].山東師范大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2020,65(05):87-98.
[2]張衛(wèi)國.作為人力資本、公共產(chǎn)品和制度的語言:語言經(jīng)濟(jì)學(xué)的一個(gè)基本分析框架[J].經(jīng)濟(jì)研究,2008(2):144-154.
[3]Pendakur, K., & Pendakur, R. (2002). Language as both human capital and ethnicity. International Migration Review, 36(1), 147-177.
[4]Huu, N., Larimo, J., & Ali, T. (2016). How do ownership control position and national culture influence conflict resolution strategies in international joint ventures. International Business Review, 25(2), 559-568.
[5]陳鵬.語言產(chǎn)業(yè)的基本概念及要素分析[J].語言文字應(yīng)用,2012(03):16-24.
[6]李宇明.語言也是“硬實(shí)力”[J].華中師范大學(xué)學(xué)報(bào):人文社會(huì)科學(xué)版,2011,50(05):68-72.
[7]黃少安,蘇劍,張衛(wèi)國.語言產(chǎn)業(yè)的涵義與我國語言產(chǎn)業(yè)發(fā)展戰(zhàn)略[J].經(jīng)濟(jì)縱橫,2012(05):24-28.
[8]賀宏志.發(fā)展語言產(chǎn)業(yè),創(chuàng)造語言紅利——語言產(chǎn)業(yè)研究與實(shí)踐綜述[J].語言文字應(yīng)用,2012(03):9-15.
[9]何宏志,陳鵬.語言產(chǎn)業(yè)導(dǎo)論[M].北京:語文出版社,2013:162-167.
[10]姜國權(quán).發(fā)展數(shù)字時(shí)代的語言產(chǎn)業(yè)[N]. 中國社會(huì)科學(xué)報(bào),2021-09-14(003).
[11]張新春,花旭.數(shù)字經(jīng)濟(jì):增長邏輯與技術(shù)機(jī)理[J].改革與戰(zhàn)略,2021,37(04):75-84.
[12]彭婷.人工智能中語言問題的哲學(xué)審視——以馬克思恩格斯語言觀為視角[J].世界哲學(xué),2020(02):17-26.
[13]李宇明.中國語言資源的理念與實(shí)踐[J].語言戰(zhàn)略研究,2019,4(03):16-28.
[14]李琳.區(qū)域經(jīng)濟(jì)發(fā)展與語言能力建設(shè)[J].吉首大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2020,41(03):104-111.
[15]曾毅平.語言環(huán)境也是一種投資環(huán)境[J].暨南學(xué)報(bào):哲學(xué)社會(huì)科學(xué),1998(01):109-116.
[16]方芮.文化距離、語言距離與外商對(duì)華直接投資[D].山東大學(xué),2020.
[17]劉昌華.數(shù)字經(jīng)濟(jì):網(wǎng)絡(luò)空間的語言產(chǎn)業(yè)[J].黃河科技學(xué)院學(xué)報(bào),2021,23(06):72-80.
[18]于曉,葉申南.歐日韓數(shù)字經(jīng)濟(jì)政策、發(fā)展趨勢(shì)及中國策略[J].財(cái)政科學(xué),2021(06):135-141.
Abstract: As a type of resource, language bears an important attribute of economy, which promotes the development of language industry. In the era of digital economy, language functions as the main form and an important part of the production factor of data, bearing the nature of panproduction factors. With the tendency of language data, there comes a new development model of language industry—language data industry. Due to its early stage of development, the language data industry meets with some growth barriers.
For the sake of the healthy and stable development of the language data industry, some effective measures need taking to tackle the thorny problems, including strengthening the academic research, increasing the managerial support, stressing the legislation of property rights, advocating the chainmodel thinking of development, drawing on the advanced foreign experience, and so on.
Keywords:digital economy; production factor; language industry; language data industry
(責(zé)任編輯:范松楠)