国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“語(yǔ)言數(shù)據(jù)與數(shù)字經(jīng)濟(jì)”多人談

2022-07-15 01:29黃少安汪張龍宋暉高寧姜國(guó)權(quán)饒高琦陳振鐸
語(yǔ)言戰(zhàn)略研究 2022年4期
關(guān)鍵詞:古籍數(shù)字化數(shù)字

黃少安 汪張龍 宋暉 高寧 姜國(guó)權(quán) 饒高琦 陳振鐸

“數(shù)字化”技術(shù)將大幅度提升“語(yǔ)言數(shù)據(jù)”的經(jīng)濟(jì)價(jià)值

黃少安(山東大學(xué)經(jīng)濟(jì)研究院) 數(shù)字化經(jīng)濟(jì)已經(jīng)成為熱議話題,但是一些基本概念卻還沒(méi)有完全厘清?,F(xiàn)在說(shuō)“數(shù)據(jù)”是一種新的生產(chǎn)要素,這個(gè)“數(shù)據(jù)”不是抽象的“數(shù)字”,而是針對(duì)特定對(duì)象的、經(jīng)過(guò)數(shù)字化處理的各種信息,其中既有數(shù)字信息,也有非數(shù)字信息。抽象的“數(shù)字”本身不可能成為生產(chǎn)要素。2019年11月發(fā)布的《中共中央關(guān)于堅(jiān)持和完善中國(guó)特色社會(huì)主義制度 推進(jìn)國(guó)家治理體系和治理能力現(xiàn)代化若干重大問(wèn)題的決定》中,“數(shù)據(jù)”第一次被官方文件納入生產(chǎn)要素并參與分配。2020年4月9日新華社正式刊發(fā)的中共中央、國(guó)務(wù)院《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》,提出“加快培育數(shù)據(jù)要素市場(chǎng)”,也是使用“數(shù)據(jù)要素”。官方文件的表述是精準(zhǔn)的。但是仍然有很多文獻(xiàn)使用得不準(zhǔn)確。“數(shù)字經(jīng)濟(jì)”的準(zhǔn)確說(shuō)法應(yīng)該是“數(shù)字化經(jīng)濟(jì)”,屬于“信息經(jīng)濟(jì)”時(shí)代的新階段,因?yàn)樗^“數(shù)字化技術(shù)”無(wú)非是信息技術(shù)的進(jìn)一步發(fā)展,主要標(biāo)志是互聯(lián)網(wǎng)的計(jì)算機(jī)技術(shù)、航天技術(shù)(通信衛(wèi)星)和智能化技術(shù)。由于有了這些技術(shù),人類(lèi)對(duì)各種形態(tài)和性質(zhì)的信息都能及時(shí)地海量地采集、處理、儲(chǔ)存、傳輸、分析和運(yùn)用,從而才有了所謂的“大數(shù)據(jù)”。一方面,采集、處理、儲(chǔ)存和分析各種數(shù)據(jù)的數(shù)字化技術(shù)本身會(huì)催生許多公司和非公司性機(jī)構(gòu),形成數(shù)字技術(shù)產(chǎn)業(yè)化;另一方面,數(shù)字化技術(shù)和各種數(shù)據(jù)又會(huì)被其他產(chǎn)業(yè)廣泛運(yùn)用,從而改造其他產(chǎn)業(yè),即所謂的“產(chǎn)業(yè)數(shù)字化”。

數(shù)字化技術(shù)使得“語(yǔ)言大數(shù)據(jù)”成為可能,而且應(yīng)用價(jià)值大幅提高。語(yǔ)言與蓬勃興起的數(shù)字化技術(shù)密切相關(guān),確切地說(shuō),數(shù)字化技術(shù)在語(yǔ)言信息領(lǐng)域大有用途。過(guò)去對(duì)語(yǔ)言信息的采集、處理、儲(chǔ)存等,是十分困難而且難以準(zhǔn)確的,用途也局限于一定領(lǐng)域。數(shù)字化技術(shù)普及后,許多工作變得可能和簡(jiǎn)單,例如,可以建立多媒體、全語(yǔ)種、多維度的語(yǔ)言數(shù)據(jù)庫(kù),語(yǔ)言的相關(guān)信息也可以形成大數(shù)據(jù)。關(guān)鍵是用途大大擴(kuò)展,例如,利用語(yǔ)言大數(shù)據(jù),分析語(yǔ)言對(duì)經(jīng)濟(jì)增長(zhǎng)的影響變得可能,語(yǔ)言扶貧(提高相應(yīng)群體的語(yǔ)言人力資本)變得可操作,民族語(yǔ)言的經(jīng)濟(jì)價(jià)值及其開(kāi)發(fā)也變得可評(píng)估和可操作,語(yǔ)言資源的保護(hù)和利用也變得相對(duì)精準(zhǔn)并能進(jìn)行效用評(píng)估,語(yǔ)言產(chǎn)業(yè)蓬勃發(fā)展也將成為可能。

能否充分利用數(shù)字化技術(shù)形成語(yǔ)言大數(shù)據(jù)并進(jìn)而同樣充分加以利用,關(guān)鍵問(wèn)題之一是能否合理配置語(yǔ)言數(shù)據(jù)的產(chǎn)權(quán)。語(yǔ)言數(shù)據(jù)資源和數(shù)據(jù)產(chǎn)品的產(chǎn)權(quán)界定和保護(hù),必須遵循效率與公平統(tǒng)一、以效率為主的總原則。具體原則是:第一,在數(shù)據(jù)分類(lèi)基礎(chǔ)上分類(lèi)界定產(chǎn)權(quán),界定為私有、公有還是混合所有,不同類(lèi)型的數(shù)據(jù)可能不同;第二,區(qū)分?jǐn)?shù)據(jù)資源和數(shù)據(jù)產(chǎn)品,二者的產(chǎn)權(quán)界定應(yīng)該不同或有不同的界定原則;第三,必須在產(chǎn)權(quán)保護(hù)(包括隱私保護(hù))與數(shù)據(jù)高效利用之間尋求平衡。

智能技術(shù)助力語(yǔ)言培訓(xùn)測(cè)試行業(yè)數(shù)字化轉(zhuǎn)型

汪張龍(科大訊飛股份有限公司) 受制于技術(shù)限制,傳統(tǒng)語(yǔ)言教學(xué)與評(píng)測(cè)對(duì)人工特別是專家依賴度較高,難以實(shí)現(xiàn)精準(zhǔn)化語(yǔ)言教學(xué)、個(gè)性化語(yǔ)言學(xué)習(xí)以及大規(guī)模語(yǔ)言水平評(píng)測(cè)。隨著人工智能技術(shù)的不斷發(fā)展和完善,語(yǔ)言數(shù)據(jù)對(duì)行業(yè)變革的影響也在逐漸加深,特別是在語(yǔ)言教育行業(yè)方面。

智能語(yǔ)音技術(shù)發(fā)展離不開(kāi)語(yǔ)言數(shù)據(jù)。得益于語(yǔ)言大數(shù)據(jù)的獲取和累積、高性能計(jì)算能力的提升、深度學(xué)習(xí)算法的突破,以智能語(yǔ)音、自然語(yǔ)言理解等技術(shù)為代表的第三次人工智能浪潮興起。海量采集的語(yǔ)音數(shù)據(jù),經(jīng)過(guò)人工專家標(biāo)注,基于深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,幫助智能語(yǔ)音技術(shù)真正走入到實(shí)用階段。如語(yǔ)音合成技術(shù)可以將任意的文字信息轉(zhuǎn)化為自然流程的語(yǔ)音,機(jī)器合成效果接近真人發(fā)音水平;語(yǔ)音識(shí)別技術(shù)可以將語(yǔ)音中的內(nèi)容、說(shuō)話人、語(yǔ)種等信息識(shí)別出來(lái),目前識(shí)別準(zhǔn)確率達(dá)到95%以上;口語(yǔ)評(píng)測(cè)技術(shù)可以對(duì)說(shuō)話人的語(yǔ)音標(biāo)準(zhǔn)程度進(jìn)行自動(dòng)評(píng)測(cè)并給出科學(xué)反饋指導(dǎo),中英文口語(yǔ)評(píng)測(cè)接近高水平專家的評(píng)分效果;機(jī)器翻譯可以實(shí)現(xiàn)多語(yǔ)種互譯,實(shí)現(xiàn)跨語(yǔ)言的自主學(xué)習(xí)。

智能語(yǔ)音技術(shù)促進(jìn)了語(yǔ)言培訓(xùn)測(cè)試行業(yè)的發(fā)展。在相關(guān)測(cè)試中,如國(guó)家普通話水平測(cè)試、中高考英語(yǔ)口語(yǔ)考試等,智能語(yǔ)音技術(shù)已得到廣泛應(yīng)用,有效地保障了評(píng)分效果、提升了測(cè)試效率、降低了測(cè)試的組織難度,每年參加智能測(cè)試的考生超過(guò)1600萬(wàn)。在語(yǔ)言培訓(xùn)方面,基于全過(guò)程的語(yǔ)言數(shù)據(jù)采集,可實(shí)現(xiàn)動(dòng)態(tài)學(xué)習(xí)評(píng)價(jià),教師可精準(zhǔn)把握學(xué)生學(xué)情,精準(zhǔn)教學(xué),實(shí)現(xiàn)“因材施教”。智能學(xué)習(xí)技術(shù)能夠?yàn)閷W(xué)生定制個(gè)性化語(yǔ)言學(xué)習(xí)方案,基于智能技術(shù)打造的語(yǔ)言教師,可以實(shí)時(shí)反饋學(xué)生的語(yǔ)言評(píng)測(cè)結(jié)果,幫助學(xué)生提升學(xué)習(xí)興趣和效率。如新疆和田皮山縣面向幼兒園、中小學(xué)、教師、農(nóng)牧民等群體開(kāi)展人工智能?chē)?guó)家通用語(yǔ)言教學(xué),半年時(shí)間內(nèi)中小學(xué)生國(guó)家通用語(yǔ)言聽(tīng)說(shuō)能力人均分?jǐn)?shù)提升10%,教師普通話測(cè)試平均分提高了24%。在全球中文推廣方面,教育部指導(dǎo)建設(shè)了“全球中文學(xué)習(xí)平臺(tái)”,平臺(tái)面向海內(nèi)外中文學(xué)習(xí)者,提供個(gè)性化的學(xué)習(xí)資源和工具,學(xué)習(xí)者可以通過(guò)語(yǔ)音或文本輸入其母語(yǔ)內(nèi)容,實(shí)時(shí)翻譯出中文并自動(dòng)分句。平臺(tái)目前已覆蓋了182個(gè)國(guó)家,用戶超過(guò)618萬(wàn)。

語(yǔ)言數(shù)據(jù)作為數(shù)字經(jīng)濟(jì)的生產(chǎn)要素,將會(huì)不斷促進(jìn)包括人工智能在內(nèi)的新一代信息技術(shù)的發(fā)展,這些新技術(shù)在語(yǔ)言培訓(xùn)測(cè)試領(lǐng)域的成熟應(yīng)用,將不斷變革原有行業(yè)形態(tài),幫助行業(yè)完成數(shù)字化轉(zhuǎn)型,促進(jìn)相關(guān)產(chǎn)業(yè)成為數(shù)字經(jīng)濟(jì)的一方支柱。

語(yǔ)言數(shù)據(jù)的優(yōu)化與自媒體傳播效率的提升

宋 暉、高 寧(1.北京第二外國(guó)語(yǔ)學(xué)院文化與傳播學(xué)院/國(guó)家語(yǔ)言規(guī)劃與治理研究中心;2.浙江大學(xué)國(guó)際教育學(xué)院) 閱讀量是自媒體的生命線。在大數(shù)據(jù)語(yǔ)境下,利用數(shù)據(jù)指導(dǎo)自媒體運(yùn)營(yíng),可以有效提高閱讀量。當(dāng)下自媒體平臺(tái)形式多樣,如微信公眾號(hào)、微博、B站、小紅書(shū)、抖音和快手等,我們以微信公眾號(hào)為代表做了考察。

運(yùn)營(yíng)者需要參照的數(shù)據(jù)分為運(yùn)營(yíng)數(shù)據(jù)和語(yǔ)言數(shù)據(jù)。運(yùn)營(yíng)數(shù)據(jù)是平臺(tái)自帶的數(shù)據(jù)即平臺(tái)內(nèi)部的監(jiān)測(cè)數(shù)據(jù),和第三方提供的數(shù)據(jù)即平臺(tái)外部的評(píng)價(jià)數(shù)據(jù)。語(yǔ)言數(shù)據(jù)則是運(yùn)營(yíng)者根據(jù)內(nèi)容生產(chǎn)需要抓取的數(shù)據(jù)。運(yùn)營(yíng)數(shù)據(jù)為我們?cè)诩夹g(shù)上運(yùn)營(yíng)公眾號(hào)提供了數(shù)據(jù)支撐。但如何獲取更多的閱讀總量則主要依靠語(yǔ)言數(shù)據(jù)來(lái)指導(dǎo)實(shí)踐。語(yǔ)言數(shù)據(jù)的抓取和分析是為內(nèi)容服務(wù)的,在內(nèi)容選擇受限的情況下,語(yǔ)言數(shù)據(jù)的應(yīng)用主要表現(xiàn)在標(biāo)題的設(shè)置上。一直以來(lái),“標(biāo)題黨”備受詬病,我們也認(rèn)為運(yùn)營(yíng)者必須具有底線意識(shí),不能為了博人眼球一味夸大甚至虛構(gòu)標(biāo)題,堅(jiān)決抵制“假大空”標(biāo)題。但同時(shí)我們應(yīng)積極地從學(xué)理角度發(fā)現(xiàn)和總結(jié)自媒體標(biāo)題的語(yǔ)言規(guī)律。筆者曾經(jīng)就公眾號(hào)標(biāo)題做過(guò)數(shù)據(jù)分析,發(fā)現(xiàn)標(biāo)題的語(yǔ)言類(lèi)型顯著影響公眾號(hào)的打開(kāi)率。

第一,數(shù)字類(lèi)標(biāo)題打開(kāi)率更高。我們?cè)鴮?duì)新榜某類(lèi)公眾號(hào)閱讀量10萬(wàn)+的文章進(jìn)行過(guò)統(tǒng)計(jì),其中標(biāo)題含有數(shù)字的文章超過(guò)70%。

第二,懸疑性標(biāo)題打開(kāi)率更高。我們對(duì)某公眾號(hào)2020年11月推送的數(shù)據(jù)高點(diǎn)連線后發(fā)現(xiàn),60%的題目包含疑問(wèn)句,如“這些熱詞,你知道幾個(gè)?”“為什么中國(guó)人要講方言?這是我聽(tīng)過(guò)最好的答案!”“北方人天天掛嘴邊卻不會(huì)寫(xiě)的26個(gè)字,你認(rèn)識(shí)幾個(gè)?”等。

第三,評(píng)價(jià)性標(biāo)題和高識(shí)別度標(biāo)題打開(kāi)率更高。運(yùn)營(yíng)者常把個(gè)人情感、判斷嵌入標(biāo)題中,構(gòu)成評(píng)價(jià)性標(biāo)題,如“意外”“淚奔”“瘋掉”“抓狂”“驚呆”等。識(shí)別度高的標(biāo)題指包含受眾熟知的、影響力大的關(guān)鍵詞的標(biāo)題。我們做過(guò)一個(gè)簡(jiǎn)單的測(cè)試,將同樣內(nèi)容的文章通過(guò)體量相當(dāng)?shù)膬蓚€(gè)公號(hào)推送,使用評(píng)價(jià)性標(biāo)題和高識(shí)別度標(biāo)題,其打開(kāi)率遠(yuǎn)遠(yuǎn)高于那些不用的。

當(dāng)然,語(yǔ)言數(shù)據(jù)的功用,還可以通過(guò)分析標(biāo)題音節(jié)的數(shù)量、句式句型特點(diǎn)發(fā)現(xiàn)標(biāo)題制作的一些規(guī)律;在不考慮時(shí)效性的情況下,可以通過(guò)競(jìng)品分析,獲取同一選題不同維度的內(nèi)容等。

語(yǔ)言數(shù)據(jù)與運(yùn)營(yíng)數(shù)據(jù)是一種互為參照的關(guān)系,語(yǔ)言數(shù)據(jù)主要是負(fù)責(zé)內(nèi)容制作提供服務(wù),只有堅(jiān)守內(nèi)容底線,運(yùn)營(yíng)數(shù)據(jù)才能曲線“優(yōu)美”;同時(shí),運(yùn)營(yíng)數(shù)據(jù)的“美丑”又會(huì)倒逼運(yùn)營(yíng)者深挖語(yǔ)言數(shù)據(jù)。兩者不存在此消彼長(zhǎng),只有互嵌式的融合才能有力助推自媒體實(shí)踐。

2020年度國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“網(wǎng)絡(luò)空間社會(huì)治理語(yǔ)言問(wèn)題研究”

語(yǔ)言數(shù)據(jù)助力數(shù)字絲綢之路建設(shè)

姜國(guó)權(quán)(首都師范大學(xué)國(guó)際文化學(xué)院) 習(xí)近平總書(shū)記指出:“要堅(jiān)持創(chuàng)新驅(qū)動(dòng)發(fā)展,加強(qiáng)在數(shù)字經(jīng)濟(jì)、人工智能、納米技術(shù)、量子計(jì)算機(jī)等前沿領(lǐng)域合作,推動(dòng)大數(shù)據(jù)、云計(jì)算、智慧城市建設(shè),連接成21世紀(jì)的數(shù)字絲綢之路?!闭Z(yǔ)言數(shù)據(jù)是在人類(lèi)運(yùn)用語(yǔ)言文字交流思想的社會(huì)活動(dòng)中形成的,用以進(jìn)行統(tǒng)計(jì)、計(jì)算、研究、設(shè)計(jì)、分析、推理、決策等活動(dòng)的語(yǔ)言文字?jǐn)?shù)據(jù),具有全球性、多樣性、基礎(chǔ)性、系統(tǒng)性、動(dòng)態(tài)性等特征,連接著絲綢之路的歷史、現(xiàn)在和未來(lái)。高效順暢的語(yǔ)言數(shù)據(jù)交流和轉(zhuǎn)換應(yīng)用可以為21世紀(jì)數(shù)字絲綢之路建設(shè)掃除語(yǔ)言障礙,是21世紀(jì)數(shù)字絲綢之路建設(shè)的關(guān)鍵要素和核心基石。

語(yǔ)言數(shù)據(jù)與共建“一帶一路”時(shí)空相伴、同向同行,不僅承載和體現(xiàn)著共建各方的現(xiàn)實(shí)需求,蘊(yùn)含和表達(dá)著共建各方的發(fā)展愿望,描述和記錄著“一帶一路”建設(shè)進(jìn)程,融入并呈現(xiàn)著共建“一帶一路”成果,而且業(yè)已成為鞏固互聯(lián)互通合作基礎(chǔ)、拓展國(guó)際合作新空間、促進(jìn)共建國(guó)家民心相通的重要支撐。

“一帶一路”倡議提出以來(lái),語(yǔ)言數(shù)據(jù)的研究應(yīng)用在服務(wù)“一帶一路”倡議方面的成效不斷顯現(xiàn)。百度翻譯、騰訊翻譯君、科大訊飛文檔翻譯等一批基于人工智能、移動(dòng)互聯(lián)網(wǎng)等前沿科技的數(shù)字化翻譯平臺(tái),通過(guò)語(yǔ)言數(shù)據(jù)識(shí)別、轉(zhuǎn)換等信息處理,支持中文和俄語(yǔ)、阿拉伯語(yǔ)等多個(gè)“一帶一路”沿線國(guó)家語(yǔ)種之間的實(shí)時(shí)互譯,為服務(wù)“一帶一路”經(jīng)濟(jì)文化交流提供了重要支持。

面向未來(lái),以語(yǔ)言數(shù)據(jù)助力21世紀(jì)數(shù)字絲綢之路建設(shè)可以從以下幾個(gè)方面著眼:(1)統(tǒng)籌推進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展和數(shù)字社會(huì)語(yǔ)言生態(tài)體系構(gòu)建,加快“一帶一路”語(yǔ)言數(shù)據(jù)服務(wù)體系建設(shè);(2)強(qiáng)化“一帶一路”語(yǔ)言數(shù)據(jù)資源共建共享,探索語(yǔ)言數(shù)據(jù)跨境安全有序流動(dòng)的策略機(jī)制;(3)支持“一帶一路”語(yǔ)言數(shù)據(jù)資源開(kāi)發(fā)和應(yīng)用,創(chuàng)新語(yǔ)言數(shù)據(jù)應(yīng)用模式和應(yīng)用場(chǎng)景,推進(jìn)語(yǔ)言數(shù)據(jù)標(biāo)準(zhǔn)化、規(guī)范化、便利化;(4)完善語(yǔ)言數(shù)據(jù)風(fēng)險(xiǎn)防控機(jī)制,強(qiáng)化語(yǔ)言數(shù)據(jù)安全保障和風(fēng)險(xiǎn)預(yù)警;(5)加強(qiáng)“一帶一路”語(yǔ)言數(shù)據(jù)相關(guān)學(xué)科建設(shè)和專業(yè)人才培養(yǎng)。

隨著語(yǔ)言數(shù)據(jù)理論研究和實(shí)踐應(yīng)用的不斷發(fā)展,以及21世紀(jì)數(shù)字絲綢之路的數(shù)字基礎(chǔ)設(shè)施建設(shè)、產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型、社會(huì)信息化發(fā)展、民眾數(shù)字素養(yǎng)提升,語(yǔ)言數(shù)據(jù)將匯聚鋪就21世紀(jì)語(yǔ)言數(shù)據(jù)絲綢之路,并在深化各方互信、促進(jìn)理念認(rèn)同、推進(jìn)合作行動(dòng)、形成務(wù)實(shí)成果等方面發(fā)揮更大作用,為創(chuàng)新推動(dòng)數(shù)字絲綢之路建設(shè)做出新的貢獻(xiàn)。

挖掘古籍語(yǔ)言資源,助力文化強(qiáng)國(guó)建設(shè)

饒高琦(北京語(yǔ)言大學(xué)漢語(yǔ)國(guó)際教育研究院) 中國(guó)是世界上古籍典藏最豐富的國(guó)家,據(jù)統(tǒng)計(jì)現(xiàn)存古籍20余萬(wàn)種,其時(shí)間跨度、涉及領(lǐng)域和保存質(zhì)量在全球皆無(wú)出其右。在現(xiàn)代傳媒出現(xiàn)以前,歷史、知識(shí)和傳統(tǒng)文化大部分以文字形式保存在古籍當(dāng)中。作為文化大國(guó)的重要標(biāo)志,古籍承載民族公共記憶,并潛移默化地塑造了我們的歷史認(rèn)同和文化認(rèn)同。就此而言,古籍是十分重要的語(yǔ)言數(shù)據(jù)資源,對(duì)古籍語(yǔ)言數(shù)據(jù)的開(kāi)發(fā)對(duì)文化強(qiáng)國(guó)建設(shè)有巨大助力。我們要重視古籍的語(yǔ)言資源價(jià)值,并為此加強(qiáng)古籍智能化技術(shù)、數(shù)據(jù)、平臺(tái)的建設(shè)工作。

古籍的作用本質(zhì)上是古籍中語(yǔ)言數(shù)據(jù)的作用?;谝褦?shù)字化的古籍材料,眾多智慧應(yīng)用如雨后春筍般快速涌現(xiàn)。如在歷史研究領(lǐng)域廣被使用的中國(guó)歷代人物傳記資料庫(kù),支持了登科時(shí)空分布、文學(xué)家旅行圖景、儒學(xué)思想交流網(wǎng)絡(luò)繪制等成果。上海圖書(shū)館基于家譜這一特殊類(lèi)型古籍,開(kāi)發(fā)了中國(guó)家譜知識(shí)服務(wù)平臺(tái),并構(gòu)建了宗族源流、可視化遷徙、族訓(xùn)、家訓(xùn)變遷、傳承查詢等服務(wù)。這些成果和產(chǎn)品兼具科研和科普價(jià)值,社會(huì)效益和經(jīng)濟(jì)效益俱佳。這些可以說(shuō)都是古籍蘊(yùn)含的語(yǔ)言數(shù)據(jù)開(kāi)發(fā)利用所獲得的紅利。

然而若要持續(xù)受益,我們必須持續(xù)加強(qiáng)古籍整理及其數(shù)字化工作。新中國(guó)成立70余年來(lái),共整理古籍38?000余種,但較之傳世古籍20余萬(wàn)種,仍有巨大差距。差距同樣也是機(jī)遇。文字識(shí)別、自動(dòng)句讀、智能分析等智能技術(shù)被紛紛應(yīng)用于古籍整理。2022年“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開(kāi)放實(shí)驗(yàn)室”研發(fā)古籍?dāng)?shù)字化平臺(tái),利用智能技術(shù)加速古籍資源建設(shè),預(yù)計(jì)3年就可以完成10?000種精選古籍的修復(fù)整理。以中華書(shū)局、上海古籍出版社和商務(wù)印書(shū)館等為代表的專業(yè)出版機(jī)構(gòu)也紛紛投巨資組建專門(mén)團(tuán)隊(duì),打造古籍?dāng)?shù)字化出版、加工平臺(tái)。

然而,我們也應(yīng)該清醒地看到,熱潮之下學(xué)界和業(yè)界對(duì)古籍語(yǔ)言資源的開(kāi)發(fā)利用尚在起步階段。正如其他成熟領(lǐng)域中語(yǔ)言資源的開(kāi)發(fā)進(jìn)程,古籍語(yǔ)言資源開(kāi)發(fā)也需要建設(shè)大規(guī)模數(shù)據(jù)基礎(chǔ)設(shè)施、廣泛開(kāi)展技術(shù)評(píng)測(cè)活動(dòng)、建立健全規(guī)范標(biāo)準(zhǔn)保障。在數(shù)據(jù)上,應(yīng)探索建立公益目的、開(kāi)放獲取、版權(quán)可控、受益共享的古籍?dāng)?shù)據(jù)平臺(tái)和系列開(kāi)源工具集合。相關(guān)學(xué)術(shù)組織應(yīng)積極規(guī)劃、聯(lián)合舉行具有公信力的智能處理技術(shù)評(píng)測(cè)。語(yǔ)言文字管理部門(mén)應(yīng)當(dāng)會(huì)同文化、宣傳部門(mén)組織研制面向歷史語(yǔ)言文字資源的語(yǔ)言規(guī)范、交換標(biāo)準(zhǔn)和技術(shù)標(biāo)注,形成規(guī)范標(biāo)準(zhǔn)體系,引領(lǐng)學(xué)術(shù)、技術(shù)和產(chǎn)業(yè)發(fā)展。

總之,古籍是重要的語(yǔ)言文字?jǐn)?shù)據(jù)載體。將古籍送入數(shù)字時(shí)代,并使其更好地發(fā)揮公共記憶、歷史鏡鑒和文明圖騰的價(jià)值,是數(shù)字轉(zhuǎn)型、智能轉(zhuǎn)型中學(xué)術(shù)界和產(chǎn)業(yè)界應(yīng)承擔(dān)時(shí)代使命。

教育部人文社科基金“清末以來(lái)漢語(yǔ)報(bào)刊詞匯使用計(jì)量研究”(20YJC740050)

信息社會(huì)與人文社會(huì)科學(xué)知識(shí)生產(chǎn)

陳振鐸(杭州師范大學(xué)錢(qián)江學(xué)院) 從2002年《布達(dá)佩斯開(kāi)放獲取倡議》開(kāi)始,在麻省理工學(xué)院誕生的開(kāi)放式獲取技術(shù)逐漸成為國(guó)際普遍采用的科學(xué)基礎(chǔ)設(shè)施基本技術(shù)標(biāo)準(zhǔn),加上互聯(lián)網(wǎng)技術(shù)本身的革新?lián)Q代,形成一種信息社會(huì)的趨勢(shì):在AI翻譯、語(yǔ)音-文字轉(zhuǎn)換技術(shù)以及互聯(lián)網(wǎng)神經(jīng)大數(shù)據(jù)等技術(shù)加持下,各種傳統(tǒng)語(yǔ)言在知識(shí)傳播上的差異逐漸消除,各種語(yǔ)種和學(xué)科知識(shí),包括各種歷史檔案文獻(xiàn)、學(xué)術(shù)活動(dòng)信息,都得以流通使用,在巨型數(shù)字平臺(tái)中表現(xiàn)和“實(shí)”現(xiàn)。諸如生產(chǎn)、傳播和教育等本來(lái)分離的部分,能通過(guò)屏幕上的同一個(gè)平臺(tái)內(nèi)實(shí)現(xiàn),傳統(tǒng)的物理介質(zhì)和空間載體不再占主導(dǎo),甚至連生產(chǎn)的“后臺(tái)”過(guò)程也聚合到平臺(tái)中成為知識(shí)本身的一部分,所有流程變?yōu)橐惑w的數(shù)字信息。

這種局面是現(xiàn)代大學(xué)和傳統(tǒng)出版誕生以來(lái)從未有過(guò)的局面,倒逼各種傳統(tǒng)力量加速轉(zhuǎn)型,出現(xiàn)幾條匯流:第一,傳統(tǒng)的全球商業(yè)型學(xué)術(shù)出版商布局?jǐn)?shù)字出版,加速將原來(lái)的館配發(fā)行轉(zhuǎn)向開(kāi)放式獲取,并生成了不同的收費(fèi)和盈利模式;第二,歐盟中法、德等國(guó)介入保護(hù)公共資金的科研成果,并提出建設(shè)自己的公立開(kāi)放科學(xué)基礎(chǔ)設(shè)施;第三,社會(huì)化和中小型商業(yè)化知識(shí)生產(chǎn),抓住新技術(shù)賴以產(chǎn)生的創(chuàng)業(yè)群體、保持獨(dú)立或爭(zhēng)取新市場(chǎng)的學(xué)者以及傳統(tǒng)平臺(tái)轉(zhuǎn)型,形成了分眾的社會(huì)化平臺(tái)。無(wú)論大型出版商還是國(guó)家的科研基礎(chǔ)設(shè)施,或是各群體自建的平臺(tái),都走向開(kāi)放獲取或開(kāi)放科學(xué),出現(xiàn)雅克·埃呂爾所描述的“技術(shù)綜合體”形態(tài),在3個(gè)層面逐漸統(tǒng)合為一體:“聽(tīng)、說(shuō)、讀、寫(xiě)”統(tǒng)合;傳統(tǒng)的語(yǔ)種、學(xué)術(shù)語(yǔ)言和技術(shù)語(yǔ)言統(tǒng)合;口語(yǔ)、書(shū)寫(xiě)和視覺(jué)語(yǔ)言統(tǒng)合。從社會(huì)學(xué)的角度,可以把它定義為一種基于話語(yǔ)表達(dá)權(quán)力的“語(yǔ)言技術(shù)綜合體”。

這也形成兩個(gè)基本趨勢(shì):傳統(tǒng)私立大型出版商逐漸成長(zhǎng)為一種巨型綜合體,控制公立學(xué)術(shù)生產(chǎn)的各方面,公共資金資助的科研成果變成巨型綜合體的抽象產(chǎn)權(quán);英語(yǔ)和信息技術(shù)發(fā)達(dá)的美國(guó)成為世界各種語(yǔ)言和科研的中心樞紐。這種全方位的巨型綜合體在機(jī)制上是為私利還是為公益;是閉合還是開(kāi)放;是讓技術(shù)服務(wù)資本或技術(shù)本身,從而異化人,還是作為工具服務(wù)人,促進(jìn)知識(shí)的傳播與進(jìn)步:這是信息社會(huì)時(shí)代人文社會(huì)科學(xué)知識(shí)生產(chǎn)的主要挑戰(zhàn)。

國(guó)家層面建設(shè)整體的開(kāi)放科學(xué)基礎(chǔ)設(shè)施,保護(hù)公共科研的公共屬性和本國(guó)語(yǔ)言的知識(shí)生產(chǎn),是個(gè)體和集體抵抗這種巨型技術(shù)綜合體的一條出路。歐盟已經(jīng)開(kāi)展實(shí)踐,以法國(guó)國(guó)家開(kāi)放文獻(xiàn)中心為例,國(guó)家投入資金、制定標(biāo)準(zhǔn)和規(guī)則,涉及知識(shí)生產(chǎn)的各主體平等參與、自主建設(shè),形成四位一體的統(tǒng)合局面:公共資金建設(shè)的高校、科研機(jī)構(gòu)的學(xué)術(shù)信息展示;公立大學(xué)和學(xué)術(shù)出版社以及小型獨(dú)立學(xué)術(shù)出版社的學(xué)術(shù)圖書(shū)出版;各種學(xué)術(shù)期刊的發(fā)布;所有參與主體實(shí)時(shí)更新的學(xué)術(shù)活動(dòng)。這是中國(guó)人文社會(huì)科學(xué)在開(kāi)放科學(xué)基礎(chǔ)設(shè)施建設(shè)方面的一種可資借鑒的方向。

責(zé)任編輯:王 飆

猜你喜歡
古籍數(shù)字化數(shù)字
推動(dòng)內(nèi)部審計(jì)工作數(shù)字化的探究
數(shù)字化起舞
西藏大批珍貴藏文古籍實(shí)現(xiàn)“云閱讀”
古籍修復(fù)師的巧手與匠心
高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
江蘇完成九成以上古籍普查
答數(shù)字
數(shù)字看G20
成雙成對(duì)
阳信县| 长汀县| 定西市| 清徐县| 鸡泽县| 永德县| 尤溪县| 阿尔山市| 石林| 潜山县| 旺苍县| 冷水江市| 锡林郭勒盟| 民乐县| 常州市| 桂平市| 西林县| 白玉县| 洛川县| 北票市| 嘉义市| 略阳县| 大邑县| 舞阳县| 陆良县| 崇仁县| 赤峰市| 民勤县| 福州市| 蓝田县| 教育| 惠东县| 酒泉市| 永嘉县| 汨罗市| 太保市| 上杭县| 溆浦县| 苍南县| 苏尼特左旗| 屏山县|