景艷梅
(云南師范大學(xué) 圖書館,云南 昆明 650500)
近年來,圍繞國家“一帶一路”倡議和云南面向南亞東南亞輻射中心建設(shè)的戰(zhàn)略定位,云南充分發(fā)揮毗鄰南亞東南亞的區(qū)位優(yōu)勢和豐富多彩的民族特色,開展教育國際交流與合作。目前,云南的外國留學(xué)生達(dá)1.9萬多人,主要來自南亞東南亞國家,留學(xué)生人數(shù)在全國排在第9位[1]。隨著留學(xué)生人數(shù)的不斷增加,高校學(xué)生結(jié)構(gòu)發(fā)生了變化,圖書館服務(wù)對象也發(fā)生了結(jié)構(gòu)性改變。留學(xué)生作為高校圖書館用戶中的特色服務(wù)群體,對“以讀者為中心”為服務(wù)理念的圖書館提出了新的要求和挑戰(zhàn)。高等學(xué)校國際化的發(fā)展趨勢為高校圖書館提升國際化服務(wù)能力提供了良好契機(jī),云南高校圖書館應(yīng)結(jié)合本館的實際情況,借鑒國內(nèi)外其他圖書館成功案例和經(jīng)驗,為留學(xué)生提供優(yōu)質(zhì)、高效的服務(wù)。
高校圖書館門戶網(wǎng)站高度集成了圖書館的所有資源和服務(wù),它提供了讀者一站式服務(wù)平臺,也是向外宣傳圖書館資源和服務(wù)的展示窗口。據(jù)云南省教育廳發(fā)布的全省高等學(xué)校名單,截至2020年6月30日,云南省共有高等學(xué)校83所,其中云南大學(xué)、昆明理工大學(xué)、云南師范大學(xué)等48所高校具有招收外國留學(xué)生資質(zhì)[2]??紤]研究項目可操作性,筆者基于具有招收留學(xué)生資質(zhì)的48所高校圖書館網(wǎng)站進(jìn)行調(diào)研,研究云南省高校圖書館對留學(xué)生開展服務(wù)情況和存在的問題。結(jié)合圖書館開展的常見服務(wù),針對留學(xué)生的服務(wù)主要包括:是否開發(fā)設(shè)計外語版圖書館網(wǎng)站;在外語版網(wǎng)站下是否提供參考咨詢服務(wù);網(wǎng)站上是否有中外文對照版圖書館指南;是否開展針對留學(xué)生的專題講座和培訓(xùn)。
來華留學(xué)生一般有學(xué)歷教育和短期訪學(xué),中方學(xué)校一般都會對漢語水平有要求,中文能力至少達(dá)《國際漢語能力標(biāo)準(zhǔn)》四級(HSK4)水平,對英文授課的專業(yè)或項目對英語水平也有一定要求。對母語為非英語國家的留學(xué)生來說,英文版網(wǎng)站內(nèi)容對他們來說有一定的困難,圖書館可考慮針對學(xué)校留學(xué)生來源國設(shè)置多語版的門戶網(wǎng)站,這樣外國留學(xué)生能方便快捷的導(dǎo)覽圖書館資源和服務(wù)。通過網(wǎng)站調(diào)研發(fā)現(xiàn):①具有招收留學(xué)生資質(zhì)的48所高校圖書館,只有云南大學(xué)圖書館開發(fā)設(shè)計了外語版門戶網(wǎng)站,涉及英語、日語、泰語、越南語、緬甸語,且該網(wǎng)站目前是國內(nèi)第一個響應(yīng)式設(shè)計的多語言圖書館網(wǎng)站;②剩下的47所高校圖書館中,有35所沒有外語版圖書館門戶網(wǎng)站,4所打不開圖書館網(wǎng)站,8所查找不到圖書館網(wǎng)站,網(wǎng)站打不開或查找不到的基本上是高職高專院校圖書館;③云南大學(xué)圖書館多語言門戶網(wǎng)站揭示的內(nèi)容主要包括圖書館介紹(借閱規(guī)則、開放時間、讀者證申請說明及圖書館導(dǎo)覽圖)、圖書館發(fā)生的新聞事件、特色資源數(shù)據(jù)庫(中國西南民族研究數(shù)據(jù)庫、云南花卉數(shù)據(jù)庫、云南大學(xué)機(jī)構(gòu)知識庫及云南大學(xué)學(xué)位論文數(shù)據(jù)庫)及漢語版的圖書館宣傳片,在外語版環(huán)境下并未提供參考咨詢服務(wù)窗口,也沒有找到多語版的圖書館服務(wù)指南;④在48所高校圖書館網(wǎng)站上搜索查找,沒找到有關(guān)專門針對留學(xué)生的讀者培訓(xùn)和講座的通告和相關(guān)新聞報道。
語言障礙是影響留學(xué)生獲取圖書館資源和服務(wù)的最主要原因,即使對留學(xué)生有漢語水平能力要求,就像中國人學(xué)習(xí)英語一樣,很大程度上是被動學(xué)習(xí)和應(yīng)付考試,根本不可能像瀏覽母語那樣一目十行。通過網(wǎng)站調(diào)研結(jié)果顯示,云南省高校圖書館針對留學(xué)生服務(wù)情況不容樂觀,只有云南大學(xué)圖書館開設(shè)了多語版網(wǎng)站并且揭示的內(nèi)容層次比較淺,網(wǎng)站內(nèi)容也沒有與中文版網(wǎng)站內(nèi)容對應(yīng)及時更新,沒有設(shè)置專門針對留學(xué)生參考咨詢服務(wù)窗口,所有圖書館基本沒有開展針對留學(xué)生的讀者培訓(xùn)服務(wù),不能實現(xiàn)外語版環(huán)境下館藏目錄和數(shù)據(jù)庫檢索,加之留學(xué)生對館藏排架和檢索規(guī)則不了解,在中文版網(wǎng)站下很難找到所需的圖書。不難發(fā)現(xiàn),造成圖書館面向留學(xué)生服務(wù)缺失有兩方面原因:①留學(xué)生自身的原因,如語言能力、信息知識獲取習(xí)慣、知識水平結(jié)構(gòu)和文化差異等造成利用圖書館資源和服務(wù)存在障礙;②圖書館缺乏積極主動的資源推廣(紙本資源、數(shù)據(jù)庫資源、空間資源等)和服務(wù)推廣(讀者培訓(xùn)、參考咨詢、館際互借等)。很多圖書館已經(jīng)意識到了針對留學(xué)生服務(wù)空白的窘境,但捉襟見肘,很多中小圖書館礙于人員和經(jīng)費的不足,很難開展留學(xué)生服務(wù)。以云南師范大學(xué)圖書館為例,近3年都沒有新進(jìn)人員(除學(xué)校內(nèi)部人員調(diào)整從其他學(xué)院調(diào)入2名),全館只有一名日語老師,處理英文文獻(xiàn)的老師很多也不是英語專業(yè)的,針對部分小語種文獻(xiàn),只能臨時聘請小語種學(xué)生進(jìn)行加工。在資源建設(shè)方面,由于經(jīng)費和語言障礙,主要以英語文獻(xiàn)為主,其他語種的文獻(xiàn)很少購買。
機(jī)器翻譯,即基于人工智能技術(shù)、通過計算機(jī)終端智能設(shè)備進(jìn)行不同語言的翻譯任務(wù),越來越引起人們的廣泛重視,并且已經(jīng)開始服務(wù)于人們?nèi)粘9ぷ?、生活中的各種跨語言應(yīng)用需求。在智慧圖書館的驅(qū)動下,機(jī)器翻譯必將在圖書館界大放光彩。機(jī)器翻譯方法主要可以分為基于規(guī)則的機(jī)器翻譯方法和基于語料庫的機(jī)器翻譯方法。后者基于建模方法不同,又可以細(xì)分為基于實例的機(jī)器翻譯方法、統(tǒng)計機(jī)器翻譯方法和神經(jīng)機(jī)器翻譯方法。近年來,神經(jīng)機(jī)器翻譯技術(shù)在學(xué)界和實際商業(yè)應(yīng)用中獲得了迅速的發(fā)展,神經(jīng)機(jī)器翻譯相對于傳統(tǒng)的機(jī)器翻譯方法在翻譯質(zhì)量上獲得顯著提升,已經(jīng)在大語種上(漢語、英語、日語等)成為商用在線機(jī)器翻譯系統(tǒng)的核心技術(shù),大網(wǎng)絡(luò)科技公司在線語言翻譯系統(tǒng)已經(jīng)采用神經(jīng)機(jī)器翻譯方法,如微軟翻譯、谷歌翻譯和百度翻譯等。
圖書館每年都會將大量的經(jīng)費用來購買紙質(zhì)圖書和數(shù)據(jù)庫,也是圖書館資源建設(shè)的重要內(nèi)容和為讀者服務(wù)的重要資源保障,紙質(zhì)資源查詢通常是通過圖書管理系統(tǒng)聯(lián)網(wǎng)進(jìn)行館藏目錄查詢,根據(jù)索取號在對應(yīng)書架位置上找到目標(biāo)圖書。而云南高校圖書館目前都只能用中文進(jìn)行館藏目錄查詢,這給剛來華學(xué)習(xí)的留學(xué)生在圖書館使用上造成了極大的心理障礙,面對動輒幾百萬的館藏圖書,卻找不到想要的一本。針對以上語言檢索障礙,筆者有一個大膽的設(shè)想:留學(xué)生用母語輸入題名、作者、關(guān)鍵詞等,就會有相關(guān)圖書檢索出來,檢索結(jié)果上呈現(xiàn)圖書原語種,并且檢索出來的圖書的題名已經(jīng)翻譯為留學(xué)生母語,這樣留學(xué)生就可以快速瀏覽相關(guān)內(nèi)容圖書,挑選出最有價值的圖書來閱讀。以云南師范大學(xué)圖書館圖書管理系統(tǒng)UILAS為例,輸入“機(jī)器翻譯”檢索條件,一共檢索出25條結(jié)果,只要通過題名大概瀏覽一下,就可以確定想要借閱的圖書。同樣,如果把圖書題名翻譯為留學(xué)生母語,留學(xué)生也可一目十行快速瀏覽挑選出感興趣的圖書,決定是否需要借閱認(rèn)真研讀。
很多高校圖書館開發(fā)了數(shù)據(jù)庫導(dǎo)航系統(tǒng),大概有以下幾種查看方式:按字母順序查看(A~Z)、按學(xué)科查看(綜合、人文社科、藝術(shù)、計算機(jī)、物理、化學(xué)等)、按文獻(xiàn)類型(文摘索引與評論、學(xué)位論文、報紙、電子期刊與會議等)。數(shù)據(jù)庫導(dǎo)航涵蓋了圖書館購買和試用的所有電子資源,讀者可根據(jù)需要快速檢索所需資源。目前所有的數(shù)據(jù)庫導(dǎo)航只是把數(shù)據(jù)庫名稱按不同的規(guī)則做了歸類(包括清華大學(xué)數(shù)據(jù)庫導(dǎo)航系統(tǒng)),是否可以嘗試把數(shù)據(jù)庫名稱翻譯為相應(yīng)的語種,并注明數(shù)據(jù)庫收錄文獻(xiàn)語種,方便留學(xué)生在上百個數(shù)據(jù)庫中找到想要檢索的目標(biāo)庫,這只是筆者的拙見,望向?qū)<仪蠼讨更c。
隨著“雙一流”建設(shè)的推進(jìn)與實施,各高校圖書館也在積極探索并實踐“雙一流”建設(shè)舉措。在繼承圖書借閱、參考咨詢、圖書推薦等傳統(tǒng)服務(wù)的同時,利用新媒體技術(shù)創(chuàng)新服務(wù)方式,更好地實現(xiàn)資源和服務(wù)推薦,實現(xiàn)個性化需求服務(wù)[3,4]??梢試L試在圖書館主頁放置多語言版圖書館宣傳片,請外教或留學(xué)生參與拍攝和制作,主要宣傳圖書館館藏資源和服務(wù)內(nèi)容,讓學(xué)生理解索取號的意義,了解圖書和期刊排架規(guī)則,方便學(xué)生根據(jù)索取號找到想要借閱的圖書。還可借助學(xué)校其他科研院所研究力量,把專家學(xué)者對外語種的研究成果與圖書館資源和服務(wù)推介工作結(jié)合起來,比如昆明理工大學(xué)智能信息處理重點實驗室主任余正濤教授帶領(lǐng)的研究團(tuán)隊在漢越、漢泰、漢緬等東南亞小語種機(jī)器翻譯方面做了大量的科學(xué)研究,圖書館可以利用自有資源和機(jī)器翻譯研究專家深入合作,針對東南亞留學(xué)生開展特殊文獻(xiàn)服務(wù)[5-7]。
機(jī)器翻譯研究如何利用計算機(jī)自動地實現(xiàn)不同語言之間的相互轉(zhuǎn)換,隨著翻譯模型和技術(shù)的不斷發(fā)展,歐洲一些國家將翻譯軟件集成到數(shù)據(jù)庫檢索系統(tǒng)中,在國內(nèi)也有多家圖書館實現(xiàn)了英文環(huán)境下的館藏目錄檢索。要實現(xiàn)跨語言信息檢索,首要任務(wù)是建立雙語語料庫,構(gòu)建翻譯引擎,并建立翻譯評價機(jī)制[8,9]。
在自然語言處理研究領(lǐng)域,數(shù)據(jù)也稱語料,不同類型、用途的數(shù)據(jù)放在一起完成一項任務(wù),稱為語料庫,機(jī)器翻譯需要大量的語料來訓(xùn)練模型。語料獲取有多種渠道,一些熟知的渠道包括電子詞典、各種應(yīng)用場景積累的數(shù)據(jù)、各種側(cè)批活動及共享任務(wù)提供的數(shù)據(jù),以及一些機(jī)構(gòu)組織編輯發(fā)布的數(shù)據(jù)(例如歐盟語料庫、聯(lián)合國語料)等。語言數(shù)據(jù)聯(lián)盟和互聯(lián)網(wǎng)數(shù)據(jù)挖掘是兩個重要的數(shù)據(jù)來源。不過這些數(shù)據(jù)來源主要是針對大語種(比如漢語、英語、日語等),針對東南亞小語種這些平臺共享數(shù)據(jù)可能不太實用,不過可以利用遷移學(xué)習(xí)借鑒大語種語料收集過程中的技術(shù)和方法,同時也借鑒一些低資源小語種人工智能翻譯的方法和成果。
平行語料是機(jī)器翻譯模型訓(xùn)練的基石,平行語料的規(guī)模和質(zhì)量對機(jī)器翻譯系統(tǒng)性能至關(guān)重要,兩者是正相關(guān)效應(yīng)。目前,隨著不斷的積累,以及一些自動方法的引進(jìn),平行語料庫的來源得到擴(kuò)展,其規(guī)模已經(jīng)較大,能基本滿足要求,但它們的質(zhì)量卻并不高。多數(shù)平行語料庫包含著大量錯誤,這些錯誤有構(gòu)造平行語料庫的原始語料中所存在的錯誤,如拼寫錯誤、錯別字、錯誤的譯文等;也有在構(gòu)造平行語料庫過程中帶進(jìn)來的新錯誤,如篇章對齊或句對齊錯誤而導(dǎo)致的錯誤翻譯等等。所有這些錯誤都將影響訓(xùn)練結(jié)果的可靠性,進(jìn)而影響翻譯系統(tǒng)的性能。除包含錯誤以外,多數(shù)平行語料庫中還包含著一些無法在如今的翻譯模型訓(xùn)練算法中起到貢獻(xiàn)的句對。這些句對通常包含成語、特殊翻譯方式等,它們本身沒有錯,也具有良好的互為翻譯性,但是目前低智能的學(xué)習(xí)方式非但不能從這些句對中受益,反而會受到這些句對的干擾。因而,前期的語料處理成為構(gòu)造高性能的統(tǒng)計機(jī)器翻譯系統(tǒng)的關(guān)鍵。
雙語語料庫的建設(shè)和應(yīng)用研究得到了國內(nèi)外研究者的廣泛重視。國際上已經(jīng)出現(xiàn)了一些大規(guī)模雙語語料庫,如加拿大的議會會議錄(Canadian Hansards)是非常著名的英法雙語語料庫,在平行語料庫的建設(shè)和研究過程中要側(cè)重語料庫的對齊加工標(biāo)注,多級自動對齊技術(shù)以及雙語平行語料庫在機(jī)器翻譯和翻譯知識獲取等方面的應(yīng)用技術(shù)。而就深入開展雙語信息化處理研究來說,建立語料庫之前還需要根據(jù)具體的應(yīng)用要求制定語料收錄規(guī)則,對收錄的范圍、內(nèi)容、標(biāo)準(zhǔn)、格式、信息標(biāo)注、校對、抽檢辦法等進(jìn)行規(guī)定,結(jié)合圖書館業(yè)務(wù)建立圖書館行業(yè)雙語數(shù)據(jù)庫。
可以預(yù)見,在不遠(yuǎn)的將來機(jī)器翻譯必將成為跨語言交流和翻譯的工具,圖書館界也會迎來無障礙跨語言檢索的時代。針對圖書館行業(yè)的機(jī)器翻譯結(jié)果研究出一套實用的客觀評估和主觀評估方法是非常有必要的。在研發(fā)機(jī)器翻譯系統(tǒng)過程中,算法改動或訓(xùn)練數(shù)據(jù)變更都會對機(jī)器翻譯系統(tǒng)的翻譯性能造成影響,需要對機(jī)器翻譯性能設(shè)定一個標(biāo)準(zhǔn),用來評價機(jī)器翻譯系統(tǒng)的幾種不同實現(xiàn)方法中哪一種更好。
通過對云南具有招收留學(xué)生資質(zhì)的48所高校圖書館門戶網(wǎng)站調(diào)研,筆者認(rèn)為,云南高校圖書館留學(xué)生服務(wù)整體水平落后,學(xué)校層面應(yīng)發(fā)揮高校優(yōu)勢與特色,積極主動融入國家“一帶一路”倡議,抓好“瀾湄合作”機(jī)制,完善和優(yōu)化留學(xué)生培養(yǎng)體系,鼓勵和選派教師出國訪學(xué),全球范圍內(nèi)招聘國際化人才,提升師資隊伍國際化水平。學(xué)院層面,應(yīng)制定留學(xué)生培養(yǎng)方案和優(yōu)化專業(yè)課程設(shè)置,引導(dǎo)留學(xué)生積極參與學(xué)院各項活動,為留學(xué)生與中國學(xué)生交流創(chuàng)造更多的機(jī)會。圖書館層面,培養(yǎng)學(xué)科館員與留學(xué)生院深度合作交流,借助學(xué)校外教力量和機(jī)器翻譯技術(shù)的融合,搭建與留學(xué)生的溝通橋梁,了解留學(xué)生對圖書館服務(wù)的需求,豐富館藏體系,開展針對留學(xué)生的個性化服務(wù)。只有各層面相互配合,主動融合合作服務(wù)模式,國內(nèi)外兼并吸收,才能將留學(xué)生的教學(xué)和管理工作開展得更好,進(jìn)而提升云南留學(xué)生服務(wù)和管理的整體水平,助力高?!半p一流”建設(shè),服務(wù)云南國際化辦學(xué)。