卡斯木江·卡米爾丁
新疆喀什特區(qū)圖書(shū)館維吾爾文史資源庫(kù)建設(shè)構(gòu)想
卡斯木江·卡米爾丁
論文從新疆少數(shù)民族特色數(shù)字資源庫(kù)建設(shè)的背景和現(xiàn)狀,在喀什建立維吾爾文史資源庫(kù)的必要性,以及建立維吾爾文史資源庫(kù)在計(jì)算機(jī)技術(shù)上的可行性等方面,對(duì)新疆喀什特區(qū)維吾爾文史資源庫(kù)建設(shè)構(gòu)想進(jìn)行了探討。
維吾爾族文史資源庫(kù)新疆喀什特區(qū)
2010年,第一次中央新疆工作座談會(huì)召開(kāi)以來(lái),在全國(guó)援疆的發(fā)展模式下,新疆公共圖書(shū)館實(shí)現(xiàn)了跨躍式發(fā)展,各地州及各縣市的公共圖書(shū)館事業(yè)都有了長(zhǎng)足發(fā)展,無(wú)論是館舍、硬件設(shè)備和計(jì)算機(jī)網(wǎng)絡(luò),還是系統(tǒng)軟件、人員素質(zhì)、培訓(xùn)學(xué)習(xí)和領(lǐng)導(dǎo)水平等各項(xiàng)指標(biāo)都上了一個(gè)大的臺(tái)階,很多地方都建立了現(xiàn)代化的新館。但隨著新疆公共圖書(shū)館事業(yè)基礎(chǔ)設(shè)施和硬件設(shè)備的改善,其軟件建設(shè)和資源建設(shè)方面的不足也暴露出來(lái)。新疆不僅缺少少數(shù)民族語(yǔ)言的地方特色數(shù)據(jù)庫(kù),連中文的地方數(shù)據(jù)庫(kù)資源也極度缺乏,在這方面進(jìn)一步拉開(kāi)了與東部地區(qū)的差距,使得“數(shù)字鴻溝”的問(wèn)題日漸突出。而作為新疆政治、經(jīng)濟(jì)和文化發(fā)展極為重要的維吾爾族相關(guān)文史專(zhuān)題資源,到目前也沒(méi)有專(zhuān)門(mén)的資源庫(kù)。雖然新疆大學(xué)有一個(gè)地方文獻(xiàn)數(shù)據(jù)庫(kù),但僅收錄了部分維吾爾文史資源的內(nèi)容,而且其服務(wù)對(duì)象也僅限于本校師生,故不予探討。由于在喀什建立維吾爾文史資源庫(kù)的資金、技術(shù)和背景條件均已比較成熟,因此,應(yīng)盡早將其列入喀什地區(qū)圖書(shū)館發(fā)展的議事日程,以推動(dòng)新疆少數(shù)民族特色資源庫(kù)的建設(shè)進(jìn)程。
目前,新疆維吾爾自治區(qū)圖書(shū)館已擁有(主要是購(gòu)買(mǎi))的數(shù)字文獻(xiàn)資源有CNKI系列數(shù)據(jù)庫(kù)、博看網(wǎng)暢銷(xiāo)期刊數(shù)據(jù)庫(kù)、萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)、國(guó)研數(shù)據(jù)庫(kù)、中數(shù)圖電子圖書(shū)等8個(gè)數(shù)據(jù)庫(kù)。共享工程首先要實(shí)現(xiàn)的是資源共享,但適合本地區(qū)的資源不能單靠共享工程國(guó)家中心來(lái)提供。新疆公共圖書(shū)館系統(tǒng)以自治區(qū)圖書(shū)館和全國(guó)文化信息資源共享中心新疆分中心為依托,建立了不少地方特色的數(shù)字資源[1]。在自建的這些資源中,視頻資源和多媒體資源占到90%以上。近年來(lái)建成的資源庫(kù)主要有:代號(hào)“千里馬”的視頻資源庫(kù),是文化部全國(guó)文化信息資源建設(shè)管理中心向各省級(jí)分中心下發(fā)的15批約8TB容量的移動(dòng)硬盤(pán)視頻資源;農(nóng)牧區(qū)實(shí)用技術(shù)庫(kù),以廣大農(nóng)牧區(qū)群眾易于接受的視頻方式,以多種語(yǔ)言形式,全方位地介紹農(nóng)牧區(qū)的種植、養(yǎng)殖、防病、防災(zāi)技術(shù),以及農(nóng)機(jī)器械保養(yǎng)維修和市場(chǎng)營(yíng)銷(xiāo)的最新信息;少數(shù)民族愛(ài)國(guó)主義題材影視庫(kù),收集新疆電視臺(tái)、有線廣播電視臺(tái)、天山電影制片廠等譯制的維吾爾、哈薩克語(yǔ)影視劇1833部集,全疆各譯制部門(mén)共譯制維吾爾、哈薩克、蒙古、柯?tīng)柨俗握Z(yǔ)影視劇2968部集;少數(shù)民族表演藝術(shù)庫(kù),內(nèi)容有享譽(yù)中外和獨(dú)具民族特色的少數(shù)民族表演藝術(shù)形式,包括十二木卡姆、頂碗舞、達(dá)瓦孜(走鋼絲),以及其他民間曲藝和舞臺(tái)?。环俏镔|(zhì)文化遺產(chǎn)庫(kù),以視頻、音頻和圖片等形式展現(xiàn)新疆非物質(zhì)文化遺產(chǎn)深厚的底蘊(yùn),其中有名列中國(guó)三大史詩(shī)的《瑪納斯》和《江格爾》;少數(shù)民族少兒“雙語(yǔ)”及基礎(chǔ)教育庫(kù),以合作建設(shè)為主,從幼兒教育抓起,以視頻方式進(jìn)行遠(yuǎn)程教育,內(nèi)容生動(dòng)活潑,寓教于樂(lè),旨在提高全疆各族兒童的“雙語(yǔ)”水平及其他各項(xiàng)綜合教育水平;新疆風(fēng)光資源庫(kù),收錄新疆各地雄偉壯麗的美麗風(fēng)景。上述7個(gè)資源庫(kù)的建設(shè),雖然少數(shù)民族語(yǔ)言文字為主的資源占到60%以上,但基本上是以視頻資源和譯制內(nèi)容為主的資源,在資源類(lèi)型上存在著嚴(yán)重的不足之處。雖然總量很大,但是無(wú)法滿足新疆各族群眾對(duì)維吾爾文化歷史方面資源的需求。由上述可知,新疆公共圖書(shū)館系統(tǒng)一直沒(méi)有建立一個(gè)關(guān)于維吾爾文史的專(zhuān)題數(shù)據(jù)庫(kù),這遠(yuǎn)遠(yuǎn)不能滿足新疆當(dāng)前政治、經(jīng)濟(jì)和文化建設(shè)的需要,因此,開(kāi)展這項(xiàng)工作顯得迫在眉睫。
2.1喀什特區(qū)經(jīng)濟(jì)發(fā)展的迫切需要
喀什是中國(guó)的西大門(mén),下轄喀什市和11縣,面積16.2萬(wàn)平方公里,接近廣東省,人口400萬(wàn),有維吾爾族、漢族等31個(gè)民族,其中維吾爾族占90%,漢族占8%,其他少數(shù)民族占2%,是多民族聚居的地區(qū)。2010年5月,中央決定在喀什設(shè)立特區(qū),使之成為國(guó)家第6個(gè)經(jīng)濟(jì)特區(qū),同時(shí)也是中國(guó)內(nèi)陸首個(gè)經(jīng)濟(jì)特區(qū),力爭(zhēng)使喀什特區(qū)成為我國(guó)“一帶一路”并重對(duì)外開(kāi)放的重要節(jié)點(diǎn),成為我國(guó)向西開(kāi)放的重要窗口,同時(shí)也是我國(guó)西部最具活力和投資價(jià)值的特區(qū)。為此,在確定對(duì)口支援新疆的19個(gè)省市中,山東、上海、廣東和深圳4省市對(duì)口支援喀什地區(qū)。同時(shí),由于南疆三地州均為國(guó)家級(jí)貧困地區(qū),面積較大,人口占全疆總?cè)丝诮?0%,其中少數(shù)民族人口占93%,同時(shí)該地區(qū)還是與國(guó)內(nèi)外恐怖、分裂和極端主義斗爭(zhēng)的主戰(zhàn)場(chǎng),是抵制國(guó)際恐怖勢(shì)力滲透的前沿陣地,因此,加快喀什經(jīng)濟(jì)開(kāi)發(fā)區(qū)的建設(shè)和發(fā)展,進(jìn)而引領(lǐng)南疆三地州的發(fā)展,對(duì)于民族、社會(huì)和國(guó)家都具有重要意義。在此基礎(chǔ)上,建設(shè)維吾爾文史資源庫(kù)對(duì)喀什特區(qū)及南疆地區(qū)的經(jīng)濟(jì)發(fā)展,政治穩(wěn)定和文化建設(shè)也具有重要意義[2]。
2.2喀什維吾爾文史資源的需要
維吾爾文化的兩部重要作品《福樂(lè)智慧》和《突厥語(yǔ)大詞典》都出自喀什人之手,研究這兩部書(shū)已經(jīng)成為一門(mén)顯學(xué),在國(guó)內(nèi)外有著較大的影響,僅研究這兩部書(shū)的論文數(shù)量就非常龐大,每年都會(huì)舉辦相關(guān)的論文研討會(huì)。如果再加上其他文獻(xiàn),例如《烏古斯可汗傳》《樂(lè)師傳》《阿曼尼莎汗》《新疆五十年》《蘇圖克·布格拉汗》等,在新疆內(nèi)外都有大量的讀者。新中國(guó)成立后,自治區(qū)累計(jì)用維吾爾、哈薩克、蒙古、柯?tīng)柨俗?、錫伯等少數(shù)民族文字出版圖書(shū)2.19萬(wàn)種,其中維吾爾文占了非常大的比例。此外,喀什地區(qū)各公共圖書(shū)館都有著數(shù)量不等的大量地方文獻(xiàn)入藏,而喀什地區(qū)民宗委、政協(xié)、文化館和文管所等單位也保存了大量的維吾爾文史資源,其中包括不少稀有的察合臺(tái)文文獻(xiàn)[3]。這些都有待通過(guò)建立維吾爾文史資源庫(kù)的形式,滿足新疆地區(qū)文化建設(shè)的需要,為新疆大開(kāi)發(fā)、新疆經(jīng)濟(jì)建設(shè)及新疆各民族的團(tuán)結(jié)安定做出應(yīng)有的貢獻(xiàn)。
2.3保護(hù)維吾爾文化遺產(chǎn)的需要
作為歷史的見(jiàn)證,喀什地區(qū)各類(lèi)型圖書(shū)館全部建立了收藏少數(shù)民族文字文獻(xiàn)的民文書(shū)庫(kù),它們與漢文書(shū)庫(kù)一起共同構(gòu)成了自治區(qū)具有民族特色的圖書(shū)館文獻(xiàn)資源體系,為各民族讀者提供了豐富的精神食糧。而新疆各地民間也有大量的古代及近代維吾爾文獻(xiàn)以地方文獻(xiàn)的形式分別保存在新疆各地的圖書(shū)館中。這些文獻(xiàn)內(nèi)容豐富,版本珍貴,部分文獻(xiàn)散存于民間面臨著失傳的危險(xiǎn)。所以,在新疆喀什建立維吾爾文史專(zhuān)題資源庫(kù)是非常必要的,可以有效地保護(hù)維吾爾族的文化遺產(chǎn)[4],因?yàn)榧堎|(zhì)文獻(xiàn)尤其是古代的紙質(zhì)文獻(xiàn)隨著時(shí)間歲月的磨蝕,非常容易損壞,這不僅不利于文獻(xiàn)的保存,更不利于讀者的使用。將維吾爾文獻(xiàn)進(jìn)行數(shù)字化處理可以有效地降低珍貴古籍文獻(xiàn)資料的損壞進(jìn)程,同時(shí)更便于讀者的閱讀利用。由于數(shù)字化文獻(xiàn)十分有利于文獻(xiàn)資源的檢索、查詢、利用、傳輸和存儲(chǔ),因而維吾爾文史資源庫(kù)的建立可以有效地提高維吾爾文獻(xiàn)的利用率,為讀者閱讀使用和相關(guān)研究者的工作創(chuàng)造便利條件,從而在維吾爾文獻(xiàn)的有效保護(hù)、使用和傳播等方面都具有重要的意義。
新疆經(jīng)濟(jì)的跨躍式發(fā)展為新疆建立各類(lèi)數(shù)據(jù)資源庫(kù)提供了充足的資金保障。同時(shí),隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,少數(shù)民族計(jì)算機(jī)技術(shù)也在不斷進(jìn)步,并為圖書(shū)館建設(shè)數(shù)字化文獻(xiàn)資源提供了技術(shù)保障。過(guò)去因?yàn)榉N種技術(shù)原因遲遲無(wú)法建立各種地方特色數(shù)據(jù)庫(kù),而現(xiàn)在因?yàn)樾录夹g(shù)的出現(xiàn),維吾爾文史資源庫(kù)建設(shè)的技術(shù)瓶頸已被克服。
3.1XML與Unicode對(duì)西部少數(shù)民族文獻(xiàn)的支持
XML(ExtensibLe Markup Language)作為網(wǎng)絡(luò)環(huán)境下的國(guó)際標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言的一個(gè)子集和實(shí)用標(biāo)準(zhǔn),給處理維吾爾和漢語(yǔ)多語(yǔ)種帶來(lái)了方便,其多級(jí)嵌套可以置標(biāo)不同層次少數(shù)民族文字的子宇段,方便系統(tǒng)平臺(tái)根據(jù)嵌套的不同語(yǔ)言而采取不同的處理方式,使瀏覽器能識(shí)別和查看從右到左的Web頁(yè)面,圖書(shū)館自動(dòng)化軟件也可以直接使用[5]。XML及其子集HTML均采用UTF-8為標(biāo)準(zhǔn)字集,支持在采用XML標(biāo)準(zhǔn)的各種品牌瀏覽器上顯示任何地區(qū)的文字網(wǎng)頁(yè)。國(guó)際Unicode協(xié)會(huì)于2003年8月27日發(fā)布的Unicodc4.0版本,為所有維吾爾、哈薩克、柯?tīng)柨俗挝淖址挤峙淞讼鄳?yīng)的Unicode編碼,使得全球的語(yǔ)言字符編碼標(biāo)準(zhǔn)得到統(tǒng)一。中國(guó)國(guó)內(nèi)適用于少數(shù)民族文字的機(jī)讀目錄和數(shù)據(jù)庫(kù)也得到全面發(fā)展[6],支持多語(yǔ)種少數(shù)民族文字的圖書(shū)館管理軟件也在不斷面世。例如,現(xiàn)在做為新疆公共圖書(shū)館主流自動(dòng)化軟件的interlib圖創(chuàng)系統(tǒng),就是支持UNICODE4.0標(biāo)準(zhǔn)的。截止2013年11月,unicode編碼的最新版本已經(jīng)升級(jí)到6.3版。
3.2都柏林核心元數(shù)據(jù)在少數(shù)民族文獻(xiàn)中的應(yīng)用
圖書(shū)館自動(dòng)化的元數(shù)據(jù)MARC是將數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、索引包羅在一起的不完全的元數(shù)據(jù)。現(xiàn)代幾種元數(shù)據(jù)只包含元素,結(jié)構(gòu)由UTU或Shama描述,因此簡(jiǎn)捷明快。目前,國(guó)內(nèi)多采用都柏林核心元數(shù)據(jù)DublinCore MetaDate,至今元數(shù)據(jù)已經(jīng)被翻譯成18種語(yǔ)言。由于只有可選擇且可重復(fù)的15個(gè)元素,所以給西部圖書(shū)館特別是開(kāi)發(fā)少數(shù)民族文字的圖書(shū)館自動(dòng)化帶來(lái)了新思路。因?yàn)椴槐貙⑸贁?shù)民族文字的特點(diǎn)同冗長(zhǎng)、繁瑣的傳統(tǒng)編目規(guī)則去謀合,根據(jù)向上兼容的規(guī)則,只須在出現(xiàn)少數(shù)民族文字的元素上加上語(yǔ)言方向和字體修飾屬性,同時(shí)發(fā)展本地化的元素限定修飾詞即可,最后在摸索中發(fā)現(xiàn),關(guān)于本地化都柏林元數(shù)據(jù)的翻譯可以借鑒阿拉伯語(yǔ)都柏林元數(shù)據(jù)標(biāo)準(zhǔn)。
3.3數(shù)據(jù)庫(kù)中維吾爾文存儲(chǔ)和顯示問(wèn)題
3.3.1存儲(chǔ)問(wèn)題
數(shù)據(jù)庫(kù)采用支持Unicode5.0的Ora cle10g數(shù)據(jù)庫(kù),并將語(yǔ)言屬性定義為NLS-LANG=SIMPLIFIED CHINESE_CHINA.AL32UTF8(界面語(yǔ)言:簡(jiǎn)體中文,地區(qū):大陸地區(qū),支持所有語(yǔ)言的UTF-8字符集編碼),這樣就可以支持存儲(chǔ)中文、英文、維吾爾文(U-nicode標(biāo)準(zhǔn))。Oracle數(shù)據(jù)庫(kù)的AL32UTF8字符集選項(xiàng)實(shí)現(xiàn)了機(jī)讀目錄字符集和數(shù)據(jù)庫(kù)字符集都統(tǒng)一到GB13000,這等同于ISO10646的Unicode字符集標(biāo)準(zhǔn)。
3.3.2顯示問(wèn)題
ISO10646與Unicode組織字符集標(biāo)準(zhǔn)統(tǒng)一化基于Unicode 標(biāo)準(zhǔn)的UTF-8編碼格式,從數(shù)據(jù)庫(kù)服務(wù)器讀取存儲(chǔ)UTF-8的編碼,通過(guò)JDBC數(shù)據(jù)庫(kù)接口,仍然以UTF-8的格式傳輸?shù)綉?yīng)用服務(wù)器上,最終傳輸?shù)阶x者客戶端。如此一來(lái),將不再存在轉(zhuǎn)換問(wèn)題,當(dāng)然也就不會(huì)再出現(xiàn)亂碼的字符集問(wèn)題。
3.4維吾爾文在數(shù)據(jù)庫(kù)中的排序問(wèn)題
Unicode標(biāo)準(zhǔn)雖然解決了維吾爾文編碼問(wèn)題,但是在支持Unicode的系統(tǒng)中,系統(tǒng)對(duì)維吾爾文進(jìn)行排序時(shí),是按阿拉伯文字母的順序進(jìn)行排序,這不符合維吾爾文字母表的順序[7]。在數(shù)據(jù)庫(kù)中對(duì)維吾爾文進(jìn)行排序時(shí),數(shù)據(jù)庫(kù)提供的排序功能是按照維吾爾字母在編碼集中的編碼順序進(jìn)行排列,而不是按照維吾爾字母表的順序進(jìn)行排序,不利于讀者利用,對(duì)于數(shù)字圖書(shū)館來(lái)說(shuō)是非常嚴(yán)重的缺陷。通過(guò)在維吾爾文字母與ASCⅡ碼之間建立一個(gè)對(duì)應(yīng)轉(zhuǎn)換表,這個(gè)問(wèn)題方才得以解決。即通過(guò)將維吾爾文字母轉(zhuǎn)換為ASCⅡ代碼進(jìn)行排序,利用系統(tǒng)提供的排序功能速度非??臁6樵兊降慕Y(jié)果則通過(guò)這個(gè)對(duì)應(yīng)表再進(jìn)行一次轉(zhuǎn)換,轉(zhuǎn)換成維吾爾文字母的方式顯示給使用者。同時(shí),在數(shù)據(jù)庫(kù)中增加一個(gè)字段,即保存維吾爾文關(guān)鍵字的ASCⅡ代碼,可以通過(guò)代碼直接查詢,通過(guò)動(dòng)態(tài)鏈接庫(kù)DLL及ActiveX(OCX)控件的方式實(shí)現(xiàn)。這樣一來(lái),就實(shí)現(xiàn)和解決了純維吾爾文在數(shù)據(jù)庫(kù)中的排序和檢索問(wèn)題。
[1]全國(guó)文化信息資源共享工程新疆分中心資源[EB/OL].[2014-11-12].http://www.xjlib.org/000001950009000 1_1.html.
[2]秦玲.對(duì)免費(fèi)開(kāi)放時(shí)代喀什地區(qū)圖書(shū)館困境與出路的思考[J].西域圖書(shū)館論壇,2012(1):1-4.
[3]葉金鳳,古力帕力.國(guó)內(nèi)外察合臺(tái)文文獻(xiàn)的收藏及研究現(xiàn)狀[J].黑龍江史志,2011(21):40-41.
[4]張玉祥,廖肇羽,陳曉艷.論維吾爾族非物質(zhì)文化遺產(chǎn)檔案式保護(hù)[J].蘭臺(tái)世界,2014(5):86-87.
[5]王曙光.新疆文化共享工程少數(shù)民族語(yǔ)言資源譯制的實(shí)踐與體會(huì)[J].圖書(shū)館理論與實(shí)踐,2010(11):101-103.
[6]王小林,陳軍.基于異構(gòu)網(wǎng)絡(luò)的西部少數(shù)民族文獻(xiàn)聯(lián)合數(shù)據(jù)庫(kù)建設(shè)[J].圖書(shū)與情報(bào),2014(2):44-47.
[7]伊馬木·達(dá)吾提,葛洪偉.維吾爾文數(shù)據(jù)庫(kù)排序軟件的設(shè)計(jì)與實(shí)現(xiàn)[J].新疆教育學(xué)院學(xué)報(bào),2007,23(4):130-132.
卡斯木江·卡米爾丁喀什地區(qū)圖書(shū)館館員。新疆喀什,844000。
Construction Conception of Uighur Cultural and Historical Resource Database in Library of Kashi SAR Xinjiang
Kasimujang·Kamierding
This paper discusses the construction conception of Uighur cultural and historical resource database in library of Kashi SAR Xinjiang,including the background and current status of the featured digital resource database construction in Xinjiang minority,the necessity of Uighur history repository established in Kashi,the feasibility of Uighur cultural and historical resources database establishment in computer technology.
Uighur.Cultural and Historical Resource Database.Kashi SAR Xinjiang.
G250.74
(2014-12-15編校:方瑋)