国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多維視角下的少林寺檔案內(nèi)容挖掘與知識服務研究*

2021-08-12 04:57:32李海濤楊晗
山西檔案 2021年5期
關(guān)鍵詞:少林寺少林可視化

李海濤 楊晗

(中山大學信息管理學院 廣州 510275)

少林寺檔案在一定程度上反映了少林武術(shù)的基本面貌與文化根脈,是人們了解、把握少林寺文化和歷史脈絡必不可少的資料。2006年少林功夫入選國家級非物質(zhì)文化遺產(chǎn)名錄,2010年8月包括少林寺常住院在內(nèi)的歷史建筑群被聯(lián)合國科教文組織列為世界文化遺產(chǎn),2017年初中共中央辦公廳、國務院辦公廳下發(fā)的《關(guān)于實施中華優(yōu)秀傳統(tǒng)文化繼承發(fā)展工程的意見》指出要實施非物質(zhì)文化遺產(chǎn)傳承發(fā)展工程,進一步完善非物質(zhì)文化遺產(chǎn)普查建檔制度。少林寺文化是我國珍貴的非物質(zhì)文化遺產(chǎn),其所蘊藏的傳統(tǒng)文化在提升中華民族文化自信上有著重要意義。新時期開展少林寺檔案的挖掘利用與知識服務,促進資源的集成整合,主動向社會提供集成化、可視化、多元化的少林寺檔案知識服務是保護少林文化、弘揚少林文化的重要途徑。

“少林寺檔案是圍繞少林寺形成的綜合性寺廟檔案”,既包括少林寺本身的檔案文獻,也包括少林文化圈形成的檔案文獻。現(xiàn)存少林寺檔案約有2萬件,主要包括金石、紙質(zhì)、聲像檔案及口述檔案[1],因少林文化歷史悠久無論是歷史檔案還是現(xiàn)代檔案都相當豐富,但是對少林寺檔案的開發(fā)利用工作遠遠落后于實踐的需要。當前少林寺檔案館仍在建設中,對檔案資源的利用仍停留在收管存階段,并且少林寺檔案資源增量大,動態(tài)、散亂、無序特征明顯,需要改變傳統(tǒng)的資源組織方式。借助知識挖掘有關(guān)技術(shù)對雜亂的少林寺檔案信息進行有序化、可視化、系統(tǒng)化處理,發(fā)現(xiàn)海量少林寺檔案資源的關(guān)聯(lián),實現(xiàn)少林寺檔案信息的高效組織與深入挖掘,從而提高少林檔案服務效益是新時期對少林寺檔案利用的新要求。少林寺檔案館應利用現(xiàn)代信息技術(shù)擴寬少林寺檔案服務渠道、改變服務方式、提升服務能力,進而向社會各界提供少林寺檔案知識服務。而主題模型、可視化技術(shù)、數(shù)字人文倉儲技術(shù)可為這一目標的實現(xiàn)創(chuàng)造條件。

1 研究現(xiàn)狀

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,當前已有將這幾種新興技術(shù)與檔案開發(fā)利用相結(jié)合的研究:在主題模型方面,陳忻等將主題模型應用于北京香山紅色檔案的編研中[2]、霍光煜等采用LDA模型提取文檔的主題特征向量,進而用K-means算法對檔案的主題特征進行聚類,得到檔案間的關(guān)聯(lián)[3];在可視化技術(shù)方面,陳海玉等在數(shù)字檔案資源語義本體的基礎(chǔ)上構(gòu)建可視化的“南昌起義”專題網(wǎng)站[4]、施仲添等以杭州規(guī)劃審批檔案為例,運用GIS技術(shù)將檔案信息空間可視化[5]、謝玉雪對美國、英國、澳大利亞、加拿大數(shù)字檔案資源的線上展覽予以分析,總結(jié)出可視化敘事數(shù)字檔案資源服務的一般模式[6]、祝振媛通過歷史人物解析與數(shù)字技術(shù)相結(jié)合的手段實現(xiàn)家譜檔案可視化[7];在數(shù)字人文倉儲方面,徐擁軍等借鑒加拿大可信數(shù)字倉儲的成功經(jīng)驗,構(gòu)建出適合我國的統(tǒng)一集成數(shù)字資產(chǎn)體系[8]、李建偉構(gòu)建的梅州僑批史料數(shù)字倉儲系統(tǒng)方案可以實現(xiàn)非結(jié)構(gòu)化數(shù)字記憶資源基于知識元的深度聚合[9]、王艷麗在對Fedora數(shù)字倉儲技術(shù)研究的基礎(chǔ)上,提出構(gòu)建基于Fedora的數(shù)字檔案保存系統(tǒng)[10]。

當前檔案學者在新興技術(shù)的應用研究中有著較為成熟的分析和理論基礎(chǔ),而在少林寺檔案的開發(fā)利用中,當前的研究成果較少:譚必勇等人分析了少林文化發(fā)展的困境與機遇,結(jié)合少林寺檔案資源的開發(fā)現(xiàn)狀為少林寺檔案的開發(fā)提出對策[11],丁海斌等人介紹了少林寺檔案的組成、特點和開發(fā)的獨特優(yōu)勢[12]??梢钥闯?,學者對少林寺檔案的關(guān)注較少,針對少林寺檔案開發(fā)利用的研究不足。

綜上,將主題模型、可視化技術(shù)、數(shù)字人文倉儲三種技術(shù)應用于檔案開發(fā)利用中的研究類型和方式呈現(xiàn)多樣化并逐漸成熟,但對少林寺檔案的研究僅有兩篇成果,為此文章在參考已有研究成果、分析有關(guān)技術(shù)的基礎(chǔ)上,結(jié)合少林寺檔案的特點,從內(nèi)容挖掘、展示和利用方面為少林寺檔案開發(fā)利用提供新思路,為進一步實現(xiàn)少林寺檔案的知識服務提供技術(shù)藍圖和理論支撐。

2 基于主題模型的少林寺檔案信息挖掘

檔案較其他史料具有更強的真實可靠性,在知識管理時代,對其的研究利用除了對容易量化的文本進行編纂外,更重要的是對其信息內(nèi)容進行分析,因此對已數(shù)字化的少林寺檔案進行有效的信息提取和數(shù)據(jù)整合是信息時代開發(fā)利用少林寺檔案的主要途徑。目前,西方學者和我國已經(jīng)積極開展將主題模型(Topic Modeling)應用于文獻內(nèi)容挖掘的研究中,拓寬了內(nèi)容分析與提取的研究路徑,如弗吉尼亞大學英語系的“羅塞蒂檔案庫(Rossetti Archive)”項目,利用文本標記、詞頻分析以及語義挖掘等技術(shù)對Rossetti有關(guān)的檔案信息資源進行深度開發(fā)和融合,加強對文獻主題的研究[13]。此外,還有美國女作家檔案、威廉.布萊克檔案等都屬于專題歷史檔案文獻資料庫。

2.1 主題模型

建立主題模型即在文本分析的基礎(chǔ)之上,借助自動化技術(shù)選用合適的特征詞匯來對文本內(nèi)容進行描述和建模,其來源于隱性語義索引,它基本思想為假設文檔是由K個潛在主題隨機混合產(chǎn)生,這些詞匯可以通過概率分布計算出來,從而可以根據(jù)詞匯分布來進行主題聚類或文本分布。一個主題模型通常包括5項內(nèi)容:(1)主題模型的輸入,包括輸入文檔集合和主題個數(shù)K;(2)主題模型的基本假設,其中重要的一個假設是詞袋假設,即一篇文檔內(nèi)的詞匯只考慮是否出現(xiàn),而不考慮其出現(xiàn)的次序;(3)主題模型的表示,有使用圖模型和生成過程兩種;(4)參數(shù)估計過程,主要是分析各主題下的詞項概率分布和各文檔的主題概率分布;(5)新樣本的推斷[14]。目前主要的主題模型有:Blei等人提出的描述主題間相關(guān)性問題的CTM模型;基于主題演化思想的動態(tài)主題模型DTM;Zhao等人提出的Twitter-LDA模型主要解決社交網(wǎng)絡中出現(xiàn)的短文本數(shù)據(jù)等。在pLSI基礎(chǔ)上,Blei等人提出了LDA(Latent Dirichlet Allocation),LDA是一個完整的生成模型,且近些年為了解決不同問題,研究多是圍繞LDA模型進行優(yōu)化擴展,是比較成熟的主題模型,因此越來越多地應用到自然語言、圖像處理等領(lǐng)域。

2.2 平臺設想

研究設計了基于LAD模型的“明代少林寺檔案”文本分類和聚類的平臺建設方案,如圖1所示。方案構(gòu)思如下:

圖1 基于LDA主題的少林寺檔案文本分類、聚類流程圖

(1)實驗數(shù)據(jù)處理

以明代的少林寺檔案資料為數(shù)據(jù)來源進行數(shù)據(jù)采集,并對導入的檔案文獻進行數(shù)據(jù)處理,包括對文獻進行人工篩選、導入文獻詞表、對文本語料進行分詞處理、對文獻進行剔除停用詞、標點、標注等處理。檔案文本語料的選擇和數(shù)據(jù)處理是文本聚類的重要環(huán)節(jié)之一,文本聚類結(jié)果的精度及效率都與該步驟有著密切關(guān)系,因此這些步驟要盡量做到精準。之后按照時間片原理劃分這些文件,由于明朝歷時二百六十七年,時間跨度大,所以本實驗設計五年為一跨度的時間劃分原則。

(2)主題抽取

構(gòu)建實驗平臺,在主題分類眾多模型中,LDA模型有非常重要的地位,因此本文采用LDA模型對“明代少林寺檔案”進行主題自動抽取。利用模型獲得文檔總詞匯后,根據(jù)實際情況設置主題數(shù),確定主題數(shù)在LDA模型中是一個困難的問題,傳統(tǒng)方式采用按照經(jīng)驗設置主題數(shù),此方法科學性和合理性較差。因此本文采用通過文本-主題最大平均分布概率和主題-詞語平均相似度概率的加權(quán)數(shù)值的方法確定主題數(shù)量[15],經(jīng)過計算本文主題數(shù)設置為10個,接著將迭代次數(shù)設為1000次進行實驗。另外,在主題抽取的基礎(chǔ)上,注意主題表達強度。

(3)主體監(jiān)測與識別

在得出的結(jié)果中進行篩選得到最能表示文本內(nèi)容的詞匯并對其進行監(jiān)測與識別,以得出不同主題的分布與強度的演化趨勢,比如洪武五年至十年這五年中,主題詞為“佛塔”、“僧司”等;嘉靖三十一年至三十六年這五年中,主題詞為“僧兵”、“抗倭”等。

3 基于可視化技術(shù)的少林寺檔案內(nèi)容展示

目前對歷史檔案文獻的開發(fā)與利用的方式主要有:查詢服務、利用大眾媒介宣傳檔案史料、檔案展覽和檔案編研工作,這些傳統(tǒng)檔案利用方式大多依靠人力完成,可有效保證開發(fā)的質(zhì)量,但人力、時間、資源有限,且當代人們追求一種“快文化”,傳統(tǒng)的手段無法滿足人們迅速獲取及篩選出有效信息的需求。當前可視化技術(shù)應用于多種領(lǐng)域,同樣可應用于少林寺檔案的利用中,它將文本中隱含的關(guān)系、內(nèi)容和規(guī)律以視覺形式展現(xiàn)出來,它借助人們與生俱來的感官能力,能夠快速直接地幫助人們獲取少林寺檔案資料中的關(guān)鍵信息??梢暬纳倭炙聶n案資料的藝術(shù)性和生動性,彌補了少林寺檔案資料分散、晦澀難懂的缺點,降低了少林寺歷史檔案資料的閱讀、利用門檻,有利于擴大少林寺檔案文獻的影響力和實現(xiàn)少林寺檔案資料的價值。

可視化技術(shù)在人文學科研究中的應用越來越得到國內(nèi)外學者的重視,比如北德克薩斯大學與斯坦福大學合作開展的舊報紙數(shù)字化新聞文本挖掘與可視化項目;Schich等繪制的三年歐洲和北美的文化史圖項目以及Cho等人開發(fā)的羅馬歷史可視化分析系統(tǒng)等。國內(nèi)的有Peter K.Bol教授與北京大學合作建立的“中國歷代人物傳記資料庫”(CBDB)項目,是目前世界上最大的中國歷史人物專輯資料分析數(shù)據(jù)庫,包括“歷史人物遷徙圖”和“學術(shù)師承可視化”兩個部分。

目前信息可視化的數(shù)據(jù)分為以下幾類:一維數(shù)據(jù)、二維數(shù)據(jù)、三維數(shù)據(jù)、多維數(shù)據(jù)、時態(tài)數(shù)據(jù)、層次數(shù)據(jù)和網(wǎng)絡數(shù)據(jù)[16]。對應的目前用于多維數(shù)據(jù)的可視化技術(shù)有:幾何、圖標和動畫的多維可視化技術(shù);用于時態(tài)數(shù)據(jù)可視化的技術(shù)主要有:線形圖、堆積圖、地平線圖和時間線圖等;用于層次數(shù)據(jù)的可視化技術(shù)主要有:節(jié)點連接圖和樹圖2種方式;用于網(wǎng)絡數(shù)據(jù)的可視化方法核心是自動布局算法,目前主要包括:力導向布局、分層布局和網(wǎng)絡布局3種。本文選取了幾種可用于少林寺檔案可視化的方法進行介紹。

3.1 主題可視化

一份檔案的主題可以從一系列能反映事件發(fā)生、發(fā)展過程的關(guān)鍵詞體現(xiàn)出來,因此可以通過關(guān)鍵詞的可視化來實現(xiàn)檔案主題的可視化??梢詫ⅰ爸黝}河”技術(shù)用于少林寺檔案主題的可視化中,主題河的原理是將同一主題的多個時序文章進行匯聚,按照時間順序展示這個主題的發(fā)展變化狀況,也可以將多個不同主題的時序文章進行匯聚,用戶既可以看出某個時間點這些主題的分布狀況,又可以看到多個主題的發(fā)展變化情況[17]。橫軸表示時間,主題強度用條帶的寬度表示出來,就可以得到隨時間線寬度變化的若干個條帶,因形狀類似河流所以起名主題河技術(shù)。主題河技術(shù)可應用于有一定時間跨度的少林寺歷史檔案中,比如以少林寺有關(guān)“戒律”的檔案文獻匯編為例,利用主題河技術(shù),可以看出每個時期少林寺對僧人犯戒懲罰的側(cè)重點。

3.2 時空可視化

通過對檔案中時空信息的抽取,將某一事件或某一地方的發(fā)展變化狀況以動態(tài)的方式在時空框架中展現(xiàn)出來,可以讓讀者了解事件發(fā)生的始末和空間背景,從而直觀、深刻地對事件產(chǎn)生更深刻的理解??蛇\用于少林寺檔案中的時空可視化技術(shù)主要是“時間序列地圖”。時間序列地圖主要用于反映同一空間區(qū)域在不同時空下的狀態(tài)并展現(xiàn)其動態(tài)變化情況,這一特點可用于少林寺檔案文獻中有關(guān)地主莊園的資料中。少林寺是一座古老的封建莊園,許多資料尤其是石碑上多有關(guān)于少林寺田地變化資料的記載,如《古堰禪師道行碑》中記載古堰禪師于元皇慶間來到少林寺,在他主持少林寺期間,曾“置莊一所,寺域開田兩傾”;《淳拙禪師道行碑》中說道“創(chuàng)鐘樓、西堂、新南寺、普照寺,益膏腴二十傾”等等[18]。在歷史上,少林寺地界東面曾至白沙(在今禹縣),西面到西白沙(在今伊川縣),面積最多時曾達八百余傾,但是每個朝代都會發(fā)生很大變化,利用時間序列地圖,將少林寺檔案中有關(guān)田地變遷的有關(guān)信息、時間序列進行離散化處理,基于矢量數(shù)據(jù)模型或柵格數(shù)據(jù)模型制作出單一圖幅反映此朝代少林寺土地的情況,并且對應某一行政區(qū)域內(nèi)的人口、城區(qū)、土地、水文、氣象等地理因素的分布狀況,也可制作出多幅連續(xù)的地圖反映少林寺田地面積、位置的時空演變特征,對研究少林寺經(jīng)濟、地位變化有所幫助。

此外,“流向地圖”可應用于研究少林寺遷移的歷史檔案中;“故事板”可應用于展示少林寺某一事件中的多個重要場景,把這些場景串聯(lián)起來形成一個完整的事件,形象展示該事件始末。

3.3 武術(shù)檔案文獻可視化

20世紀90年代末,馬明達先生提出要重視武術(shù)古籍,有關(guān)少林寺武術(shù)文獻的研究取得了一些成就,但是這些武術(shù)文獻研究普遍忽視了文獻中附加的圖像的作用[19]。將這些武術(shù)圖像進行可視化展示,有兩方面意義:一是方便考訂文獻內(nèi)容,厘定版本形成?,F(xiàn)有的清代“少林拳棍刀槍譜”系列文獻在輾轉(zhuǎn)傳抄的過程中,由于種種原因,招式名稱發(fā)生了變化,但有圖像作為依據(jù),根據(jù)動作樣式特點,將每一幅圖像做成每一幀動畫,圖文互參,方可以確定版本間的關(guān)系以及文字錯訛情況。二是便于后人對少林武術(shù)的學習。將少林武術(shù)檔案文獻中的拳法、槍譜以動畫形式直觀的展示于后人面前,再配以語音說明,可以幫助人們充分理解少林武術(shù)中的動作,加深對動作的理解。目前國內(nèi)的動畫制作技術(shù)已非常成熟,可以將這一工作外包給有關(guān)公司,并加上有關(guān)少林武術(shù)人員協(xié)助,利用Matlab、Flash等動畫制作軟件,將靜態(tài)的少林武術(shù)檔案文獻以連續(xù)播放或快速變化等形式轉(zhuǎn)變?yōu)閯討B(tài)連貫的武術(shù)教學視頻。

3.4 人物關(guān)系可視化

少林寺經(jīng)過多年發(fā)展,在維護管理、繼承傳授方面形成了一套官府式的組織機構(gòu),人員關(guān)系眾多復雜。來自九省十三縣的千門萬戶的寺僧,一到寺里便形成了乃徒乃師、法子法孫的大家族組織形式。此外,少林寺的家族分為大悲庵、永化堂、彌陀庵等十八門,每門一般都是祖孫三代,清涼庵的輩數(shù)甚至達到八、九輩,每一門好像寺里的一個小宗。這些復雜的人物關(guān)系可以借助“人物知識圖譜”技術(shù)將其可視化?!叭宋镏R圖譜”是一種知識可視化方法,通過語義檢索技術(shù),篩選出少林寺檔案中某一人物相關(guān)信息,并以可視化的形式來分析和表示人物之間的關(guān)系。人物知識圖譜可謂是目前研究少林寺僧人間的繁雜關(guān)系最便利、效果最好的手段之一。人物知識圖譜的核心表示對象是角色和關(guān)系,利用人物知識圖譜顯示寺僧間的師徒關(guān)系、宗親關(guān)系,也可應用于某一少林寺名人的專題檔案中,顯示該人物的地緣關(guān)系和業(yè)緣關(guān)系。

4 基于云計算、數(shù)字人文倉儲等技術(shù)的少林寺檔案利用

少林寺建于北魏太和十九年,但是少林武術(shù)源于何時學界還沒有統(tǒng)一的定論[20]。雖然沒有確切的說法,但少林寺文化源遠流長,尤其在唐朝達到了繁榮時期,至今已有千年歷史。在這悠久的歷史長河中,少林文化逐步享譽世界,并且形成了眾多少林寺檔案文獻,主要有五類:第一類是少林武術(shù)文獻,比如明代的《少林棍法禪宗》、《少林拳棒槍刀譜》等拳棍刀槍譜類以及《少林拳術(shù)秘錄》、《拳經(jīng)拳法備要》等拳譜;第二類是古代少林寺在日常活動中形成的檔案文獻,比如講經(jīng)、傳道、朝覲、布施、法事等記錄性文書以及農(nóng)業(yè)生產(chǎn)、田產(chǎn)契約、戒律守則等內(nèi)、外部管理檔案;第三類是實物檔案,比如金石、碑碣以及法器、供器、飾品等,尤其在碑刻方面,少林寺寺內(nèi)外碑銘繁多;第四類是醫(yī)藥檔案,少林科技文化中最重要的是少林醫(yī)藥文化,自五代十國起少林傷科得到發(fā)展再到明清時期的繁榮,少林醫(yī)藥經(jīng)過千余年的發(fā)展形成了類型豐富的少林醫(yī)藥秘術(shù)檔案;第五類是新中國建國之后少林寺形成的檔案,包括文書檔案、會計檔案、基建檔案等業(yè)務檔案以及旅游接待、對外交流等檔案文獻。可以看出,少林寺形成的檔案文獻種類數(shù)量豐富,但是由于天災、戰(zhàn)亂以及人為等種種原因,少林寺檔案文獻已經(jīng)散落于各地,給查找利用少林寺檔案文獻帶來很大阻礙。云計算、大數(shù)據(jù)、數(shù)字人文倉儲等信息技術(shù)的逐漸成熟給少林寺檔案的利用提供了新的手段。

運用云計算、數(shù)字人文倉儲技術(shù)利用少林寺檔案,即建立少林寺特色資源庫。首先要對各類少林寺檔案文獻進行數(shù)字化,對于紙質(zhì)檔案文獻以及實物檔案可以利用復印、拓印、三維激光掃描等手段,將其形態(tài)進行轉(zhuǎn)化,再依據(jù)國家古籍保護中心編制的《古籍數(shù)字化工作手冊》及其他規(guī)定為依據(jù),對少林寺檔案文獻進行數(shù)字化處理。

其次,利用“云計算”、“大數(shù)據(jù)”等信息技術(shù),建設大型少林寺特色檔案文獻庫。少林寺在國內(nèi)有大量下院,在國外有200多個文化交流中心,形成了少林文化圈,其檔案也應包括少林文化圈檔案,因此讓全國乃至世界各地的博物館、檔案館、文化交流中心、其他寺廟以及個人通過身份認證后,將所擁有的與少林寺有關(guān)的文獻資料上傳至文獻庫中,將有關(guān)的數(shù)字檔案文獻集中管理,共同建設少林寺文獻資源庫,形成我國文化特色,為弘揚少林寺傳統(tǒng)文化以及學者研究提供便利。

最后,利用數(shù)字人文倉儲技術(shù)在這一文獻庫中,建立各種不同主題的小型少林寺檔案文獻資源庫?!皵?shù)字人文倉儲”是將“數(shù)字人文”和“數(shù)字倉儲”兩個概念融合在一起產(chǎn)生的一個新的領(lǐng)域,是“數(shù)字倉儲”技術(shù)應用于數(shù)字人文項目、人文社科領(lǐng)域研究的一種新方式。概念創(chuàng)始人Inmom WH認為“數(shù)字倉儲”面向的數(shù)字資源具有一定主題的、集成的、穩(wěn)定的、能夠不斷更新等特點,支持對數(shù)字資源進行保存、管理和訪問等操作的綜合性系統(tǒng)[21]。在少林寺檔案中,從武術(shù)方面上分為“拳棍刀槍譜”、“拳法”“功法圖籍”三類;在日常事務中,古代少林寺將其分為六類,有禪堂、生產(chǎn)、招待、庫房銀錢、日常事務、飲食等;在旅游接待檔案中,有少林寺宣傳文件、旅游接待情況統(tǒng)計、旅游路線設計、旅游項目策劃等;在對外交流中,分為國內(nèi)和國外以及在此過程中產(chǎn)生的各種材料,比如預算審核表、出境申請、研討會材料等。少林寺檔案種類繁多、數(shù)量豐富,因此可以按照不同主題對少林寺檔案進行分類以建立不同主題檔案文獻庫。

根據(jù)數(shù)字倉儲的設計思想和主要功能,本文設計的小型少林寺主題檔案倉儲由3層架構(gòu)組成,依次為存儲層、業(yè)務邏輯層和服務層,體系結(jié)構(gòu)如圖2所示。

圖2 少林寺檔案數(shù)字倉儲體系架構(gòu)圖

(1)存儲層

存儲層主要功能是保存數(shù)據(jù)以及對數(shù)據(jù)進行讀、寫、刪、增等各種處理,數(shù)據(jù)包括數(shù)據(jù)流及其元數(shù)據(jù)文件。因為數(shù)字人文倉儲保存的資源是有一定相同主題的,因而這個倉儲是圍繞某個特定的研究對象來建立的,這個特定主題稱為“人文實體”。具體到少林寺歷史檔案倉儲中,其保存的數(shù)字資源主要包括某武術(shù)、經(jīng)濟、人物等主題的全部檔案資料,比如掃描后的原始文件圖像、加工后的數(shù)字化檔案、3D建模后的石碑檔案等。

(2)業(yè)務邏輯層

業(yè)務邏輯層分為處理子系統(tǒng)、內(nèi)容管理子系統(tǒng)和知識組織子系統(tǒng)三個部分。處理子系統(tǒng)包括人文領(lǐng)域本體建模、人文實體數(shù)字化采集與歸檔。內(nèi)容管理子系統(tǒng)包括信息資源導入和知識組織。知識組織子系統(tǒng)負責將導入的資源進行標注和轉(zhuǎn)換為通用的元數(shù)據(jù)模型。

(3) 服務層

服務層指的是多維度聚合服務。在今后發(fā)展中,此倉儲不僅融合了少林寺檔案,更包括與該人文實體有關(guān)的圖書、文物、影視資料、圖譜和其他文獻等實體,通過二維掃描設備進行紙質(zhì)文獻掃描、通過三維設備進行石碑、實物等立體數(shù)字掃描、通過音頻信息技術(shù)進行歌曲、影視等信息的數(shù)字化采集。各類數(shù)字化采集成果根據(jù)需要進行格式轉(zhuǎn)換,基于人文實體進行標注后歸檔保存到數(shù)字倉儲的服務層中,這些資料補充了特定人文實體檔案的匱乏,后續(xù)可以為用戶提供多維度信息服務,滿足用戶多方面、深層次的信息需求。

5 結(jié)語

總的來說,信息時代為少林寺檔案的開發(fā)利用工作帶了三個方面的影響:首先是內(nèi)容挖掘方面,可利用LDA模型自動抽取文本主題;其次是內(nèi)容展示方面,利用相關(guān)可視化技術(shù)使少林寺檔案主題、時空、武術(shù)動作和人物關(guān)系可視化;最后是內(nèi)容利用方面,利用云計算、數(shù)字人文倉儲,生成多維度聚合服務,滿足用戶深層次、多方面的信息需要。信息技術(shù)使少林寺檔案資源的整理和開發(fā)方式趨于多元化,有利于檔案部門開發(fā)利用檔案中的信息內(nèi)容,而不單單是關(guān)注檔案實體的收集和管理。

信息技術(shù)在其他領(lǐng)域發(fā)展較為成熟,但應用于少林寺檔案中,具體的開發(fā)項目和平臺較少。由于新技術(shù)的不斷更迭和逐漸成熟以及檔案復合型人才較為匱乏,本文提出的技術(shù)方案目前實現(xiàn)較為困難,但是從理論上研究具體技術(shù)特點,提出相應的方案藍圖是具備現(xiàn)實意義的。檔案學者及有關(guān)人員只有把握好當前時機,積極研究和勇于實踐,才有可能在不斷發(fā)展的未來占領(lǐng)先機。

猜你喜歡
少林寺少林可視化
宋 文彥博 楷書宿少林寺詩拓片
中國書法(2023年2期)2023-07-17 09:29:56
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
少林小羅漢拳(十)
少林與太極(2020年3期)2020-07-14 08:41:21
基于CGAL和OpenGL的海底地形三維可視化
少林小羅漢拳茵(四)
少林與太極(2019年8期)2019-10-08 05:40:55
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
A transition method based on Bezier curve for trajectory planning in cartesian space①
少林寺與政治的千年恩怨
齊魯周刊(2015年31期)2015-08-19 09:46:05
我要去少林寺
短篇小說(2014年12期)2014-02-27 08:32:53
英德市| 永城市| 平塘县| 辛集市| 乌拉特后旗| 徐汇区| 托克托县| 察隅县| 晋江市| 延长县| 合肥市| 通渭县| 屏南县| 邵东县| 东方市| 曲沃县| 来安县| 临海市| 广德县| 京山县| 临朐县| 招远市| 乌拉特后旗| 建平县| 张家口市| 大庆市| 关岭| 泽普县| 定远县| 深州市| 敦煌市| 岑巩县| 华安县| 富蕴县| 鄱阳县| 秦皇岛市| 开平市| 红原县| 富宁县| 罗江县| 宜昌市|