曹 畋,張 婧
(南京曉莊學院,江蘇 南京 210017)
本圖書館內“張仲樵民間音樂特藏室”現(xiàn)存的音樂特藏資源,包括民間音樂藏書3 500余冊,其中部分為清代及民國善本,20世紀60年代至今的音樂視頻及錄音資料千余小時,民國音樂手抄本300余本,手稿筆記67本,珍貴唱片及開盤帶350余盤。珍貴的特藏是研究江蘇民間音樂的“諾亞方舟”。
目前,很多圖書館和大學都開發(fā)了特色音樂資源庫。例如:英國牛津大學建設的牛津格羅夫藝術在線數據庫(Oxford Music Online)。又如:哈佛大學音樂圖書館、丹麥在線音樂研究圖書館、加利福尼亞大學音樂圖書館、哥倫比亞大學音樂與藝術圖書館……都建設了自己的音樂特色資源庫,但國內在音樂特藏數據庫設計上還有差距[1]。
筆者主要基于“張仲樵民間音樂特藏”內容形式,對張仲樵音樂數據庫建設的內容需求和功能需求兩個方面進行分析。具體內容是對本次開發(fā)的張仲樵音樂數據庫所涵蓋的資源的數據特點進行分析,以及對資源庫在各方面使用者的功能需求方面進行分析。
通過對“張仲樵民間音樂特藏室”中現(xiàn)有江蘇民間音樂資源的整理發(fā)現(xiàn),可輸入的基礎數據具有跨越多個時期,多種跨數據類型,數據載體多樣等特點。江蘇民間音樂源遠流長,現(xiàn)有的數據并非某一特定歷史時期內的民間音樂,而是涉及不同時期,不同風格的數據?,F(xiàn)有數據包含音頻、圖片、視頻及文字信息,數據類型跨越了多種不同的數據類別?,F(xiàn)有數據還涉及光盤、錄影帶、唱片、錄像帶、筆記、古譜等多種載體記錄形式[2]。
根據特藏的特點,張仲樵音樂數據庫的數據體系中包括基本數據和相關數據兩大類?;緮祿ǎ航K民間音樂視頻,江蘇民間音樂音頻,江蘇民間音樂照片,江蘇民間音樂分類信息等。相關數據包括:使用信息、實物信息、歷史信息、地理信息、法規(guī)信息等。實物信息主要以音頻、圖片或視頻的形式來展示江蘇民間音樂的數據。使用信息,主要包括江蘇民間音樂資源使用情況,江蘇民間音樂的網絡瀏覽量、下載傳播情況信息以及用戶的反饋情況等。實物信息,主要是指實際館藏物本身具有的物理信息。歷史信息,主要為文字描述或者圖片信息中包括了江蘇民間音樂的起源、歷史發(fā)展、文獻、調查研究報告一類的數據。地理信息,是指根據江蘇民間音樂的種類在地理上繪制的相關江蘇民間音樂的地域分布及發(fā)展情況。法規(guī)信息,主要有江蘇民間音樂的保護級別、調查記錄、保護范圍、鑒定文書、保護機構等信息[3]。
基于輸入數據特點和系統(tǒng)性能保證方面的考慮,對數據運行時的需求做以下方面的分析。①張仲樵音樂數據庫的數據庫容量分析。數據中包含大量的視頻文件,而視頻文件比較占用存儲空間,經測算目前在經過適當壓縮處理的情況下,每小時的視頻仍然需要600M以上的數據庫存儲空間。因此,需要為視頻文件預留足夠的存儲空間。②海量非結構化數據的分析。張仲樵音樂數據庫的原始數據來自多種渠道和多種采集方式,因此數據來源類型多樣。抄本、音頻、視頻、古籍等多樣化的異構數據源,讓江蘇民間音樂數據庫呈現(xiàn)非結構化的特征。針對異構的數據格式和來源,需要利用元數據的概念,元數據包括有關數據和元數據則,元數據中可以表明數據的類型和基本信息,本數據庫中即媒體編碼類型、媒體類型等信息,而元數據則一般和數據本身無關,本數據庫中如:照片拍攝所在位置信息,聲音特性等內容,這些必須到數據中去提取,因此,元數據的提取需要根據不同的數據進行不同的區(qū)分,需具體情況具體分析[4]。
通過對張仲樵音樂數據庫功能的調研和歸納總結,確定了以下基本功能。
3.2.1 檢索功能。需要對不同類型,不同時期,不同階段的江蘇民間音樂資料信息進行實時檢索查詢,便于檢索結果的二次檢索和保存。
3.2.2 溝通功能。平臺用戶在需要時可以通過資源平臺和平臺上的其他用戶溝通,也能和平臺的管理員取得聯(lián)系和進行溝通。
3.2.3 推廣功能。通過平臺不但可以在線查詢和觀看相關圖片、視頻和文字內容,欣賞音頻文件,還可將喜歡的內容通過多種新媒體對江蘇民間音樂進行轉發(fā)推廣,便于通過社交平臺傳播。
3.2.4 權限管理功能。除代碼層面的安全性,還需要資源庫從權限分配的角度控制平臺的安全性。例如:已經上傳到資源庫的共享資源,不能由用戶隨意刪除和編輯,如果需要進行修改和刪除的操作必須聯(lián)系管理員進行。
另外,張仲樵音樂數據庫還需要考慮系統(tǒng)未來的擴容和功能可擴展性需求。
張仲樵音樂數據庫的系統(tǒng)架構是基于流行的瀏覽器/服務器(Browser/Server,B/S)的網絡服務架構。該音樂資源服務平臺,不但要完成對音樂特藏中大量資源的數字化處理及結構化存儲,還需要對建立一個易于操作的人機接口,方便用戶進行特藏資源檢索,以及查找資源并易于模塊和功能的拓展。為此,總體需求需要滿足以下內容。
4.1.1 制定資源庫元數據標準對張仲樵音樂數據庫中的資源進行統(tǒng)一描述和封裝。當然,統(tǒng)一描述和封裝之前必須對江蘇民間音樂資源進行合理分類。結合各類中江蘇民間音樂的元數據的特點,為每個類別中的江蘇民間音樂資源設定元數據。由元數據統(tǒng)一描述數據的標準,定義數據加工格式、存放格式及分類等,從而實現(xiàn)所有張仲樵民間音樂特藏內資源都有合理的元數據標準,進而便于描述和封裝。
4.1.2 按照資源類別區(qū)分數據庫中的元數據屬性。根據張仲樵民間音樂特藏室中館藏的民間音樂資料的初步整理情況,對已整理的張仲樵民間音樂特藏資源進行數據庫的分類設定,讓設定的類別既能方便用戶查詢,又能有效區(qū)分數字化江蘇民間音樂資源的特征。通過對實際情況的考慮,初步按照資源類別來區(qū)分數據庫中的元數據屬性,如圖1所示。
圖1 張仲樵音樂數據庫資源的分類及元數據屬性
4.1.3 設計方便快捷的導航和檢索頁面。便于用戶進行多層次、多維度的張仲樵音樂庫的資料查詢和檢索。讓用戶能快速檢索,并以統(tǒng)一的格式呈現(xiàn)給用戶。
為確保張仲樵民間音樂特藏資源庫具有較好的可維護性和擴展性,張仲樵音樂數據庫采用了系統(tǒng)開發(fā)中流行的分層設計理念。系統(tǒng)架構使用了成熟的JSP+Apache+MySQL的架構,數據庫采用了世界著名的Oracle公司旗下的MySQL關系數據庫管理系統(tǒng)。整個系統(tǒng)從邏輯上可以分為表示層、數據層、數據持久層、業(yè)務邏輯層和數據層,具體如圖2所示。
圖2 張仲樵音樂數據庫展示系統(tǒng)分層架構
如圖2所示,從上到下,分別是表示層、業(yè)務邏輯層、數據持久層、數據層。表示層主要負責接收用戶在客戶端發(fā)出的請求數據,并負責將用戶發(fā)出的請求提交傳送到業(yè)務邏輯層處。業(yè)務邏輯層,接受表示層提交的數據后,自動調用對應的業(yè)務邏輯,從而處理相應的請求。業(yè)務邏輯所進行的操作,就是對數據持久層進行邏輯上的處理業(yè)務。數據持久層根據業(yè)務邏輯并獲取數據層中的數據,完成對數據層數據的處理,并把結果傳遞到表示層進行表示。數據層則根據業(yè)務邏輯層的指令完成對底層江蘇民間音樂資源文件數據庫進行讀、寫等操作,并利用JavaBean來封裝數據。這樣的結構增強了代碼的復用性,使得代碼更容易編寫、維護和使用。數據層位于系統(tǒng)底層,負責數據庫的處理,包括數據庫的操作及全文索引的建立。業(yè)務邏輯層也可直接從全文索引中獲取需要的數據,從而提升數據庫查詢檢索效率。
本次開發(fā)的張仲樵音樂數據庫,系統(tǒng)可劃分為門戶子系統(tǒng)和后臺子系統(tǒng)兩大板塊,張仲樵民間音樂特藏室中大量的江蘇民間音樂資源以及相應數據元標準是資源管理和開發(fā)的基石,張仲樵音樂數據庫為整個數據平臺的實現(xiàn)提供基礎的保障。
圖3 張仲樵音樂數據庫平臺功能框架
如圖3所示,張仲樵音樂數據庫的功能框架可分為系統(tǒng)服務層和基礎資源層兩部分。其中系統(tǒng)服務層又包括門戶子系統(tǒng)和后臺管理子系統(tǒng)。門戶子系統(tǒng)是江蘇民間音樂資源展示系統(tǒng)與用戶間交互的人機接口,是向用戶展示系統(tǒng)服務的窗口。通過門戶子系統(tǒng)不僅提供給了用戶全方位檢索音樂資源數據的入口,同時也可以很好地展示各種音樂資源。后臺管理子系統(tǒng)主要完成資源 分類管理、日志管理、高級檢索配置、用戶管理、資源條目管理、相似詞庫配置等。基礎資源層主要包括了張仲樵音樂數據庫音樂數據公共數據元的標準以及張仲樵音樂數據庫資源數據庫。
門戶子系統(tǒng)功能模塊可進一步劃分如圖4所示兩大模塊:用戶信息模塊以及全方位檢索模塊。其中用戶信息模塊包含兩個子模塊,分別為:賬號管理模塊和登錄、注冊模塊。檢索模塊為門戶子系統(tǒng)的核心模塊,負責所有系統(tǒng)資源的全方位檢索及資源信息查看功能,根據用戶需求,全方位檢索模塊包含4個子模塊,分別為:資源全局搜索模塊、資源高級搜索模塊、資源單類別查詢模塊以及詳細信息瀏覽模塊。
圖4 門戶子系統(tǒng)功能模塊
后臺管理子系統(tǒng)分為:資源分類管理,字段管理,高級檢索配置,資源條目管理,日志管理,用戶管理,相似詞庫配置,如圖5所示。
圖5 張仲樵音樂數據庫展示系統(tǒng)后臺管理功能模塊