任天琪+崔杰
摘 要:摘 要:檔案事由元數(shù)據(jù)描述了事件的特征及背景信息,是檔案元數(shù)據(jù)核心集的重要組成部分。通過E—R模型構(gòu)建的事由元數(shù)據(jù)模型,從中分析出事由實(shí)體元數(shù)據(jù)的組成,及事由聯(lián)系元數(shù)據(jù)之間的關(guān)系。事由元數(shù)據(jù)模型的構(gòu)建為檔案元數(shù)據(jù)核心集系統(tǒng)提供了事由方面的數(shù)據(jù)設(shè)計框架,使系統(tǒng)在再現(xiàn)社會歷史面貌、構(gòu)建全宗群、提高檔案檢索利用效率方面具有廣泛的應(yīng)用價值。
關(guān)鍵詞:事由實(shí)體元數(shù)據(jù);事由聯(lián)系元數(shù)據(jù);全宗群
Abstract:The subjectmetadata describes the characteristics and background information of events, and is an important component of the archives metadata core set. In this paper, the model of subject metadata is constructed by E - R model. The writer analysises the composition of the subject-entity metadatal, and the relationship between the subject-relation metadata. The model of subject metadata provides a data frame design causes for Archives Metadata Core Set.It has wide application value inthe reproduction of social history, the construction of fonds group, and improving efficiency of retrieval.
Keywords:Subject-Entity metadata ; Subject-Relation metadata; Fonds group
本文是教育部人文社會科學(xué)研究項目《“魂系歷史主義”的檔案元數(shù)據(jù)核心集的構(gòu)建研究》(編號批準(zhǔn)號:15YJC870007)的延伸研究。在研究項目中,我們根據(jù)劉新安教授和伍振華教授提出的“檔案歷史聯(lián)系與歷史的同構(gòu)性”的檔案本質(zhì)[1],構(gòu)建了檔案元數(shù)據(jù)核心集。在核心集中包含了來源、事由和年代三大元數(shù)據(jù)模型。本文以事件為研究對象,利用“事件六元組”和實(shí)體—聯(lián)系(E—R)模型,對事由元數(shù)據(jù)模型進(jìn)行分析研究,從事件中提取出事由實(shí)體元數(shù)據(jù),并建立元數(shù)據(jù)之間的聯(lián)系,形成事由聯(lián)系元數(shù)據(jù),以完成檔案元數(shù)據(jù)核心集對事件的完整記錄。
1檔案元數(shù)據(jù)核心集中事由元數(shù)據(jù)模型的構(gòu)建
檔案元數(shù)據(jù)核心集是對檔案歷史聯(lián)系要素(來源、事由和年代)的本體特征及要素之間的關(guān)系進(jìn)行結(jié)構(gòu)化的詳盡描述。其中,事由要素的特征和事由之間的關(guān)系,相對于來源的三層次結(jié)構(gòu)和年代的線性結(jié)構(gòu)要復(fù)雜得多。首先,事由元數(shù)據(jù)模型中要素及其關(guān)系并不是凌亂地排列的,它是以網(wǎng)絡(luò)的形式有序存在的。通過圖1我們可以看出,檔案事由元數(shù)據(jù)模型是三維網(wǎng)絡(luò)結(jié)構(gòu),這種結(jié)構(gòu)在“事由”的體現(xiàn)上更加明顯。圖中的N0—N9是網(wǎng)絡(luò)中的節(jié)點(diǎn),它表示一個特征事件,網(wǎng)絡(luò)中邊代表事件間的關(guān)系,邊的權(quán)重體現(xiàn)事件間的關(guān)系強(qiáng)度。其次,事由元數(shù)據(jù)模型不但可以完整地描述事件的本體特征信息,而且還可以將事件間的關(guān)聯(lián)信息準(zhǔn)確地揭示出來。那么,模型是如何運(yùn)作來揭示檔案之間的事由聯(lián)系的?或者說,網(wǎng)絡(luò)中的點(diǎn)和線是如何排列連接,才能準(zhǔn)確完整地描述出一個整體事件呢?
圖1檔案事由元數(shù)據(jù)網(wǎng)狀模型示意圖
從圖1中,我們可以了解到事由元數(shù)據(jù)包括事由實(shí)體元數(shù)據(jù)和事由聯(lián)系元數(shù)據(jù)。事由實(shí)體元數(shù)據(jù)就是圖1中“點(diǎn)”。在本體研究領(lǐng)域,事件被認(rèn)為是在某個特定時間和環(huán)境下發(fā)生的、由若干角色參與、表現(xiàn)出若干動作特征的一件事情。“形式上,事件可表示為e,定義為一個六元組:e=。其中,A為動作要素,表示事件的變化過程及其特征,是對動作的程度、方式、方法等的描述;O為對象要素,包括參與事件的所有角色;T為時間要素,表示事件發(fā)生的時間段,從事件發(fā)生的起點(diǎn)到事件結(jié)束的終點(diǎn);V 為環(huán)境要素,表示事件發(fā)生的場所及其環(huán)境特征;P為斷言要素,包括事件發(fā)生的前置斷言、中間斷言以及后置斷言,分別描述事件的開始、過程與結(jié)束;L為語言表現(xiàn)要素,表示事件的語言規(guī)律,包括核心詞集、核心詞表現(xiàn)、核心詞搭配等。”[2]那么,這六要素即為事件實(shí)體的六大特征,通過這六個特征來提取事由實(shí)體元數(shù)據(jù)。事由聯(lián)系元數(shù)據(jù)是通過建立事由實(shí)體元數(shù)據(jù)之間的聯(lián)系,來揭示隱藏在事件內(nèi)部的聯(lián)系,以及事件與事件之間的聯(lián)系,是對圖1中“線”的描述。我們可以運(yùn)用E-R模型對圖1進(jìn)行一個更為直觀的解剖。
圖2 事由元數(shù)據(jù)E-R模型示意圖
2“事由實(shí)體元數(shù)據(jù)”的提取
事由即事件,事由實(shí)體元數(shù)據(jù)即是對社會實(shí)踐活動(事件)各種要素的具體描述。依據(jù)事件的六個特征,結(jié)合“事由原則”記錄事件的方法、順序,我們所提取的事由實(shí)體元數(shù)據(jù)是從單一事件中獲得的。其中,O、T、V三個要素是顯而易見的,即有確定值,直接從事件中提取即可;A、P、L三個要素則少有確定值,多為敘述性語言,即需要著錄者對事件要素進(jìn)行語言描述。這組元數(shù)據(jù)中的一部分與傳統(tǒng)著錄項一致,另一部分是傳統(tǒng)著錄中沒有體現(xiàn)的,但是,是建立事由聯(lián)系的關(guān)鍵元數(shù)據(jù)。可以用二維表格(表1)的形式表示,其中元數(shù)據(jù)取值類型分為字符型、日期型和數(shù)值型三類,用M/C將事由元數(shù)據(jù)分為必選事件元數(shù)據(jù)(M)、可選事件元數(shù)據(jù)(C)。
根據(jù)人們對事件的認(rèn)識習(xí)慣,檔案工作者可以按照語言表現(xiàn)要素(L)、對象要素(O)、時間要素(T)、環(huán)境要素(V)、動作要素(A)、斷言要素(P)這一順序進(jìn)行著錄。
表1事由實(shí)體元數(shù)據(jù)
2.1語言表現(xiàn)要素(L)實(shí)體元數(shù)據(jù)。對“事件名稱”“事件代碼”“關(guān)鍵詞”的著錄,是對事件的語言表現(xiàn)要素L的著錄?!笆录a”由組織機(jī)構(gòu)代碼(統(tǒng)一社會信用代碼)[3]—事件發(fā)生年月—事件發(fā)生順序號三個部分組成。例如“敦煌壁畫藝術(shù)精品高校公益巡展——天津城建大學(xué)站”在2016年10月舉行,那么事件代碼就是“1212 0000 401359292 M—201610—01”?!瓣P(guān)鍵詞”是對事件進(jìn)行精煉的一組詞語,為可擴(kuò)展元數(shù)據(jù),可以是一個,也可以是多個。在著錄時為“關(guān)鍵詞1”“關(guān)鍵詞2”(注:之后出現(xiàn)的可擴(kuò)展元數(shù)據(jù),均以此類推。)……比如“敦煌”“高校”“公益巡展”“天津城建大學(xué)”。
2.2對象要素(O)實(shí)體元數(shù)據(jù)。對“參與的組織機(jī)構(gòu)”“組織機(jī)構(gòu)代碼”“參與的部門”“部門代碼”“參與的個人”“公民身份證號碼”的著錄,是對事件的對象要素O的著錄。因為對象要素是事件的全部參與者,可能是某一機(jī)構(gòu)、機(jī)構(gòu)中的部門,或者是機(jī)構(gòu)中的某個人。對象要素的取值規(guī)則可以參考《基于來源的組織機(jī)構(gòu)元數(shù)據(jù)構(gòu)建研究——以天津外國語大學(xué)為例》[4]論文中對“組織機(jī)構(gòu)、部門、個人”的取值規(guī)則。
2.3時間要素(T)實(shí)體元數(shù)據(jù)。對“事件起始時間”“事件結(jié)束時間”“事件持續(xù)時間”“事件關(guān)鍵時間節(jié)點(diǎn)”的著錄,是對事件的時間要素T的著錄。三個日期型元數(shù)據(jù)取值規(guī)則以八位時間數(shù)字表示,“事件持續(xù)時間”按數(shù)值型取值。比如活動時間起始時間為2016年10月27日,結(jié)束時間是2016年11月27日,中間持續(xù)31天。那么,“事件起始時間”為20161027,“事件結(jié)束時間”為20161127,“事件持續(xù)時間”為31?!笆录P(guān)鍵時間節(jié)點(diǎn)”是指在事件發(fā)展過程中的關(guān)鍵節(jié)點(diǎn),為可擴(kuò)展元數(shù)據(jù)。比如在建設(shè)項目中,會有項目的審批時間、開工時間、竣工時間、某一關(guān)鍵點(diǎn)的時間(如水泥澆筑時間)等。
2.4環(huán)境要素(V)實(shí)體元數(shù)據(jù)。對“事件發(fā)生地點(diǎn)”“地址代碼”“坐標(biāo)”“環(huán)境特征”的著錄,是對事件的環(huán)境要素V的著錄,主要是對發(fā)生地點(diǎn)的描述。當(dāng)事件發(fā)生地有具體地址的,比如某建設(shè)項目,則“事件發(fā)生地點(diǎn)”填寫具體地址,并根據(jù)GB/T2260-2007[5]和GB/T10114-2003[6]填寫“地址代碼”。當(dāng)事件發(fā)生地沒有具體地址時,比如科研項目中需要采集地礦標(biāo)本,地點(diǎn)沒有具體的地址,那么,只能對“事件發(fā)生地點(diǎn)”給出確定的省界,然后根據(jù)測量給出“坐標(biāo)”,并對“環(huán)境特征”進(jìn)行文字描述。
2.5動作要素(A)實(shí)體元數(shù)據(jù)。對“動詞摘要”“文件類型”的著錄,是對事件的動作要素A的著錄,兩個元數(shù)據(jù)均為可擴(kuò)展元數(shù)據(jù)?!皠釉~摘要”是指“表彰”“處分”“任職”“免職”“成立”“調(diào)整”“撤銷”等動作的描述。“文件類型”在文件實(shí)體中表現(xiàn)為“通知”“報告”“決定”“請示”“批復(fù)”“函”“申請”“意見”等。
2.6斷言要素(P)實(shí)體元數(shù)據(jù)。對“文件題名”“文號”“撰文原因”“領(lǐng)導(dǎo)批示”“處理結(jié)果”的著錄,是對事件斷言要素P的著錄,表示事件的主要內(nèi)容。其中“文件題名”“文號”是確定值,“撰文原因”“領(lǐng)導(dǎo)批示”“處理結(jié)果”為描述性文字。
3“事由聯(lián)系元數(shù)據(jù)”的建立
檔案對于事件的記錄過程是一環(huán)扣一環(huán)的,根據(jù)人們認(rèn)識事物的順序,由小到大揭露事件的背景及全過程。所以,“事由聯(lián)系元數(shù)據(jù)”包括了事件內(nèi)部之間、事件與事件之間兩種類型的聯(lián)系。它與事由實(shí)體元數(shù)據(jù)共同對檔案中涉及的活動或事件進(jìn)行描述。
3.1事由之間的內(nèi)在聯(lián)系。對于一件事情來說,小到一個案卷中的文件就可以說明,比如“天津城建大學(xué)綜合體育館工程項目竣工報告”,這一個文件就說明了一件事情,即體育館工程竣工。而相對復(fù)雜的事情,每個文件即一件事情的節(jié)點(diǎn),將文件按照事件的實(shí)際發(fā)展過程進(jìn)行排序,將事件和事件的過程記錄下來,以實(shí)現(xiàn)檔案“以物記事”的功能,即“一事一卷”。我們在立卷的過程中,可以根據(jù)事由實(shí)體元數(shù)據(jù)的時間要素(T)、斷言要素(P)、語言表現(xiàn)要素(L)之間的關(guān)系,將描述相同事件的文件聯(lián)系起來,最終形成能夠描述事件完整過程的案卷,或?qū)n}全宗。
事由實(shí)體元數(shù)據(jù)在對單一事件進(jìn)行著錄時,通常是按照事件發(fā)生的實(shí)際進(jìn)度著錄的,也就是按照時間順序(T)來著錄。就如上文提到“天津城建大學(xué)綜合體育館工程項目竣工報告”,在它之前要有項目的審批文件、相關(guān)的招投標(biāo)文件、合同等前期資料,還有與之相關(guān)的施工文件、竣工文件、圖紙等。這些文件按照時間順序進(jìn)行排列整理,就得到了關(guān)于天津城建大學(xué)綜合體育館工程項目的完整案卷材料。在工程施工的過程中,初步設(shè)計圖紙會根據(jù)實(shí)際情況進(jìn)行變更,產(chǎn)生的變更圖紙根據(jù)事由之間的邏輯關(guān)系(P),追加在初步設(shè)計圖紙之后。
對于全宗來說,則是在一個大背景下,對同一類檔案的集中整理。比如在天津城建檔案館中,天津城建大學(xué)綜合體育館工程項目、天津工業(yè)大學(xué)的場館建設(shè)項目、天津農(nóng)學(xué)院的場館建設(shè)項目等一系列場館建設(shè)工程項目檔案都會集中到這里,這些場館都是為全國第十三屆運(yùn)動會(以下簡稱“全運(yùn)會”)比賽服務(wù)的。那么,我們可以將這些項目檔案進(jìn)行集中整理,形成“全運(yùn)會場館項目檔案全宗”這一客體全宗。
由此可見,事由之間的內(nèi)在聯(lián)系是在具體的社會實(shí)踐活動過程中產(chǎn)生的,是描述同一件事情的檔案間的聯(lián)系。它是對一項具體的社會實(shí)踐活動的完整記錄,可以將按照來源關(guān)系整理而被割裂的事件關(guān)聯(lián)起來,對事件的整體過程加以還原。
3.2事由之間的外在聯(lián)系——背景關(guān)系?!霸谏鐣顒又?,任何事件都不能憑空發(fā)生,是有背景和原因的。而案卷只是記錄了一個個孤立的事件,雖然保證了一個具體事件的完整性,但是事件的背景并沒有被記錄下來。換句話說,每件事情的案卷內(nèi)關(guān)于事件發(fā)生背景的文字內(nèi)容不能作為此事件的背景?!盵7]簡單來說,案卷內(nèi)文件不能自證其所記錄事件的背景。所以單純地以事立卷并無法揭示事件背景。如何通過事由聯(lián)系來揭示事件的背景呢?“從社會實(shí)踐活動過程看,事件的背景和原因有可能是另一件事情,或者是另幾件事情。人們在認(rèn)識客觀事件時,通常將一件事孤立起來認(rèn)識,而這件事件之外的事情暫時不去研究,這樣便于將主要事件的來龍去脈了解清晰。但并不是說要扭斷主要事件與其他事件之間的客觀聯(lián)系,只是其他事件暫時推后,而這些被推后的事件就成為主要事件的背景?!录谋尘熬褪沁@樣在我們認(rèn)識客觀歷史的過程中形成的?!盵8]endprint
從檔案整理實(shí)踐角度看,檔案室在接收案卷后,會根據(jù)來源原則,對案卷進(jìn)行分類整理,所有案卷最終匯聚成一個單位的全宗(主體全宗)。全宗內(nèi)的案卷“有機(jī)地構(gòu)成了一個更大的事件,形成一個單位的全部歷史”。[9]我們可以認(rèn)為,全宗就是全宗內(nèi)任何一個孤立事件的大背景,全宗內(nèi)某一個孤立事件與其他事件之間有背景關(guān)系。當(dāng)主體全宗被移交至檔案館,檔案館可以按照檔案間的事由聯(lián)系,建立客體全宗,或全宗群??腕w全宗或全宗群中的檔案之間,也存在著相應(yīng)的背景關(guān)系。
舉個簡單的例子,某企業(yè)和某大學(xué)分別制發(fā)的關(guān)于廉潔文化宣傳教育的文件,前者為“宣傳企業(yè)文化”,后者為“樹立良好的師德風(fēng)范”,從標(biāo)題上看兩個文件并非同一件事,但是內(nèi)容性質(zhì)是相同的,都是在廉潔文化宣教背景下形成的文件,所以是具有相同背景聯(lián)系的。從上面的例子,我們可以看出兩個單位的檔案室分別可以按照“企業(yè)文化”和“師德風(fēng)范”的事由進(jìn)行立卷歸檔。在將這部分檔案移交至檔案館后,檔案館可以按照“廉潔文化宣傳教育”這一事由,建立一個客體全宗,全宗內(nèi)的檔案則可互為背景。
對于檔案形成的最大實(shí)體——全宗群來說,是對事件及其背景的整體描述,是將多個獨(dú)立的小事件按照一定的聯(lián)系排列起來的。比如全運(yùn)會即將在天津舉行,從運(yùn)動會的前期準(zhǔn)備、運(yùn)動會比賽期間的活動到運(yùn)動會閉幕這一全過程將建立起“全國第十三屆運(yùn)動會檔案全宗群”。在這個全宗群中會包括天津城建檔案館的“全運(yùn)會場館建設(shè)項目全宗”。
我們可以根據(jù)事由實(shí)體元數(shù)據(jù)中的對象要素(O)、動作要素(A)、斷言要素(P)、語言表現(xiàn)要素(L)來構(gòu)建全宗或者全宗群,以建立事由之間的背景關(guān)系。由此可見,從案卷到全宗、全宗群的過程,檔案不僅記錄了具體事件的全過程,也對事件的背景進(jìn)行了完整的記錄。
4事由元數(shù)據(jù)模型的功能
4.1真實(shí)、完整地再現(xiàn)社會歷史的面貌。事由元數(shù)據(jù)模型的主要功能是以事件的角度記錄社會歷史。將同一事由形成的文件排列在一起,可以客觀地反映出事件發(fā)生、發(fā)展、結(jié)束的全過程。單一事由記錄了社會中的一個事件;而多個事由匯總在一起,則記錄了更大背景的社會歷史。它不僅為研究者提供了完整的事件記錄,還可以解釋事件背后的景色。
4.2形成更高級的檔案物質(zhì)形態(tài)——全宗群。全宗群是非常重要的檔案現(xiàn)象和客觀事實(shí),是同構(gòu)性檔案本質(zhì)觀點(diǎn)的集中體現(xiàn)。它可以進(jìn)行多維整理,既不像“案卷”只能按“事由”,也不像“全宗”只能按主體意義上的“來源”整理。[10]它拋開了檔案的物質(zhì)實(shí)體,根據(jù)檔案元數(shù)據(jù)核心集中來源、事由、年代元數(shù)據(jù)之間的特征和聯(lián)系,對檔案進(jìn)行整理。全宗群的這種檔案組織方法和方式更加靈活多樣,完全符合“具體情況具體分析”和歷史主義的基本要求。[11]全宗群的出現(xiàn),不僅保持了全宗之間檔案的歷史聯(lián)系,更維護(hù)了同類檔案的不可分散性。
4.3提高檔案的查全率和查準(zhǔn)率。事由元數(shù)據(jù)模型可以將同一事由的相關(guān)文件按照事由原則集中在一起,這樣可以彌補(bǔ)因在檔案實(shí)體整理過程中,只能按照來源原則整理檔案的不足。它將隔斷的具有事由聯(lián)系的檔案文件匯總在一起,在查閱這一事由的有關(guān)文件時,就可以直接查找到全部文件,從而提高查全率;在集中的相關(guān)文件中查找某份文件的概率也就增大,也就提高了文件的查準(zhǔn)率。
參考文獻(xiàn):
[1]劉新安,伍振華,崔杰.檔案歷史聯(lián)系與歷史的同構(gòu)性:一個新的檔案本質(zhì)觀點(diǎn)[J].檔案學(xué)通訊,2016(6).4.
[2]張旭潔.事件本體構(gòu)建中幾個關(guān)鍵問題的研究[D].上海大學(xué),2012.52.
[3]全國組織機(jī)構(gòu)代碼管理中心.GB/T 16987-2002 組織機(jī)構(gòu)代碼信息數(shù)據(jù)庫(基本庫)數(shù)據(jù)格式[S].北京:中國標(biāo)準(zhǔn)出版社,2002.2.
[4]崔杰,楊文剛,田偉.基于來源的組織機(jī)構(gòu)元數(shù)據(jù)構(gòu)建研究——以天津外國語大學(xué)為例[J].檔案管理,2017(1),34.
[5]中國標(biāo)準(zhǔn)化研究院,民政部區(qū)劃地名司.GB/T2260-2007 中華人民共和國行政區(qū)劃代碼[S].北京:中國標(biāo)準(zhǔn)出版社,2008.2.
[6]中國標(biāo)準(zhǔn)化研究院,民政部區(qū)劃地名司,遼寧省標(biāo)準(zhǔn)研究院. GB/T10114-2003縣以下行政區(qū)劃代碼編制規(guī)則[S].中國標(biāo)準(zhǔn)出版社,2003.12.
[7][8]劉新安,檔案記錄事件背景的方法[J].北京檔案,2000(11).25.
[9]劉新安,檔案記錄事件背景的方法[J].北京檔案,2000(11).27.
[10][11]伍振華,張園園,黃小萍.同構(gòu)性檔案本質(zhì)觀點(diǎn)的尋根——對《檔案管理學(xué)》“全宗群”等論述的解讀[J].檔案學(xué)通訊,2017(2):29.
(作者單位:任天琪,天津城建大學(xué);崔杰,天津外國語大學(xué) 來稿日期:2017-09-05)endprint