關(guān)鍵詞: 口述歷史資源; 名人歷史事件; 語義模型; 知識表示
DOI:10.3969 / j.issn.1008-0821.2024.10.014
〔中圖分類號〕G254 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 10-0168-10
截至2022年底,中國各級綜合檔案館館藏錄音磁帶、錄像磁帶、影片檔案109 5 萬盤[1] , 口述歷史資源是其中重要組成部分, 是一種隨著現(xiàn)代技術(shù)快速發(fā)展的新興檔案資源, 內(nèi)容上具有以人物、事件和主題為中心的典型特征[2] 。隨著名人圖書館、名人檔案館、名人博物館等場館的建設(shè), 與名人相關(guān)的口述歷史資源發(fā)展迅猛, 由口述歷史資源析出的名人歷史事件, 其“自下而上” 研究歷史的新途徑, 受到了歷史、檔案、圖情領(lǐng)域的普遍重視[3] 。
事件是理解現(xiàn)實世界的基本知識單元之一, 主要分為通用事件和領(lǐng)域事件兩類。通用事件是指不具有顯著學科特征的一般事件; 領(lǐng)域事件是指某一具體領(lǐng)域的事件, 如突發(fā)事件、歷史事件、地理事件等。名人歷史事件是領(lǐng)域事件中一類重要事件,是理解名人及其所處社會歷史發(fā)展進程的基本知識單元之一。在社會發(fā)展的歷史進程中, 關(guān)鍵人物及與之關(guān)聯(lián)的重要事件所發(fā)揮的作用往往是決定性的。如何基于口述歷史資源對這類關(guān)鍵人物與歷史事件進行語義化識別、知識化抽取, 從而更加清晰地梳理其知識網(wǎng)絡(luò), 并對事件發(fā)展的輪廓和脈絡(luò)進行可視化和敘事化的知識表示, 是數(shù)字人文領(lǐng)域一直在探討的問題, 也是作為文化記憶機構(gòu)的圖檔博單位不斷努力探索和創(chuàng)新嘗試的重要命題。其中, 關(guān)鍵人物與重要事件所關(guān)聯(lián)的名人歷史事件語義模型構(gòu)建是大規(guī)模應(yīng)用實踐的重要基礎(chǔ)。
學界對事件的知識表示進行了諸多研究, 也取得了一定的研究成果。劉宗田等[4] 較早對事件與事件類進行了六元組的定義, 并構(gòu)建了語義模型, 通過對基于傳統(tǒng)本體結(jié)構(gòu)的、基于傳統(tǒng)本體和邏輯方法的、基于事件類層次結(jié)構(gòu)的3 類事件本體模型的比較分析, 認為基于事件類層次結(jié)構(gòu)的本體相較傳統(tǒng)本體而言較有優(yōu)勢[5] 。近年來, 學者對事件的語義模型日益關(guān)注, 在通用事件方面重點關(guān)注不同語義模型的比較分析研究。劉思含等[6] 綜合研究和比較了現(xiàn)有的基于概念層級的、邏輯層級的和事件六元組的3 類事件本體模型, 提出了一種事件本體的自動構(gòu)建方法。徐雷等[7] 、劉錫峰等[8] 、陳金菊等[9] 從多個維度對當前國內(nèi)外主要的事件語義模型,尤其是典型的通用事件語義模型進行了分析、比較和研究。學者們對通用事件的語義模型研究表明,當前的語義模型在橫向關(guān)聯(lián)和深度表示上存在不足,需要增加其關(guān)聯(lián)性、動態(tài)性和互操作性。領(lǐng)域事件方面, 學界多關(guān)注基于突發(fā)事件語義模型的構(gòu)建及應(yīng)用。桑勇[10] 建構(gòu)了一個面向突發(fā)事件新聞生成和信息抽取的事件語義模型。陳金菊[11] 根據(jù)由表及里的建模思想, 構(gòu)建了一個突發(fā)事件新聞深層次語義描述模型。趙又霖等[12] 面向突發(fā)事件提出了社會感知數(shù)據(jù)驅(qū)動下的時空語義模型, 為突發(fā)事件的監(jiān)測和管理奠定了堅實的語義基礎(chǔ)。對于歷史事件, 學界研究較少。廖作芳[13] 構(gòu)建了典籍《三國志》的歷史領(lǐng)域本體, 其中的事件模型較為簡單,主要以年代為標準進行概念劃分。李宗生[14] 基于事件描述的五元組構(gòu)建事件語義模型, 并進行歷史拓撲關(guān)系查詢研究。孫紹丹[15] 研究了歷史報紙資源的語義化知識組織全過程, 通過定義事件類型及觸發(fā)詞的方式構(gòu)建事件框架。Leskinen P 等[16] 基于芬蘭第二次世界大戰(zhàn)的數(shù)據(jù)構(gòu)建了一個歷史軍事模型。何琳等[17] 面向先秦典籍, 依據(jù)CIDOC CRM概念模型, 以軍事、婚姻、外交、政治、民生等為核心類, 構(gòu)建了面向典籍的本體語義模型。牛力等[18] 在參考SEM 簡單事件模型、FOAF 人物基本特征和CRM 模型中物理實體概念劃分的基礎(chǔ)上, 構(gòu)建了人物事件導向的本體知識模型, 以實現(xiàn)多模態(tài)檔案資源的知識聚合。姬方亞[19] 在現(xiàn)有事件本體的基礎(chǔ)上, 通過分析提煉核心概念,設(shè)計面向百年黨史的事件本體模型, 以構(gòu)建黨史事件知識圖譜。
總的來說, 學界對通用事件和領(lǐng)域事件中突發(fā)事件的語義模型研究較為深入,但對領(lǐng)域事件中歷史事件的研究主要以有限范圍的歷史著作或某段時期的歷史為主,對強調(diào)人物和事件關(guān)聯(lián)的名人歷史事件的語義模型研究較為不足,缺乏成熟可用的知識組織模型。在成熟可用的知識組織模型基礎(chǔ)上才能建立“映射法則”, 以陳述形式將事件要素進行邏輯融合, 從而進一步以“規(guī)則推理” 研究視角,根據(jù)特定的場景定制規(guī)則, 最終實現(xiàn)用戶自定義的推理過程等研究。
1名人歷史事件的特征與需求
1.1名人歷史事件的特征
哲學家和認知科學家認為, 事物和事件組成了人類賴以生存的客觀物質(zhì)世界[20] , 而人類的命題記憶也是主要以事件為存儲單位[21] 。然而學界對事件并沒有一個統(tǒng)一的定義, 不同的學科領(lǐng)域和不同的研究對事件的內(nèi)涵有不同的界定。語言學專家認為, 動詞是客觀世界中的事件在語言層面的投射,事件的語義框架即為動詞的語義框架[22] 。情報學專家認為, 事件是在特定時間和環(huán)境下發(fā)生的, 由若干角色參與的, 表現(xiàn)出特定動作特征、狀態(tài)變化特征以及語言描述特征的一段獨立的過程[23] 。權(quán)威辭典中對事件的解釋為: ①事情; ②特指歷史上或社會上所發(fā)生的大事[24] 。此定義將一般事件與大事進行了區(qū)分, 但是并沒有提及區(qū)分的標準。具體到名人歷史事件而言, 首先需要厘清名人和歷史事件之間的關(guān)系。在社會發(fā)展進程中, 一方面, 關(guān)鍵人物往往對重要事件發(fā)揮著決定性的作用; 另一方面, 在歷史事件中的關(guān)鍵人物也往往因為一個或一系列重要事件的歷史作用、重要影響和眾所周知,而變得著名??梢哉f, 名人和與其相關(guān)的歷史事件是緊密聯(lián)系且相互成就的。因此, 綜合現(xiàn)有研究,本研究的名人歷史事件是指, 在特定歷史時間和歷史空間中發(fā)生的, 由包括名人在內(nèi)的若干角色參與,具有一定時序特征、動作和狀態(tài)變化特征與發(fā)展規(guī)律, 并對社會歷史進程產(chǎn)生一定影響的活動或現(xiàn)象。其具有如下典型特征:
1) 組成:是子事件顆粒的集合
名人歷史事件是一個什么范疇的概念? 首先需要厘清故事、事件和動作3 個概念。有學者對故事、事件和動作進行了較為嚴格的區(qū)分。如Nakasone A等[25] 認為故事是事件的序列, CIDOC-CRM[26] 模型將動作(Activity)歸為事件(Event)的子類。其實這3 個概念的角度有所區(qū)別, 故事是從敘事呈現(xiàn)的受眾層面表述, 事件是從社會文化層面表述, 而動作是從語言層面表述。本文基于社會文化層面對名人歷史事件進行研究, 不對故事、事件和動作進行嚴格區(qū)分, 以公眾耳熟能詳?shù)拇笫录γ藲v史事件進行命名, 并將一個大事件分割為具有一定關(guān)聯(lián)關(guān)系的若干子事件顆粒, 事件和子事件擁有相同的語義模型。以李政道、楊振寧獲得1957 年諾貝爾物理學獎這一歷史事件為例, 以口述歷史檔案為主的相關(guān)資料非常豐富, 包括人物采訪、諾貝爾獎歷史記載、各類傳記等, 形成一系列子事件, 包括李政道、楊振寧聯(lián)名發(fā)表論文Question of Parity Con?servation in Weak Interactions, 多位物理學家通過實驗成功驗證其理論, 兩位科學家獲諾獎提名, 諾獎委員會通過電報發(fā)送獲獎通知, 兩位科學家前往瑞典參加頒獎典禮, 媒體對此次獲獎進行報道等一系列子事件??梢哉f, 名人歷史事件是在同一事件母題下, 具有一定關(guān)聯(lián)關(guān)系的子事件顆粒的集合。
2)分類:通用歷史事件與專有歷史事件
綜合研究名人口述歷史資料, 可以看到, 名人歷史事件通常分為通用歷史事件和專有歷史事件兩類。通用歷史事件是名人作為一個社會中的人或某類人所通常經(jīng)歷的共性事件, 如: 出生、去世、結(jié)婚、生子、求學、工作等, 作為名人科學家還可能經(jīng)歷發(fā)表研究成果、獲得榮譽獎項等。而專有歷史事件是與某位名人強關(guān)聯(lián)的專有事件, 如艱難回國之于錢學森, 公車上書之于康有為、梁啟超, 浦東開發(fā)開放之于汪道涵等。一般來說, 通用歷史事件主要體現(xiàn)名人與普通人相同的有血有肉的一面或名人群體的共性特征, 而專有歷史事件則是名人與眾不同的高光時刻, 是其人物社會價值的集中體現(xiàn)。
3)要素: 實體、關(guān)系、作用效應(yīng)
歷史事件的本質(zhì)是事件的組成要素。劉忠寶等[27] 將歷史事件的組成要素分為時間、地點、參與者3 類。李宗生[28] 定義歷史事件五元組為時間、空間、對象、事件、屬性。何琳等[29] 則將句法和角色結(jié)合, 所標注的主要元素為施事者、受事者、工具、處所和時間等??偟膩碚f, 從組成要素的層面, 人物歷史事件主要由人、地、時、物等實體和實體之間的關(guān)系組成, 其本質(zhì)是在特定的時空背景下, 施事與受事之間發(fā)生的作用效應(yīng)關(guān)系, 同時被文獻、檔案、藏品等資源記錄和反映。
1.2名人歷史事件應(yīng)用需求
名人相關(guān)的口述歷史資源非常豐富, 其蘊含著大量的歷史事件, 具有重要的學術(shù)價值、史料價值和精神傳播價值, 名人是此類資源收集的核心, 是揭示的核心要求, 是管理和服務(wù)的核心元素。名人和與之關(guān)聯(lián)的重要歷史事件可以說是相輔相成, 不可分割, 構(gòu)建名人歷史事件語義模型對特藏資源從語義和知識的層面進行組織, 利用知識圖譜等技術(shù),有助于名人口述歷史資源的知識表達。
從史學研究層面,可以進行語義級查詢和主題性聚合, 對資源進行知識抽取、知識關(guān)聯(lián)、知識挖掘和知識發(fā)現(xiàn),從而為人文歷史深入研究提供知識服務(wù)工具和平臺。如鐘文敏[30] 通過分析和使用日記文本中的歷史事件, 對《譚延闿日記》進行內(nèi)容挖掘和知識發(fā)現(xiàn); 鄧君等[31] 以事件實體為中心, 探索事件與項目、事件、地點等實體關(guān)系的知識發(fā)現(xiàn),為人文研究的縱深發(fā)展提供新的線索和依據(jù)。
從文化價值傳播層面, 可以將抽象和難以閱讀的知識化的資源進行敘事化展示和可視化呈現(xiàn), 從而能更好地獲得讀者或觀眾的感知與認同。如趙小萱等[32] 將事件信息與地理信息關(guān)聯(lián)后進行可視化展示; 位通等[33] 對《朱熹年譜長編》進行知識重構(gòu),系統(tǒng)梳理年譜事件及其關(guān)聯(lián)信息, 開發(fā)年譜可視化平臺, 實現(xiàn)年譜事件的時空可視化; 上海博物館“宋徽宗數(shù)字人文專題” 項目、“威尼斯時光機”、上海圖書館“上海年華” 項目[34] 等都使用數(shù)字敘事模式展示重要歷史事件, 為讀者與研究人員提供獨特的歷史視野和研究思路。
2名人歷史事件語義模型構(gòu)建
人、地、時、事、物是哲學層面描述客觀世界的5 個基本概念, 是理解現(xiàn)實世界的基本語義單元,同時也是挖掘特藏資源語義知識的基本實體。其中,事件是最為特殊的一類。人、地、時、物通常由自身屬性可以進行大致描述, 如可用姓名、性別、照片等信息大致描述一個人物, 用經(jīng)緯度定位一個地點, 用紀年法、天文歷法描述一個時間, 用外觀、尺寸、重量、色彩等描述一個物品。而相比其他實體, 對事件的描述和說明則更加依賴與其他實體的關(guān)聯(lián), 厘清事件與所涉實體之間的關(guān)系也是構(gòu)建事件語義框架的關(guān)鍵步驟。
本體模型的構(gòu)建方法從方向上來講主要有自上而下和自下而上兩種; 從方式來講主要有人工構(gòu)建、半自動構(gòu)建和自動構(gòu)建3 類; 從操作上來講有骨架法、TOVE 法、七步法、Methontology、IDEF-5、Ontoknowledge、NeOn、循環(huán)獲取法等。綜合調(diào)研當前應(yīng)用較為廣泛的代表性事件語義模型, 包括基于概念層級的通用事件模型SEM[35] (簡單事件模型)、基于事件類層次結(jié)構(gòu)的六元組結(jié)構(gòu)模型(劉宗田)、數(shù)據(jù)實例規(guī)模最大的EventKG模型[36],主要應(yīng)用于新聞領(lǐng)域的NOEM 和應(yīng)用于歷史文化領(lǐng)域的Ramli F等。在綜合研究前人語義模型的基礎(chǔ)上,運用自上而下的方法, 結(jié)合名人口述歷史資源的特征和應(yīng)用需求, 構(gòu)建名人歷史事件語義模型如圖1所示。
構(gòu)建名人歷史事件語義模型的關(guān)鍵在于深入分析歸類名人歷史事件知識顆粒和實體間關(guān)系, 從而形成語義知識網(wǎng)絡(luò)全景。名人歷史事件語義模型框架主要包括時間、人物、資源、空間、描述(關(guān)系)等要素, 同時由于此類事件所具有的子事件顆粒特征, 事件和事件之間的關(guān)系也是語義框架的重要部分。
時間: 指該事件發(fā)生的時間, 包括時間點的描述和時間段的描述。時間點描述包括事件的起始時間和結(jié)束時間; 時間段的描述指的是某段時間, 而這個時間段通常情況下很難被精確拆分或很難考證為以起始時間和終止時間為標志的時間點, 此時用時間段進行較為模糊的描述也是一個變通的辦法。
人物: 指與該事件相關(guān)的人物, 人物與該事件的關(guān)系包括主動關(guān)系、被動關(guān)系、旁觀關(guān)系和其他4 類。主動關(guān)系的語義特征為該人物是事件的施事主體, 對事件的發(fā)生主動施加作用, 如主導、創(chuàng)設(shè)、推動、參與等; 被動關(guān)系的語義特征為該人物對事件不主動施加作用, 而是被動承受事件發(fā)生后的結(jié)果或稱“效應(yīng)” “承受” 的結(jié)果較為中性, “遭受”的結(jié)果則較為負面; 旁觀關(guān)系的語義特征為該人物既不是該事件的施事主體, 也不是該事件的受事主體, 而僅僅是該事件的旁觀者、見證人和目擊者,如一場事故的目擊證人等; 其他關(guān)系為無法歸屬于以上3類的關(guān)系。
資源: 名人歷史事件相關(guān)的口述歷史資源(DocX)類型包括圖書、手稿、信件、音頻、視頻、論文以及相關(guān)圖像等, 所涉及的資源主要包括直接資源、間接資源、相關(guān)資源3 類。直接資源是指與該事件直接發(fā)生作用的客體實物(Object); 間接資源是指與該事件并不直接發(fā)生作用, 但有口述記錄、報道等性質(zhì), 可以對該事件進行歷史還原的資料;相關(guān)資源是指除以上兩類資源外, 有提及該事件的資源。以事件“李政道、楊振寧獲諾貝爾獎” 為例,諾貝爾獎?wù)?、證書等為該事件的直接資源, 以該事件為主要對象的歷史影像資料、口述采訪以及媒體報道等為間接資源, 其他并非以該事件為主要對象,僅僅是提到此事的資料為相關(guān)資源。
事件:描述事件和事件之間的關(guān)系是對名人歷史事件進行敘事化呈現(xiàn)的基礎(chǔ)工作, 也是口述歷史資源中大量析出的事件信息。參考以往研究, 將事件之間的關(guān)系分為分類關(guān)系和非分類關(guān)系兩類, 分類關(guān)系包括上位關(guān)系和下位關(guān)系, 非分類關(guān)系包括組成關(guān)系、因果關(guān)系、跟隨關(guān)系、伴隨關(guān)系、共軛關(guān)系、條件選擇關(guān)系、隨機選擇關(guān)系等。在具體實踐中,如圖2所示, 事件與事件、事件與資源、事件與時間、事件與人物等可通過語義Class關(guān)聯(lián),并用ClassScheme 表述語義之間的關(guān)系值, 從而達到如圖1 所示的名人歷史事件語義架構(gòu)。
空間: 描述事件發(fā)生過程中所涉及的地點、環(huán)境等, 以此反映事件發(fā)生過程中的遷徙情況。
描述(關(guān)系):是指對事件—事件、事件—人物、事件—時間、事件—空間、事件—資源之間的關(guān)系描述, 以形成事件內(nèi)容的知識關(guān)聯(lián)。此外, 描述性內(nèi)容還包括事件名稱、背景、起因、經(jīng)過、結(jié)果和后續(xù)效應(yīng)(影響) 等, 在本研究中將其作為事件屬性進行描述。
3名人歷史事件知識表示的實證研究
名人歷史事件語義模型構(gòu)建是為了讓事件從口述歷史資源中以知識關(guān)聯(lián)的形式描述出來, 以實現(xiàn)知識表示。本文以李政道推動的CUSPEA 項目為例,以口述歷史資源中CUSPEA 相關(guān)資源為基礎(chǔ)數(shù)據(jù),對名人歷史事件語義模型進行實例化, 并進行融合應(yīng)用展示。
1979年, 李政道先生以戰(zhàn)略科學家的眼光創(chuàng)辦CUSPEA (China-U.S.Physics Examination andApplication Program, 中文名稱為中國—美國聯(lián)合招考物理研究生項目), 在沒有TOEFL 和GRE 的時代開辟了通往美國留學的綠色通道, 幫助中國物理等專業(yè)優(yōu)4uDg/YAOI5hWdyBQMQ+R25r3ujmp6DfUNdWl/vMGePo=秀學子接受當時世界一流的研究生教育培養(yǎng), 對促進中美科技、教育交流和中國科技人才的培養(yǎng)作出了不可磨滅的歷史貢獻。CUSPEA 是一個資源主題, 也是一個歷史事件。從歷史研究層面,研究學者期望對該事件進行深入聚合; 從精神傳播層面, 社會公眾希望通過敘事化、可視化的呈現(xiàn),能對該事件有一個直觀的了解。
3.1實例化構(gòu)建
以口述歷史資源為基礎(chǔ), 對李政道與CUSPEA的歷史事件進行實例化驗證。從1979年的Pre-CUSEPA 到1988年最后一期CUSPEA考試, 整個項目持續(xù)10 年, 每一年的CUSPEA都是一個貫穿一整年的二級子事件, 包括準備、考試、閱卷、申請、錄取、入學等三級子事件。另外, 在CUSPEA正式實施之前, 還有一些前序的背景或原因事件需要進行標注。實例化結(jié)果如圖3所示。
使用資源描述框架(Resource Description Frame?work, 簡稱RDF)對事件進行描述, 節(jié)選對事件3第一次Pre-CUSPEA 的描述如圖4 所示。
3.2知識表示應(yīng)用
為了清晰地進行知識表示, 本研究使用知識圖譜領(lǐng)域應(yīng)用最為廣泛的圖數(shù)據(jù)庫Neo4j 將數(shù)據(jù)文件與圖數(shù)據(jù)庫中的元素進行映射, 并進行存儲。Neo4j作為開源的圖數(shù)據(jù)庫管理系統(tǒng), 將結(jié)構(gòu)化的數(shù)據(jù)以多邊網(wǎng)絡(luò)的形式而不是以二維表格的形式存儲, 存儲粒度更細, 表現(xiàn)力更豐富, 復雜查詢、實時數(shù)據(jù)點擊流查詢和路徑查詢等功能更為強大。
1)知識導入
Cypher 是Neo4j 的查詢語言, 專門用來處理存儲圖數(shù)據(jù)結(jié)構(gòu), 具有聲明式(Declarative)、表現(xiàn)力(Expressive)、模式匹配(Pattern Matching)、冪等(Idempotent)特點。關(guān)鍵的語句有CREATE 主要用于創(chuàng)建節(jié)點、關(guān)系和它們的屬性; MATCH 主要用于描述數(shù)據(jù)庫應(yīng)該匹配的模式; MERGE 主要用于索引和鎖來匹配和創(chuàng)建等。將數(shù)據(jù)導入Neo4j 主要有3種方法: 第一種是用CREATE 語句, 逐條導入數(shù)據(jù)。第二種是使用load csv 或apoc 語句批量導入CSV 格式的數(shù)據(jù)。第三種是使用導入工具進行批量導入,如官方提供的neo4j-import、Java API-BatchInserter,微云數(shù)聚開發(fā)的導入精靈等。本文將原始數(shù)據(jù)轉(zhuǎn)換為CSV 格式, 使用load csv 語句進行導入。
以CUSPEA 事件節(jié)點的導入為例, 導入語句為:
load csv with headers from ‘ file:///CUSPEAe?vent.csv’as line
create(:CUAPEAevent {id:line. id,name:line.name,description:line. description,begin:line. begin,end:line.end,place:line.place})
創(chuàng)建實體間關(guān)系前, 需先導入實體關(guān)系映射數(shù)據(jù)。如創(chuàng)建事件間下位關(guān)系前, 需先創(chuàng)建下位關(guān)系節(jié)點標簽(三元組形式):
load csv with headers from “file:///eventRxw.csv”as row
create (:下位關(guān)系{er_fromEname:row.fromE?name,er _guanxi:row. guanxi,er _ toEname: row. toE?name})
然后再批量創(chuàng)建相應(yīng)的關(guān)系:
match(n:CUAPEAevent),(r:‘下位關(guān)系’),(m:CUAPEAevent)
where n.name =r.er_fromEname andr.er_toE?name=m.name
create(n)-[:下位關(guān)系{eventR:r.er_guanxi}]->(m)
2)知識聚合
基于名人歷史事件語義數(shù)據(jù)模型, 可以從語義和知識的角度對數(shù)據(jù)進行深度聚合, 并進行可視化呈現(xiàn)。在此, 可使用D3.js、GraphViz 等組件, 或Gephi、Keylines 等平臺工具對數(shù)據(jù)進行可視化, 另外Neo4j 瀏覽器也是一個可擴展、可嵌入的圖數(shù)據(jù)庫可視化工具。本文使用Neo4j 瀏覽器對導入的數(shù)據(jù)進行了簡單的知識聚合, 形成如圖5 所示的CUSPEA 考生與每次CUSPEA 考試子事件的分類聚合關(guān)系, 如圖6 所示的每次CUSPEA 考試子事件與口述歷史資源的分類聚合關(guān)系, 以及如圖7 所示的CUSPEA 子事件之間的關(guān)系。
3)語義查詢
基于語義模型能聚焦資源的深層含義進行搜索, 獲得比關(guān)鍵詞查詢更好的查詢效果。對于存放于Neo4j 中的屬性圖數(shù)據(jù)可使用Cypher進行查詢。如基于本模型面向本實例數(shù)據(jù), 可查詢某一事件中的復雜人物關(guān)系, 例如:
查詢1982 年后經(jīng)CUSPEA項目前往哥倫比亞大學生導師
MATCH(x3:CUSPEAevent)-[考生] - >(x1:CUSPEAScholar)<-[:導師]-(x2:supervisor)
WHERE x3.year>=1982 AND x3.to=‘Columbia’RETURN x2
還可查詢復雜事件和人物所關(guān)涉的資源, 例如:
查詢通過CUSPEA 出國具有校友關(guān)系的CUS?PEA 學者的口述歷史資源
MATCH(x1:CUSPEAScholar) -[:校友] -(x3:CUSPEAScholar),(x2:resources)-[:資源]-(x1)
RETURN x2
4)敘事呈現(xiàn)
基于本模型可以對名人歷史事件進行敘事化呈現(xiàn)。根據(jù)實體之間的關(guān)系和不同的敘事需求, 選擇不同的敘事方式進行展示, 如時間敘事、空間敘事、主題敘事等。
時間敘事是基于時間維度對歷史發(fā)展規(guī)律的宏觀審視, 是一種歷時性、序列化的敘事結(jié)構(gòu); 空間敘事是基于空間維度對日常社會生活的微觀觀察,是一種共時態(tài)的分布式敘事結(jié)構(gòu)[37] ; 主題敘事是基于內(nèi)容維度對特定主題的系統(tǒng)聚合, 是一種意義化的敘事結(jié)構(gòu)。這3 類敘事方式經(jīng)常綜合應(yīng)用于陳列展演、歷史研究、編研出版、虛實交互、沉浸體驗等敘事場景。如以時間為序列組織CUSPEA 相關(guān)展覽, 以CUSPEA 創(chuàng)立緣起和發(fā)展為主題進行歷史研究, 以CUSPEA 學者在國內(nèi)和國外就讀的學校及所在地為基礎(chǔ)進行互動展演。
4結(jié)語
事件的知識組織與應(yīng)用一直是知識處理的重點和難點問題, 名人歷史事件的知識化是對口述歷史資源進行知識重組、價值挖掘和敘事展演的重要基礎(chǔ)。引入跨學科研究視角, 對名人歷史事件進行知識化, 有助于口述歷史檔案全宗級、案卷級的研究粒度深化為檔案單件與知識單元, 使得檔案單件的數(shù)據(jù)化保存與呈現(xiàn)轉(zhuǎn)向記憶單元的組織與關(guān)聯(lián), 從而實現(xiàn)價值導向的資源內(nèi)容發(fā)現(xiàn)與服務(wù)方式轉(zhuǎn)型。
本文在前人研究的基礎(chǔ)上,對名人歷史事件的內(nèi)涵、特征和應(yīng)用需求進行了總結(jié)與分析, 構(gòu)建了名人歷史事件語義模型, 并以科學家李政道和其創(chuàng)辦的CUSPEA事件為例進行語義模型的實例化驗證。在應(yīng)用實踐中,借鑒產(chǎn)業(yè)界成功應(yīng)用的知識圖譜技術(shù), 基于語義模型建設(shè)的圖數(shù)據(jù)庫能夠形成更具靈活性、細粒度、可擴展、相關(guān)關(guān)聯(lián)的實體關(guān)系和知識, 實現(xiàn)不同用戶對名人特色資源進行語義級查詢、主題性聚合、敘事化展示和可視化呈現(xiàn)的應(yīng)用需求,革新口述歷史檔案研究方法與路徑,實現(xiàn)檔案內(nèi)部諸要素自我呈現(xiàn),促成比既往更為直接的檔案解構(gòu)模式。后續(xù)將進一步對事件模型進行優(yōu)化和擴展,以滿足規(guī)模較大和復雜程度較高事件及事件集的應(yīng)用需求。