曲云鵬
(1. 中國科學(xué)院文獻情報中心,北京 100409;2. 中國科學(xué)院大學(xué),北京 100049;3. 國家圖書館,北京 100080)
存檔資源鍵研究*
曲云鵬1,2,3
(1. 中國科學(xué)院文獻情報中心,北京 100409;2. 中國科學(xué)院大學(xué),北京 100049;3. 國家圖書館,北京 100080)
存檔資源鍵(ARK)是一種面向數(shù)字資源長期保存的資源永久標識符系統(tǒng),由圖書館等公益保存機構(gòu)開發(fā),申請與使用簡單,并且可以免費使用,適合有長期保存需求的保存機構(gòu)。ARK可以通過同一個標識符的不同參數(shù)指向資源的三種信息,即資源本身、資源的元數(shù)據(jù)和提供者有關(guān)聲明。ARK通過它的限定符系統(tǒng)為資源提供方的多種服務(wù)提供了最大的支持,也為用戶訪問資源帶來了方便。ARK已經(jīng)在歐美的學(xué)術(shù)機構(gòu)圖書館中獲得了較多的應(yīng)用,值得進行研究。
永久標識符;ARK;長期保存
為了建立高質(zhì)量的信息標識符命名體系,實現(xiàn)對信息對象永久性的有效訪問,美國國家醫(yī)學(xué)圖書館委托加州數(shù)字圖書館(California Digital Library,CDL)設(shè)計了存檔資源鍵(Archival Resource Key,ARK),并于2003年完成。ARK是一個開放的、注重實效的、低費用的資源永久性標識解決方案,它建立在URL、Handle System、DOI、OpenURL等成果之上,對各類型資源提供了廣泛支持。ARK所支持的資源對象既包括數(shù)字文檔、數(shù)據(jù)庫、軟件、網(wǎng)站以及物理對象如圖書、雜志等,也包括無形對象,如化學(xué)物質(zhì)、疾病、詞匯、演出等[1]。
ARK是一種框架,也指遵循這種框架的唯一標識符,可以實現(xiàn)對信息對象的高質(zhì)量和持續(xù)性的標識。永久持續(xù)性是ARK服務(wù)的關(guān)鍵的部分,ARK框架使用靈活,以冗余的方式最大程度上保證了資源的長期可訪問性。
2.1 ARK的優(yōu)點
ARK不同于其他的唯一標識符系統(tǒng),它是圖書館行業(yè)為了保證數(shù)字資源的長期保存可用性而開發(fā)的框架,具有以下優(yōu)點:
(1)適合圖書館提供面向長期保存的數(shù)字資源服務(wù)
ARK系統(tǒng)在圖書館環(huán)境中開發(fā),可以滿足圖書館中數(shù)字存檔工作人員的要求,并針對圖書館等保存機構(gòu)的資源長期保存需求,設(shè)計了冗余的資源訪問方式,明確了組織承諾(organisation commitment)對于永久標識符框架的重要性。這些承諾可以幫助用戶來判斷資源的保存情況變化,以保證用戶有最大的可能獲取到資源。
(2)免費
ARK是圖書館開發(fā)的永久標識符系統(tǒng),可以免費使用,降低了保存機構(gòu)提供所存檔資源訪問服務(wù)時的成本。
(3)簡單
任何個人和機構(gòu)都可以設(shè)立自己的ARK唯一標識符解析服務(wù),同時ARK唯一標識符系統(tǒng)對于硬件的要求較低,而且對于數(shù)字資源的訪問只需要網(wǎng)絡(luò)服務(wù)器的“redirect”和“get”方式就可以使用。
(4)良好的兼容性
ARK框架是一個基于標準的框架,獨立于協(xié)議和技術(shù),具有很好的兼容性。ARK可以用于封閉的環(huán)境,例如暗存檔(dark archive),也可以用于開放的公眾可以訪問的環(huán)境。
(5)功能多樣
ARK系統(tǒng)中,通過ARK限定符的不同后綴,可以實現(xiàn)對于數(shù)據(jù)對象、元數(shù)據(jù)和機構(gòu)聲明等內(nèi)容的訪問,具有強大的功能。
(6)靈活性
在ARK框架中,如果一個機構(gòu)同時作為命名映射授權(quán)主機(NMAH,naming mapping authority hostport)和命名分配授權(quán)機構(gòu)(NAA,naming assigning authority)進行工作,該機構(gòu)可以對自己的標識符框架擁有完整的控制權(quán)。而且,ARK部分是獨立于HTTP協(xié)議部分的,可以在不損失任何核心表示信息的情況下從一個服務(wù)器移植到另一個服務(wù)器上。
(7)開放性
ARK標識符系統(tǒng)目前還在不斷的發(fā)展當中,可以自由使用,歡迎各類型機構(gòu)的加入。
(8)透明性
ARK的后綴特點可以提供保存機構(gòu)的更多信息,為用戶進行判斷提供基礎(chǔ)。
2.2 同其他主要標識符系統(tǒng)的區(qū)別
(1)同DOI的區(qū)別
ARK同知名的唯一標識符規(guī)范DOI相比,有著以下的區(qū)別:
①ARK來自于公共文化機構(gòu),比如圖書館、檔案館等等。DOI來自于出版商和電子商務(wù)團體,經(jīng)常被用于識別在線的文檔和出版物。②DOI標識符的生成受制于對于每個標識符的收費體系,而ARK是免費的,主要由公共文化機構(gòu)使用,其持續(xù)性指的是相當長的一段時間。③在ARK框架下,每個命名分配授權(quán)都有很大的自主權(quán),加州數(shù)字圖書館只負責維護這種規(guī)范和命名分配授權(quán)注冊,每個ARK的命名分配授權(quán)機構(gòu)都可以免費定義自己的策略和服務(wù)。DOI是商業(yè)化的,是一種由出版商和在線數(shù)據(jù)提供商構(gòu)成的非集中式的模型,每個DOI機構(gòu)在操作層面上都有著不同的技術(shù)選擇和服務(wù)提供方式。
(2)同URL的區(qū)別
ARK和URL的區(qū)別主要體現(xiàn)在對于資源的永久訪問上。URL是通過HTTP或者HTTPS協(xié)議對在線資源提供訪問的一串字符串。通過URL,用戶可以快速地對資源進行訪問,但是在線資源經(jīng)常會失效,因此URL也無法保證數(shù)字資源訪問的長期可用性。而在ARK框架中,每個資源都會分配一個唯一的永久標識符。如果一個網(wǎng)站或者主機發(fā)生變化,ARK中只有命名映射授權(quán)主機部分會發(fā)生變化,唯一標識符還保留。一個使用ARK的機構(gòu),在定義了策略之后,就需要承擔維護資源和標識符之間的聯(lián)系的責任。如果一個資源已經(jīng)被移除,機構(gòu)需要給出這個資源的簡單描述,和被移除的原因。ARK強制機構(gòu)將資源的長期訪問作為首要問題進行考慮,這是ARK同URL最根本的區(qū)別。
3.1 ARK的結(jié)構(gòu)與功能
3.1.1 ARK的基本結(jié)構(gòu)
ARK標識符是一個包含著“ark:”標記的字符串序列,通用形式是http://NMAH/ark:/NAAN/Name。圖1是一個ARK標識資源的例子:
第一部分是命名映射授權(quán)主機(NMAH,Naming Mapping Authority Hostport),在本例中是“ark.cdlib. org”。第二部分是ARK協(xié)議標識,即“ARK:”。第三部分是命名分配授權(quán)號(NAAN,naming assigning authority number),這是一個用來標識命名分配授權(quán)機構(gòu)的通用唯一數(shù)字,在本例中是“13030”。第四部分是由命名分配授權(quán)(NAA,naming assigning authority)機構(gòu)分配的名字,本例中是“ft4w10060w”。在ARK中,NAAN之前的部分并不用來標識或者比較對象,它表示的是一個主機名,用戶可以通過這個主機訪問該資源,也可以通過別的主機訪問該資源,主機名只是用來保證資源可用。NMAH部分是臨時的,可以任意使用,也可以替換。當目前的命名映射授權(quán)主機失效時,新的服務(wù)提供者會替代,重新生成NMAH。這樣,授權(quán)主機出現(xiàn)問題的時候,ARK的核心標識會很容易恢復(fù),將由ark:/開頭的ARK部分獨立出來即可[2-3]。
圖1 ARK實例
NAA是首次給該資源命名的機構(gòu)。NAAN的注冊方式同URN的命名空間很相似,但是NAAN的命名只是5位或者9位的數(shù)字。前100000(1-99999)注冊的機構(gòu)可以分配到5位數(shù)字的號碼,之后的機構(gòu)號碼就是9位的。這種規(guī)則可以減少NAAN同臨近的數(shù)字之間的混淆[4]。
3.1.2 ARK的限定符
ARK的限定符是一個強大的工具,可以通過限定符識別組件或者資源的不同版本,是ARK區(qū)別于其他永久標識符的一個明顯特點。ARK的限定符是在由NAA命名之后的部分,這是一個可選的限定符部分。它將基礎(chǔ)的ARK進行了擴展,可以指向?qū)ο髢?nèi)部,比如提供對于對象層級組件或者子部分的訪問,或者提供對資源的各種變量,例如版本、語言、格式等信息的訪問。ARK限定符的使用首先體現(xiàn)在通過ARK對資源的元數(shù)據(jù)和資源提供者的資源狀態(tài)承諾進行訪問的方式,即在ARK標識符后加“?”和“??”[5]。
限定符可以由NAA或者任何NMA來進行設(shè)定。ARK的命名映射授權(quán)機構(gòu)對于自己的ARK訪問方式可以進行比較全面的定義,對于如何訪問資源的一部分也有著靈活的方法。
在形式上,限定符是由組件路徑(ComponentPath)、變量路徑(VariantPath)以及變量路徑后跟隨組件路徑形成的。變量路徑由字符“.”來隔開,變量路徑由字符“/”來隔開。見如下一個例子:
http://example.org/ark:/12025/654xz321/s3/f8.05v. tiff
在本例中,字符串“/s3/f8”是組件路徑,“05v. tiff”是變量路徑。
使用ARK限定符可以通過在ARK標識符后增加“/”來揭示對象之間的層次關(guān)系。如以下ARK標識符:
ark:/12025/654/321
這是一個標識了一個對象的ARK標識符,事實上,它同以下三個ARK是一致的。
ark:/12025/654/xz/321
ark:/12025/654/xz/
ark:/12025/654
在ARK規(guī)范中,在名字后出現(xiàn)的“/”,表示它左側(cè)的部分被包含在右側(cè)的部分。在這個例子中,三個資源訪問的都是命名為654的資源,而654資源包含在xz資源中,xz資源包含在321資源中。對于“/”本身來講,它的左右都必須是有效的、非結(jié)構(gòu)標識的字符,在解釋ARK的時候,兩個連續(xù)的“/”就會被化簡成為一個。
標識資源變量的ARK。在限定符的使用中,可以利用“.”來分割對象的各種變量。如果在ARK中包含了“.”,那么它左側(cè)的部分是一個基本命名,右側(cè)的部分一直到結(jié)尾,或者下一個“.”之間,都是一個前綴。一個資源命名中可能包含多個前綴。例如:
ark:/12025/654.24
ark:/12025/sz4/654.24
ark:/12025/654.20v.78g.f55
在前綴命名中有兩個主要的規(guī)則。第一,如果兩個ARK共享了同樣的基本命名,但是有著不同的前綴,相應(yīng)的對象被認為互為變量。第二,一個帶有前綴的ARK就意味著一定有一個沒有前綴的變量可以用ARK來表示。
對于變量的揭示完全由命名分配者決定。變量完全可以揭示對象的命名、多個變量的命名和相互之間的關(guān)系等等。
3.1.3 ARK的元數(shù)據(jù)和維護記錄獲取
ARK是同協(xié)議無關(guān)的,在HTTP和DNS環(huán)境下都可以很好地工作。很多機構(gòu)都使用最常用的HTTP和DNS網(wǎng)絡(luò)方式來進行ARK標識符的解析。
當用戶通過ARK標識符訪問一個資源時,如果ARK中的命名映射授權(quán)主機是有效的,用戶可以被直接引領(lǐng)到該有效的命名映射授權(quán)主機中。如果這個命名映射授權(quán)主機已經(jīng)失效了,或者臨時不可用,用戶可以通過識別命名分配授權(quán)或使用加州數(shù)字圖書館維護的命名映射授權(quán)主機注冊表來尋找當前正在服務(wù)的命名映射授權(quán)主機,從而定位最新的命名映射授權(quán)主機。
ARK框架同樣還定義了一個簡單的使用HTTP協(xié)議來傳遞ARK的協(xié)議,即THUMP(微型HTTP URL映射協(xié)議,Tiny HTTP URL Mapping Protocol)[6]。這個協(xié)議允許用戶在瀏覽器的地址欄直接輸入ARK請求。只要用戶知道相關(guān)命名映射授權(quán)主機的Internet主機的名稱和端口號,用戶就可以通過THUMP向這個主機發(fā)送請求。THUMP請求是一個以“?”結(jié)尾的字符串,其中包含了ARK請求。在THUMP的響應(yīng)結(jié)果中,ARK可以解析定向到對象或者對象元數(shù)據(jù)。結(jié)果中還有一個承諾協(xié)議,包括了對象的永久性、變化(比如對象變化的環(huán)境,比如格式遷移)以及變化歷史等,這些結(jié)果會以電子資源引用符(Electronic Reource Citation,ERC)的規(guī)范返回。ERC是一種對象描述規(guī)范,使用了都柏林核心元數(shù)據(jù)。它主要使用了其中的四個核心元素來描述資源,即 who、what、when、where在每一項中都記載了該對象相關(guān)的一些信息[7]。
以圖2為例,在URL中輸入http://digital.library. unt.edu/ark%3A/67531/metadc28359/?,這是請求NAAN為67531的機構(gòu)中,名為metadc28359的資源的元數(shù)據(jù)。其響應(yīng)結(jié)果如下:
圖2 THUMP元數(shù)據(jù)響應(yīng)結(jié)果
如果輸入的是http://digital.library.unt.edu/ ark%3A/67531/metadc28359/??,這是請求該資源的變化情況。其響應(yīng)結(jié)果如圖3所示。
圖3 THUMP文件歷史響應(yīng)結(jié)果
3.2 ARK的申請、使用與維護
3.2.1 ARK的申請與使用
以ARK作為唯一標識符的機構(gòu)必須成為ARK框架中的命名分配授權(quán)機構(gòu),或者被授權(quán)成為一個命名分配授權(quán)機構(gòu)的子授權(quán)。每個命名分配授權(quán)都通過一個或者更多的命名映射授權(quán)主機相關(guān)聯(lián)。命名映射授權(quán)主機是提供服務(wù)的實體,負責提供對那些標識過的數(shù)字對象的訪問、轉(zhuǎn)發(fā)等等。具體的過程如下[8]:
(1)定義ARK命名的結(jié)構(gòu)。首先,使用機構(gòu)需要申請成為一個分配授權(quán)機構(gòu),獲取一個分配授權(quán)號,并明確自己的ARK命名策略,即明確使用ARK來標識資源的類型,例如書目記錄、物理文檔、抽象的概念等。如果需要使用ARK來對應(yīng)多種類型的資源,那么應(yīng)該使用預(yù)定義的前綴來識別每種特殊的子集。
(2)使用軟件來生成ARK標識符。機構(gòu)可以使用自己開發(fā)的工具,也可以使用開源軟件NOID(Nice Opaque Identifier)[9]來進行這項工作。開源軟件NOID由加州數(shù)字圖書館設(shè)計開發(fā),用來生成唯一標識符,在配置正確的情況下可以生成ARK標識符[10]。另外,也可以使用加州數(shù)字圖書館提供的一種新的服務(wù)——EZID[11]來生成和維護ARK標識符。該服務(wù)通過在線接口訪問,也可以通過API訪問,來自動化生成大量的標識符[12]。
(3)使用軟件來解析ARK標識符,即需要使用一些軟件將帶有ARK名稱的Web地址同相應(yīng)的資源聯(lián)系起來。該步驟中,首先要定義利用哪個主機來解析ARK標識符,即解析服務(wù)器。然后需要定義一系列的參數(shù)來讓用戶可以獲取資源的整體或一部分,比如一頁,或者針對這個資源的一些服務(wù),例如文檔的某一個版本、書目記錄格式等等。例如,法國圖書館利用gallica.bnf.fr來識別數(shù)字資源標識符,catalogue.bnf.fr來識別書目記錄;在ARK中使用了/fn來請求數(shù)字文檔中的某一頁,n就是頁碼。簡單說,這個步驟需要你選擇一個NMAH,來解析ARK,以及一個參數(shù)來獲取特殊類型的服務(wù)[13]。
3.2.2 ARK的維護
ARK框架由當前的加州數(shù)字圖書館進行維護,該機構(gòu)的命名分配授權(quán)注冊表單中列出了命名分配授權(quán)號和對應(yīng)的NMAH主機。這個注冊表單同樣由加州數(shù)字圖書館維護,在美國國家醫(yī)學(xué)圖書館有一個鏡像。注冊命名分配授權(quán)表單給出了一個ARK用戶群體的標識。加入該框架的成本很低,沒有費用的要求。任何機構(gòu)都可以通過聯(lián)系加州數(shù)字圖書館獲取一個命名分配授權(quán)號[14]。
圖4 N2T工作流程
在NMAH主機部分中,主機名一般可以持續(xù)幾十年。當命名映射授權(quán)主機失效的時候,就需要重新尋找可以用的NMAH主機來訪問資源。ARK規(guī)范中提供了三種方式來尋找NMAH。
①當需要尋找一個新的NMAH時,客戶端會在ARK中抽取NAAN,然后在一個全球數(shù)據(jù)庫中對NAAN進行查詢,尋找所有的為該NAAN提供ARK服務(wù)的NMAH。目前這個服務(wù)器定位為N2t.info。這是一個低成本高可靠性,由類似聯(lián)盟形式進行維護的NMAH,可以提供可用的基于HTTP的URL。如果希望這個尋找的過程是自動的,則需要使用一個Name-to-Thing(N2T)解釋器[15]來進行自動化操作。
②在全球可訪問的文件中查找NMAH,即在一個命名授權(quán)表中尋找一個可用的NMAH。這個表保存在加州數(shù)字圖書館,地址是http://www.cdlib.org/inside/ diglib/ark/natab。任何機構(gòu)可以從Internet上復(fù)制這個表。表中以評論行的方式(#開頭的行)來解釋資源的格式、文件的修改時間、地址以及NAA注冊的指導(dǎo)。
③通過DNS尋找NMAH。這是一種比較陳舊的方法來解決尋找NMAH問題,需要基于URN解析器來進行。該方法在RFC2915[16]中進行了描述。這種方法需要查詢DNS系統(tǒng)。首先一個請求需要發(fā)送到DNS,請求一個可以匹配給定NAAN的解析器的列表。DNS會將這個請求分發(fā)到特殊的DNS服務(wù)器中,來提供答案,如果本地DNS緩存了這些信息,那就可以略過這個步驟。相應(yīng)信息會以命名授權(quán)指針(name authority pointer)記錄的形式返回,一般的結(jié)果就是一個或者多個候選的NMAH列表。
目前,已經(jīng)有大約150多個組織使用ARK作為唯一標識符系統(tǒng)[17]。其中,較為知名的應(yīng)用機構(gòu)是CDL。CDL采用ARK作為它自己擁有以及它所控制數(shù)字對象的標識,采用METS描述SIP、DIP包。CDL在ARK服務(wù)方面作出如下聲明:①保證CDL分配的ARK具有永久唯一性,已經(jīng)發(fā)布的ARK不再重新分配;②CDL分配的ARK不包括廣泛的可識別語義信息;③CDL分配的ARK包括一個校驗字符,以便及時發(fā)現(xiàn)傳輸中造成的錯誤。CDL采用開放源碼軟件“NOID”(nice opaque identifiers)來進行ARK分配管理,NOID除了生成ARK標識符外,它還可以實現(xiàn)元數(shù)據(jù)信息與標識符的綁定,并指定建立一個URL訪問接口和名稱解析器。目前,CDL已經(jīng)分配了80,000個ARK。在加州使用ARK的用戶包括加州大學(xué)的10個校區(qū)圖書館、加州州立大學(xué)圖書館以及加州公共圖書館等[18]。
法國圖書館使用ARK用于所有的書目信息、所有的數(shù)字化后的圖書,以及這些書的圖片、腳本和圖等。同時ARK還被用戶指向法國圖書館長期保存系統(tǒng)SPAR中的AIP信息包的標識,包括了其他的數(shù)字資源類型,例如ARC文件、原生的音視頻和軟件資源、存檔記錄等[19]。法國圖書館還計劃用于在線展覽。由于在RDF中資源和屬性必須使用URI來進行命名,法國國家圖書館使用了ARK的URI框架來識別它的數(shù)字資源和元數(shù)據(jù)記錄。它的開源性和非專有性的本質(zhì)和由公共機構(gòu)來進行維護的特點讓ARK成為了一個在數(shù)字保存環(huán)境中使用的理想的框架。ARK用于識別真實存在的對象很實用,因為它可以指向文檔的一部分或者指定特殊的視圖。所以ARK是法國國家圖書館命名真實的AIP或者其中的一部分并在RDF中進行描述的方法[20]。
北德州大學(xué)圖書館使用了ARK作為所有數(shù)字對象的識別框架。除了正常訪問對象、元數(shù)據(jù)和承諾的方法外,UNT圖書館還增加了一個功能,即在ARK后增加/thumbnail/來查看預(yù)覽。另外UNT圖書館使用一個工具來處理帶有固定前綴的序列式標識符的生成,名字是number-server[21]。
賓州圖書館使用ARK inspired noids作為唯一標識符,在這個scholarsphere倉儲服務(wù)中,其中有亮點的是基于Rubynoid庫的微服務(wù)。這些標識符用于fedora系統(tǒng)中,由ScholarSphere來解析[22]。
資源存檔鍵ARK在制定規(guī)范時首先將資源的長期保存放在第一位考慮,對于以長期保存工作為第一任務(wù)的保存機構(gòu)有著重要的意義;ARK兼容多種協(xié)議,可以利用簡單的Web和HTTP方式對資源進行訪問,體現(xiàn)了它的便利性;ARK的限定符提供了對同一資源的不同部分進行訪問的功能,使保存資源的管理和訪問更加容易;ARK還提供了XML方式的元數(shù)據(jù)等信息提供方式,這樣元數(shù)據(jù)對于人更加易讀,促進數(shù)據(jù)在不同的信息系統(tǒng)中的共享。ARK的這四個特點符合唯一標識符規(guī)范的發(fā)展方向,即保證資源的永久性、規(guī)范的易用性和資源的可讀性。
我國對于唯一標識符系統(tǒng)的研究不多,主要集中在針對DOI的研究,也缺少唯一標識符的具體應(yīng)用。ARK標識符充分考慮了作為非營利性公共服務(wù)的圖書館使用DOI的不便,以及資源常長期保存的需求,在免費的框架下提供了功能不弱于DOI的唯一標識系統(tǒng)。我國眾多的圖書館和檔案館有強烈的數(shù)字資源長期保存服務(wù)需求,但是目前我國仍然缺少一個國內(nèi)通用的唯一標識符規(guī)范。ARK體系為圖書館的資源標識與揭示提供了一種新的思路,值得進一步的研究與探索。
[1]STARR J. ARK (Archival Resource Key) Identifiers [EB/OL]. (2013-03-22) [2013-12-17]. http://www.cdlib.org/inside/diglib/ark/.
[2]KUNZE J. Overview of Archival Resource Key (ARK) Tools [EB/OL]. (2005-07-01) [2013-12-17]http://dot.ucop.edu/home/jak/ ark_tools.ppt.
[3]ARK Anatomy [EB/OL]. [2013-12-17]. https://wiki.ucop.edu/display/ Curation/ARK+Anatomy.
[4]NAAN: Name Assigning Authority Number [EB/OL]. [2013-12-17]. https://wiki.ucop.edu/display/Curation/NAANs.
[5]HAKALA J. Persistent identifiers - an overview [EB/OL](2010-10-13) [2013-12-17]. http://metadaten-twr.org/2010/10/13/persistentidentifiers-an-overview/.
[6]GAMIEL K, KUNZE J, NASSAR N. THUMP -- The HTTP URL Mapping Protocol [EB/OL]. (2007-08-24) [2013-12-17]. https:// confluence.ucop.edu/download/attachments/1802247/thumpspec.pdf
[7]ERC: Electronic Resource Citation and Dublin Core Kernel Metadata [EB/OL]. (2013-09-06) [2013-12-17]. https://confluence.ucop.edu/ display/Curation/ERC.
[8]KUNZE J. The ARK Identifier Scheme [EB/OL]. (2008-05-22) [2013-12-17]. https://wiki.ucop.edu/download/attachments/16744455/ arkspec.pdf?version=1&modificationDate=1261036800000.
[9]KUNZE J. Noid: Nice Opaque Identifier (Minter and Name Resolver) [EB/OL]. (2012-09-04) [2013-12-17]. https://wiki.ucop.edu/display/ Curation/NOID.
[10]Noid-nice Opaque Identifier Generator Commands [EB/ OL]. [2013-12-17]https://confluence.ucop.edu/download/ attachments/16744482/noid.pdf.
[11]STARR J. EZID [EB/OL]. (2013-04-30) [2013-12-17]. http://www. cdlib.org/services/uc3/ezid/.
[12]Generating ARKs [EB/OL]. (2013-04-30) [2013-12-17]. https://wiki. ucop.edu/display/Curation/Generating+ARKs.
[13]ARK (Archival Resource Key) [EB/OL]. [2013-12-17]. http://www. bnf.fr/en/professionals/issn_isbn_other_identifiers/a.ark_en.html
[14]CDL Name Assignment and Support Policy Statements [EB/OL]. [2013-12-17]. https://wiki.ucop.edu/display/Curation/CDL+Policies.
[15]KUNZE J. Low-Risk Persistent Identification: the “Entity”(N2T) Resolver [EB/OL]. (2006-10-10) [2013-12-17]. http://www. ipresconference.org/ipres06/presentations/John_Kunze-CDL.pdf.
[16]MEALLING M. The Naming Authority Pointer (NAPTR) DNS Resource Record [EB/OL]. (2000-09) [2014-08-23]. http://www.ietf. org/rfc/rfc2915.txt.
[17]KUNZE J. Registered Name Assigning Authority Numbers [EB/ OL]. (2013-11-15) [2013-12-17]. http://www.cdlib.org/uc3/naan_table. html.
[18]KUNZE J. University Library Experience - CDL Case Study [EB/OL]. (2005-06-30) [2013-12-17]. http://dot.ucop.edu/home/jak/ cdl_case_study.ppt.
[19]BERMES E. Persistent Identifiers for Digital Resources: The experience of the National Library of France [EB/OL]. (2006-12-30) [2013-12-17]. http://www.if la.org/VI/4/news/ipnn40.pdf.
[20]FAUDUET L, PEYRARD S. A data-first preservation strategy: data management in SPAR [C]// Proceedings of International Conference on Preservation of Digital Objects, 2010.
[21]PHILLIPS M E. Using Archival Resource Keys (ARKs) for Persistent Identification [EB/OL]. (2008-06-05) [2014-10-02]. http:// digital.library.unt.edu/ark:/67531/metadc28359/.
[22]CLAIR K. Metadata for a Micro-services-based Digital Curation System [EB/OL]. [2013-12-17]. http://dcevents.dublincore.org/index. php/IntConf/dc-2011/paper/viewFile/17/8.
A Research on Archival Resources Key
QU YunPeng1,2,3
(1. Library, Chinese Academy of Sciences, Beijing 100049, China; 2. University of Chinese Academy of Science, Beijing 100049, China; 3. National Library of China, Beijing 100081, China)
ARK (Archival Resources Key) is a kind of persistent identifier for long-term preservation, developed by preserving institutions like libraries. It is suitable for the institutions with long-term preservation needs and can be used for free. What is different from other persistent identifiers is that ARK can point to three kinds of information of a resource: the resource itself, the metadata and the statements of the resource owners. The qualifier system gives the resource provider the most efficient support for the multiple kinds of services, easy for the users to access resources. ARK has been widely used in European and American research institute libraries and deserves more researches on it.
Persistent identifier; ARK; Digital preservation
G250
10.3772/j.issn.1673—2286.2014.12.005
2014-12-01)
* 本研究得到國家社科基金后期資助項目“數(shù)字資源長期保存的技術(shù)研究與實踐”(編號:09FTQ005)資助。
曲云鵬,男,1980年生,國家圖書館數(shù)字資源部館員,研究方向:網(wǎng)絡(luò)存檔、長期保存、自然語言處理,E-mail:quyp@nlc.gov.cn。