国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對(duì)政府網(wǎng)站網(wǎng)頁歸檔的問題思考

2016-05-30 03:46尹哲
北京檔案 2016年2期
關(guān)鍵詞:網(wǎng)頁檔案館政府

尹哲

摘要:政府網(wǎng)站資源具有歷史價(jià)值、文化價(jià)值、研究?jī)r(jià)值和經(jīng)濟(jì)價(jià)值,網(wǎng)頁歸檔理應(yīng)受到重視。本文對(duì)政府網(wǎng)站網(wǎng)頁歸檔的現(xiàn)狀進(jìn)行分析,指出檔案部門網(wǎng)頁歸檔面臨的問題,并提出根據(jù)網(wǎng)頁欄目特點(diǎn)明確歸檔范圍和保管期限、采取適當(dāng)?shù)木W(wǎng)頁歸檔技術(shù)、加強(qiáng)整理及利用、提供法律層面的保障等建議。

關(guān)鍵詞:網(wǎng)頁歸檔歸檔范圍采集工作

自1999年“政府上網(wǎng)”工程啟動(dòng)以來,我國政府網(wǎng)站發(fā)展迅速,為各級(jí)政府有效傳播信息,提高公共服務(wù)水平,促進(jìn)公民參與決策提供了重要支撐。政府網(wǎng)站資源具有歷史價(jià)值、文化價(jià)值、研究?jī)r(jià)值和經(jīng)濟(jì)價(jià)值,國家檔案局原局長(zhǎng)楊冬權(quán)提出:“要把網(wǎng)絡(luò)信息這種‘有價(jià)值的國家資本尤其是把體現(xiàn)政府行使職能的政府網(wǎng)站等信息列入歸檔范圍,對(duì)網(wǎng)站等信息進(jìn)行存檔”??梢?,作為公共文化事業(yè)機(jī)構(gòu)的檔案館理應(yīng)承擔(dān)起網(wǎng)頁歸檔的責(zé)任。

一、網(wǎng)站網(wǎng)頁歸檔的現(xiàn)狀

網(wǎng)絡(luò)資源保存項(xiàng)目源于1996年,首批建立網(wǎng)頁歸檔項(xiàng)目的有澳大利亞、加拿大、瑞典國家圖書館和互聯(lián)網(wǎng)檔案館(Internet Ar? chive)。其后很多國家的圖書館和其他機(jī)構(gòu)也參與進(jìn)來,但是在諸多項(xiàng)目中只有少數(shù)檔案館參與。例如,加拿大的國家圖書檔案館和英國國家檔案館。[1]互聯(lián)網(wǎng)檔案館,在首批建立的網(wǎng)頁歸檔項(xiàng)目中具有典型意義。它定期收錄和抓取全球網(wǎng)站的信息并進(jìn)行保存。對(duì)于大型網(wǎng)站,它每天都備份一次;對(duì)于小型網(wǎng)站,它每年收錄一次。其歸檔范圍也日益完善,從收錄網(wǎng)頁擴(kuò)展到收錄圖片、音頻、軟件、視頻等。英國國家檔案館的政府網(wǎng)頁項(xiàng)目于2003年9月開始,初期選擇收集50個(gè)所轄范圍內(nèi)的政府網(wǎng)站,并與專業(yè)網(wǎng)頁歸檔組織Internet Archive合作。2005年,與Internet memory founda? tion合作。以收集實(shí)體形式和數(shù)字形式的公共記錄為主。[2]

對(duì)于我國來說,已有的網(wǎng)頁歸檔項(xiàng)目是中國Web信息博物館項(xiàng)目和中國國家圖書館的中文網(wǎng)絡(luò)信息資源收集和保存項(xiàng)目。其中,中國Web信息博物館(Web In? foMall)是2002年北京大學(xué)網(wǎng)絡(luò)實(shí)驗(yàn)室開發(fā)建設(shè)的中國網(wǎng)頁歷史信息存儲(chǔ)與展示系統(tǒng)。它通過全面持續(xù)地收集中國互聯(lián)網(wǎng)上的網(wǎng)頁,將獲得的海量網(wǎng)頁組織儲(chǔ)存起來,主要包括歷史網(wǎng)頁存儲(chǔ)系統(tǒng)和回放系統(tǒng)兩個(gè)部分。[3]中國國家圖書館的中文網(wǎng)絡(luò)資源收集和保存項(xiàng)目(WICP)則于2003年啟動(dòng),重點(diǎn)收集對(duì)中國社會(huì)、經(jīng)濟(jì)等有重大影響的網(wǎng)頁以及“gov. cn”域名的中國政府網(wǎng)站。“截至2010年底,它保存了8萬多個(gè)中國政府網(wǎng)站中的所有網(wǎng)頁(gov.cn域名)、315種電子期刊和報(bào)紙。WICP對(duì)網(wǎng)絡(luò)資源按照專題進(jìn)行分類和保存,目前保存的網(wǎng)絡(luò)資源有100多個(gè)專題,在線數(shù)據(jù)庫導(dǎo)航可以訪問約2萬個(gè)服務(wù)項(xiàng)目?!睔w檔網(wǎng)頁已成為國家圖書館數(shù)字資源的重要組成部分。[4]

對(duì)于我國檔案部門來說,其對(duì)政府網(wǎng)站歸檔的工作尚處在探索階段。筆者調(diào)研發(fā)現(xiàn),目前國內(nèi)僅有鄭州市、青島市等少數(shù)檔案館開展了政府網(wǎng)站歸檔的試點(diǎn)工作,大多數(shù)省市檔案部門還沒有開展網(wǎng)頁歸檔工作。在已經(jīng)開展網(wǎng)頁歸檔的省市檔案館中,不僅歸檔的網(wǎng)頁數(shù)量較少,而且也沒有建立起一套完整的收集、保管、利用的管理體系。

二、檔案部門開展網(wǎng)頁歸檔面臨的問題

(一)歸檔的范圍和保管期限不明確

中國Web博物館項(xiàng)目和WICP等項(xiàng)目采取的是全面網(wǎng)頁收集方式,即對(duì)網(wǎng)站和網(wǎng)頁全部收集。各級(jí)檔案部門則對(duì)網(wǎng)頁收集歸檔的范圍和期限沒有明確標(biāo)準(zhǔn)。筆者認(rèn)為,對(duì)于企業(yè)網(wǎng)站、商業(yè)網(wǎng)站、個(gè)人網(wǎng)站等來說,政務(wù)網(wǎng)站應(yīng)是檔案部門關(guān)注的重點(diǎn)。也就是說,并非所有的政務(wù)網(wǎng)站網(wǎng)頁文件都具有長(zhǎng)期保存價(jià)值,因此需要按照網(wǎng)頁內(nèi)容的價(jià)值來決定網(wǎng)頁的歸檔范圍和保管期限。如果不加甄別地將所有網(wǎng)頁信息全部歸檔,很可能造成網(wǎng)頁數(shù)據(jù)的堆積,使得無效或價(jià)值較低的網(wǎng)頁信息占據(jù)大量存儲(chǔ)空間。

(二)歸檔的技術(shù)和標(biāo)準(zhǔn)不完備

網(wǎng)頁信息采集是從給定的網(wǎng)頁出發(fā),根據(jù)網(wǎng)頁中提供的超鏈接信息,連續(xù)地抓取網(wǎng)頁(可以是靜態(tài)的,也可以是動(dòng)態(tài)的)和網(wǎng)絡(luò)中的文件,并全部提取網(wǎng)頁內(nèi)的信息。從技術(shù)上來說,靜態(tài)網(wǎng)頁的抓取比較簡(jiǎn)單,可以按照時(shí)間頻率定期進(jìn)行。動(dòng)態(tài)網(wǎng)頁的捕獲和存儲(chǔ)技術(shù)并不成熟,抓取軟件很難齊全抓取。隨著網(wǎng)頁制作技術(shù)的不斷提高,新型網(wǎng)頁文件不斷產(chǎn)生。除了HTML格式文件以外,網(wǎng)頁上還有很多其他格式的文件,如Java文件、Ac? tiveX文件、Jpg等圖片文件以及各類文本文件。對(duì)于上述文件哪些需要?dú)w檔,目前尚無明確標(biāo)準(zhǔn)。

(三)歸檔的保管和利用體系不完善

網(wǎng)站網(wǎng)頁的保管不僅僅是對(duì)原始文件的存儲(chǔ),支持網(wǎng)頁文件運(yùn)行的軟件和硬件平臺(tái)也決定了網(wǎng)頁是否可以長(zhǎng)期利用。部分網(wǎng)站網(wǎng)頁存檔僅保存了原始網(wǎng)頁,脫離了原有的軟硬件平臺(tái),網(wǎng)頁便無法展現(xiàn)。因此,合理完備的備份體系決定了網(wǎng)站網(wǎng)頁能否全面、及時(shí)有效地進(jìn)行保存。另外,針對(duì)不同形式的網(wǎng)頁構(gòu)建統(tǒng)一的資源體系,提供全方位的檢索利用模式等問題也有待考慮,不同的網(wǎng)頁如果不分類則無法檢索,建議按照其內(nèi)容和形式特征進(jìn)行分析、選擇和標(biāo)注。

(四)歸檔的法律問題不能避免

一是著作權(quán),許多網(wǎng)站的文件作者并不明確,在利用時(shí)應(yīng)考慮其帶來的法律問題。二是采集權(quán),檔案部門是否對(duì)網(wǎng)站網(wǎng)頁具有下載、負(fù)責(zé)、存儲(chǔ)的權(quán)限。三是保管權(quán),檔案館是否可以長(zhǎng)期保存網(wǎng)站的網(wǎng)頁信息。四是使用權(quán),網(wǎng)站信息資源在檔案部門是否可以再次發(fā)布利用。五是隱私權(quán),在網(wǎng)站信息的使用過程中是否侵犯了網(wǎng)站形成者的隱私權(quán)。[5]

三、檔案部門開展網(wǎng)頁歸檔工作的對(duì)策

(一)根據(jù)網(wǎng)頁欄目特點(diǎn)明確歸檔范圍和保管期限

政府網(wǎng)站的欄目分為政府信息公開類、在線辦事類、公眾參與類三類。政府信息公開類欄目包括信息公開目錄、信息公開指南、各類年報(bào)、法規(guī)文件、規(guī)劃計(jì)劃等。此類文件內(nèi)容相對(duì)穩(wěn)定,重要性強(qiáng),應(yīng)長(zhǎng)期保存。動(dòng)態(tài)信息和通知公告等欄目?jī)?nèi)容更新頻繁,時(shí)效性較強(qiáng),應(yīng)定期保存。在線辦事類欄目提供的場(chǎng)景服務(wù)或虛擬一站式大廳,具有一定的時(shí)效性,應(yīng)定期保存。網(wǎng)上審批、網(wǎng)上辦事等業(yè)務(wù)多涉及單位和個(gè)人信息,應(yīng)長(zhǎng)期保存。公眾參與類欄目比如網(wǎng)上調(diào)查、民意征集、網(wǎng)上咨詢等信息具有一定的時(shí)效性,應(yīng)短期保存。除了以上三類以外,一些部門或相關(guān)熱點(diǎn)鏈接,可根據(jù)重要程度保存,不重要的不保存。

(二)采取適當(dāng)?shù)木W(wǎng)頁歸檔技術(shù)

采集是政府網(wǎng)站信息資源保存的首要環(huán)節(jié)。所謂采集,就是以既定的概率,及時(shí)選擇值得保存的政府信息資源,并通過各種方式將其歸檔。[6]目前的采集模式主要有推送和拉取兩種。

1.推送模式是政府或者第三方機(jī)構(gòu)主動(dòng)將網(wǎng)站信息主動(dòng)呈繳或捐贈(zèng)到保存機(jī)構(gòu)。呈繳或捐贈(zèng)的信息資源既包括易于采集的資源,又包括機(jī)構(gòu)不易保存的深層網(wǎng)頁及數(shù)據(jù)庫資源。筆者調(diào)研發(fā)現(xiàn),此類網(wǎng)站信息主動(dòng)呈繳給檔案館的情況非常少。在一些呈繳的案例中,多數(shù)是因?yàn)檎块T或臨時(shí)機(jī)構(gòu)撤并,需要在較短時(shí)間內(nèi)將其網(wǎng)站的全部數(shù)據(jù)包括架構(gòu)等完全移交至檔案館,由于沒有更多的標(biāo)準(zhǔn),檔案館對(duì)網(wǎng)頁信息并沒有時(shí)間進(jìn)行有效篩選。

2.拉取模式是保存機(jī)構(gòu)使用的特定軟件工具,主動(dòng)采集政府網(wǎng)站信息資源并將其下載到本地服務(wù)器。其采集方法主要有:(1)廣泛式采集。采用收割軟件自動(dòng)采集國家域名范圍內(nèi)或整個(gè)因特網(wǎng)的網(wǎng)頁及其他在線資源。其采用的網(wǎng)絡(luò)爬蟲或網(wǎng)絡(luò)蜘蛛技術(shù)已經(jīng)成熟。優(yōu)點(diǎn)是收集范圍齊全,人工介入較少;缺點(diǎn)是質(zhì)量難以把控,采集時(shí)間較長(zhǎng)、耗時(shí)較多。(2)選擇性采集。按照特定標(biāo)準(zhǔn),有選擇地采集部分網(wǎng)絡(luò)空間或特定資源。其基于對(duì)資源的重要性、主題或內(nèi)容相關(guān)聯(lián)的某些資源進(jìn)行甄選。優(yōu)點(diǎn)是收集質(zhì)量相對(duì)較高;缺點(diǎn)是采用人工方式甄別和采集,具有一定的主觀性,甄別難度較大。(3)專題性采集。一般針對(duì)具體的專題或事件進(jìn)行采集。(4)復(fù)合式采集。由于單一方法存在局限,所以越來越多的網(wǎng)頁歸檔項(xiàng)目趨于復(fù)合式的采集方法。

(三)加強(qiáng)整理及利用

從不同政府網(wǎng)站采集的信息是海量的,檔案部門有必要對(duì)這些信息進(jìn)行篩選過濾、重命名和標(biāo)示、分類和編目。經(jīng)編目后形成一系列專題,并提供時(shí)間、地域、關(guān)鍵詞等多種檢索途徑,使讀者按各個(gè)分類進(jìn)行瀏覽,便于用戶選擇。

(四)提供法律層面的保障

一是檔案部門應(yīng)對(duì)檔案法及相關(guān)法規(guī)進(jìn)行修正,建立合法的呈繳制度,構(gòu)建統(tǒng)一的國家呈繳體系。二是修改《著作權(quán)法》等法律法規(guī),賦予檔案館出于保存目的而對(duì)政府網(wǎng)站進(jìn)行采集、復(fù)制和編輯的權(quán)利。三是通過與政府機(jī)構(gòu)合作,獲得版權(quán)所有者的許可。

注釋及參考文獻(xiàn):

[1]王爍.法國國家圖書館網(wǎng)頁歸檔項(xiàng)目發(fā)展?fàn)顩r研究[J].陜西檔案,2012(3):46-47.

[2]梁皆璇.英國政府網(wǎng)頁檔案項(xiàng)目及其啟示[J].北京檔案,2014(12):38-40.

[3]周文佳.豐富數(shù)字檔案館館藏的新視角——由In? ternet archive和中國Web信息博物館所想到的[J].浙江檔案,2008(9):17 -18.

[4]姜萌萌.簡(jiǎn)析我國網(wǎng)頁歸檔項(xiàng)目對(duì)檔案館工作的啟示[J].蘭臺(tái)世界,2013(3):28-29 .

[5]周文佳.網(wǎng)站文件的歸檔——從檔案學(xué)視角捕獲和保存網(wǎng)站文件[J].中國檔案,2008(10):42-44.

[6]王爍,魏紅,于麗曼.網(wǎng)頁歸檔項(xiàng)目中的采集策略研究[J].辦公室業(yè)務(wù),2013(2):157-158.

作者單位:北京市檔案館

猜你喜歡
網(wǎng)頁檔案館政府
知法犯法的政府副秘書長(zhǎng)
基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計(jì)
基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
全省部分檔案館新館掠影
依靠政府,我們才能有所作為
網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
政府手里有三種工具
太倉市數(shù)字檔案館成為“全國示范數(shù)字檔案館”
10個(gè)必知的網(wǎng)頁設(shè)計(jì)術(shù)語
科隆檔案館突然坍塌