田艷羅 陳建
摘 要:通過對(duì)荷蘭阿姆斯特丹檔案館“VeleHanden”(眾在參與)眾包案例的調(diào)研發(fā)現(xiàn),其在館藏選擇、用戶激勵(lì)、平臺(tái)設(shè)計(jì)和質(zhì)量控制方面有成熟完善的措施。我國檔案眾包實(shí)踐目前存在政策支持不明確、社會(huì)關(guān)注度不足、平臺(tái)管理不完善及檔案開放工作滯后等困境,可以充分借鑒荷蘭先進(jìn)經(jīng)驗(yàn),從制度規(guī)范、檔案開放、公眾參與、平臺(tái)建設(shè)、質(zhì)量控制等方面著手進(jìn)行改進(jìn),提高我國檔案眾包實(shí)踐質(zhì)量和水平。
關(guān)鍵詞:荷蘭;阿姆斯特丹;眾在參與;檔案眾包;檔案數(shù)字化;質(zhì)量控制;檔案開放
Abstract: The research on the case of 'VeleHanden' crowdsourcing in the Netherlands Amsterdam Archives showsthat it has mature and perfect measures in archival collection selection, user motivation, platform design and qualitycontrol. The current dilemmas of China's archival crowdsourcing practice include unclear policy support, insufficientsocial attention, imperfect platform management, and lagging archival openness. We can fully learn from theadvanced experience of the Netherlands and start to make improvement in terms of system regulation, archiveopening, public participation, platform construction and quality control to improve the quality and level of archivalcrowdsourcing practice in China.
Keywords: Netherlands; Amsterdam; Velehanden; Archival crowdsourcing; Archival digitization; Quality control;Archive opening
眾包即“一個(gè)公司或機(jī)構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的大眾網(wǎng)絡(luò)的做法”[1],眾包模式在檔案領(lǐng)域的應(yīng)用也有著許多成功的例子,形成了良好的示范效應(yīng)。綜合國內(nèi)外學(xué)者的研究發(fā)現(xiàn),對(duì)國外檔案眾包實(shí)踐的關(guān)注更多集中在英語語言國家。荷蘭的檔案眾包項(xiàng)目“VeleHanden”雖然具備開始時(shí)間早、參與人數(shù)多、平臺(tái)設(shè)計(jì)完善等特點(diǎn),但是因?yàn)轫?xiàng)目網(wǎng)站和檔案文字更多使用的是荷蘭語,受到語言的限制并沒有引起更多學(xué)者的注意。目前國內(nèi)對(duì)于此項(xiàng)目的直接研究成果僅有一篇,即鄧成雯從檔案眾包的角度對(duì)VeleHanden的運(yùn)行、組織、法律、激勵(lì)和質(zhì)量控制機(jī)制進(jìn)行了全面的介紹,也從規(guī)范、主體和客體3個(gè)層面提出了對(duì)我國開展檔案眾包的啟示,[2]但其研究僅局限于平臺(tái)本身,沒有參考足夠的外文文獻(xiàn),對(duì)平臺(tái)的前期設(shè)計(jì)關(guān)注較少,并未分析我國檔案眾包的開展困境,其啟示缺乏針對(duì)性。
本文對(duì)荷蘭VeleHanden眾包項(xiàng)目進(jìn)行研究,分別從檔案部門、眾包網(wǎng)站設(shè)計(jì)、眾包項(xiàng)目參與者等多個(gè)角度總結(jié)歸納出項(xiàng)目特點(diǎn),尋找其項(xiàng)目開展及順利運(yùn)行傳播的因素,在分析我國目前檔案眾包實(shí)踐及其阻礙因素的基礎(chǔ)上,根據(jù)項(xiàng)目研究及我國檔案眾包的現(xiàn)實(shí)情況提出更具針對(duì)性的啟示。
1 荷蘭“VeleHanden”項(xiàng)目的開展背景及內(nèi)容分析
1.1 項(xiàng)目開展背景。阿姆斯特丹市檔案館成立于1848年,館藏的各類檔案材料排架長度超過55公里。阿姆斯特丹市的檔案數(shù)字化工作開始時(shí)間早,數(shù)字化程度高。檔案館自20世紀(jì)90年代推出網(wǎng)絡(luò)查檔系統(tǒng),2005年為公眾提供按需掃描服務(wù),截止到2020年,已經(jīng)有3000萬次的掃描。從2023年4月起,檔案館開始提供下載服務(wù),利用者可以根據(jù)需求以多種格式下載檔案。
“VeleHanden”的概念由阿姆斯特丹市檔案館首次提出,期望能夠創(chuàng)建一個(gè)可持續(xù)的眾包平臺(tái),檔案館對(duì)平臺(tái)的不同部分應(yīng)該以什么樣的方式開展工作提出構(gòu)想,由Picturae公司的軟件工程師去具體完成。在項(xiàng)目準(zhǔn)備期招募志愿者組建測試小組,提前參與檔案眾包的項(xiàng)目并提出反饋意見,[3]這也為之后吸引公眾參與,維持VeleHanden項(xiàng)目的持續(xù)良好運(yùn)行奠定了基礎(chǔ)。
1.2 平臺(tái)簡介。VeleHanden眾包平臺(tái)歸Picturae公司所有,負(fù)責(zé)網(wǎng)站的創(chuàng)建、日常維護(hù)和進(jìn)一步開發(fā)以及參與者論壇的管理,并將檔案館提供的檔案材料進(jìn)行數(shù)字化后上傳網(wǎng)站供眾包參與者選擇和開展任務(wù)。除阿姆斯特丹市檔案館之外,VeleHanden眾包平臺(tái)也歡迎其他檔案機(jī)構(gòu)參與進(jìn)來,只需要支付一筆服務(wù)費(fèi)[4]。檔案機(jī)構(gòu)是某個(gè)具體眾包項(xiàng)目的所有者,提供館藏物品負(fù)責(zé)具體項(xiàng)目的創(chuàng)建、管理和整體實(shí)施[5]。
VeleHanden的網(wǎng)站平臺(tái)頁面簡潔,內(nèi)容清晰明了,主要包括“首頁”“項(xiàng)目”“參與者”“新聞”“關(guān)于我們”“幫助”6個(gè)模塊。首頁展示了項(xiàng)目、新聞、參與者采訪的精選內(nèi)容。項(xiàng)目模塊統(tǒng)計(jì)了VeleHanden平臺(tái)自2011 年創(chuàng)建以來所有的眾包項(xiàng)目,其中已完成(結(jié)束)項(xiàng)目98個(gè),用戶還可參與的活躍項(xiàng)目19個(gè)。每個(gè)眾包項(xiàng)目都有項(xiàng)目信息介紹、參與者可獲得的獎(jiǎng)勵(lì)、詳細(xì)的輸入和操作說明以及可視化的項(xiàng)目進(jìn)度,并設(shè)置了交流論壇可供管理者與參與者和參與者之間的交流互動(dòng),方便公眾能夠更順暢地選擇和完成項(xiàng)目任務(wù)。新聞部分更新十分頻繁,是平臺(tái)發(fā)布的關(guān)于眾包項(xiàng)目的更新預(yù)告、平臺(tái)維護(hù)說明、重要節(jié)日祝福等新聞。截至2023年5月,VeleHanden已經(jīng)有22367人注冊參與眾包項(xiàng)目,累計(jì)完成了1300余萬份掃描件的眾包工作。[6]
1.3 眾包任務(wù)分析。在VeleHanden眾包平臺(tái)上參與者需要完成的主要任務(wù)包括編制索引、著錄照片和添加標(biāo)簽、校對(duì)人工智能的工作等。
為歷史檔案編制索引是平臺(tái)上絕大部分眾包項(xiàng)目的主要任務(wù),檔案館館藏的歷史檔案在經(jīng)過數(shù)字化掃描后上傳到平臺(tái),參與者需對(duì)文件中的手寫文本進(jìn)行識(shí)別并按要求輸入,這就需要志愿者有一定的古文字水平和必要的外文能力。
為方便更多的初學(xué)者參與此類眾包項(xiàng)目,檔案館提供了詳細(xì)的輸入說明和部分古代手寫文字與現(xiàn)代字母的對(duì)比。2011 年VeleHanden平臺(tái)建立之初的首個(gè)眾包項(xiàng)目“民兵登記冊1814—1941”是按姓名、出生日期和出生地編制民兵登記冊索引,共吸引了1397名志愿者參與,項(xiàng)目歷時(shí)三年多完成并于2022年12月存檔。
照片檔案是歷史畫面的生動(dòng)寫照,但是由于年代久遠(yuǎn),照片背后的故事和人物信息已經(jīng)隨時(shí)間消逝,為了使這些照片檔案被更方便地檢索到,需要眾包參與者對(duì)照片信息進(jìn)行著錄和添加標(biāo)記。例如“格羅寧根的形象:新聞攝影機(jī)構(gòu) D.van der Veen”項(xiàng)目,格羅寧根檔案館保留了新聞攝影機(jī)構(gòu)拍攝的格羅寧根市二十世紀(jì)六七十年代大小事件的底片,為了這些圖片能夠更好地被查找和使用,需要參與者對(duì)這些圖片進(jìn)行著錄,如果參與者曾居住在格羅寧根市,或者是格羅寧根足球俱樂部的體育迷,那么將會(huì)對(duì)著錄這些圖片有很大幫助,對(duì)照片中的信息描述得越具體越有利于對(duì)照片的檢索利用。
計(jì)算機(jī)通過深度學(xué)習(xí)能夠識(shí)別早年的手寫筆跡、可以對(duì)照片中的場景進(jìn)行識(shí)別和簡單分類,然而計(jì)算機(jī)的轉(zhuǎn)錄與識(shí)別并不是十分準(zhǔn)確,這就需要眾包參與者將原歷史檔案與計(jì)算機(jī)生成的文本進(jìn)行比對(duì)并更正錯(cuò)誤,經(jīng)過糾正,計(jì)算機(jī)能夠重新獲得訓(xùn)練提升轉(zhuǎn)錄的準(zhǔn)確性。2022年的“布魯日奧爾德曼銀行檔案的證人證詞”是一個(gè)更正類型的眾包項(xiàng)目,參與者對(duì)計(jì)算機(jī)錯(cuò)誤識(shí)別的文本進(jìn)行更正并做好標(biāo)記,能夠幫助計(jì)算機(jī)獲得廣泛的文本語料庫,為研究者提供十八世紀(jì)荷蘭南部日常生活的信息?!皵z影記憶:訓(xùn)練計(jì)算機(jī)”項(xiàng)目首次訓(xùn)練人工智能應(yīng)用于識(shí)別照片中的場景,參與者從計(jì)算機(jī)提供的五個(gè)類別中選擇出最合適的一個(gè),人工的參與可以訓(xùn)練計(jì)算機(jī)更精確地識(shí)別出照片的主要主題。
2 荷蘭“VeleHanden”眾包項(xiàng)目的特點(diǎn)
2.1 選擇合適的館藏檔案。所選擇用來參與眾包的檔案包括各種與公眾生活密切相關(guān)的信息登記冊,參與者有機(jī)會(huì)從中找到自己祖先的相關(guān)信息,激發(fā)了公眾的參與熱情。平臺(tái)上的眾包項(xiàng)目除了歷史、民政的類別,還涉及法律契約、證人證詞、地圖標(biāo)記等,能夠吸引到文史、政法、地理等多領(lǐng)域的愛好者參與進(jìn)來。
2.2 低門檻與便捷的進(jìn)入通道。VeleHanden項(xiàng)目是低門檻的,歡迎荷蘭內(nèi)外的所有人參與眾包。大部分的眾包任務(wù)簡單易做,公眾可以很容易地參與進(jìn)來。除電子郵箱地址必須是真實(shí)信息,參與者的姓名、性別和地區(qū)等內(nèi)容都可以虛構(gòu),充分尊重志愿者對(duì)個(gè)人隱私信息的公開權(quán)利。平臺(tái)在設(shè)計(jì)時(shí)遵循的三個(gè)原則是確保快速、簡單和盡可能地自動(dòng)化,在參與者輸入字段的過程中,掃描圖像會(huì)自動(dòng)定位到相應(yīng)位置,方便用戶操作提高效率和體驗(yàn)感。[7]
平臺(tái)使用OpenID技術(shù),用戶可以通過Google、Facebook、Twitter等世界通用的社交媒體賬號(hào)直接登錄平臺(tái),這也方便了世界上其他地區(qū)的用戶參與眾包項(xiàng)目。每周三下午,志愿者還可以到阿姆斯特丹市檔案館大樓的信息中心,在線下與小組成員一起參與轉(zhuǎn)錄和輸入數(shù)據(jù)。[8]
2.3 穩(wěn)定的平臺(tái)功能與活躍的平臺(tái)氛圍。開發(fā)檔案眾包任務(wù)依托網(wǎng)絡(luò)平臺(tái),因此平臺(tái)的穩(wěn)定性和安全性至關(guān)重要。VeleHanden網(wǎng)站的開發(fā)商Picturae公司是荷蘭專業(yè)的大規(guī)模文化遺產(chǎn)數(shù)字化服務(wù)機(jī)構(gòu),提供長期在線存儲(chǔ)數(shù)字化藏品的服務(wù),有成熟的軟件開發(fā)技術(shù)和平臺(tái)維護(hù)能力。為了在線用戶良好的參與體驗(yàn),平臺(tái)有明文規(guī)定的個(gè)人信息和隱私保護(hù)細(xì)則,使用先進(jìn)的技術(shù)維護(hù)用戶在操作時(shí)的流暢性。
交流論壇和平臺(tái)發(fā)布的新聞?dòng)行У鼐S持了網(wǎng)站的活躍度。平臺(tái)設(shè)計(jì)者很早就意識(shí)到溝通是平臺(tái)成功的關(guān)鍵因素,在每個(gè)項(xiàng)目都設(shè)了留言和討論區(qū)域,參與者可以在討論區(qū)發(fā)布問題并分享自己的經(jīng)驗(yàn)和發(fā)現(xiàn),還可以就其他用戶的問題給出自己的解答?;钴S的網(wǎng)站給用戶積極的反饋,使用戶有較高的參與感和獲得感,而不是像完成任務(wù)一樣孤零零地輸入數(shù)據(jù),能夠有效地增強(qiáng)用戶黏性。
2.4 全過程的質(zhì)量控制,保障眾包項(xiàng)目的質(zhì)量。阿姆斯特丹市檔案館很注重眾包項(xiàng)目的質(zhì)量,從前期設(shè)計(jì)、中期管理到后期審核做好了全過程的質(zhì)量控制。
前期合理設(shè)計(jì)眾包平臺(tái)?!霸跊]有公眾的反饋下開發(fā)他們將要使用的工具是錯(cuò)誤做法”,在VeleHanden眾包平臺(tái)的設(shè)計(jì)過程中,阿姆斯特丹市檔案館就招募志愿者組成測試小組[9],充分考慮參與用戶的意見,開發(fā)更適合參與者操作的平臺(tái)。在注冊前,公眾可以通過輸入“索引示例”來判斷自己能否勝任這份工作,平臺(tái)也能篩選出更適合的參與者。
中期規(guī)范參與者的輸入操作。平臺(tái)上發(fā)布的每個(gè)具體的眾包項(xiàng)目都有詳細(xì)的具體操作說明,項(xiàng)目介紹能夠讓參與者快速了解項(xiàng)目從而選擇自己感興趣的部分,示例視頻和PDF輸入說明幫助參與者學(xué)習(xí)如何輸入數(shù)據(jù)。在用戶第一次操作時(shí),在數(shù)據(jù)輸入框下還會(huì)有自動(dòng)的步驟引導(dǎo)。網(wǎng)站的自動(dòng)檢查程序能夠?qū)Ω袷藉e(cuò)誤的輸入提出警告,參與者如果發(fā)現(xiàn)異常情況可以通過溝通按鈕直接向項(xiàng)目協(xié)調(diào)員發(fā)送郵件。[10]
后期的檢查審核。VeleHanden使用復(fù)式系統(tǒng),將同一份掃描文件派發(fā)給兩個(gè)不同的人獨(dú)立輸入數(shù)據(jù),完成后交由第三人進(jìn)行審查,如果檢查員不能確定結(jié)果的正誤,可以提交給項(xiàng)目負(fù)責(zé)人進(jìn)行處理。歷史檔案大部分為手寫文字并且年代久遠(yuǎn),檔案原件會(huì)出現(xiàn)手寫錯(cuò)誤或模糊不清的情況,這給參與者的工作造成很大困擾,兩個(gè)參與者較多的輸入分歧也會(huì)影響檢查員的審查。為了維護(hù)檔案數(shù)據(jù)的真實(shí)性,學(xué)會(huì)與原始材料的錯(cuò)誤與缺漏共處至關(guān)重要。民兵登記冊項(xiàng)目的搜索系統(tǒng)設(shè)計(jì)得十分巧妙,在克服原始數(shù)據(jù)本身存在的錯(cuò)誤的情況下,能夠方便用戶很輕松地檢索到相應(yīng)的信息。[11 ]
3 我國檔案眾包實(shí)踐困境分析
為更好開發(fā)檔案資源,我國已經(jīng)進(jìn)行了一些具有檔案眾包色彩的實(shí)踐,經(jīng)過調(diào)研發(fā)現(xiàn),目前已開展的項(xiàng)目有“我的北京記憶”項(xiàng)目、盛宣懷檔案抄錄項(xiàng)目、籍合網(wǎng)古籍整理眾包平臺(tái)等。這些項(xiàng)目吸引到一定數(shù)量的眾包參與者,能夠有效地幫助保護(hù)城市記憶、提高檔案轉(zhuǎn)錄和古籍出版效率,為我國檔案收集眾包、轉(zhuǎn)錄眾包提供了優(yōu)秀范例。但是我國的檔案眾包實(shí)踐總體來說處于萌芽試點(diǎn)階段,開展數(shù)量稀少,公眾參與度低,社會(huì)影響較小,面臨著諸多困境。
3.1 制度環(huán)境方面:缺乏明確的政策指導(dǎo)。開展檔案眾包缺乏明確的政策支持。2020年新出臺(tái)的《中華人民共和國檔案法》第七條增加“國家鼓勵(lì)社會(huì)力量參與和支持檔案事業(yè)的發(fā)展”的表述,然而對(duì)于何種社會(huì)力量以什么樣的方式參與檔案事業(yè)并沒有具體的解釋。檔案眾包作為社會(huì)力量參與檔案事業(yè)的一種形式并沒有專門針對(duì)性的規(guī)章制度進(jìn)行指導(dǎo),從前期準(zhǔn)備、平臺(tái)設(shè)計(jì)到參與雙方的權(quán)責(zé)都沒有統(tǒng)一的規(guī)范,只能依靠檔案眾包的發(fā)起方在實(shí)踐中摸索。
3.2 檔案開放方面:檔案資源開放較滯后。豐富有特色的館藏檔案資源是公眾積極參與檔案眾包的內(nèi)在動(dòng)機(jī)。然而《中國統(tǒng)計(jì)年鑒2022》的相關(guān)數(shù)據(jù)顯示,2001年至2021年,我國綜合檔案館的館藏檔案迅速增長,與之相比的開放檔案數(shù)量增速相對(duì)緩慢,利用檔案在開放檔案中所占的比例越來越低,這說明我國的檔案開放工作還有很大的提升空間,如表1所示[12]。而在檔案資源的開放過程中,檔案館還應(yīng)關(guān)注到數(shù)字化副本的開放問題。近年來隨著檔案數(shù)字化項(xiàng)目的開展,極大地提高了館藏紙質(zhì)檔案的數(shù)字化率,但是由于檔案專業(yè)人員有限,開放鑒定進(jìn)程相對(duì)緩慢,數(shù)字化副本的開放速度滯后于數(shù)字化速度[13],影響了公眾對(duì)檔案的檢索利用。檔案未經(jīng)開放也就不能上傳到網(wǎng)站供公眾瀏覽和參與眾包工作,難以吸引到更多的眾包參與者,影響檔案眾包的進(jìn)程。
3.3公眾意識(shí)方面:社會(huì)總體關(guān)注度不足。自2006年眾包的概念被首次提出以來,眾包模式逐漸在各行各業(yè)被廣泛應(yīng)用,但與營利性質(zhì)的商業(yè)眾包相比,知識(shí)文化類眾包的關(guān)注度相對(duì)較低。此外,檔案眾包的特殊性也使其并沒有獲得足夠的關(guān)注。首先,檔案通常被封閉在昏暗的庫房中,在社會(huì)大眾的觀念里檔案是神秘嚴(yán)肅的。其次,檔案部門沒有很好地進(jìn)行檔案宣傳。大多數(shù)檔案館官方公眾號(hào)與公眾的互動(dòng)很少,對(duì)推文留言板塊的留言不予回應(yīng),這也消耗了公眾參與檔案事業(yè)的積極性。[14]最后,檔案相關(guān)信息的受眾有限,傳播范圍小,公眾在網(wǎng)絡(luò)上和實(shí)際生活中通常沒有機(jī)會(huì)接收到檔案信息。這些因素阻斷了公眾對(duì)檔案眾包的關(guān)注,也使得其難以轉(zhuǎn)化成檔案眾包參與者,為檔案資源的開發(fā)貢獻(xiàn)智慧。
3 . 4 平臺(tái)建設(shè)方面: 平臺(tái)管理不完善嚴(yán)密。與VeleHanden網(wǎng)站相比,我國現(xiàn)有的檔案眾包平臺(tái)缺乏參與者與項(xiàng)目管理者便捷的溝通渠道、眾包任務(wù)單一且未進(jìn)行明確的難度分級(jí)、未能做好項(xiàng)目的全程管理。以盛宣懷檔案抄錄項(xiàng)目和古籍整理眾包平臺(tái)為例:第一,盛宣懷檔案抄錄項(xiàng)目和古籍整理眾包平臺(tái)均未設(shè)計(jì)交流區(qū),用戶與項(xiàng)目管理者溝通只能通過上一級(jí)的上海市圖書館或籍合網(wǎng)平臺(tái)進(jìn)行反饋,不能及時(shí)解決在參與眾包過程中遇到的問題,影響參與者的體驗(yàn)。第二,盛宣懷檔案抄錄項(xiàng)目的任務(wù)是將手寫歷史檔案抄錄為現(xiàn)代漢語,對(duì)檔案材料中的文本進(jìn)行識(shí)別有一定困難,即便是專業(yè)人員也要花費(fèi)大量時(shí)間。第三,平臺(tái)的難度分級(jí)十分模糊,僅針對(duì)項(xiàng)目進(jìn)行難度分級(jí),而每個(gè)項(xiàng)目中的具體任務(wù)沒有明確的難度說明,使得參與者不能較快地找到適合自己的任務(wù),影響眾包效率和參與者的積極性。第四,眾包平臺(tái)在全程管理方面有所欠缺,在已經(jīng)截止的75個(gè)抄錄項(xiàng)目中僅有23個(gè)項(xiàng)目的完成度是百分之百,部分項(xiàng)目甚至沒有人參與抄錄。注冊的用戶可以隨意選擇認(rèn)領(lǐng)和刪除認(rèn)領(lǐng)抄錄任務(wù),已經(jīng)過期的任務(wù)仍在任務(wù)列表中并未刪除。隨意的項(xiàng)目和用戶管理會(huì)影響最終的檔案眾包結(jié)果,未及時(shí)更新的眾包任務(wù)影響了用戶的抄錄效率。
4 “VeleHanden”項(xiàng)目對(duì)我國開展檔案眾包的啟示
針對(duì)目前我國檔案眾包實(shí)踐面臨的困境, 借鑒VeleHanden項(xiàng)目的優(yōu)秀經(jīng)驗(yàn),我國可以從制度規(guī)范、檔案開放、公眾參與、平臺(tái)建設(shè)、質(zhì)量控制等方面進(jìn)行改進(jìn)。4.1 完善相關(guān)制度規(guī)范。開展檔案眾包實(shí)踐,要政策先行。檔案眾包涉及檔案機(jī)構(gòu)、平臺(tái)開發(fā)者和公眾等多方主體,流程復(fù)雜,運(yùn)行管理有一定的難度,檔案主管部門應(yīng)當(dāng)制定統(tǒng)一的制度規(guī)范指導(dǎo)檔案眾包實(shí)踐更好地開展。在檔案眾包的開展過程中,需將檔案資源上傳到開放的網(wǎng)站平臺(tái)上供大家瀏覽,存在信息安全風(fēng)險(xiǎn);用戶在眾包平臺(tái)上貢獻(xiàn)內(nèi)容屬于個(gè)人的智慧勞動(dòng),涉及知識(shí)產(chǎn)權(quán)保護(hù)的問題[15];參與者在注冊時(shí)一般需要填寫較多的個(gè)人信息,關(guān)系到個(gè)人隱私的獲取與保護(hù)。為了充分尊重各方主體的權(quán)利,保障眾包項(xiàng)目的良好運(yùn)行,VeleHanden平臺(tái)制定了專門的信息政策,嚴(yán)格遵守荷蘭的法律規(guī)范、歐盟的信息數(shù)據(jù)管理規(guī)定,明確了各參與主體的權(quán)責(zé)。我國也應(yīng)當(dāng)參考現(xiàn)有的網(wǎng)絡(luò)安全法、個(gè)人信息保護(hù)法等法律法規(guī)制定更適合檔案眾包的制度規(guī)范,保障檔案眾包各參與主體的合法權(quán)益。
4.2 做好檔案的鑒定開放。雖然我國的檔案開放數(shù)量在逐年增長,但因?yàn)闄n案存量和增量巨大,檔案開放率還處于較低的水平[16],難以滿足開發(fā)檔案眾包項(xiàng)目的需求。此外,經(jīng)過鑒定達(dá)到開放標(biāo)準(zhǔn)的檔案是否能上傳到眾包平臺(tái)供公眾查看和轉(zhuǎn)錄,也是實(shí)際工作中需要考慮的問題。2022年8月開始實(shí)施的《國家檔案館檔案開放辦法》在檔案開放主體和范圍、檔案開放程序和方式、開放檔案利用和保護(hù)、保障和監(jiān)督方面提供了新的指導(dǎo)。
檔案館可以根據(jù)本館檔案的利用現(xiàn)狀,總結(jié)出用戶對(duì)館藏利用最多的內(nèi)容,優(yōu)先開展這類檔案的鑒定開放工作。大部分公眾首先對(duì)檔案館的館藏檔案感興趣,然后才會(huì)參與基于本館館藏開發(fā)的檔案眾包項(xiàng)目。隨著歷史上行政區(qū)劃的變遷,部分反映同一事件的歷史檔案分散保存在不同省市的檔案館,這時(shí)檔案部門之間可以進(jìn)行溝通交流,合作開發(fā)同一個(gè)眾包項(xiàng)目。以長征檔案為例,主體收藏在中央檔案館,另一部分存留在中國第二歷史檔案館和云南、貴州、四川等省級(jí)檔案館,館際之間的合作能夠聚合更多的相關(guān)檔案,達(dá)到更好的眾包效果。
4.3 采取多種方式提高公眾參與度。用戶是檔案眾包的核心[17],為了吸引更多的眾包參與者,我國可以采用線上線下兩種方式進(jìn)行針對(duì)性的宣傳,而不僅僅依賴于線上平臺(tái)。比如,可以在館內(nèi)的電子閱覽室開設(shè)專門的檔案眾包工作區(qū)域,供來館的參觀者和查檔者注冊試用。再如,可在文化機(jī)構(gòu)、學(xué)校等場所進(jìn)行專題宣傳,吸引對(duì)歷史和文化感興趣的參與者。
此外,檔案眾包平臺(tái)可以適當(dāng)添加中英雙語切換的功能,吸引對(duì)我國歷史檔案感興趣的外國人參與眾包。簡化注冊登錄方式,使公眾能夠較快地開始眾包任務(wù),提高效率。建立眾包項(xiàng)目的互動(dòng)討論區(qū)、制定積分兌換規(guī)則、組織參與者的線下活動(dòng)等用戶激勵(lì)方式能夠有效地吸引新用戶,留住已有的參與者。我國可以從這些做法中借鑒優(yōu)秀經(jīng)驗(yàn),選擇更適合我國國情和公眾的激勵(lì)方式。
4.4 選擇合適的眾包平臺(tái)。眾包平臺(tái)的持續(xù)穩(wěn)定是眾包項(xiàng)目順利運(yùn)行的重要保障。VeleHanden自上線以來,已持續(xù)運(yùn)行12年之久,這也說明了一個(gè)穩(wěn)定長期的軟件合作公司的重要性。因此選擇合適可靠的軟件開發(fā)商共同開發(fā)檔案眾包平臺(tái)應(yīng)當(dāng)作為檔案眾包項(xiàng)目設(shè)計(jì)的首要任務(wù),軟件開發(fā)商應(yīng)當(dāng)兼具專業(yè)能力與人文素養(yǎng)。一個(gè)成熟的眾包平臺(tái)還應(yīng)當(dāng)包括詳細(xì)的規(guī)則說明,對(duì)平臺(tái)開發(fā)者、發(fā)包方和參與者的權(quán)利和義務(wù)進(jìn)行明確的規(guī)定。國外的數(shù)字人文眾包平臺(tái)對(duì)用戶個(gè)人的隱私保護(hù)十分重視,其關(guān)注點(diǎn)集中在信息內(nèi)容、信息安全和信息存儲(chǔ)等七個(gè)主要類別[18],尊重眾包參與者的個(gè)人權(quán)利,同時(shí)也對(duì)用戶的行為進(jìn)行約束和規(guī)范,以保障其他用戶和檔案資產(chǎn)的信息安全。
4.5 做好眾包全過程質(zhì)量控制。對(duì)眾包結(jié)果的質(zhì)量擔(dān)憂阻礙了部分檔案機(jī)構(gòu)開發(fā)眾包項(xiàng)目的步伐,因此需要做好充分的準(zhǔn)備,預(yù)防錯(cuò)誤的發(fā)生。第一,在設(shè)計(jì)眾包項(xiàng)目時(shí),綜合考慮本館實(shí)際需要和參與者的能力,選取恰當(dāng)?shù)臋n案材料并按難易程度分類,便于參與者根據(jù)自身能力選擇項(xiàng)目。同時(shí)需要為項(xiàng)目編寫詳細(xì)的輸入說明和系統(tǒng)使用說明,必要時(shí)錄制教學(xué)視頻,為參與者的正確輸入做好保障。第二,在參與者錄入的過程中,設(shè)計(jì)自動(dòng)程序識(shí)別錯(cuò)誤格式并發(fā)出提醒,設(shè)置討論區(qū)供參與者交流遇到的問題與經(jīng)驗(yàn)體會(huì),項(xiàng)目管理者通過討論平臺(tái)能夠了解參與情況并及時(shí)解決參與者的問題。第三,眾包任務(wù)完成后的審核過程,應(yīng)對(duì)有經(jīng)驗(yàn)的眾包參與者進(jìn)行審核培訓(xùn),審核結(jié)果由檔案員進(jìn)行檢查,以確保檔案眾包成果的最終質(zhì)量。
5 結(jié)語
荷蘭“VeleHanden”眾包項(xiàng)目幫助檔案館切實(shí)解決了檔案在線檢索利用的難題,滿足了用戶快速檢索檔案的需求。對(duì)其眾包平臺(tái)設(shè)計(jì)、項(xiàng)目選擇、用戶激勵(lì)和質(zhì)量審核等方面進(jìn)行分析探討,對(duì)我國開展檔案眾包實(shí)踐具有重要啟發(fā)借鑒意義,對(duì)于促進(jìn)我國檔案信息資源開發(fā)利用模式轉(zhuǎn)型升級(jí),提高檔案事業(yè)社會(huì)參與度具有重要參考價(jià)值。
*本文系2018年度國家社科基金青年項(xiàng)目──基于過程管理的歷史檔案開發(fā)利用眾包模式研究(項(xiàng)目編號(hào):18CTQ039)資助成果;山東大學(xué)2022年度教育教學(xué)改革研究一般項(xiàng)目《檔案學(xué)概論》(項(xiàng)目編號(hào):2022Y059)資助成果。
參考文獻(xiàn):
[1]HOWE J.The Rise of Crowdsouring[J].Wired,2006(6):176-183.
[2]鄧成雯.荷蘭阿姆斯特丹檔案館“VeleHanden”眾包項(xiàng)目機(jī)制研究及啟示[J].檔案管理,2021(6):11 6-11 9.
[3][7][9] NEIIEKE,SIGNE.Participatorytranscription in Amsterdam and Copenhagen[C]//Edward Benoit III,Alexandra Eveleigh.ParticipatoryArchives:Theory and practice.London:FacetPublishing,2019:103-11 3.
[4][10][11 ] FLEURBAAY E,EVELEIGH A.Crowdsourcing:prone to error?[C]// International Council onArchives conference.2012.
[5]Gebruiksvoorwaarden VeleHanden.nl[EB/OL].[2023-05-01].https://velehanden.nl/Inhoud/paginas/index/id/gebruiksvoorwaarden
[6]VeleHanden.nl[EB/OL].[2023-05-01].https://velehanden.nl/.
[8]Ontdek de geheimen van het archief[EB/OL].[2023-05-01].https://www.amsterdam.nl/stadsarchief/agenda/vrijwilligers/
[12]中華人民共和國國家統(tǒng)計(jì)局.中國統(tǒng)計(jì)年鑒2022[M].北京:中國統(tǒng)計(jì)出版社,2022.
[13]馬雪雯.我國紙質(zhì)檔案數(shù)字化工作研究[D].南京:南京大學(xué),2020.
[14]馬志穎.社交媒體時(shí)代檔案領(lǐng)域公眾參與研究[D].蘇州:蘇州大學(xué),2020.
[15]祝一,陳建.參與共治與開放共享:新加坡國家檔案館檔案眾包項(xiàng)目實(shí)踐及啟示[J].北京檔案,2022(10):43-47.
[16] 曲春梅,劉曉雨,王溶琨.檔案開放促發(fā)展 數(shù)據(jù)共享惠民生:2022年中國檔案利用體系建設(shè)發(fā)展報(bào)告[J].中國檔案,2023(3):26-27.
[17]丁越.開放融合與參與共贏:美國國家檔案與文件署的檔案眾包實(shí)踐及其啟示[J].檔案與建設(shè),2022(12):48-52.
[18]徐孝娟,趙澤瑞,賈海洋,史如菊.國外數(shù)字人文眾包個(gè)人信息保護(hù)研究及啟示:以網(wǎng)站運(yùn)營者“隱私政策”為視角[J].現(xiàn)代情報(bào),2023,43(2):168-177.
(作者單位:山東大學(xué)歷史文化學(xué)院 田艷羅,碩士研究生;陳建,管理學(xué)博士,歷史學(xué)博士后,副教授,碩士生導(dǎo)師,澳大利亞莫納什大學(xué)訪問學(xué)者 來稿日期:2023-06-01)