(山東省圖書館,山東 濟(jì)南 250199)
開放獲取(Open Access,OA)運(yùn)動在國內(nèi)外已經(jīng)有10多年的發(fā)展歷程,目前正借助互聯(lián)網(wǎng)時代逐漸向深入發(fā)展。OA數(shù)字化文獻(xiàn)資源已經(jīng)成為包括圖書館在內(nèi)的所有互聯(lián)網(wǎng)用戶重要的數(shù)字化文獻(xiàn)資源類型。不過,由于受到多方面主客觀因素的影響,圖書館在建設(shè)OA數(shù)字化文獻(xiàn)資源過程中,仍然存在著一些值得分析和研究的問題。在此,對其中的文獻(xiàn)搜索、文獻(xiàn)下載和文獻(xiàn)存儲問題進(jìn)行研究和探討,并力求尋找到解決問題的相關(guān)對策。
圖書館OA數(shù)字化文獻(xiàn)資源建設(shè)過程中的文獻(xiàn)搜索是首要工作環(huán)節(jié),其中存在著一些值得分析和研究的問題,包括選擇搜索工具、采用搜索方法、掌握搜索技巧等方面。其核心目的是解決在互聯(lián)網(wǎng)上能否搜索到所需要的OA數(shù)字化文獻(xiàn)資源的問題。選擇搜索工具的主要內(nèi)容集中在對于搜索引擎和瀏覽器的選擇方面。因?yàn)閺乃阉饕婀ぞ叩慕嵌葋碇v,使用不同的搜索引擎,其搜索效果往往差別很大,這種差別主要表現(xiàn)在文獻(xiàn)搜索的全面性(要求數(shù)量大)、準(zhǔn)確性(要求命中率高)和速度性(要求搜索速度快)。目前,在互聯(lián)網(wǎng)搜索過程中,用戶使用最多的搜索引擎有百度搜索引擎、谷歌搜索引擎、搜狗搜索引擎、360搜索引擎等。這種排序是根據(jù)我國用戶的熟悉程度設(shè)定的,然而,從實(shí)際搜索效果和準(zhǔn)確的搜索統(tǒng)計數(shù)據(jù)來看卻并非如此。因此,在實(shí)際的文獻(xiàn)搜索過程中,要科學(xué)合理并靈活地選擇使用各種搜索引擎工具。
以2017年12月29日通過互聯(lián)網(wǎng)搜索語句“學(xué)術(shù)共產(chǎn)主義開放獲取文獻(xiàn)資源網(wǎng)站”為例,其采用加引號限定的精確搜索方式,各種搜索引擎的搜索統(tǒng)計數(shù)據(jù)分別為:谷歌166條、搜狗39條、360搜索33條、百度21條。將此語句改為未加引號的常規(guī)搜索,其統(tǒng)計數(shù)據(jù)分別為:谷歌 103 000 條、360搜索 56 100 條、搜狗9701條、百度95條。由此可見,使用不同品牌的搜索引擎工具最終搜索的結(jié)果相差很大,這種狀況勢必會對圖書館OA數(shù)字化文獻(xiàn)資源建設(shè)產(chǎn)生重要影響。與搜索引擎工具類似,使用不同品牌的瀏覽器工具,往往會對不同文種OA數(shù)字化文獻(xiàn)資源的搜索結(jié)果產(chǎn)生重要影響。例如,在瀏覽器是否具有外文網(wǎng)站在線翻譯為中文界面的功能方面,不同品牌的瀏覽器往往差別很大。其中既有直接提供翻譯功能,且使用方便的瀏覽器,如360安全瀏覽器、搜狗瀏覽器;也有可以添加翻譯功能,使用不太方便的瀏覽器,如IE瀏覽器;以及不具備翻譯功能的其他品牌瀏覽器等。
在圖書館建設(shè)OA數(shù)字化文獻(xiàn)資源的互聯(lián)網(wǎng)搜索過程中,還會遇到搜索真實(shí)性的問題,即所搜索到的數(shù)字化文獻(xiàn)資源是否真正的OA數(shù)字化文獻(xiàn)資源的問題。因?yàn)樵诨ヂ?lián)網(wǎng)搜索實(shí)踐中,往往存在著有些名義上為開放獲取文獻(xiàn)資源,實(shí)際卻并非如此的情況。此時需要利用圖書館員的搜商素質(zhì)和搜索能力,配合相關(guān)的技術(shù)手段和方法加以鑒別和驗(yàn)證,不可盲目地相信一些網(wǎng)站的廣告和宣傳。在采用搜索方法方面,需要在搜索的過程中靈活機(jī)動地綜合運(yùn)用各種科學(xué)有效的搜索方法。其中包括常用的順查法、倒查法、抽查法、追溯法、交替法、關(guān)鍵詞法、翻譯法、限定法和搭腳手架法等。掌握一定的搜索技巧也是取得搜索成功的重要條件,在特定情況下甚至是關(guān)鍵性條件。例如,對于各種特定格式的OA數(shù)字化文獻(xiàn)的搜索技巧,OA數(shù)字化古籍文獻(xiàn)的搜索技巧,國外OA數(shù)字化文獻(xiàn)的搜索技巧,網(wǎng)盤OA數(shù)字化文獻(xiàn)的搜索技巧等。
這是指部分OA數(shù)字化文獻(xiàn)資源下載獲取的前提條件,是需要用戶在相關(guān)的文獻(xiàn)資源網(wǎng)站上注冊登錄后,方可實(shí)現(xiàn)下載獲取,而不能直接下載獲取的一種限定性下載獲取情況類型。對于這種用戶必須注冊登錄后方可開放獲取的限定性下載情況進(jìn)行原因分析,會發(fā)現(xiàn)這是網(wǎng)站為了便于統(tǒng)計、分析和掌握客戶數(shù)量及其相關(guān)信息,從而為網(wǎng)站的有效運(yùn)營和擴(kuò)大發(fā)展提供客戶統(tǒng)計數(shù)據(jù)而采取的相關(guān)技術(shù)性管理措施,同時也是許多網(wǎng)站通常所采取的技術(shù)方法。對于這種注冊登錄限定性下載情況的解決和處理方法一般比較簡單:一、可以按照網(wǎng)站的要求進(jìn)行注冊和登錄即可;二、對于某些文獻(xiàn)資源網(wǎng)站,如較為常用的文檔分享資源網(wǎng)站,則可以采用專用的文獻(xiàn)資源下載器下載,如常用的百度文庫、豆丁網(wǎng)、道客巴巴等文檔分享資源網(wǎng)站,可以采用冰點(diǎn)下載器進(jìn)行下載獲取;常用的優(yōu)酷、愛奇藝、騰訊、百度等視頻文獻(xiàn)資源網(wǎng)站,則可以采用“碩鼠下載器”或?qū)S玫囊曨l播放器進(jìn)行下載獲取,從而可以有效地解決需要注冊登錄的限定性下載獲取問題。
這是指部分OA數(shù)字化文獻(xiàn)資源下載獲取的前提條件,是需要用戶在相關(guān)的文獻(xiàn)資源網(wǎng)站上具備并消耗一定數(shù)量的積分虛擬貨幣后,方可實(shí)現(xiàn)下載獲取的一種限定性下載獲取情況類型。這種虛擬貨幣在不同的網(wǎng)站有不同的名稱,常見的名稱有積分、財富值、豆元、金幣等。產(chǎn)生這種限定性情況的原因往往是多方面的,多見的原因如網(wǎng)站為了進(jìn)一步擴(kuò)大影響,或文獻(xiàn)資源的上傳者為了通過積分換取一定的報酬,抑或是為了通過積累積分獲得自己的相關(guān)下載獲取權(quán)力等。對于這種消耗積分限定性下載獲取情況的解決方法,一是可以通過參加網(wǎng)站所要求的各種活動來積累積分,但這需要付出一定的時間成本,而且會受到網(wǎng)站規(guī)則的制約,無法隨心所欲地獲取積分;二是選擇更為有效也是速度更快的解決方法,即可以采用專用的文獻(xiàn)資源下載器軟件進(jìn)行下載獲取,從而免除所有的積分類虛擬貨幣的限定性下載獲取條件。
這是指部分OA數(shù)字化文獻(xiàn)資源下載獲取的前提條件,是需要用戶在相關(guān)的文獻(xiàn)資源網(wǎng)站上提供所需要的密碼后,方可實(shí)現(xiàn)下載獲取的一種限定性下載獲取情況類型。對于設(shè)定密碼限定性下載獲取情況的原因進(jìn)行分析,排除一些非正常情況的黑客所為外,往往屬于上傳開放獲取文獻(xiàn)的擁有者所做出的條件限定,即不想過于讓自己所上傳的開放獲取文獻(xiàn)資源處于完全開放的環(huán)境之中,而是針對特定需要的用戶實(shí)行開放獲取。在這種情況下,就有必要采用一定的限定性措施,而下載獲取密碼就是最為常用的一種限定性技術(shù)手段。根據(jù)密碼限定級別的不同,又可分為設(shè)定提取密碼、下載密碼和解壓密碼1—3個層次的不同下載密碼情況。對于設(shè)定密碼限定性下載獲取情況的解決對策,可以采用通過相關(guān)渠道首先獲取到下載密碼,然后再運(yùn)用下載獲取的方法予以解決。密碼設(shè)置的類型主要有集中統(tǒng)一設(shè)置型、分散單獨(dú)設(shè)置型和分散集中混合設(shè)置型3種。集中統(tǒng)一設(shè)置型一般是由文獻(xiàn)資源整合網(wǎng)站集中統(tǒng)一設(shè)置的文獻(xiàn)開放下載提取密碼,分散單獨(dú)設(shè)置型多為開放獲取文獻(xiàn)上傳者為每種文獻(xiàn)下載獲取時為用戶單獨(dú)設(shè)置的獨(dú)立獲取密碼。
在此以開放獲取數(shù)字化期刊文獻(xiàn)資源為例,對設(shè)定密碼限定性下載獲取的實(shí)例予以解析。首先,通過開放獲取數(shù)字化期刊文獻(xiàn)資源整合網(wǎng)站獲取密碼的方式予以解決。如對于僅具有設(shè)定獲取密碼一個密碼級別的期刊文獻(xiàn)資源,通過網(wǎng)站渠道取得獲取密碼即可解決。如“百度網(wǎng)盤”網(wǎng)站中設(shè)置有獲取密碼的部分整本開放獲取數(shù)字化期刊文獻(xiàn)資源就是如此。具有提取密碼和解壓密碼兩個層次的下載獲取密碼,需要首先輸入第1層次的提取密碼下載獲取到文獻(xiàn)資源,然后再輸入第2層次的解壓密碼將下載獲取后的壓縮文件予以解壓縮。若為具有3個層次的提取密碼、下載密碼和解壓密碼,則需要首先利用獲取密碼獲取文獻(xiàn),再利用下載密碼完成下載,最后再利用解壓密碼完成文獻(xiàn)的解壓縮。如“云雜志”“尚雜志”“谷博雜志館”“喜泡泡雜志館”等網(wǎng)站免費(fèi)期刊欄目中的整本開放獲取數(shù)字化期刊文獻(xiàn)資源即是如此,它們分別都采用了3個層次的密碼限定性下載獲取措施。
這是指原本可以從網(wǎng)盤下載,但現(xiàn)在無法直接從網(wǎng)盤中下載獲取利用的情況。對于這種情況進(jìn)行原因分析后,認(rèn)為此類情況的原因相對較為復(fù)雜,其中既有短時間內(nèi)用戶從網(wǎng)盤下載文獻(xiàn)數(shù)量過多,引起網(wǎng)盤啟動的技術(shù)性下載限定措施發(fā)揮作用;也有計算機(jī)系統(tǒng)反應(yīng)遲緩的原因,導(dǎo)致短時間內(nèi)出現(xiàn)無法直接從網(wǎng)盤中下載獲取利用的情況;還有一些屬于原因不明或已經(jīng)不值得再去深究的原因。對于這種無法下載獲取情況的解決方法,可以采用將需要下載獲取的OA數(shù)字化文獻(xiàn)資源先保存到用戶自己的網(wǎng)盤中(前提是需要有先注冊的網(wǎng)盤),然后再從網(wǎng)盤中下載獲取的方法予以解決。另外一種解決方法,是可以先退出網(wǎng)盤,推遲一段時間后再打開網(wǎng)盤繼續(xù)下載的方法解決。實(shí)踐效果證明,這往往是一種較為有效的解決方法,盡管需要占用一定的延時時間。
這是指下載獲取過程中出現(xiàn)中途下載失敗的情況。對于這種情況進(jìn)行分析后發(fā)現(xiàn),它往往也是由于多方面的原因所造成的。其中既包括有采用某種品牌的瀏覽器的技術(shù)性原因,也包括有網(wǎng)絡(luò)運(yùn)營商對下載文獻(xiàn)資源數(shù)量較多時所采取的限定性措施原因,還包括受到網(wǎng)絡(luò)帶寬限制而產(chǎn)生的通過網(wǎng)絡(luò)節(jié)點(diǎn)產(chǎn)生局部擁堵原因。如利用搜狗瀏覽器下載獲取過程中,其最大同時下載文件數(shù)量一般為5個,其余文件處于等待下載獲取狀態(tài)中。如在下載過程中會出現(xiàn)下載速度逐漸減慢,以至于最后出現(xiàn)下載失敗的提示。此類情況往往出現(xiàn)在需要下載獲取容量較大的文件時,如50MB以上,甚至數(shù)百M(fèi)B的大容量文件情況。對于下載獲取過程中出現(xiàn)中途下載失敗的情況,最常用也是最有效的解決辦法,是更換不同品牌的瀏覽器。如及時將搜狗品牌瀏覽器的下載獲取工作,改為由谷歌品牌瀏覽器下載獲取,在下載獲取的過程中往往會取得相當(dāng)好的效果。
這是指下載獲取過程中出現(xiàn)因網(wǎng)站限速導(dǎo)致下載速度明顯下降的情況。它一般是由于網(wǎng)站或網(wǎng)絡(luò)運(yùn)營商通過技術(shù)監(jiān)控措施,發(fā)現(xiàn)存在用戶大量下載文獻(xiàn)資源的情況后,所采取的技術(shù)性限速措施,其目的往往是為了在一定范圍內(nèi)平衡分配各用戶之間的網(wǎng)速。對于這種下載獲取速度下降的情況,可以采用先暫停下載,然后通過繼續(xù)下載以便獲得加速的方法予以解決。以搜狗瀏覽器為例,當(dāng)同時有5個文件正在下載,每個文件約50—60K/秒的下載速度,不久后(往往數(shù)分鐘)其下載速度就可能會急劇下降到10—20K/秒。此時需要點(diǎn)擊暫停一下,然后馬上恢復(fù)下載,則可以達(dá)到瞬間100—200K/秒的下載速度,然后又恢復(fù)到正常50—60K/秒的下載速度。另外,根據(jù)下載速度的具體情況,也可以嘗試在不同品牌的瀏覽器之間相互轉(zhuǎn)化,根據(jù)實(shí)際情況予以優(yōu)選解決。這種解決方法在網(wǎng)速不變的情況下,有時可以達(dá)到原有下載速度的6倍左右,效果往往是非常明顯的。
在圖書館OA數(shù)字化文獻(xiàn)資源建設(shè)過程中,對于已經(jīng)通過搜索過程、下載獲取過程獲取到的OA數(shù)字化文獻(xiàn)資源,只有將其保存和存儲到一定的數(shù)字化存儲空間中,方可以實(shí)現(xiàn)將互聯(lián)網(wǎng)上的OA數(shù)字化文獻(xiàn)資源成功轉(zhuǎn)變?yōu)閳D書館的館藏開放獲取數(shù)字化文獻(xiàn)資源,從而最終完成圖書館的OA數(shù)字化文獻(xiàn)資源建設(shè)過程。所以,圖書館對OA數(shù)字化文獻(xiàn)資源的數(shù)字化存儲是重要的工作環(huán)節(jié),也是文獻(xiàn)資源建設(shè)的最后環(huán)節(jié)。在這其中首先涉及選擇存儲方式問題。一般情況下可以選擇網(wǎng)下存儲方式、網(wǎng)上存儲方式以及網(wǎng)下網(wǎng)上同時存儲方式3種存儲方式。網(wǎng)下存儲方式的優(yōu)勢是可以單獨(dú)變?yōu)閳D書館所擁有的OA數(shù)字化文獻(xiàn)資源,而不再會受到互聯(lián)網(wǎng)上各種因素的影響和干擾。缺點(diǎn)是需要圖書館投入資金購置存儲所需要使用的相關(guān)設(shè)備。如圖書館服務(wù)器設(shè)備、圖書館移動硬盤設(shè)備。網(wǎng)上存儲方式的優(yōu)勢是可以節(jié)約圖書館購置存儲設(shè)備的資金,甚至可以實(shí)現(xiàn)免費(fèi)存儲。缺點(diǎn)是可能會受到互聯(lián)網(wǎng)固有缺點(diǎn)的影響,從而影響到圖書館存儲OA數(shù)字化文獻(xiàn)資源的穩(wěn)定性。而網(wǎng)下網(wǎng)上同時存儲方式,一方面同時具有兩種存儲方式的優(yōu)缺點(diǎn),另一方面,可以通過優(yōu)勢互補(bǔ)、缺點(diǎn)互抵,達(dá)到更好的存儲效果。
在圖書館OA數(shù)字化文獻(xiàn)資源存儲的實(shí)踐過程中,存在著一些需要研究和解決的相關(guān)問題,其中主要集中在文獻(xiàn)存儲的容量性、時限性和速度性問題三方面。如果這些問題不能得到妥善的解決,則存儲過程將難以順利實(shí)現(xiàn),從而最終影響圖書館OA數(shù)字化文獻(xiàn)資源建設(shè)的效果。文獻(xiàn)存儲的時限性是指OA數(shù)字化文獻(xiàn)資源在存儲空間中可以存留時間的長短。由于它體現(xiàn)了文獻(xiàn)存儲的時效問題,所以,也是文獻(xiàn)存儲的重要指標(biāo)之一。文獻(xiàn)存儲的時限性目前包括永久性存儲、限時性存儲和同時存在的混合性存儲3種類型。圖書館在OA數(shù)字化文獻(xiàn)資源存儲的實(shí)踐過程中,要根據(jù)實(shí)際需求靈活地進(jìn)行選擇文獻(xiàn)的存儲時限,對于沒有必要長久存儲的文獻(xiàn),可以采用臨時存儲措施。即使已經(jīng)長久存儲的文獻(xiàn),也可以根據(jù)實(shí)際需要調(diào)整為臨時存儲或予以刪除,從而為新增文獻(xiàn)騰出所需要的存儲空間。
文獻(xiàn)存儲的容量性是指OA數(shù)字化文獻(xiàn)資源能夠獲得多大的存儲空間,由于它體現(xiàn)了文獻(xiàn)存儲的空間大小問題,所以,是文獻(xiàn)存儲的重要指標(biāo)之一。文獻(xiàn)存儲的容量包括文獻(xiàn)存儲空間的總?cè)萘繂栴}和存儲文獻(xiàn)的單個容量問題。從理論上講,總存儲容量和單個文獻(xiàn)存儲容量當(dāng)然是越大越好,因?yàn)檫@樣可以解決任何容量大小文獻(xiàn)的存儲。然而,由于受到各種條件的限制,這種理想化的存儲容量是很難達(dá)到的。所以,在這種情況下,就要尋找盡可能接近理想存儲容量的條件。就目前網(wǎng)下和網(wǎng)上存儲的現(xiàn)實(shí)情況而言,某些電子郵箱(如網(wǎng)易126郵箱)存儲可以基本實(shí)現(xiàn)無限總?cè)萘康奈墨I(xiàn)長久存儲,但是其單個文獻(xiàn)容量則一般限制在50MB以內(nèi),臨時存儲單個文獻(xiàn)容量限制在2GB以內(nèi)。所以它僅適合存儲大量單個文獻(xiàn)容量較小的OA數(shù)字化文獻(xiàn)資源。目前“115網(wǎng)盤”單個賬戶的總存儲容量在10TB,單個文獻(xiàn)存儲容量在5GB。通過注冊多個賬戶,它適合圖書館存儲單個容量更大的文獻(xiàn)資源。
文獻(xiàn)存儲的速度性是指OA數(shù)字化文獻(xiàn)資源在向存儲空間上傳存儲或從存儲空間下載獲取(即反存儲)過程中,文獻(xiàn)資源的上傳或下載速度快慢,由于它體現(xiàn)了文獻(xiàn)存儲的效率問題,所以,也是文獻(xiàn)存儲的重要指標(biāo)之一。存儲文獻(xiàn)上傳或下載速度的快慢問題,往往取決于多種因素,其中既有電信運(yùn)營服務(wù)商的網(wǎng)絡(luò)帶寬影響因素,也有存儲文獻(xiàn)所使用網(wǎng)站的技術(shù)性因素,還有用戶所使用瀏覽器的技術(shù)性因素,以及圖書館工作人員的操作水平因素等。圖書館可以自主采取對策提高存儲速度的因素主要為后3種因素。即在滿足其他存儲條件的基礎(chǔ)上,選擇存儲和下載速度更快的文獻(xiàn)存儲資源網(wǎng)站,采用存儲和下載速度更快的瀏覽器,提供圖書館員文獻(xiàn)存儲所需要的技術(shù)水平,掌握能夠及時處理各種存儲和下載傳輸問題的技能。
隨著國內(nèi)外來自政府、學(xué)術(shù)組織、出版發(fā)行機(jī)構(gòu)、圖書館等文獻(xiàn)收藏和服務(wù)機(jī)構(gòu),以及廣大互聯(lián)網(wǎng)用戶的全方位支持,OA數(shù)字化文獻(xiàn)資源正在日益成為包括圖書館在內(nèi)的所有用戶重要的數(shù)字化文獻(xiàn)資源來源類型。圖書館要在OA數(shù)字化文獻(xiàn)資源建設(shè)的過程中,只有認(rèn)真分析和研究所遇到的各種問題,并且有針對性地提出相應(yīng)的解決對策,才能夠更為順利地完成建設(shè)任務(wù),從而進(jìn)一步豐富圖書館的館藏數(shù)字化文獻(xiàn)資源,為用戶提供更為有利的文獻(xiàn)資源服務(wù)保障。隨著互聯(lián)網(wǎng)時代各種新技術(shù)的不斷發(fā)展,圖書館在OA數(shù)字化文獻(xiàn)資源建設(shè)的過程中也會有新的問題出現(xiàn),不過,它們也同時為圖書館提供了新的學(xué)習(xí)機(jī)會和研究空間。