楊瑞華,張建華,余 艷,向 導(dǎo),劉 建,廖明強(qiáng)
(中國(guó)工程物理研究院核物理與化學(xué)研究所,四川綿陽(yáng) 621900)
針對(duì)特殊專業(yè)研究中的設(shè)想和實(shí)施階段產(chǎn)生的大量科技文獻(xiàn)資料,如何將文獻(xiàn)安全并科學(xué)有效地管理,以便隨時(shí)查找和利用,成為需要解決的問(wèn)題。早在1992年埃斯特雷亞山社區(qū)學(xué)院建立了最初的信息共享空間,共享專業(yè)性的學(xué)生進(jìn)行學(xué)習(xí)研究[1]。
科研工作中經(jīng)常會(huì)利用已知信息,并因此取得事半功倍的效果。當(dāng)前管理科研信息的軟件系統(tǒng)有“檔案管理系統(tǒng)[2]”和某些單位建立的信息港模式。檔案管理系統(tǒng)中通常只能存儲(chǔ)單位內(nèi)部的定型成果信息,信息港管理則是一定程度上可公開(kāi)的信息。而科研人員所需的中間過(guò)程數(shù)據(jù)、討論的紀(jì)錄、處理數(shù)據(jù)采用的工具及一些雖未在正式刊物發(fā)表,卻對(duì)科研極具參考價(jià)值的信息卻無(wú)法查找,更無(wú)法利用。為此,開(kāi)發(fā)了文獻(xiàn)資料數(shù)據(jù)成果共享平臺(tái)管理軟件。
軟件系統(tǒng)采用Delphi+SQL Server架構(gòu),采用網(wǎng)絡(luò)化C/S/S三層構(gòu)架的模式實(shí)現(xiàn)了不限制類型的各類文件文獻(xiàn)數(shù)據(jù)資料的統(tǒng)一管理,使多年累積的技術(shù)成果和文獻(xiàn)資料得以長(zhǎng)期保存,方便檢索,并更好地應(yīng)用在日常的科研課題文獻(xiàn)資料獲取中。通過(guò)這種受控的信息資源網(wǎng)絡(luò)交流共享軟件平臺(tái),使日??蒲泄ぷ髦械奈墨I(xiàn)和文件資料數(shù)據(jù)得到更充分有效的利用。
文獻(xiàn)共享方式大致可分為紙質(zhì)“借閱式”、對(duì)面“詢問(wèn)式”、推送“郵件式”、瀏覽“網(wǎng)頁(yè)式”。文中介紹及時(shí)“桌面式”共享方式[3]。
圖1 系統(tǒng)主要界面
(1)借閱式共享。在計(jì)算機(jī)未出現(xiàn)前,文獻(xiàn)信息是以紙張形式存在的,紙張式信息共享的方式就是借閱。而在當(dāng)今信息化程度較高的情況下,借閱式共享的效率已無(wú)法滿足要求,但出于某種原因該方式仍將長(zhǎng)期存在。
(2)詢問(wèn)式共享。詢問(wèn)方式的主要缺點(diǎn)是信息交流不充分。也是最普通的信息共享方式。
(3)郵件式共享。有文獻(xiàn)信息時(shí),利用網(wǎng)絡(luò)郵件進(jìn)行發(fā)布,采用一對(duì)一或一對(duì)多的方式。其缺點(diǎn)是導(dǎo)致無(wú)用信息增多。
(4)網(wǎng)頁(yè)式共享。網(wǎng)頁(yè)式共享也可稱為信息港模式,均是經(jīng)過(guò)整理后公開(kāi)發(fā)表、發(fā)布的信息,通??煞从尘?,而大多對(duì)于科研更有幫助的原始信息和過(guò)程信息則無(wú)法出現(xiàn)。不能為日后的參考提供充分信息資源。
(5)桌面式共享。采用內(nèi)部網(wǎng)絡(luò)使用的共享軟件進(jìn)行桌面交互式共享,改變了借閱式和詢問(wèn)式的缺點(diǎn),同時(shí)又集中其優(yōu)點(diǎn)。采用多對(duì)多方式共享文獻(xiàn),多個(gè)用戶可同時(shí)或錯(cuò)時(shí)上傳、下載文獻(xiàn)。也就是所用用戶均可向信息池中添加信息,而又可根據(jù)權(quán)限和積分等共享信息。
提供主動(dòng)式、非面對(duì)面的信息共享方式,使得系統(tǒng)參與人員可利用非整塊的空閑時(shí)間,主動(dòng)上傳文獻(xiàn)資料,克服資料面對(duì)面交接的時(shí)間和空間局限,實(shí)現(xiàn)桌面共享。在節(jié)約時(shí)間的同時(shí),主動(dòng)提供共享信息。獲取信息也是主動(dòng)進(jìn)入系統(tǒng)進(jìn)行搜索所需的信息。
通過(guò)這種方式將以往的面對(duì)面詢問(wèn)式、紙張借閱式、郵件對(duì)點(diǎn)式和網(wǎng)頁(yè)搜索被動(dòng)式,用非實(shí)時(shí)、多對(duì)多、無(wú)限借閱、拖放式上傳和桌面檢索等方式所替代。
軟件只在授權(quán)的網(wǎng)絡(luò)和計(jì)算機(jī)中使用,未通過(guò)該軟件獲取的信息無(wú)法讀取。軟件限制使用范圍,文獻(xiàn)采用二進(jìn)制形式拆分加密存放于數(shù)據(jù)庫(kù)中。如此,軟件離開(kāi)規(guī)定的環(huán)境便不可使用,而數(shù)據(jù)庫(kù)被非法獲取后只能看到一些“加密”后的二進(jìn)制碼,其破譯難度較高,上傳文獻(xiàn)的安全性得到了保障。
(1)身份認(rèn)證。本軟件集成采用“域控”方式的網(wǎng)絡(luò)中用戶身份信息,登錄系統(tǒng)時(shí)直接獲取域中身份信息,無(wú)需驗(yàn)證,操作簡(jiǎn)單。同時(shí)軟件系統(tǒng)具有一定安全性保障。在異地計(jì)算機(jī)上則采用頁(yè)面登錄方式,輸入用戶名和密碼也可以方便進(jìn)入系統(tǒng)。這里輸入的用戶名和密碼在數(shù)據(jù)庫(kù)中是經(jīng)過(guò)加密存放的,也有一定強(qiáng)度的安全性。
(2)瀏覽上傳。進(jìn)入上傳頁(yè)面后,一種方式是點(diǎn)擊“瀏覽文獻(xiàn)”按鈕,選定要上傳文獻(xiàn)后,系統(tǒng)自動(dòng)獲取文獻(xiàn)的大小、修改日期等基本信息,并形成系統(tǒng)所需的部分屬性信息。僅需少量輸入即可實(shí)現(xiàn)文獻(xiàn)上傳。另一種更為方便的方式是將需要共享的文件直接拖放至該頁(yè)面,即可實(shí)現(xiàn)文件基本信息獲取。
在文獻(xiàn)數(shù)據(jù)共享時(shí)采用文件流分割上傳和下載技術(shù),提高了速度,同時(shí)突破文件大小限制。同時(shí)采用多線程技術(shù),避免巨大文獻(xiàn)上傳時(shí)造成的計(jì)算機(jī)“假死”現(xiàn)象[4]。
(1)文獻(xiàn)類型。共享的文獻(xiàn)類型無(wú)限制,由此信息庫(kù)中不僅包括發(fā)表文章、總結(jié)報(bào)告和數(shù)碼照片等,還包括經(jīng)典軟件工具等豐富的共享資源。
(2)分割上傳技術(shù)。利用“文件流”進(jìn)行文件分割,再將分割后的“文件流”轉(zhuǎn)換為“內(nèi)存流”,利用內(nèi)存流進(jìn)行文件的網(wǎng)絡(luò)傳送。設(shè)計(jì)好其之間的邏輯關(guān)系,大幅提高文件上傳速度,尤其針對(duì)較大文件的處理效果更為明顯。
數(shù)據(jù)庫(kù)字段最大限制為4 GB,要確保上傳文件為保證安全保存在數(shù)據(jù)庫(kù)中,需采用文件分割技術(shù)來(lái)突破上傳限制,滿足較大文件上傳需求。
(3)多線程技術(shù)。采用多線程的應(yīng)用程序允許同一程序的多部分同時(shí)執(zhí)行,為程序賦予并行特性,因而可執(zhí)行某些實(shí)時(shí)性和隨機(jī)性強(qiáng)的操作,提高CPU的利用率,加快文獻(xiàn)數(shù)據(jù)信息處理速度。在本軟件系統(tǒng)中,啟動(dòng)一個(gè)或多個(gè)線程讀取并分割文件,同時(shí)啟動(dòng)其他線程上傳內(nèi)存流并保存至數(shù)據(jù)庫(kù)中。
該流分割技術(shù)不僅支持大文件的傳送,還增強(qiáng)了文件安全性。分割存放的單個(gè)文件則是一堆二進(jìn)制碼,若不采用本系統(tǒng)專用技術(shù)合并,后臺(tái)數(shù)據(jù)被竊取后將無(wú)較大用途。
文獻(xiàn)上傳后,可能發(fā)現(xiàn)文獻(xiàn)錯(cuò)誤,需要?jiǎng)h除。該刪除過(guò)程將導(dǎo)致數(shù)據(jù)庫(kù)占用多余的空間。尤其是幾GB文件的刪除,其日志文件及其他殘留信息會(huì)空占服務(wù)器硬盤(pán)空間,并嚴(yán)重影響數(shù)據(jù)庫(kù)性能。網(wǎng)絡(luò)服務(wù)器存放位置不便于經(jīng)常出入管理。因此軟件采用遠(yuǎn)程控制技術(shù),使得具有相應(yīng)權(quán)限的用戶可遠(yuǎn)程清理數(shù)據(jù)庫(kù),保證數(shù)據(jù)庫(kù)的清潔。
通過(guò)該系統(tǒng),克服了以往優(yōu)勢(shì)資源無(wú)法得到充分利用的情況,實(shí)現(xiàn)了主動(dòng)式文獻(xiàn)資料數(shù)據(jù)成果的需求。在該軟件平臺(tái)的數(shù)據(jù)庫(kù)中可積累大量原始的文獻(xiàn)數(shù)據(jù)資源,而非檔案管理中單一模式的總結(jié)報(bào)告。
通常一項(xiàng)新技術(shù)的產(chǎn)生或一種新模式的變化,在開(kāi)始階段均無(wú)法被完全接受,需要時(shí)間的積累來(lái)提高認(rèn)識(shí)。而有序積累和原始積累對(duì)一個(gè)單位的長(zhǎng)遠(yuǎn)發(fā)展有著重要意義。
[1]李越,唐小利,陳晨.國(guó)內(nèi)外信息共享空間(IC)研究及其啟示[J].醫(yī)學(xué)信息學(xué)雜志,2011(8):65-68.
[2]莫雪妹.檔案信息資源共建共享的思考[J].China's Foreign Trade,2011(14):152-156.
[3]李君,蔣志東.信息資源共享研究綜述[J].現(xiàn)代商貿(mào)工業(yè),2011(11):240-241.
[4]羅峰.基于P2P和網(wǎng)絡(luò)編碼的遠(yuǎn)程桌面共享[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2007(4):454-457.