沈華根 韋志輝
摘 要:在當(dāng)前的大數(shù)據(jù)爆棚的背景下,人們?cè)絹?lái)越多地感受到了信息資源給生活所帶來(lái)的便利。但就現(xiàn)狀來(lái)看,高校中建設(shè)的信息資源平臺(tái)較少,已經(jīng)建成的又難以保證數(shù)量和質(zhì)量都可以持續(xù)性地增加,不能滿足師生的大數(shù)據(jù)檢索要求。文章闡述將大數(shù)據(jù)進(jìn)行有效的收集和整理,整合建設(shè)可持續(xù)發(fā)展的知識(shí)機(jī)構(gòu)庫(kù)平臺(tái)的合理性。探討既可以避免重復(fù)建設(shè),減少成本,又可以滿足不斷發(fā)展變化的高校教學(xué)科研環(huán)境,達(dá)到提高資源使用率和學(xué)科創(chuàng)新服務(wù)效果的途徑。
關(guān)鍵詞:高校信息化;知識(shí)機(jī)構(gòu)庫(kù);大數(shù)據(jù)
1 通過(guò)用戶的大數(shù)據(jù)分析合理管理文獻(xiàn)資源
大數(shù)據(jù)的分析對(duì)于當(dāng)前高校數(shù)據(jù)管理來(lái)說(shuō)是一項(xiàng)很重要的工作。面對(duì)海量數(shù)據(jù),前期合理的分析可以將讀者感興趣的信息資源等瀏覽對(duì)象的記錄進(jìn)行統(tǒng)計(jì)和管理,用來(lái)確定現(xiàn)有的數(shù)字資源存在的價(jià)值、依據(jù),以及未來(lái)可能需要繼續(xù)增強(qiáng)的方面。海量數(shù)據(jù)中的每一項(xiàng)數(shù)據(jù)條目的瀏覽、下載量的記錄看似微不足道,但將同一類數(shù)據(jù)記錄與其他關(guān)聯(lián)的、涉及的不同類型的數(shù)據(jù)記錄通過(guò)軟件進(jìn)行合理的相互關(guān)聯(lián),通過(guò)大數(shù)據(jù)的結(jié)構(gòu)化統(tǒng)計(jì),把與瀏覽者關(guān)注的知識(shí)文獻(xiàn)相關(guān)的共性與差異閱讀信息的關(guān)鍵線索進(jìn)行對(duì)比分析,對(duì)數(shù)據(jù)中的有效信息進(jìn)行有序解讀,實(shí)現(xiàn)對(duì)隱藏于數(shù)據(jù)中的知識(shí)結(jié)構(gòu)與線索的歸納與推理[1],就可以得出該數(shù)據(jù)體系的在某一范圍研究領(lǐng)域內(nèi)的認(rèn)同感和存在的價(jià)值。
在以往的信息資源使用率統(tǒng)計(jì)上,大多高校都是基于單個(gè)的文獻(xiàn)數(shù)據(jù)庫(kù)的統(tǒng)計(jì)。而用大數(shù)據(jù)技術(shù)進(jìn)行分析,則可以通過(guò)獲取到的數(shù)據(jù)瀏覽總量,如某一類學(xué)科數(shù)據(jù)庫(kù)的點(diǎn)擊量、某一篇文獻(xiàn)的瀏覽量和下載量、推送新聞稿的閱覽和轉(zhuǎn)發(fā)量等,從中發(fā)現(xiàn)數(shù)據(jù)之間存在的組織和關(guān)聯(lián)性、關(guān)鍵詞、高頻詞等,把握住師生的使用習(xí)慣,對(duì)數(shù)據(jù)中出現(xiàn)的有效信息進(jìn)行合理解讀,從而對(duì)高校信息資源整體的被利用的程度進(jìn)行客觀的、可視化的評(píng)價(jià)。
所以將大數(shù)據(jù)分析技術(shù)用于建立高校的機(jī)構(gòu)知識(shí)庫(kù)平臺(tái),不僅將已有的科研成果進(jìn)行數(shù)字化存儲(chǔ),還能為高校的學(xué)術(shù)研究提供數(shù)據(jù)的檢索及下載使用、指定時(shí)間段的數(shù)據(jù)使用率分析、用戶之間的學(xué)術(shù)交流、重點(diǎn)難點(diǎn)問(wèn)題的解決等大數(shù)據(jù)分析服務(wù)。同時(shí)通過(guò)對(duì)學(xué)科優(yōu)質(zhì)資源的重新整合和利用,讓許多學(xué)科在資源利用上有交叉有聯(lián)合的部分可以借助平臺(tái)優(yōu)勢(shì)進(jìn)行優(yōu)勢(shì)互補(bǔ)和利用。好中選優(yōu),將有限的資金用于高校師生最需要的方面,避免重復(fù)建設(shè),減少成本,提高利用效率。
2 建設(shè)一站式信息共享資源平臺(tái)
高校作為國(guó)家科研力量的重要組成部分,其所任職的學(xué)者在各項(xiàng)科研活動(dòng)中積累了大量的學(xué)術(shù)信息資源,如科研數(shù)據(jù)、論文專著、實(shí)體作品等,且每年學(xué)生的畢業(yè)論文、畢業(yè)作品,學(xué)校每年所發(fā)生的各項(xiàng)重大事件的記載等各項(xiàng)數(shù)據(jù)量都相當(dāng)大。如果能夠有效地將這些學(xué)術(shù)資源進(jìn)行收集,在學(xué)校范圍內(nèi)或于一定范圍內(nèi)的高校一起構(gòu)建一站式信息共享資源平臺(tái),則可以避免重復(fù)建設(shè),提高知識(shí)成果的利用率,形成學(xué)術(shù)交流圈,共同挖掘、共享科研數(shù)據(jù),共同促進(jìn)知識(shí)的傳播與再利用[2]。
從目前國(guó)內(nèi)建設(shè)的實(shí)際情況來(lái)看,機(jī)構(gòu)知識(shí)庫(kù)平臺(tái)的建設(shè)內(nèi)容主要包含以下幾個(gè)方面:首先是對(duì)本校內(nèi)所有已經(jīng)形成實(shí)際成果的歷屆師生科研成果進(jìn)行收集,為這些科研成果進(jìn)行數(shù)字化加工并按類別設(shè)立統(tǒng)一格式,購(gòu)置大量的存儲(chǔ)服務(wù)器用于存儲(chǔ)這些數(shù)據(jù)。同時(shí)購(gòu)置專用服務(wù)器并安裝發(fā)布平臺(tái),為所收集到的資源進(jìn)行一站式信息資源共享做好準(zhǔn)備。其次,在構(gòu)建一站式信息資源共享平臺(tái)時(shí),要注意其信息檢索所覆蓋的范圍不僅僅局限于本校的科研成果,還應(yīng)實(shí)現(xiàn)主流數(shù)據(jù)庫(kù)、高校自建數(shù)據(jù)庫(kù)、一定區(qū)域內(nèi)高校之間的信息共享,實(shí)現(xiàn)跨機(jī)構(gòu)、跨數(shù)據(jù)庫(kù)、跨校區(qū)、跨區(qū)域的信息共享[3]。只要搜索想要查詢的關(guān)鍵詞,就應(yīng)該能從各個(gè)數(shù)據(jù)庫(kù)中查找到跟此關(guān)鍵詞相關(guān)的信息,而不再需要到每個(gè)數(shù)據(jù)庫(kù)中去單獨(dú)查找。以達(dá)到更快更全面地為用戶提供所要查閱的檢索信息的需求。
3 建設(shè)知識(shí)機(jī)構(gòu)庫(kù)平臺(tái)的主要特色需求
3.1操作界面簡(jiǎn)潔實(shí)用、人性化
在購(gòu)買或自建服務(wù)平臺(tái)時(shí),都應(yīng)當(dāng)遵循一條原則,即平臺(tái)需具備簡(jiǎn)潔實(shí)用、人性化、以用戶的實(shí)際操作需求為目的。之所以平臺(tái)必須遵循上述原則,是因?yàn)槠脚_(tái)不是單純的程序,如果不從用戶的角度出發(fā),則有可能導(dǎo)致不被用戶歡迎。更何況使用平臺(tái)的用戶大多沒有受過(guò)系統(tǒng)的計(jì)算機(jī)教育,對(duì)平臺(tái)的使用不熟悉,即使遇到簡(jiǎn)單的問(wèn)題也不知如何解決。所以該學(xué)科服務(wù)平臺(tái)應(yīng)當(dāng)以最為簡(jiǎn)單有效的方式讓用戶知道使用的方法,用“傻瓜式”的輸入搜索就可以輕松找到自己想獲取的知識(shí)信息,搜索到的信息可以根據(jù)用戶需求呈現(xiàn)出條目式或圖表式的結(jié)構(gòu),并提供多樣化的下載方式。
3.2發(fā)展符合用戶需求的信息服務(wù)系統(tǒng)
目前國(guó)內(nèi)還缺少較為成熟的知識(shí)機(jī)構(gòu)庫(kù)平臺(tái),很多數(shù)字化資源被單獨(dú)購(gòu)買了之后因各自元數(shù)據(jù)標(biāo)準(zhǔn)的不同等因素只能提供單個(gè)簡(jiǎn)易的瀏覽和檢索,還無(wú)法做到在一個(gè)平臺(tái)上的整合和服務(wù)。所以平臺(tái)底層一般采用半結(jié)構(gòu)化和非結(jié)構(gòu)化元數(shù)據(jù)倉(cāng)庫(kù),主要是實(shí)現(xiàn)對(duì)文檔、表格、圖片、視頻、音頻等非結(jié)構(gòu)化數(shù)據(jù)資源的集中存儲(chǔ)。同時(shí)要為存儲(chǔ)的數(shù)據(jù)制定統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),滿足后期建設(shè)中統(tǒng)一管理運(yùn)用的需求,為未來(lái)有可能的其他數(shù)據(jù)庫(kù)的數(shù)據(jù)加入提供標(biāo)準(zhǔn)上的統(tǒng)一化建設(shè)管理。
3.3平臺(tái)技術(shù)的特色性、兼容性和可發(fā)展性
在平臺(tái)建設(shè)過(guò)程中,應(yīng)充分結(jié)合本校的實(shí)際情況,尤其是對(duì)本校的特色學(xué)科、重點(diǎn)學(xué)科著重分析整理。接下來(lái)針對(duì)學(xué)校專業(yè)結(jié)構(gòu)與特色,制定符合本校專業(yè)特色的平臺(tái)的詳細(xì)需求,并和參與建設(shè)的軟件公司合作,聯(lián)合搭建定制的平臺(tái)功能模塊。由于各種學(xué)科資源所呈現(xiàn)出來(lái)的特性越來(lái)越多元化,應(yīng)當(dāng)將可以數(shù)字化的本校資源,包括非結(jié)構(gòu)化數(shù)據(jù),例如教師專著、專利、科研成果、碩博論文等;文獻(xiàn)以外的各種媒體資源,例如圖片、音視頻、空間實(shí)體物品等,都要進(jìn)行數(shù)字化處理,再統(tǒng)一建成一個(gè)可以匯集各種優(yōu)質(zhì)資源的學(xué)科平臺(tái),實(shí)現(xiàn)對(duì)本校學(xué)科資源的整合、管理和共享。
另外知識(shí)機(jī)構(gòu)庫(kù)平臺(tái)的一項(xiàng)重要功能就是它的綜合檢索發(fā)現(xiàn)能力。現(xiàn)在的資源平臺(tái)不應(yīng)當(dāng)局限于一所學(xué)校單獨(dú)建設(shè)的層面上,還應(yīng)當(dāng)整合進(jìn)其他已經(jīng)購(gòu)買的資源或其他學(xué)校的科研成果。系統(tǒng)的檢索發(fā)現(xiàn)能力則體現(xiàn)在,不僅可以以學(xué)校原來(lái)已經(jīng)收錄的文獻(xiàn)的全文進(jìn)行檢索,還可以通過(guò)數(shù)據(jù)索引功能、檢索結(jié)果聯(lián)想功能、數(shù)據(jù)倉(cāng)儲(chǔ)管理等技術(shù)對(duì)使用者所要檢索的關(guān)鍵詞進(jìn)行有可能的檢索結(jié)果優(yōu)化推薦。另外在兼容性方面要開放標(biāo)準(zhǔn)服務(wù)接口,允許其他的數(shù)據(jù)平臺(tái)的數(shù)據(jù)通過(guò)數(shù)據(jù)清單的形式進(jìn)行自動(dòng)對(duì)接,方便更多的資源在該平臺(tái)中被一次性檢索到,提高所建資源的利用率。
4 高校應(yīng)擬定知識(shí)機(jī)構(gòu)庫(kù)平臺(tái)的建設(shè)管理辦法
要搭建一個(gè)功能完善、使用方便的知識(shí)機(jī)構(gòu)庫(kù)平臺(tái),并不是一件容易的事。在面對(duì)當(dāng)前信息技術(shù)不斷進(jìn)步的大背景下,如何去選擇一款真正適合高校自身學(xué)科發(fā)展的平臺(tái),使其發(fā)揮最大的作用,同時(shí)在技術(shù)上保持先進(jìn)性和可靠性,是一項(xiàng)較為專業(yè)和艱巨的任務(wù)。同時(shí)平臺(tái)搭建需要學(xué)校層面的統(tǒng)一決策和規(guī)劃,首先要認(rèn)識(shí)到平臺(tái)的搭建確實(shí)能為學(xué)校的學(xué)科建設(shè)帶來(lái)好的、積極的一面,愿意撥款或設(shè)立專項(xiàng)資金來(lái)保證項(xiàng)目的開展。并且在建設(shè)過(guò)程中需要涉及各個(gè)二級(jí)學(xué)院對(duì)于本學(xué)院相關(guān)已有學(xué)科、專業(yè)的科研成果的收集整理,為確保能夠順利完成還需要學(xué)校層面對(duì)這項(xiàng)工作進(jìn)行推進(jìn)。
在平臺(tái)建設(shè)中期,應(yīng)當(dāng)鼓勵(lì)全校師生,尤其是教學(xué)和科研一線的教職工共同參與資源的建設(shè)、開發(fā)與利用,拓展數(shù)字資源的采集渠道,實(shí)現(xiàn)師生對(duì)自己科研信息的管理、發(fā)布和共享。在為一線師生提供學(xué)科服務(wù)的同時(shí),也為學(xué)校在學(xué)科信息大數(shù)據(jù)的建設(shè)提供支持。如果可以延續(xù)這樣的建設(shè)模式,則有助于為學(xué)校建設(shè)出具有本校專業(yè)特色、擁有自主知識(shí)產(chǎn)權(quán)的數(shù)據(jù)庫(kù)資源。當(dāng)平臺(tái)構(gòu)建區(qū)域成熟后,還可以在此基礎(chǔ)之上建設(shè)移動(dòng)門戶管理和應(yīng)用系統(tǒng)集成等,為高??蒲谐晒姆e累做強(qiáng)有力的數(shù)據(jù)和服務(wù)保障。
在平臺(tái)建設(shè)完成后,并不意味著工作的完成,而是一項(xiàng)長(zhǎng)期工作的開始。平臺(tái)的日常維護(hù)需要專人管理,每年都需投入相應(yīng)的精力和資金對(duì)平臺(tái)進(jìn)行維護(hù)更新,保證平臺(tái)始終可以不斷發(fā)展。這就需要在建設(shè)初期就制定一系列管理辦法,例如建設(shè)的目標(biāo)設(shè)立、資源的標(biāo)準(zhǔn)化管理、每年所投入的專項(xiàng)資金的設(shè)立和來(lái)源辦法、平臺(tái)建成后的培訓(xùn)推廣計(jì)劃等,都需盡早落實(shí)并在后期徹底貫徹下去。同時(shí),資源平臺(tái)的內(nèi)容持續(xù)性建設(shè)、平臺(tái)使用的促進(jìn)機(jī)制也是需要考慮到的。平臺(tái)搭建出來(lái),如果無(wú)法獲得持續(xù)的內(nèi)容更新,或者無(wú)法應(yīng)用到高校師生日常的實(shí)際需求中,就有可能被遺忘。對(duì)于平臺(tái)的推廣和使用方法也要落實(shí)到每個(gè)學(xué)院分管領(lǐng)導(dǎo)、專業(yè)系主任、骨干教師、學(xué)生會(huì)主要成員中,達(dá)到推廣宣傳的作用,避免高校師生對(duì)于知識(shí)機(jī)構(gòu)庫(kù)平臺(tái)這種新興技術(shù)理解不足,減小平臺(tái)的使用難度。
5結(jié)語(yǔ)
總的來(lái)說(shuō),高校要建設(shè)具有本校專業(yè)特色和獨(dú)立知識(shí)產(chǎn)權(quán)的知識(shí)機(jī)構(gòu)庫(kù)平臺(tái),必須首先有大數(shù)據(jù)時(shí)代高校知識(shí)資源數(shù)字化建設(shè)的意識(shí),和這樣的投入和建設(shè)給未來(lái)高校學(xué)科建設(shè)帶來(lái)的幫助。在建設(shè)中除了充分利用現(xiàn)代化計(jì)算機(jī)技術(shù)、購(gòu)置知名設(shè)備品牌外,還應(yīng)當(dāng)構(gòu)建人性化、智能化、兼容性強(qiáng)的平臺(tái),同時(shí)借此對(duì)學(xué)校已有的科研信息進(jìn)行整理收集,提高學(xué)校工作人員的專業(yè)技能,為創(chuàng)造更好的科研環(huán)境打下良好的基礎(chǔ)。
[參考文獻(xiàn)]
[1]張穎.大數(shù)據(jù)時(shí)代高校圖書館信息資源管理的創(chuàng)新與發(fā)展[J]武漢理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015 (3):449-452
[2]孫驍驍,韓海濤.大數(shù)據(jù)時(shí)代圖書館服務(wù)創(chuàng)新研究[J]圖書情報(bào)工作,2015 (12):28-30
[3]葉莉,凌征強(qiáng).基于數(shù)據(jù)挖掘的高校圖書館信息服務(wù)[J]圖書館工作與研究,2017(5):70-74.