国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

搜索引擎的學(xué)術(shù)應(yīng)用對圖書館數(shù)據(jù)服務(wù)的啟示

2017-10-11 04:00:02羅曉蘭
數(shù)字圖書館論壇 2017年8期
關(guān)鍵詞:搜索引擎百度圖書館

羅曉蘭

(上海中醫(yī)藥大學(xué)圖書館,上海 201203)

搜索引擎的學(xué)術(shù)應(yīng)用對圖書館數(shù)據(jù)服務(wù)的啟示

羅曉蘭

(上海中醫(yī)藥大學(xué)圖書館,上海 201203)

開放數(shù)據(jù)是科研重要的數(shù)據(jù)來源,但在目前的科研數(shù)據(jù)開放共享中卻被忽視。本文以科研中常用的搜索引擎數(shù)據(jù)為例,分析科研成果對開放數(shù)據(jù)的使用情況。從中國知網(wǎng)和萬方數(shù)據(jù)庫獲取國內(nèi)以谷歌和百度產(chǎn)品為研究數(shù)據(jù)來源的期刊論文(4 212篇)作為研究數(shù)據(jù),通過人工標(biāo)引和詞頻統(tǒng)計的方式,對國內(nèi)科研論文中對搜索引擎產(chǎn)品數(shù)據(jù)使用情況進(jìn)行統(tǒng)計,分析搜索引擎數(shù)據(jù)的使用特點、研究領(lǐng)域和發(fā)展趨勢,為圖書館制定合理的科研開放數(shù)據(jù)服務(wù)政策、構(gòu)建合適的科研數(shù)據(jù)服務(wù)模式提出建議。

學(xué)術(shù)研究;搜索引擎;開放數(shù)據(jù);圖書館

1 研究背景

開放數(shù)據(jù)在政策、經(jīng)濟(jì)和社會發(fā)展條件的不斷促進(jìn)下,已具備深厚的數(shù)據(jù)積累。數(shù)據(jù)開放要求政府重視數(shù)據(jù)的搜集、公布、開放和運用[1],促使政府自身或大眾能較為便利地獲取和再利用這些信息[2]。數(shù)據(jù)共享讓大眾生活更加便利和智能,也為科學(xué)研究提供海量數(shù)據(jù)資源。促進(jìn)開放數(shù)據(jù)的利用有助于釋放大數(shù)據(jù)的能量,以大數(shù)據(jù)為動力支持社會創(chuàng)新,以創(chuàng)新發(fā)展智能經(jīng)濟(jì)[3]。目前數(shù)據(jù)共享的研究主體主要是科研過程中產(chǎn)生的科學(xué)數(shù)據(jù)[4],但免費公開獲取的開放數(shù)據(jù)源常被忽視。

開放數(shù)據(jù)源涵蓋在科學(xué)研究中利用的開放數(shù)據(jù)集、公共搜索和統(tǒng)計服務(wù)、開放平臺和研究工具等,具有公開性、可得性、完整性、即時性等特點,主要由政府、科研機(jī)構(gòu)、非政府組織、開放的商業(yè)平臺、互聯(lián)網(wǎng)應(yīng)用程序等提供[5]。在各學(xué)科領(lǐng)域都存在具有行業(yè)特色的開放數(shù)據(jù),這些數(shù)據(jù)被廣泛使用到科研項目中。另外,還存在部分各學(xué)科通用數(shù)據(jù),如搜索行為數(shù)據(jù)、在線社區(qū)文本、微博話題關(guān)注數(shù)據(jù)等。

在開放數(shù)據(jù)集中,來自于搜索引擎的數(shù)據(jù)是常用數(shù)據(jù)類型,貫穿科研工作的始終。搜索引擎提供的開放數(shù)據(jù)具有使用范圍更廣、適用性更強(qiáng)、可獲得性更高等優(yōu)勢。尤其是在大數(shù)據(jù)科研理念下,基于用戶搜索行為、在線交互行為、健康行為、學(xué)術(shù)行為、網(wǎng)絡(luò)輿情等數(shù)據(jù)的數(shù)據(jù)量更大,更具有時效性。

作為重要的公開信息資源,搜索引擎的學(xué)術(shù)應(yīng)用主要有兩種形式:一是以搜索引擎產(chǎn)品提供的數(shù)據(jù)作為研究數(shù)據(jù)來源,二是以搜索引擎提供的平臺或產(chǎn)品作為研究對象。其在科研中的應(yīng)用優(yōu)勢主要包括數(shù)據(jù)可獲得性高、數(shù)據(jù)覆蓋范圍廣、實時性強(qiáng)、數(shù)據(jù)的認(rèn)可度較高,還可通過實時、豐富的開放數(shù)據(jù)增加科研成果的創(chuàng)新程度。相關(guān)科研成果涉及輿情分析、反恐、人口統(tǒng)計和決策、金融投資、旅游服務(wù)、健康管理、教育教學(xué)等領(lǐng)域[6-7]。此外,搜索引擎也為科學(xué)研究提供許多高效實用的研究工具,如Google Earth、Google App Engine、百度云等。

在目前科研數(shù)據(jù)共享的趨勢下,面對科研第四范式下科研人員對科學(xué)數(shù)據(jù)及其應(yīng)用的需求變化,作為數(shù)據(jù)資源服務(wù)方的圖書館須思考如何有效提升開放數(shù)據(jù)資源建設(shè)的服務(wù)能力,開展科學(xué)數(shù)據(jù)服務(wù)[8-9]。但與出版商和期刊雜志社相比,圖書館并沒有獲取科研數(shù)據(jù)的先天優(yōu)勢條件,由此在科研過程中產(chǎn)生的科研數(shù)據(jù)共享進(jìn)程也推進(jìn)緩慢。

2 數(shù)據(jù)獲取及分析

2.1 數(shù)據(jù)獲取及預(yù)處理

在中國知網(wǎng)和萬方期刊文獻(xiàn)數(shù)據(jù)庫中檢索國內(nèi)利用百度、谷歌提供的工具、數(shù)據(jù)、資源(如谷歌趨勢、谷歌地圖、百度指數(shù))等進(jìn)行學(xué)術(shù)研究的期刊論文。檢索式為:篇名/題名 OR 文摘=百度 OR Baidu OR 谷歌 OR Google,搜索時間為2016年8月20—31日。通過題錄信息進(jìn)行初步篩選,保留有效題錄,包括利用搜索引擎提供數(shù)據(jù)和工具進(jìn)行研究、以搜索引擎產(chǎn)品為研究對象的論文,隨后刪除重復(fù)記錄,形成統(tǒng)一格式的有效文本集。

對篩選過的文獻(xiàn)題錄進(jìn)行人工標(biāo)引,標(biāo)引格式為“技術(shù)/產(chǎn)品/數(shù)據(jù)—年代”,如Google Earth—2016。產(chǎn)品和數(shù)據(jù)編碼目錄來源于文獻(xiàn)篩選過程中對產(chǎn)品和數(shù)據(jù)類型的統(tǒng)計。

為保證標(biāo)引質(zhì)量,進(jìn)行兩組人工標(biāo)引。人工標(biāo)引的評分者信度系數(shù)為0.986(P<0.01,Sig雙側(cè)為0),說明兩組標(biāo)引者一致性很高,但仍存在二者標(biāo)注不一致的情況。如對產(chǎn)品名稱描述的不一致、對多種數(shù)據(jù)共同使用的標(biāo)引缺失、標(biāo)引中的錯誤等,隨后根據(jù)論文內(nèi)容進(jìn)一步確認(rèn)標(biāo)引信息,形成一致的結(jié)果。

經(jīng)過篩選后的期刊文獻(xiàn)題錄數(shù)據(jù)共4 212條,基于百度提供的數(shù)據(jù)進(jìn)行研究的有1 121篇,基于谷歌數(shù)據(jù)的有3 091篇。從文獻(xiàn)量看,2001—2013年,利用百度或谷歌提供的數(shù)據(jù)進(jìn)行研究的成果處于上升態(tài)勢。

2.2 搜索引擎在學(xué)術(shù)研究中應(yīng)用的頻次統(tǒng)計

搜索引擎積累了大量的搜索行為數(shù)據(jù)、語料資源、具有社交屬性的用戶自生成內(nèi)容、搜索趨勢和地理信息數(shù)據(jù)。搜索引擎不僅可為科研活動提供豐富的數(shù)據(jù),還能將部分服務(wù)或產(chǎn)品二次開發(fā)嵌入新的科學(xué)研究,降低科研初始開發(fā)的時間成本和經(jīng)濟(jì)成本,為科研工作創(chuàng)造更多可能性。谷歌和百度在平臺構(gòu)建和開發(fā)工具方面為廣大科研人員提供較大的擴(kuò)展空間,如谷歌地球、谷歌地圖和百度地圖等為地理、地質(zhì)、交通運輸、航空航天、林業(yè)、畜牧業(yè)、農(nóng)業(yè)、資源環(huán)境等學(xué)科提供基礎(chǔ)資源數(shù)據(jù),一般研究模式是在免費版的谷歌地球基礎(chǔ)上二次開發(fā),并與實際需求相結(jié)合進(jìn)行個性化加工,實現(xiàn)功能擴(kuò)展。

根據(jù)數(shù)據(jù)分析結(jié)果,基于谷歌的學(xué)術(shù)研究常用資源有谷歌地球、谷歌地圖、谷歌搜索、谷歌數(shù)字圖書館、谷歌學(xué)術(shù)、谷歌安卓平臺、谷歌云計算等;基于百度的學(xué)術(shù)研究常用資源有百度搜索、百度地圖、百度指數(shù)、百度貼吧、百度文庫、百度百科、百度知道等。

3 搜索引擎在學(xué)術(shù)研究中的應(yīng)用分析及討論

3.1 搜索引擎在學(xué)術(shù)研究中的應(yīng)用統(tǒng)計

搜索引擎在學(xué)術(shù)研究中的應(yīng)用主要有搜索工具和統(tǒng)計、地理信息系統(tǒng)、在線文檔系統(tǒng)和百科類問答系統(tǒng)、社交互動平臺、開發(fā)平臺及其他專業(yè)類數(shù)據(jù)(見表1)。作為獲取行為數(shù)據(jù)和查詢文獻(xiàn)信息的重要補充來源,搜索數(shù)據(jù)是研究中使用最多的數(shù)據(jù)來源,而地理信息系統(tǒng)在專業(yè)領(lǐng)域中使用最頻繁。

(1)搜索應(yīng)用。學(xué)術(shù)研究常用的搜索應(yīng)用包括通用搜索、學(xué)術(shù)搜索、專業(yè)搜索、搜索指數(shù)和趨勢統(tǒng)計,不同類型的搜索類產(chǎn)品在科研中的應(yīng)用情況,如表2所示。

表1 搜索引擎在學(xué)術(shù)研究中的應(yīng)用統(tǒng)計

表2 搜索類產(chǎn)品在學(xué)術(shù)研究中的應(yīng)用統(tǒng)計

其中,在科研中常用的搜索趨勢統(tǒng)計數(shù)據(jù)是搜索服務(wù)的衍生品,常用于經(jīng)濟(jì)學(xué)、行為學(xué)和信息科學(xué)研究,如百度指數(shù)和谷歌趨勢。百度指數(shù)主要用于投資行為、旅游管理、流行病預(yù)測、產(chǎn)品關(guān)注度及變化趨勢、票房預(yù)測、房地產(chǎn)、就業(yè)、輿情分析、空氣質(zhì)量、食品監(jiān)管、城市發(fā)展研究、消費者信心指數(shù)、受眾行為分析、出版發(fā)行等方面(見表3)。

表3 百度指數(shù)在學(xué)術(shù)研究的應(yīng)用統(tǒng)計

(2)地理信息系統(tǒng)。谷歌地球、谷歌地圖、百度地圖等是研究使用頻率最高的專業(yè)數(shù)據(jù)來源,主要應(yīng)用于地理、地質(zhì)、測繪、交通運輸、電力工程、地球物理學(xué)、電信、建筑工程、林業(yè)、水利水電、氣象、資源環(huán)境以及教育培訓(xùn)等領(lǐng)域。研究模式主要有兩種:一種是通過谷歌地球等軟件的API及KML二次開發(fā)接口快速提取相關(guān)模型、數(shù)據(jù)和影像資料,實現(xiàn)工程設(shè)計的高度仿真,用于設(shè)計、施工、評估等多個階段;另一種是通過前期測量獲取數(shù)據(jù),將設(shè)計方案通過谷歌地圖或百度地圖提供的二次開發(fā)接口進(jìn)行加工呈現(xiàn),使設(shè)計方案可視化并可通過移動客戶端進(jìn)行瀏覽和調(diào)用。

地理信息系統(tǒng)作為谷歌和百度在學(xué)術(shù)應(yīng)用中數(shù)量最多的數(shù)據(jù)類型,存在嚴(yán)重“偏科”的特點。除測繪、地理信息、農(nóng)業(yè)、林業(yè)、牧業(yè)、漁業(yè)等學(xué)科外,社會科學(xué)的很多創(chuàng)新研究也可借助地理信息系統(tǒng)開展,如將百度地圖、谷歌地圖與圖書館的讀者服務(wù)、自助圖書館等結(jié)合起來,利用在線地圖構(gòu)建基于地理位置的用戶服務(wù)和用戶行為分析。

(3)在線文檔系統(tǒng)和百科類問答系統(tǒng)。在線文檔系統(tǒng)及百科類問答系統(tǒng)為科研提供大量持續(xù)增長的研究數(shù)據(jù)和文本資料,是文本分析研究的常用數(shù)據(jù)來源。在線文檔系統(tǒng)是國內(nèi)近年來發(fā)展較快但頗受爭議的研究熱點,主要用于文獻(xiàn)獲取,或作為課程教學(xué)資源數(shù)據(jù)庫使用[7],最受關(guān)注的是版權(quán)問題[10]。百度百科和百度知道是常用的百科類問答系統(tǒng),其產(chǎn)生的大量文本資源是很有價值的科研數(shù)據(jù)來源,主要用于問答系統(tǒng)的運作模式和用戶行為[11]、網(wǎng)絡(luò)文本處理方法[12]、在線知識分享行為和模式[13-14]、網(wǎng)絡(luò)信息行為及信息擴(kuò)散研究[15]、在線問答系統(tǒng)的文本質(zhì)量[16]、語義分析和文本挖掘[17-18]等研究。從研究成果發(fā)布時間看,這類系統(tǒng)研究屬于比較新的研究領(lǐng)域,還有繼續(xù)深入研究的價值。

(4)社交互動數(shù)據(jù)。使用社交互動平臺數(shù)據(jù)的研究主要集中在圖書館學(xué)、情報學(xué)、計算機(jī)科學(xué)、新聞傳播學(xué)和教育學(xué)。百度貼吧、百度知道等根據(jù)用戶需求對行業(yè)和學(xué)科類別進(jìn)行細(xì)分,形成數(shù)個聚集大量用戶且具有社交互動性質(zhì)的平臺。在國內(nèi)期刊論文中使用百度貼吧的情況更多,主要用于研究電視節(jié)目關(guān)注與傳播[19]、網(wǎng)絡(luò)群體管理[20]、網(wǎng)絡(luò)語言傳播[21]、在線互動行為[22-23]、網(wǎng)絡(luò)互動文化[24]等。百度知道數(shù)據(jù)主要用于研究在線互動平臺機(jī)制[25-26]、基于社交網(wǎng)絡(luò)的信息和知識傳播[27-28]等。由于這些產(chǎn)品的社交屬性不如微信、微博等社交媒體,因而并不是社交網(wǎng)絡(luò)研究的主流數(shù)據(jù)來源,研究領(lǐng)域較狹窄,數(shù)據(jù)被挖掘的程度不高。智能移動終端普及以后,移動終端使傳統(tǒng)論壇和互動問答平臺的社交屬性更強(qiáng),便于繼續(xù)追蹤基于平臺APP的移動使用行為數(shù)據(jù),開展研究工作。

(5)開發(fā)平臺和工具。搜索引擎提供開源的平臺工具為科研和教學(xué)提供幫助,這些平臺和工具大致可為兩類,一是提供開發(fā)平臺或技術(shù)支持,二是共享資源和協(xié)作學(xué)習(xí)。如谷歌協(xié)作平臺是側(cè)重于團(tuán)隊協(xié)作的網(wǎng)站編輯工具,可幫助企業(yè)創(chuàng)建企業(yè)內(nèi)網(wǎng)、進(jìn)行項目管理跟蹤等,用戶通過谷歌協(xié)作平臺將所有類型的資源(包括文檔、視頻、圖片、日歷等)與好友、團(tuán)隊或網(wǎng)絡(luò)分享[29]?;诖颂匦裕雀鑵f(xié)作平臺被應(yīng)用到“云計算輔助教學(xué)”實踐,并取得較好成效[30-31]。谷歌云計算開發(fā)平臺(Google App Engine)同樣在應(yīng)用軟件開發(fā)、教學(xué)課程資源庫建設(shè)、自主學(xué)習(xí)、協(xié)作學(xué)習(xí)、數(shù)字圖書館建設(shè)等領(lǐng)域中使用[32-33]。同樣,百度推出的同類產(chǎn)品(百度云、百度眾包平臺、百度開放服務(wù)平臺等)也在科研中得到應(yīng)用[34-35]。

除以上列舉的主要應(yīng)用形式,在大數(shù)據(jù)決策的發(fā)展趨勢下,搜索引擎提供的相關(guān)數(shù)據(jù)平臺和服務(wù)(百度大數(shù)據(jù)+)、專業(yè)信息服務(wù)(百度健康、百度閱讀、百度旅游)、在線特色服務(wù)(谷歌線上藝術(shù)博物館)、在線特色小工具等都可成為可用的科研開放數(shù)據(jù)源,但目前鮮有成果出現(xiàn)。

3.2 搜索引擎學(xué)術(shù)應(yīng)用總結(jié)

基于搜索引擎的開放數(shù)據(jù)價值得到學(xué)界普遍認(rèn)可,但目前對開放數(shù)據(jù)的應(yīng)用程度還不夠深入,從目前國內(nèi)科學(xué)研究對搜索引擎數(shù)據(jù)的使用中發(fā)現(xiàn)以下兩個問題。

(1)數(shù)據(jù)應(yīng)用層次太淺,只有部分?jǐn)?shù)據(jù)被有效利用。如利用谷歌和百度地理信息系統(tǒng)的相關(guān)研究約1 700條,占總體研究數(shù)量的40%,而60%中像百度拇指醫(yī)生、百度閱讀、谷歌眼鏡、谷歌線上虛擬博物館等未被開發(fā)利用的數(shù)據(jù)就有可能存在科研的創(chuàng)新點。未來基于不同平臺、不同場景的數(shù)據(jù)融合,將是科研數(shù)據(jù)利用的發(fā)展趨勢。

(2)在學(xué)術(shù)研究中頻繁使用的數(shù)據(jù)存在偏好,基于同類型數(shù)據(jù)的研究設(shè)計、方法和過程雷同,科研創(chuàng)新性不高,如何讓有價值的數(shù)據(jù)在科研實踐中發(fā)揮更大的作用,在研究模式、方法和切入點上值得學(xué)者進(jìn)一步探索。

4 討論及未來研究方向

4.1 搜索引擎的學(xué)術(shù)應(yīng)用對圖書館數(shù)據(jù)服務(wù)的啟示

從搜索引擎數(shù)據(jù)應(yīng)用的案例分析可見,開放數(shù)據(jù)在各學(xué)科學(xué)術(shù)研究中應(yīng)用廣泛,是可利用的有效科研創(chuàng)新資源。但國內(nèi)對開放數(shù)據(jù)的關(guān)注較少,成果的嚴(yán)重“偏科”也從側(cè)面說明部分學(xué)科對開放數(shù)據(jù)的應(yīng)用太少,開放數(shù)據(jù)的發(fā)現(xiàn)、抓取、整理、發(fā)布、利用和評估整個流程缺乏規(guī)范和指導(dǎo)。而資源獲取、整合和推廣等工作是圖書館的優(yōu)勢,因此可基于科研用戶對開放數(shù)據(jù)的使用特點,在圖書館進(jìn)行館藏資源建設(shè)、特色數(shù)據(jù)庫開發(fā)和服務(wù),以及在資源整合過程中吸取有用經(jīng)驗,提供更人性化和個性化的資源服務(wù)。

(1)構(gòu)建開放數(shù)據(jù)資源目錄,做好開放數(shù)據(jù)資源發(fā)現(xiàn)和導(dǎo)航工作,幫助用戶獲取更多開放數(shù)據(jù)用于科學(xué)研究,提升科研創(chuàng)新性?,F(xiàn)階段科研數(shù)據(jù)共享工作提倡用戶公開共享科研活動產(chǎn)生的數(shù)據(jù),但不能忽視開放數(shù)據(jù)的應(yīng)用。圖書館應(yīng)抓住大數(shù)據(jù)分析和決策的發(fā)展趨勢,更多應(yīng)用公開、易獲得的原始數(shù)據(jù),為學(xué)術(shù)研究和管理決策提供資源支持。圖書館雖然不擁有科研成果數(shù)據(jù)的版權(quán),但可根據(jù)用戶學(xué)科背景和需求,對公開研究數(shù)據(jù)集進(jìn)行搜集和加工,整理開放數(shù)據(jù)資源目錄,為用戶提供免費數(shù)據(jù)參考咨詢和數(shù)據(jù)推薦服務(wù)。目前全球范圍內(nèi)有價值的開放數(shù)據(jù)集數(shù)量巨大,用戶在研究中所使用的占比較少,大部分有價值的開放數(shù)據(jù)還未被利用。此外,在開放數(shù)據(jù)主題新穎性、研究模式的創(chuàng)新等方面有待加強(qiáng)。

(2)開展學(xué)科數(shù)據(jù)服務(wù),做好開放數(shù)據(jù)獲取的輔助工作。目前科研人員處于信息和數(shù)據(jù)海量增長的時代,圖書館可通過開展學(xué)科數(shù)據(jù)服務(wù)、嵌入式科研輔助服務(wù)等形式,幫助科研人員搜索可利用的開放數(shù)據(jù)、制定數(shù)據(jù)獲取方案、尋求最佳獲取途徑;此外,還可提供存儲空間和運行設(shè)備,評估數(shù)據(jù)價值,輔助數(shù)據(jù)分析工作,實現(xiàn)科研貢獻(xiàn)和學(xué)術(shù)共享空間的職能。

圖書館的信息資源、用戶行為數(shù)據(jù)、空間數(shù)據(jù)等也頗具研究價值,可開放給用戶進(jìn)行科學(xué)研究。如上海圖書館利用整理的家譜數(shù)據(jù)開展開放數(shù)據(jù)應(yīng)用開發(fā)競賽,力求更充分地釋放開放數(shù)據(jù)的價值,最大程度挖掘其背后的應(yīng)用潛力,激發(fā)創(chuàng)新能力,這種雙贏互動的形式值得推廣。

(3)建立開放數(shù)據(jù)獲取平臺,整合學(xué)科資源、知識和數(shù)據(jù),加強(qiáng)不同層次資源和數(shù)據(jù)的關(guān)聯(lián)性??蒲泄ぷ餍枰墨I(xiàn)、知識、數(shù)據(jù)和工具等多種資源,但大部分資源分散在不同機(jī)構(gòu)和平臺,并未進(jìn)行整合。圖書館可利用其在文獻(xiàn)資源整合管理方面的經(jīng)驗和優(yōu)勢,將用戶所需科研資源、知識、數(shù)據(jù)和工具進(jìn)行整理和發(fā)布,利用關(guān)聯(lián)技術(shù)建立不同類型資源的聯(lián)系,構(gòu)建開放數(shù)據(jù)獲取平臺,方便科研用戶使用;還可提供數(shù)據(jù)使用情況分析報告和研究進(jìn)展供科研人員參考,通過資源和服務(wù)整合提升科研成果創(chuàng)新。

(4)做好對科研人員的數(shù)據(jù)素養(yǎng)培訓(xùn)。從搜索引擎數(shù)據(jù)在研究中使用可以發(fā)現(xiàn),學(xué)科、研究主題間差異明顯,部分學(xué)科并沒有利用可公開獲取的龐大數(shù)據(jù)進(jìn)行科研活動。除學(xué)科特點有所不同,科研數(shù)據(jù)素養(yǎng)是限制國內(nèi)科研人員充分使用開放數(shù)據(jù)的制約條件之一,圖書館在進(jìn)行數(shù)據(jù)資源服務(wù)過程中可向用戶提供相關(guān)培訓(xùn),包括對相關(guān)研究設(shè)計、數(shù)據(jù)抓取、工具使用、數(shù)據(jù)可視化等進(jìn)行輔導(dǎo),結(jié)合圖書館提供的數(shù)據(jù)資源服務(wù),針對基于數(shù)據(jù)研究的發(fā)展趨勢,組織數(shù)據(jù)分析培訓(xùn)課程,更好地輔助教學(xué)科研。

4.2 本文不足之處和未來研究方向

公開的科研數(shù)據(jù)將有望成為圖書館在數(shù)據(jù)服務(wù)階段進(jìn)行深度挖掘和整合的服務(wù)資源,在學(xué)術(shù)研究中還有極大的價值等待挖掘。本文在樣本數(shù)據(jù)選取時只選取搜索引擎開放數(shù)據(jù),不夠全面。在下一步研究中應(yīng)將國內(nèi)學(xué)術(shù)研究中常用的搜索引擎服務(wù)、社交網(wǎng)絡(luò)數(shù)據(jù)、政府機(jī)構(gòu)和非營利機(jī)構(gòu)提供數(shù)據(jù)等的利用情況納入研究范圍,如豆瓣、微博、微信和行業(yè)特色數(shù)據(jù)源集等。然后,與國外研究情況進(jìn)行對比分析,獲取科研用戶使用行為特點和需求,為國內(nèi)基于開放數(shù)據(jù)的科學(xué)研究事業(yè)提供寶貴經(jīng)驗,為圖書館構(gòu)建開放數(shù)據(jù)資源服務(wù)目錄和服務(wù)體系提供支持。

[1]張毅菁.從信息公開到數(shù)據(jù)開放的全球?qū)嵺`——兼對上海建設(shè)“政府?dāng)?shù)據(jù)服務(wù)網(wǎng)”的啟示[J].情報雜志,2014(10):175-178,183.

[2]陳美.美國開放政府?dāng)?shù)據(jù)的保障機(jī)制研究[J].情報雜志,2013(7):148-153.

[3]BERTOT J C,鄭磊,徐慧娜,等.大數(shù)據(jù)與開放數(shù)據(jù)的政策框架:問題、政策與建議[J].電子政務(wù),2014(1):6-14.

[4]劉晶晶,馬建華.論科研數(shù)據(jù)開放共享的三種途徑[J].情報雜志,2015(10):146-150,96.

[5]畢秋靈.數(shù)據(jù)新聞中的開放數(shù)據(jù)應(yīng)用[J].湖北社會科學(xué),2016(7):190-194.

[6]楊濱.論云計算輔助教學(xué)(CCAI)中協(xié)作學(xué)習(xí)產(chǎn)生的設(shè)計機(jī)制——以Google sites下的協(xié)作學(xué)習(xí)為例[J].現(xiàn)代教育技術(shù),2009(11):95-99.

[7]王玉龍.基于百度文庫的微課資源社區(qū)構(gòu)建策略研究[J].中國遠(yuǎn)程教育,2015(2):73-78.

[8]黃金霞,馬雨萌.大數(shù)據(jù)時代開放信息資源的數(shù)據(jù)服務(wù)能力思考[J].數(shù)字圖書館論壇,2016(8):54-59.

[9]陳建新.科學(xué)數(shù)據(jù)服務(wù):圖書館服務(wù)的新領(lǐng)域[J].圖書與情報,2013(4):93-95.

[10]張麗波,馬海群,周麗霞.避風(fēng)港原則適用性研究及立法建議——由百度文庫侵權(quán)案件說起[J].圖書情報知識,2013(1):122-127.

[11]常靜,楊建梅,歐瑞秋.基于TAM的百度百科用戶參與意向的影響因素研究[J].軟科學(xué),2010(12):34-37.

[12]陸勇,章成志,侯漢清.基于百科資源的多策略中文同義詞自動抽取研究[J].中國圖書館學(xué)報,2010(1):56-62.

[13]夏火松,王瑞新.百度百科詞條特性對知識共享意愿影響的實證研究[J].科學(xué)學(xué)研究,2010(12):1877-1883,1890.

[14]黃令賀,朱慶華,沈超.差異與穩(wěn)定:網(wǎng)絡(luò)百科用戶興趣動態(tài)變化研究[J].圖書情報知識,2016(2):101-113.

[15]張洋,盧橋.中文社會化媒體信息老化的計量分析[J].情報雜志,2015(3):77-84.

[16]孫曉寧,趙宇翔,朱慶華.基于SQA系統(tǒng)的社會化搜索答案質(zhì)量評價指標(biāo)構(gòu)建[J].中國圖書館學(xué)報,2015(4):65-82.

[17]許坤,馮巖松,趙東巖,等.面向知識庫的中文自然語言問句的語義理解[J].北京大學(xué)學(xué)報(自然科學(xué)版),2014(1):85-92.

[18]段利國,陳俊杰.綜合句法結(jié)構(gòu)及語義相似度的問題推薦技術(shù)[J].計算機(jī)科學(xué),2012(1):203-206.

[19]張倩,戴建華,閆萌萌.基于電視劇網(wǎng)絡(luò)點播量分析的社會化媒體價值研究[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報),2013(11):59-62.

[20]張郁文.淺析貼吧粉絲群體的管理——以“羅志祥吧”為例[J].新聞世界,2014(8):154-156.

[21]賀潔.從大眾傳媒看“土豪”的傳播與發(fā)展[J].青年記者,2014(24):86-87.

[22]萬力勇.網(wǎng)絡(luò)百科用戶協(xié)同創(chuàng)作的互動機(jī)制研究——以百度百科貼吧為例[J].情報雜志,2014(1):167-172.

[23]王國華,劉菊,楊騰飛,等.網(wǎng)絡(luò)空間中艾滋病的社會支持研究——以百度貼吧“HIV吧”為例[J].情報雜志,2015(11):105-110.

[24]李可安.新媒體傳播方式下的粉絲文化——以新浪微博和百度貼吧為例[J].科技傳播,2015(12):92-93.

[25]趙麗紅.互動式知識問答分享平臺對虛擬參考咨詢服務(wù)的啟示[J].圖書館建設(shè),2009(5):62-64.

[26]霍建梅,李書寧.圖書館數(shù)字館藏建設(shè)用戶參與激勵機(jī)制探究[J].圖書情報工作,2015(2):5-10.

[27]寧寒松.線上互動系統(tǒng)中“輿論領(lǐng)袖”的缺失及成因——以百度知道為例[J].新聞世界,2012(8):119-120.

[28]王小立.百度“知道”知識傳播對個人數(shù)字圖書館資源共享的啟示——基于系統(tǒng)動力學(xué)方法[J].圖書館,2016(2):83-87.

[29]百度百科.Google Sites[2016-11-7].http://baike.baidu.com/link?url=osu 8ZSzbSC_yozf1NaziwxabhN79UBmlyhleJvg1OW3jlKneQVkshAvO1 Gah1uU5mI5n61Nu3t0YMsUUkxSQ1dldtesmhwsRiawt-xQ3vqu.

[30]楊濱.論云計算輔助教學(xué)(CCAI)中協(xié)作學(xué)習(xí)產(chǎn)生的設(shè)計機(jī)制——以Google sites下的協(xié)作學(xué)習(xí)為例[J].現(xiàn)代教育技術(shù),2009(11):95-99.

[31]徐瑞.Google協(xié)作平臺在中小學(xué)教師教育技術(shù)培訓(xùn)中的應(yīng)用探究[D].上海:華東師范大學(xué),2010.

[32]劉曉剛.基于開源云計算的遠(yuǎn)程教育系統(tǒng)的設(shè)計與實現(xiàn)[J].中國教育信息化,2011(9):40-43.

[33]王佳雋,呂智慧,吳杰,等.云計算技術(shù)發(fā)展分析及其應(yīng)用探討[J].計算機(jī)工程與設(shè)計,2010(20):4404-4409.

[34]陳霞,閔華清,宋恒杰.眾包平臺作弊用戶自動識別[J].計算機(jī)工程,2016(8):139-145,152.

[35]丁峰,梅曉亮,張麗.專業(yè)群教學(xué)資源信息化面向移動APP題庫的設(shè)計及實現(xiàn)[J].信息系統(tǒng)工程,2016(5):148-149,152.

Abstract:Open data is an important source of data for scientific research,but it is neglected in the scientific data sharing system.This study takes the search engine as an example to analyze the usage of open data in scientific research.4 212 items got from CNKI and Wanfang to analyze the Google and Baidu data use behavior by the way of manual indexing and word frequency statistics,including their characteristics,frequency and tendency.Based on this,the author made recommendations to develop open data service policy and service mode for library.

Keywords:Academic Research;Search Engine;Open Data;Library

The Academic Applications of Search Engine and Its Inspiration to Library Data Services

LUO XiaoLan
(Shanghai University of TCM Library,Shanghai 201203,China)

G252.7

10.3772/j.issn.1673-2286.2017.08.007

羅曉蘭,女,1985年生,博士研究生,講師,研究方向:信息檢索、健康信息行為、技術(shù)采納與行為,E-mail:miaoqu11@126.com。

2017-04-24)

猜你喜歡
搜索引擎百度圖書館
Robust adaptive UKF based on SVR for inertial based integrated navigation
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
飛躍圖書館
百度遭投行下調(diào)評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
百度“放衛(wèi)星”,有沒有可能?
太空探索(2014年4期)2014-07-19 10:08:58
去圖書館
廣告主與搜索引擎的雙向博弈分析
德庆县| 铁岭市| 资中县| 崇州市| 沭阳县| 林周县| 灵宝市| 牟定县| 阿拉善盟| 全州县| 蛟河市| 荆门市| 祁东县| 涟源市| 信宜市| 神木县| 洛南县| 志丹县| 南木林县| 聂拉木县| 云龙县| 孝感市| 康保县| 洪雅县| 克山县| 亚东县| 句容市| 尖扎县| 泸州市| 仪征市| 富蕴县| 兴国县| 宣汉县| 汽车| 阳东县| 丰原市| 西丰县| 龙井市| 尚志市| 景谷| 扶风县|