国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

近十年中外圖書情報(bào)學(xué)大數(shù)據(jù)研究論文比較分析

2016-10-14 08:46:55劉玲玲
河北科技圖苑 2016年2期
關(guān)鍵詞:高頻詞情報(bào)機(jī)構(gòu)詞頻

劉玲玲

(天津醫(yī)科大學(xué)圖書館 天津 300070)

?

近十年中外圖書情報(bào)學(xué)大數(shù)據(jù)研究論文比較分析

劉玲玲

(天津醫(yī)科大學(xué)圖書館天津300070)

在大數(shù)據(jù)研究已然成為各行各業(yè)共同關(guān)注的大背景下,對(duì)近十年中外圖書情報(bào)學(xué)大數(shù)據(jù)研究的學(xué)術(shù)論文展開(kāi)主題分析具有現(xiàn)實(shí)意義。以萬(wàn)方數(shù)據(jù)庫(kù)和EBSCO數(shù)據(jù)庫(kù)為數(shù)據(jù)源,借助高頻詞統(tǒng)計(jì)軟件及主題分析法,對(duì)高頻詞語(yǔ)進(jìn)行系統(tǒng)性與綜合性比較,揭示中外大數(shù)據(jù)研究的熱點(diǎn)及發(fā)展趨勢(shì)。對(duì)比分析發(fā)現(xiàn),數(shù)據(jù)、技術(shù)、服務(wù)是中外共同關(guān)注的主題熱點(diǎn)。

大數(shù)據(jù);圖書情報(bào);詞頻分析

近年來(lái),圖書情報(bào)學(xué)界有關(guān)大數(shù)據(jù)的文獻(xiàn)報(bào)道迅猛增長(zhǎng),這說(shuō)明大數(shù)據(jù)專題研究已經(jīng)成為這一學(xué)科研究的重點(diǎn)。在這樣的背景下,從發(fā)文時(shí)間、學(xué)科發(fā)展特點(diǎn)及主題詞分析等方面對(duì)中外大數(shù)據(jù)論文進(jìn)行統(tǒng)計(jì)分析,有助于我們及時(shí)掌握該專題領(lǐng)域的研究熱點(diǎn)與重點(diǎn),了解其學(xué)科發(fā)展趨勢(shì),為該專題領(lǐng)域研究的深入開(kāi)展和未來(lái)發(fā)展提供參考和借鑒。

1 文獻(xiàn)來(lái)源與研究方法

1.1文獻(xiàn)來(lái)源

以萬(wàn)方數(shù)據(jù)庫(kù)和EBSCO數(shù)據(jù)庫(kù)為數(shù)據(jù)源,學(xué)科設(shè)定為圖書館學(xué)和情報(bào)學(xué),檢索時(shí)間限定為2005年1月1日至2014年12月31日。萬(wàn)方數(shù)據(jù)庫(kù),以大數(shù)據(jù)為檢索詞,選擇題名或關(guān)鍵詞字段進(jìn)行檢索。EBSCO數(shù)據(jù)庫(kù),以“big data”為檢索詞進(jìn)行主題檢索,檢索執(zhí)行時(shí)間為2015年10月6日。通過(guò)檢索數(shù)據(jù)下載,數(shù)據(jù)、文本特征提取,將相關(guān)信息進(jìn)行歸納和統(tǒng)計(jì)分析。

1.2研究方法

本文采用基于詞頻統(tǒng)計(jì)的內(nèi)容分析法。該方法是一種基于定性分析的量化研究方法,是透過(guò)詞頻現(xiàn)象探視內(nèi)容本質(zhì)的科學(xué)方法。它的主要原理是以具體某組詞在樣本文獻(xiàn)中出現(xiàn)的次數(shù)為基礎(chǔ)進(jìn)行詞頻分析,揭示不同語(yǔ)詞之間的相互關(guān)系,進(jìn)而分析該領(lǐng)域研究的結(jié)構(gòu)和熱點(diǎn)。

2 研究論文統(tǒng)計(jì)分析

2.1論文及詞頻統(tǒng)計(jì)

2005年—2014年,萬(wàn)方數(shù)據(jù)庫(kù)刊載大數(shù)據(jù)論文5 963篇,關(guān)鍵詞24 423個(gè);EBSCO數(shù)據(jù)庫(kù)刊載398篇,關(guān)鍵詞2 160個(gè),如表1。

表1 中外大數(shù)據(jù)研究論文及詞頻年代分布

2.2發(fā)文量及發(fā)表時(shí)間比較

2005年—2014年間,中外大數(shù)據(jù)論文及其關(guān)鍵詞數(shù)量均呈上升趨勢(shì),表現(xiàn)出不同的發(fā)展特點(diǎn)。

2.2.1研究特點(diǎn)比較

2005年-2014年間,大數(shù)據(jù)相關(guān)英文論文398篇,大數(shù)據(jù)相關(guān)中文論文5 963篇,是英文論文發(fā)文量的14.98倍。另外,EBSCO數(shù)據(jù)庫(kù)大數(shù)據(jù)論文最早可追溯到1968年,萬(wàn)方數(shù)據(jù)庫(kù)可追溯到1998年。因此,可以推斷,國(guó)外大數(shù)據(jù)研究起步早,但發(fā)展平緩;國(guó)內(nèi)研究雖然起步比較晚,但是發(fā)展迅速,后來(lái)者居上。

2.2.2發(fā)展階段比較

國(guó)外2005年至2010年為起步階段,5年發(fā)文20篇,占總發(fā)文量的5.03%,研究呈現(xiàn)緩慢、零散的特點(diǎn);2011年至2012年為快速發(fā)展階段,2年發(fā)文76篇,占論文總量的19.10%;2013年至2014年為高速發(fā)展階段,2年發(fā)文302篇,占發(fā)文總量的75.88%,詞頻1 624次,占詞頻總量的75.05%。2014年達(dá)到峰值,發(fā)文171篇,詞頻931次。與之不同的是,國(guó)內(nèi)2005年至2012年間,文獻(xiàn)數(shù)量平穩(wěn)增長(zhǎng),年平均發(fā)文量達(dá)575篇,2013年至2014年間,發(fā)文數(shù)量階梯式上升,呈現(xiàn)高速發(fā)展勢(shì)頭。

3 研究?jī)?nèi)容比較分析

3.1中外高頻詞統(tǒng)計(jì)

2005年-2014年,中外文大數(shù)據(jù)相關(guān)論文共計(jì)6 361篇,關(guān)鍵詞26 583個(gè),總詞頻為12 078。由于高頻關(guān)鍵詞數(shù)量較多,受篇幅所限,故選取中外論文關(guān)鍵詞中詞頻位居前20位的高頻詞,如表2。

表2 中外大數(shù)據(jù)相關(guān)文獻(xiàn)高頻詞分布

續(xù)表2

從表2可知,大數(shù)據(jù)論文高頻中文詞主要有大數(shù)據(jù)、云計(jì)算、關(guān)聯(lián)數(shù)據(jù)、關(guān)聯(lián)規(guī)則、圖書館服務(wù)等;高頻英文詞主要有Big data、Database management、Data analysis、Information resources management、Data mining、Information services等。

3.2中外大數(shù)據(jù)論文共同關(guān)注熱點(diǎn)分析

中外高頻關(guān)鍵詞頻次分別為785、620,占其詞頻總量的7.31%、46.30%。從某個(gè)側(cè)面,這些高頻關(guān)鍵詞可以代表中外大數(shù)據(jù)論文研究的熱點(diǎn)與重點(diǎn)。

3.2.1數(shù)據(jù)是第一大研究熱點(diǎn)

圖書情報(bào)機(jī)構(gòu)在長(zhǎng)期的資源使用、存儲(chǔ)、管理過(guò)程中,累積了大量不同類型的數(shù)據(jù),如傳統(tǒng)數(shù)據(jù)、電子數(shù)據(jù)、社交網(wǎng)絡(luò)媒體交互數(shù)據(jù)等。這些數(shù)據(jù)集合構(gòu)成的大數(shù)據(jù),成為圖書情報(bào)機(jī)構(gòu)開(kāi)展各項(xiàng)服務(wù)的基礎(chǔ)。國(guó)內(nèi)外學(xué)者對(duì)數(shù)據(jù)研究的熱情同樣高漲:中文“數(shù)據(jù)”高頻詞有大數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、數(shù)據(jù)中心、數(shù)據(jù)采集器、元數(shù)據(jù)倉(cāng)儲(chǔ)、采訪數(shù)據(jù)等,總頻次399,占高頻詞總頻次的50.83%;外文高頻詞有Big data、Data analysis、Data mining、Data libraries等,總頻次293,占高頻詞總頻次的47.26%。中外“數(shù)據(jù)”高頻詞分別占高頻詞總量的大約1/2,說(shuō)明國(guó)內(nèi)外大數(shù)據(jù)論文都很重視對(duì)數(shù)據(jù)相關(guān)問(wèn)題的研究。

對(duì)不同數(shù)據(jù)集合進(jìn)行整合處理、深層次挖掘,為圖書情報(bào)機(jī)構(gòu)服務(wù)模式創(chuàng)新及未來(lái)發(fā)展趨勢(shì)提供分析與預(yù)測(cè)[1];大數(shù)據(jù)的存儲(chǔ)及其安全技術(shù)問(wèn)題;新型數(shù)據(jù)類型的互聯(lián)共享等等,未來(lái)仍將是大數(shù)據(jù)專題研究領(lǐng)域的重點(diǎn)內(nèi)容。

3.2.2云計(jì)算、云存儲(chǔ)、聚類分析、算法等技術(shù)研究是第二大熱點(diǎn)

大數(shù)據(jù)時(shí)代強(qiáng)調(diào)對(duì)所有數(shù)據(jù)的分析處理。海量數(shù)據(jù)的處理、運(yùn)算及存儲(chǔ)管理催生出新技術(shù),如云計(jì)算、云存儲(chǔ)、聚類分析等。這些新技術(shù)以及技術(shù)的不斷創(chuàng)新,關(guān)乎大數(shù)據(jù)背后隱藏的高價(jià)值的經(jīng)濟(jì)價(jià)值和社會(huì)效應(yīng)。中文“技術(shù)”高頻詞有云計(jì)算、關(guān)聯(lián)規(guī)則、聚類分析、數(shù)據(jù)采集器、云存儲(chǔ)、決策樹(shù)等,總頻次229,占中文高頻詞總量的29.18%。外文高頻詞有Data mining、Information technology、Cloud computing、Algorithms等,總頻次147,占外文高頻詞總量的23.71%。

技術(shù)是大數(shù)據(jù)發(fā)揮決策及管理作用的支撐。依托大量數(shù)據(jù),借助關(guān)聯(lián)數(shù)據(jù)、語(yǔ)義化、本體等技術(shù)及數(shù)據(jù)挖掘分析軟件等工具實(shí)現(xiàn)知識(shí)服務(wù)[2],未來(lái)仍將是中外大數(shù)據(jù)研究的重點(diǎn)和熱點(diǎn)。因此,圖書情報(bào)人員應(yīng)該從圖書館的實(shí)際出發(fā),加強(qiáng)對(duì)大數(shù)據(jù)技術(shù)的研發(fā)。

3.2.3服務(wù)是第三大研究熱點(diǎn)

服務(wù)是圖書館的生命,是圖書館核心價(jià)值的體現(xiàn)。全數(shù)據(jù)的出現(xiàn)為圖情機(jī)構(gòu)創(chuàng)新服務(wù)模式和服務(wù)內(nèi)容提供了新的視角與思維。服務(wù)群體的不斷擴(kuò)大、用戶需求及需求實(shí)現(xiàn)途徑的多樣化、個(gè)性化,以及基于需求導(dǎo)向的服務(wù)創(chuàng)新,是大數(shù)據(jù)時(shí)代圖情機(jī)構(gòu)創(chuàng)新服務(wù)的重點(diǎn)。中文“服務(wù)”高頻詞有圖書館服務(wù)、服務(wù)模式、學(xué)科服務(wù)、個(gè)性化信息服務(wù)、服務(wù)創(chuàng)新,總頻次136,占高頻詞總頻次的17.33%;外文高頻詞只有Information services,頻次22,占高頻詞總頻次的3.55%。綜上可以看出,國(guó)內(nèi)對(duì)于服務(wù)的研究熱情遠(yuǎn)遠(yuǎn)高于國(guó)外,國(guó)內(nèi)更注重服務(wù)方面的理論研究。

大數(shù)據(jù)時(shí)代,不同類型資源的開(kāi)發(fā)利用得到了空前深化,資源重組之后的新知識(shí)、新價(jià)值日益凸顯。借助大數(shù)據(jù)的優(yōu)勢(shì),創(chuàng)新服務(wù)方式更好地適應(yīng)圖書情報(bào)機(jī)構(gòu)用戶的個(gè)性化需求,進(jìn)而創(chuàng)造需求將是未來(lái)中外圖情界大數(shù)據(jù)研究的重要內(nèi)容之一。

3.3中外大數(shù)據(jù)論文不同關(guān)注熱點(diǎn)比較

對(duì)比中外大數(shù)據(jù)論文的前20位高頻詞,我們既可以發(fā)現(xiàn)中外學(xué)術(shù)研究共同關(guān)注的焦點(diǎn)問(wèn)題,也能發(fā)現(xiàn)它們研究的不同側(cè)重點(diǎn)。

3.3.1國(guó)外大數(shù)據(jù)論文更加重視對(duì)于信息的研究

信息是圖書情報(bào)機(jī)構(gòu)提供服務(wù)的基礎(chǔ)。大量繁冗復(fù)雜信息的獲取、存儲(chǔ)、管理、服務(wù)及信息技術(shù)的研發(fā)等,有助于提高圖書情報(bào)機(jī)構(gòu)的信息服務(wù)水平?!癐nformation”相關(guān)高頻詞有Information resources management、Information services、Information technology、Information retrieval、Access to information、Information storage & retrieval systems、Information resources,總頻次為162,占高頻詞總頻次的26.13%。國(guó)外學(xué)者重視對(duì)信息技術(shù)、信息存儲(chǔ)、信息獲取、信息管理、地理信息系統(tǒng)等的研究。國(guó)內(nèi)前20位高頻詞中只“個(gè)性化信息服務(wù)”一詞涉及信息,然而該詞本身強(qiáng)調(diào)的是服務(wù),并非信息。

從機(jī)構(gòu)存儲(chǔ)的角度出發(fā),凸顯大數(shù)據(jù)的特征和優(yōu)勢(shì)。運(yùn)用大數(shù)據(jù)可視化技術(shù),從更多維度來(lái)深度揭示信息背后的隱性關(guān)系,挖掘新知識(shí),創(chuàng)造新價(jià)值,將是未來(lái)大數(shù)據(jù)研究關(guān)注的焦點(diǎn),國(guó)內(nèi)應(yīng)該加強(qiáng)對(duì)于信息存儲(chǔ)管理及技術(shù)的研發(fā)。

3.3.2國(guó)外大數(shù)據(jù)論文更加重視對(duì)于大數(shù)據(jù)本體的研究

大數(shù)據(jù)是互聯(lián)網(wǎng)和云計(jì)算的產(chǎn)物?;ヂ?lián)網(wǎng)、數(shù)據(jù)庫(kù)、搜索引擎等是大數(shù)據(jù)存在的根本,大數(shù)據(jù)的出現(xiàn),加劇了現(xiàn)代化圖書情報(bào)機(jī)構(gòu)在服務(wù)內(nèi)容與服務(wù)方式對(duì)于它們的依賴。同時(shí),借助互聯(lián)網(wǎng)蓬勃發(fā)展的社交媒體,能夠以文本、圖像、音樂(lè)和視頻等多種不同的形式來(lái)呈現(xiàn)。社交媒體傳播的信息儼然成為大數(shù)據(jù)的重要部分。國(guó)外學(xué)者重視在線社交網(wǎng)絡(luò)等網(wǎng)絡(luò)信息資源的收集與利用。相關(guān)高頻詞Internet、Search engines、Social media等,而國(guó)內(nèi)高頻詞卻鮮有提及。綜上,大數(shù)據(jù)的本體研究應(yīng)該成為未來(lái)大數(shù)據(jù)論文研究的一個(gè)重要方向,只有這樣才能讓大數(shù)據(jù)更好地為圖書情報(bào)機(jī)構(gòu)服務(wù)。

4 結(jié)束語(yǔ)

大數(shù)據(jù)時(shí)代,中外大數(shù)據(jù)論文共同關(guān)注的研究重點(diǎn)與熱點(diǎn)——數(shù)據(jù)、技術(shù)、服務(wù),與圖書情報(bào)機(jī)構(gòu)服務(wù)用戶的核心價(jià)值是一致的。大數(shù)據(jù)的理論研究與技術(shù)開(kāi)發(fā)百花齊放,為圖書情報(bào)機(jī)構(gòu)實(shí)施和推動(dòng)大數(shù)據(jù)應(yīng)用,創(chuàng)新服務(wù)模式和服務(wù)內(nèi)容具有較大的理論價(jià)值和現(xiàn)實(shí)指導(dǎo)意義。國(guó)外大數(shù)據(jù)研究起步較早,而國(guó)內(nèi)學(xué)者奮力直追,到了中期,從數(shù)量上超過(guò)了國(guó)外相關(guān)研究文獻(xiàn)??v觀國(guó)內(nèi)外文獻(xiàn)研究特點(diǎn),可以斷定大數(shù)據(jù)研究目前仍處于強(qiáng)勁發(fā)展階段。與國(guó)外相比,國(guó)內(nèi)更加側(cè)重于理論研究,研究?jī)?nèi)容趨同,缺乏足夠的實(shí)踐支持。未來(lái),國(guó)內(nèi)學(xué)者應(yīng)該在理論與實(shí)踐相結(jié)合的基礎(chǔ)上,加強(qiáng)大數(shù)據(jù)的應(yīng)用與策略性研究、加強(qiáng)大數(shù)據(jù)各種技術(shù)的研發(fā)。圖書情報(bào)機(jī)構(gòu)應(yīng)該積極尋找大數(shù)據(jù)應(yīng)用的切入點(diǎn),從用戶和用戶需求出發(fā),利用大數(shù)據(jù)更好地提供服務(wù)才是根本。

[1]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012,(5):37-40.

[2]祝森生.大數(shù)據(jù)時(shí)代關(guān)于智慧圖書館的幾個(gè)研究問(wèn)題探討[J].圖書與情報(bào),2013,(5):126-128.

G254

A

2015-11-12責(zé)任編輯:孫煒)

猜你喜歡
高頻詞情報(bào)機(jī)構(gòu)詞頻
省級(jí)兩會(huì)上的高頻詞
小康(2022年7期)2022-03-10 11:15:54
30份政府工作報(bào)告中的高頻詞
小康(2022年7期)2022-03-10 11:15:54
基于詞頻分析法的社區(qū)公園歸屬感營(yíng)建要素研究
園林科技(2021年3期)2022-01-19 03:17:48
省級(jí)兩會(huì)上的高頻詞
小康(2021年7期)2021-03-15 05:29:03
28份政府工作報(bào)告中的高頻詞
小康(2021年7期)2021-03-15 05:29:03
淺談基層科技情報(bào)機(jī)構(gòu)現(xiàn)狀及發(fā)展對(duì)策的思考
詞頻,一部隱秘的歷史
云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報(bào)》學(xué)術(shù)研究特色
圖書館論壇(2014年8期)2014-03-11 18:47:59
西方預(yù)測(cè)伊朗18個(gè)月內(nèi)擁有核武
宁波市| 嘉鱼县| 外汇| 海宁市| 河曲县| 六盘水市| 武穴市| 综艺| 泉州市| 聂拉木县| 宝坻区| 达拉特旗| 桐庐县| 常山县| 鹿邑县| 会泽县| 星座| 北碚区| 武穴市| 栖霞市| 保康县| 舞阳县| 陆河县| 金寨县| 鹿泉市| 卢氏县| 武川县| 太康县| 陆良县| 乌恰县| 安庆市| 中山市| 武威市| 三门县| 肃南| 正定县| 承德县| 调兵山市| 资溪县| 澎湖县| 昭觉县|