国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國內(nèi)知識發(fā)現(xiàn)研究可視化分析

2018-03-23 12:23:16韓雪
中國管理信息化 2018年3期
關(guān)鍵詞:共詞分析社會網(wǎng)絡(luò)分析可視化

韓雪

[摘 要] 選取CNKI收錄的知識發(fā)現(xiàn)相關(guān)研究文獻,利用STAI構(gòu)建高頻關(guān)鍵詞共現(xiàn)矩陣,運用SPSS繪制聚類樹狀圖,采用社會網(wǎng)絡(luò)分析及共詞分析等方法對2012年至2017年五年內(nèi)知識發(fā)現(xiàn)領(lǐng)域研究熱點及趨勢進行分析,通過梳理國內(nèi)知識發(fā)現(xiàn)領(lǐng)域研究現(xiàn)狀,以期為知識發(fā)現(xiàn)的研究和發(fā)展提供借鑒和指導(dǎo)。

[關(guān)鍵詞] 知識發(fā)現(xiàn);社會網(wǎng)絡(luò)分析;共詞分析;可視化

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 03. 055

[中圖分類號] G250 [文獻標(biāo)識碼] A [文章編號] 1673 - 0194(2018)03- 0136- 03

0 引 言

隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)的指數(shù)級增長和廣泛的可用性為知識發(fā)現(xiàn)提供了巨大的潛力,并為在各個學(xué)科和各領(lǐng)域中的應(yīng)用帶來了新的挑戰(zhàn),知識發(fā)現(xiàn)與數(shù)據(jù)挖掘也成為了國內(nèi)學(xué)術(shù)界研究的熱點[1]。本文運用社會網(wǎng)絡(luò)分析方法和共詞分析方法,通過關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和關(guān)鍵詞共詞聚類分析,探索我國知識發(fā)現(xiàn)研究熱點和內(nèi)容結(jié)構(gòu),通過與國際研究前沿領(lǐng)域的比較,以期為后續(xù)知識發(fā)現(xiàn)研究與實踐的開展提供參考和建議。

1 數(shù)據(jù)來源與研究方法

1.1 數(shù)據(jù)來源

本文選取CNKI中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫為數(shù)據(jù)來源,檢索式為“主題=知識發(fā)現(xiàn)”;檢索時間從2012年1月1日至2017年5月1日,得到2 277檢索結(jié)果,經(jīng)過數(shù)據(jù)清洗,去除新聞及通知等不相關(guān)檢索內(nèi)容,共獲得2 216條檢索結(jié)果。

1.2 數(shù)據(jù)處理工具

在進行研究分析前,對數(shù)據(jù)進行預(yù)處理工具是數(shù)據(jù)分析的重要環(huán)節(jié)。本文使用文獻題錄信息統(tǒng)計分析工具(Statistical Analysis Toolkit for Informetrics, SATI)[2]對檢索結(jié)果進行字段信息抽取、條目頻次統(tǒng)計,最后構(gòu)建共詞矩陣,將共詞矩陣導(dǎo)入社會網(wǎng)絡(luò)分析軟件Ucinet和SPSS進行分析,形象的展示知識發(fā)現(xiàn)的研究熱點與前沿發(fā)展趨勢。

1.3 構(gòu)建共現(xiàn)矩陣

將從CNKI中檢索到的內(nèi)容以endnote格式導(dǎo)出,然后導(dǎo)入SATI中,選擇作者以及關(guān)鍵詞作為字段抽取,進行頻次統(tǒng)計,生成高頻關(guān)鍵詞矩陣,將生成的矩陣保存為Excel格式,導(dǎo)入ucinet和SPSS中,為后續(xù)分析做準(zhǔn)備。

1.4 研究方法

本文利用社會網(wǎng)絡(luò)分析方法構(gòu)建高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,采用共詞聚類分析法,利用SPSS繪制關(guān)鍵詞聚類樹狀圖揭示知識發(fā)現(xiàn)領(lǐng)域研究結(jié)構(gòu)及其存在的內(nèi)在聯(lián)系[3]。

2 高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析

將在SATI中生成的關(guān)鍵詞共詞矩陣導(dǎo)入ucinet,使用netdraw進行可視化分析生成高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),如圖1所示。其中節(jié)點越大,連線越多表明該關(guān)鍵詞屬于知識發(fā)現(xiàn)領(lǐng)域核心的關(guān)鍵詞,在該領(lǐng)域具有重要作用。由圖1可知,數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、圖書館、關(guān)聯(lián)數(shù)據(jù)、關(guān)聯(lián)規(guī)則是知識發(fā)現(xiàn)領(lǐng)域的熱點研究問題。其中數(shù)據(jù)挖掘與知識發(fā)現(xiàn)處在該領(lǐng)域的絕對中心,一方面關(guān)于知識發(fā)現(xiàn)與數(shù)據(jù)挖掘關(guān)系的探討一直受到學(xué)者的關(guān)注,另一方面在某種程度上可以說,知識發(fā)現(xiàn)在其他領(lǐng)域的應(yīng)用是圍繞著數(shù)據(jù)挖掘展開的。

3 高頻關(guān)鍵詞聚類分析

聚類分析是一種“物以類聚”的研究方法,它的基本思想是根據(jù)數(shù)據(jù)對象的特征,將特征相似的數(shù)據(jù)對象歸為一類,使得同一類中的數(shù)據(jù)對象的距離小于與其他類間的數(shù)據(jù)對象的距離,主要目的是用來判別數(shù)據(jù)對象之間關(guān)系的親疏程度。聚類分析方法又分為劃分法和層次法,層次聚類法是指將數(shù)據(jù)對象聚類成具有層次嵌套結(jié)構(gòu)的樹狀圖,位于最頂層的根節(jié)點對應(yīng)的是整個數(shù)據(jù)集,處于最底層的對應(yīng)的是單獨的數(shù)據(jù)點[4],本文使用層次聚類法探討知識發(fā)現(xiàn)領(lǐng)域高頻關(guān)鍵詞之間的內(nèi)在聯(lián)系,探究知識發(fā)現(xiàn)領(lǐng)域的研究熱點。

將高頻關(guān)鍵詞共現(xiàn)矩陣導(dǎo)入SPSS 20.0分析軟件中進行系統(tǒng)聚類分析,經(jīng)過詳細(xì)比較研究,本研究采用組間聯(lián)接、歐式平方距離的方法聚類效果最好[5],得到高頻關(guān)鍵詞聚類樹狀圖,如圖2所示。對聚類結(jié)果進行分析,可以看出,在這五年中,知識發(fā)現(xiàn)領(lǐng)域的研究熱點大概可以分為四類:知識發(fā)現(xiàn)方法與技術(shù)研究;圖書館知識服務(wù)研究;知識發(fā)現(xiàn)應(yīng)用領(lǐng)域研究;粗糙集理論與應(yīng)用研究。

(1)知識發(fā)現(xiàn)方法與技術(shù)研究

包括關(guān)鍵詞關(guān)聯(lián)規(guī)則、Apriori算法、數(shù)據(jù)挖掘、決策樹、數(shù)據(jù)倉庫、聚類以及數(shù)據(jù)分析。其研究主要集中在關(guān)聯(lián)規(guī)則算法的研究與改進,決策樹算法研究與應(yīng)用,數(shù)據(jù)倉庫關(guān)鍵技術(shù)研究,旨在通過改進技術(shù)提高數(shù)據(jù)挖掘的質(zhì)量和效率,保證數(shù)據(jù)分析的正確性和有效性。

(2)圖書館知識服務(wù)研究

包括關(guān)鍵詞數(shù)字圖書館、知識服務(wù)、大數(shù)據(jù)等,其研究主要集中在圖書館知識發(fā)現(xiàn)系統(tǒng)研究,數(shù)字圖書館知識服務(wù)平臺研究,圖書館個性化服務(wù)研究。此類研究主要依托圖書館的海量資源、成熟的服務(wù)體系及大量用戶的知識需求,通過知識挖掘?qū)Ω黝愇墨I資源進行整合分析,針對不同用戶的需求為其提供精準(zhǔn)的知識發(fā)現(xiàn)服務(wù),旨在通過提供更好的信息服務(wù)內(nèi)容和手段,提升用戶體驗[6]。

(3)知識發(fā)現(xiàn)應(yīng)用領(lǐng)域研究

包括關(guān)鍵詞物聯(lián)網(wǎng)、聚類分析、關(guān)聯(lián)數(shù)據(jù)、可視化、中醫(yī)藥、本體、知識管理,其研究內(nèi)容集中在將知識發(fā)現(xiàn)理論應(yīng)用物聯(lián)網(wǎng)、關(guān)聯(lián)數(shù)據(jù)、中醫(yī)藥等領(lǐng)域,當(dāng)前關(guān)聯(lián)數(shù)據(jù)被W3C推薦為語義網(wǎng)的最佳實踐,利用關(guān)聯(lián)數(shù)據(jù)數(shù)據(jù)量大、結(jié)構(gòu)統(tǒng)一的特點,將知識發(fā)現(xiàn)與關(guān)聯(lián)數(shù)據(jù)結(jié)合進行語義網(wǎng)環(huán)境下的知識發(fā)現(xiàn)[7];在中醫(yī)藥領(lǐng)域,通過構(gòu)建中醫(yī)藥學(xué)的本體工程進行中醫(yī)藥學(xué)知識發(fā)現(xiàn),利用知識發(fā)現(xiàn)技術(shù)進行中醫(yī)病案數(shù)據(jù)庫研究、探索中醫(yī)診療規(guī)律[8]等方面也成為研究熱點。

(4)粗糙集理論與應(yīng)用研究

包括關(guān)鍵詞粗糙集、屬性約簡、形式概念分析、概念格、屬性偏序結(jié)構(gòu),其研究重點在粗糙集理論與應(yīng)用研究上。將粗糙集理論應(yīng)用于知識發(fā)現(xiàn)研究,可以大幅提高數(shù)據(jù)處理的能力[9]。

4 結(jié) 語

本文主要以CNKI上發(fā)表的知識發(fā)現(xiàn)相關(guān)研究論文為基礎(chǔ),基于社會網(wǎng)絡(luò)分析和共詞聚類分析,聚焦知識發(fā)現(xiàn)研究熱點,結(jié)果顯示近年來,知識發(fā)現(xiàn)領(lǐng)域研究熱點集中在提高知識發(fā)現(xiàn)能力以及知識發(fā)現(xiàn)與各領(lǐng)域結(jié)合方面,在知識發(fā)現(xiàn)挖掘方法、中醫(yī)藥學(xué)、生物醫(yī)學(xué)等領(lǐng)域發(fā)展較快,并已有一些研究成果, 隨著數(shù)據(jù)挖掘方法技術(shù)的不斷提高,知識發(fā)現(xiàn)將在各領(lǐng)域有更廣泛的應(yīng)用。

主要參考文獻

[1]KDD2016Program.http://www.kdd.org/kdd2016/program/accepted-papers.html[EB/OL].(2017-01-15)[2017-12-09].

[2]劉啟元,葉鷹.文獻題錄信息挖掘技術(shù)方法及其軟件SATI的實現(xiàn)——以中外圖書情報學(xué)為例[J].信息資源管理學(xué)報,2012(1):50-58.

[3]鐘偉金. 共詞分析法應(yīng)用的規(guī)范化研究——主題詞和關(guān)鍵詞的聚類效果對比分析[J]. 圖書情報工作,2011,55(6):114-118.

[4]王學(xué)東,杜曉曦,石自更. 面向?qū)W術(shù)博客知識交流的社會網(wǎng)絡(luò)中心性分析[J]. 情報科學(xué),2013(3):3-8,16.

[5]白雪. 聚類分析中的相似性度量及其應(yīng)用研究[D].北京:北京交通大學(xué),2012.

[6]高勁松,李迎迎,梁艷琪,等. 基于文獻數(shù)據(jù)可視化的知識發(fā)現(xiàn)模型研究[J]. 圖書館學(xué)研究,2016(2):49-56.

[7]顧洪濤. 我國高校圖書館研究熱點探析[D].大連:遼寧師范大學(xué),2014.

[8]陳蘭蘭. 基于社會網(wǎng)絡(luò)分析和共詞分析的國內(nèi)關(guān)聯(lián)數(shù)據(jù)研究[J]. 圖書與情報,2013(5):129-132.

[9]農(nóng)田泉. 知識發(fā)現(xiàn)技術(shù)在中醫(yī)藥研究中的應(yīng)用[J]. 中醫(yī)學(xué)報,2013(2):210-211.

[10]王國胤,姚一豫,于洪. 粗糙集理論與應(yīng)用研究綜述[J]. 計算機學(xué)報,2009(7):1229-1246.

猜你喜歡
共詞分析社會網(wǎng)絡(luò)分析可視化
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于德溫特數(shù)據(jù)庫的關(guān)鍵共性技術(shù)分析
中國市場(2016年31期)2016-12-19 09:15:43
國內(nèi)圖書館嵌入式服務(wù)研究主題分析
境外公益旅游研究進展與啟示
新浪微博娛樂明星的社會網(wǎng)絡(luò)分析
時代金融(2016年29期)2016-12-05 17:09:47
基于社會網(wǎng)絡(luò)分析的青島市產(chǎn)學(xué)研專利合作網(wǎng)絡(luò)結(jié)構(gòu)研究
基于文獻計量分析我國生物科學(xué)素養(yǎng)研究狀況(2001~2016年)
平邑县| 金坛市| 高邮市| 仙游县| 榆社县| 佛教| 青神县| 炉霍县| 壶关县| 大竹县| 军事| 芮城县| 漳平市| 竹溪县| 罗定市| 资源县| 保山市| 常熟市| 盐山县| 霍城县| 吉木萨尔县| 辽宁省| 通辽市| 万山特区| 全州县| 广昌县| 肥乡县| 双峰县| 高雄市| 乳山市| 格尔木市| 弋阳县| 广安市| 轮台县| 江陵县| 洱源县| 芮城县| 东台市| 白城市| 阳谷县| 昌邑市|