国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合聚類算法和社會網(wǎng)絡(luò)分析技術(shù)的學(xué)科交叉研究熱點分析

2021-03-09 01:09:00張立說陳天文
內(nèi)蒙古科技與經(jīng)濟 2021年3期
關(guān)鍵詞:子群熱點交叉

張立說,陳天文

(濰坊市圖書館,山東 濰坊 261000)

隨著科技的不斷進步與發(fā)展,科學(xué)研究的交叉性與高動態(tài)性等特點日益顯著[1],因此學(xué)科交叉熱點研究成了當(dāng)下學(xué)者們的研究熱點。研究學(xué)科交叉熱點可揭示當(dāng)下學(xué)科主題之間的內(nèi)在聯(lián)系、了解前言動態(tài),更能有效地分析研究主題發(fā)展的潛在規(guī)律[2]。

學(xué)科交叉研究早在20世紀(jì)70年代就已被學(xué)者提出,目前學(xué)科交叉研究已進入實證研究階段[3],Rhoten等[4]人在文章中提出,從大學(xué)研究項目和青年學(xué)者的調(diào)研入手,強調(diào)了學(xué)科交叉研究的意義與其發(fā)展前景。蔣永新等[5]對圖書情報研究論文做關(guān)鍵詞聚類分析,研究其熱點論題的分布與變化趨勢。閔超等[6]在更細粒度上做聚類類團分析、戰(zhàn)略坐標(biāo)分析,進一步探索學(xué)科交叉研究熱點。

筆者擬在前期學(xué)者的研究基礎(chǔ)上,運用CONCOR迭代相關(guān)收斂法對關(guān)鍵詞進行聚類,借助SPSS、UCINET和NETDRAW軟件進一步對當(dāng)下學(xué)科交叉熱點進行分析,以圖書情報學(xué)與互聯(lián)網(wǎng)技術(shù)學(xué)為例,挖掘兩學(xué)科關(guān)鍵詞之間的內(nèi)部關(guān)系,揭示兩個學(xué)科的研究熱點與發(fā)展趨勢,為研究者深入了解學(xué)科背景知識與掌握前言動態(tài)打下堅實基礎(chǔ)。

1 相關(guān)技術(shù)簡介

筆者選取圖書情報與互聯(lián)網(wǎng)技術(shù)兩門學(xué)科文獻對應(yīng)主題詞進行研究與分析,首先將提取后的文本進行預(yù)處理,生成結(jié)構(gòu)化的矩陣,然后分別對其進行CONCOR迭代相關(guān)收斂分析與聚類分析,揭示兩學(xué)科當(dāng)前研究熱點,分析兩學(xué)科交叉熱點發(fā)展趨勢。

1.1 CONCOR迭代相關(guān)收斂法

CONCOR(convergent correlation)是一種迭代相關(guān)收斂法,可對數(shù)據(jù)樣本重復(fù)訓(xùn)練從而實現(xiàn)凝聚子群分析。CONCOR的主要思想為:首先提取樣本特征項,生成樣本矩陣;然后CONCOR算法會根據(jù)矩陣各行或列之間的關(guān)系生成相關(guān)系數(shù),得到相關(guān)系數(shù)矩陣CO1;CONCOR算法再將矩陣CO1作為輸入矩陣?yán)^續(xù)訓(xùn)練樣本,根據(jù)CO1矩陣各行或列存在關(guān)系得到新的系數(shù)矩陣CO2;繼續(xù)迭代計算,最終通過樹形圖(tree-diagram)將各位置間結(jié)構(gòu)對等程度展示出來,并將各網(wǎng)絡(luò)成員標(biāo)記出來。

CONCOR算法生成的相關(guān)系數(shù)矩陣中包含皮爾遜積距系數(shù),此系數(shù)可用來衡量各對象間的相似性,將樣本的凝聚子群關(guān)系展示出來,根據(jù)樣本對象特點,形成一個個不重疊的子群,并能根據(jù)子群密度分析子群的重要程度或孤立點,從而實現(xiàn)深度分析群體的功能。

1.2 聚類算法

聚類分析(群分析)是運用統(tǒng)計分析的方法對樣本進行分類,是數(shù)據(jù)挖掘中的重要方法。聚類,就是通過分析樣本數(shù)據(jù)間的內(nèi)在關(guān)系,將具有相同屬性或相似的對象聚集在一起,不相同的對象分成不同類別的過程。與分類不同的是,聚類可根據(jù)樣本自身特點,訓(xùn)練分類標(biāo)準(zhǔn),從而得到合適的類別。

常用的聚類算法有K-means方法、K-medoids方法、CLARANS方法、BIRCH方法等[7~10],筆者選擇系統(tǒng)聚類方法,其主要思想是:首先將樣本中各對象看成一類,然后根據(jù)各類之間的距離,將距離最小的進行合并,生成新一類;再根據(jù)新類與其他類之間距離,合并距離最近的兩類;重復(fù)此步驟,直至所有樣本對象合為一類為止。用此方法處理學(xué)科關(guān)鍵詞,可根據(jù)當(dāng)前關(guān)鍵詞出現(xiàn)頻率進行有效分類,有助于分析學(xué)科關(guān)鍵詞之間的關(guān)系,深入分析學(xué)科研究熱點。

2 基于CONCOR的學(xué)科交叉研究熱點與潛在研究方向分析

2.1 數(shù)據(jù)預(yù)處理

為了清楚展現(xiàn)兩門學(xué)科交叉研究領(lǐng)域的組成結(jié)構(gòu)及其演化情況,筆者以中國知網(wǎng)論文被引數(shù)量為基礎(chǔ),選取從2013年開始7年的文章數(shù)據(jù)為支撐,其中,圖書情報技術(shù)與互聯(lián)網(wǎng)技術(shù)兩學(xué)科交叉的文章3 000篇,互聯(lián)網(wǎng)技術(shù)學(xué)科文章3 000篇。研究這兩門學(xué)科當(dāng)下的研究熱點,并對研究熱點進行預(yù)測。由于關(guān)鍵詞最能反映文章核心,因此,根據(jù)需要將所選文獻導(dǎo)出其文獻關(guān)鍵詞,并對這些關(guān)鍵詞進行去重、關(guān)鍵詞抽取、詞頻統(tǒng)計、矩陣生成,在生成矩陣時筆者選用經(jīng)典的相似度矩陣公式,根據(jù)關(guān)鍵詞在文章中出現(xiàn)的詞頻生成相似度矩陣。

2.2 CONCOR凝聚子群分析

由于圖書情報技術(shù)與互聯(lián)網(wǎng)技術(shù)交叉學(xué)科在很大程度上借鑒了互聯(lián)網(wǎng)技術(shù)的領(lǐng)先優(yōu)勢,因此,將當(dāng)下互聯(lián)網(wǎng)技術(shù)學(xué)科的研究熱點進行分析,從而支撐交叉學(xué)科熱點的研究與預(yù)測。筆者將處理好的相似度矩陣導(dǎo)入Ucinet軟件中進行CONCOR凝聚子群分析,可生成對應(yīng)凝聚子群,并計算出密度最大的子群,從而得到貢獻最大的學(xué)科關(guān)鍵詞。因此,本文選擇將互聯(lián)網(wǎng)技術(shù)學(xué)科關(guān)鍵詞矩陣導(dǎo)入,生成可視化圖形,如圖1所示,分析當(dāng)下互聯(lián)網(wǎng)技術(shù)學(xué)科中較熱的關(guān)鍵詞。

圖1 互聯(lián)網(wǎng)技術(shù)學(xué)科關(guān)鍵詞凝聚子群分析

CONCOR算法將詞頻大于30的關(guān)鍵詞分成8個子群,每個子群對應(yīng)的密度矩陣,如圖2所示,其中密度最大的子群為第2和第6個子群,證明這兩個子群在整個群體中貢獻度最大,其對應(yīng)的關(guān)鍵詞分別為{服務(wù)質(zhì)量,云制造,服務(wù)組合,遺傳算法,協(xié)同過濾,Web服務(wù)}、{新浪微博,用戶體驗,互聯(lián)網(wǎng)},而根據(jù)關(guān)鍵詞詞頻統(tǒng)計(部分截圖,如圖3所示),詞頻最高的并不是密度最大的,因此CONCOR算法可幫助找到互聯(lián)網(wǎng)技術(shù)學(xué)科研究熱點。

圖2 互聯(lián)網(wǎng)技術(shù)學(xué)科凝聚子群密度分析

圖3 互聯(lián)網(wǎng)技術(shù)學(xué)科關(guān)鍵詞詞頻統(tǒng)計部分截圖

2.3 系統(tǒng)聚類

筆者運用系統(tǒng)聚類方法對圖書情報技術(shù)與互聯(lián)網(wǎng)技術(shù)交叉學(xué)科關(guān)鍵詞進行聚類操作,根據(jù)2.2節(jié)中分析得到的互聯(lián)網(wǎng)技術(shù)學(xué)科密度較大的關(guān)鍵詞集合,將兩交叉學(xué)科的關(guān)鍵詞矩陣用NetDraw工具生成可視化關(guān)系圖譜,并標(biāo)記出聚類后含有{服務(wù)質(zhì)量,云制造,服務(wù)組合,遺傳算法,協(xié)同過濾,Web服務(wù)}、{新浪微博,用戶體驗,互聯(lián)網(wǎng)}的關(guān)鍵詞類別,如圖4所示。

圖4 兩學(xué)科交叉關(guān)鍵詞可視化圖譜

圖4中,網(wǎng)絡(luò)安全、信息安全、云服務(wù)、網(wǎng)絡(luò)技術(shù)、服務(wù)、高校、圖書館管理、計算機、服務(wù)質(zhì)量為一類,其中服務(wù)質(zhì)量為2.2節(jié)中標(biāo)記的密度較大關(guān)鍵詞組中一員,這證明了當(dāng)下服務(wù)、網(wǎng)絡(luò)安全等不僅是互聯(lián)網(wǎng)行業(yè)的熱點話題,在圖書情報行業(yè)中依舊是研究者們的熱點,更是下一步的研究趨勢,隨著互聯(lián)網(wǎng)的不斷發(fā)展與普及,數(shù)字圖書館、云服務(wù)成了當(dāng)下圖書館發(fā)展的趨勢,但同時面臨著網(wǎng)絡(luò)安全、信息竊取等問題,因此網(wǎng)絡(luò)安全、網(wǎng)絡(luò)技術(shù)等已成為當(dāng)下研究的熱點和趨勢。社交網(wǎng)絡(luò)、移動信息服務(wù)、研究熱點、微信公眾平臺、微博等被分為一類,其中微博為2.2節(jié)中標(biāo)記密度較大關(guān)鍵詞組中一員,這證明了網(wǎng)絡(luò)信息研究已成為熱點話題,網(wǎng)絡(luò)平臺中隱藏著許多需要挖掘的信息,由于信息技術(shù)的不斷發(fā)展,線上閱讀、討論已成為人們生活中必不可少的一部分,例如微博、微信等平臺,這已成為研究者們不斷關(guān)注的焦點。

從以上分析可以看出,運用CONCOR算法可挖掘出當(dāng)下學(xué)科的關(guān)注熱點,以單學(xué)科熱點數(shù)據(jù)為基礎(chǔ),借助聚類方法,可分析得到交叉學(xué)科中的熱點信息,預(yù)測交叉學(xué)科研究發(fā)展方向。

3 結(jié)束語

筆者運用CONCOR迭代相關(guān)收斂法,對交叉學(xué)科其中一門學(xué)科關(guān)鍵詞做凝聚子群分析,得到最大密度子群;再對交叉學(xué)科關(guān)鍵詞做系統(tǒng)聚類,以數(shù)據(jù)可視化的形式展現(xiàn)出來,借助單門學(xué)科最大密度子群中的熱點話題,分析交叉學(xué)科當(dāng)下的研究熱點與發(fā)展趨勢,提出了基于CONCOR的學(xué)科交叉熱點分析與預(yù)測方法,為研究者掌握學(xué)科知識演化方向提供支持。但本文在研究過程中還存在許多不足之處:①隨著科研的不斷發(fā)展與進步,許多文獻關(guān)鍵詞并不能很好的概括文獻重點,許多關(guān)鍵知識會散落在摘要或是正文中,本文在研究時以關(guān)鍵詞為依據(jù),其數(shù)據(jù)不夠全面,需要深度研究。②在研究方法上,研究熱點會隨著時間的推移不斷改變,因此,在熱點研究時應(yīng)考慮時間等多方面的因素,這也是今后的研究重點。

猜你喜歡
子群熱點交叉
超聚焦子群是16階初等交換群的塊
熱點
子群的核平凡或正規(guī)閉包極大的有限p群
“六法”巧解分式方程
熱點
車迷(2019年10期)2019-06-24 05:43:28
結(jié)合熱點做演講
快樂語文(2018年7期)2018-05-25 02:32:00
連一連
基于Fast-ICA的Wigner-Ville分布交叉項消除方法
計算機工程(2015年8期)2015-07-03 12:19:54
恰有11個極大子群的有限冪零群
與Sylow-子群X-可置換的子群對有限群的影響
长乐市| 道真| 重庆市| 松江区| 正镶白旗| 恭城| 通江县| 安阳市| 太仓市| 崇州市| 盈江县| 石棉县| 斗六市| 泰宁县| 银川市| 磴口县| 许昌县| 比如县| 黔江区| 卓尼县| 银川市| 当雄县| 正镶白旗| 青铜峡市| 剑阁县| 蒙阴县| 柏乡县| 宁化县| 凤山市| 汤阴县| 夹江县| 佳木斯市| 永和县| 辉县市| 威宁| 龙山县| 贵溪市| 县级市| 琼海市| 平度市| 磴口县|