国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基礎(chǔ)研究領(lǐng)域知識圖譜研究前沿的可視化分析

2021-10-15 09:28:48陳雅丹杜元朱爽趙欣然孫娜李心怡胡燁胤李新龍
海南醫(yī)學(xué) 2021年19期
關(guān)鍵詞:主題詞圖譜資助

陳雅丹,杜元,朱爽,趙欣然,孫娜,李心怡,胡燁胤,李新龍

1.北京中醫(yī)藥大學(xué),北京 100029;

2.北京中醫(yī)藥大學(xué)東方醫(yī)院,北京 100078;

3.北京中醫(yī)藥大學(xué)東直門醫(yī)院,北京 100700

知識圖譜(Knowledge Graph)一詞在1972 年即已經(jīng)被提出[1],隨著2012年谷歌知識圖譜的發(fā)布,特定領(lǐng)域的知識圖譜構(gòu)建成為研究熱點(diǎn)問題,并逐漸滲透到金融、工業(yè)和醫(yī)學(xué)領(lǐng)域[2]。知識圖譜的本質(zhì)是連接實(shí)體間關(guān)系的圖,即揭示實(shí)體之間關(guān)系的語義網(wǎng)絡(luò)[3],在實(shí)現(xiàn)知識可視化的同時(shí),也可以挖掘知識單元或知識群之間隱含的復(fù)雜關(guān)系[4]。知識圖譜技術(shù)作為新一代人工智能的關(guān)鍵通用技術(shù)[5],在推動(dòng)人工智能從感知智能向認(rèn)知智能的跨越中扮演著重要角色。國家自然科學(xué)基金(national natural science foundation of China,NSFC)作為我國資助基礎(chǔ)研究的主體之一,其所資助的項(xiàng)目在一定程度上代表了國內(nèi)基礎(chǔ)研究領(lǐng)域的熱點(diǎn)和方向。本文通過對NSFC在知識圖譜研究資助項(xiàng)目的分布情況、研究熱點(diǎn)及前沿的計(jì)量分析,系統(tǒng)梳理了基礎(chǔ)研究領(lǐng)域知識圖譜技術(shù)的研究進(jìn)展。

1 資料與方法

1.1 數(shù)據(jù)來源在NSFC 官網(wǎng)[6]立項(xiàng)項(xiàng)目中,以“知識圖譜”、“知識地圖”為關(guān)鍵詞檢索相關(guān)研究,檢索時(shí)間1997至2019年。

1.2 數(shù)據(jù)預(yù)處理(1)數(shù)據(jù)庫建立:將檢索結(jié)果分批導(dǎo)入到Excel 軟件,提取立項(xiàng)項(xiàng)目標(biāo)題、所屬學(xué)部、項(xiàng)目類型、項(xiàng)目編號、項(xiàng)目金額、負(fù)責(zé)人、單位、批準(zhǔn)年份等信息。(2)項(xiàng)目初篩及預(yù)處理:首先根據(jù)項(xiàng)目標(biāo)題剔除與知識圖譜無關(guān)的項(xiàng)目。對項(xiàng)目單位信息進(jìn)行預(yù)處理,將同一大學(xué)或科研院所附屬研究所統(tǒng)一合并為該大學(xué)或科研院所,如“中國科學(xué)院北京基因組研究所、中國科學(xué)院沈陽自動(dòng)化研究所、中國科學(xué)院大連化學(xué)物理研究所”統(tǒng)一為“中國科學(xué)院”。(3)主題詞提取及預(yù)處理:對納入項(xiàng)目的標(biāo)題進(jìn)行分詞處理,在分詞處理時(shí)遵循以下原則:①拆分,最小完整意義拆分,保留具有實(shí)際意義的最小完整詞匯,如“異質(zhì)信息網(wǎng)絡(luò)的多粒度表示與知識獲取方法研究”拆分為“異質(zhì)信息網(wǎng)絡(luò)、多粒度、知識表示、知識獲取”;②剔除,剔除標(biāo)題中部分通用表述或無特定含義的詞匯,如知識圖譜、機(jī)制、研究、關(guān)系、作用;③統(tǒng)一,對同一含義的主題詞統(tǒng)一為多數(shù)研究采用的表述,英文縮略詞統(tǒng)一為相應(yīng)的中文表述,如“DEA”統(tǒng)一為“數(shù)據(jù)包絡(luò)分析”;④合并,將同一研究領(lǐng)域內(nèi)的具體分子物質(zhì)、通用技術(shù)等合并為其上級概念,如“知識抽取”、“知識發(fā)現(xiàn)”等相同概念統(tǒng)一為“知識獲取”。

1.3 主題詞共現(xiàn)分析及可視化(1)數(shù)據(jù)格式轉(zhuǎn)換:將完成預(yù)處理的項(xiàng)目信息表(.xlsx) 整理為“CNKI-EndNote 格式”,另存為“制表符分隔的文本(.txt)”文件后將制表符替換為空格,將每條題錄最后增加兩空行,將項(xiàng)目信息表轉(zhuǎn)換成可視化軟件VOSViewer (Version 1.6.15)[7]可讀取的文章題錄信息形式:%0 Journal Article;%A 辜麗川;%+安徽農(nóng)業(yè)大學(xué);%T 基于知識圖譜的農(nóng)業(yè)大數(shù)據(jù)碎片化知識發(fā)現(xiàn)方法研究;%D 2017;%K 農(nóng)業(yè);大數(shù)據(jù);碎片化知識;知識發(fā)現(xiàn);%W CNKI。(2)主題可視化網(wǎng)絡(luò)構(gòu)建及聚類:將“.txt”題錄文件導(dǎo)入VOSViewer 軟件,構(gòu)建主題詞可視化網(wǎng)絡(luò),采用軟件網(wǎng)絡(luò)聚類算法進(jìn)行聚類分析。VOSViewer網(wǎng)絡(luò)聚類算法類似于Modularity方法(公式1),能夠?qū)崿F(xiàn)聚類內(nèi)部各元素間較高的相似性,不同簇間存在較高的相異性。

公式中,Wij=2m/cicj,ci為元素i 所屬的聚類,δ (ci,cj)表示的方程值為1 (若ci=cj)或0;γ為聚類的分辨率,γ越大則得到的聚類越多,分類就越細(xì)。(3)主題詞時(shí)間疊加網(wǎng)絡(luò):在上述主題詞網(wǎng)絡(luò)的基礎(chǔ)上,以主題詞出現(xiàn)的平均年度為依據(jù),構(gòu)建主題詞時(shí)間疊加網(wǎng)絡(luò)。將主題詞可視化網(wǎng)絡(luò)及時(shí)間疊加網(wǎng)絡(luò)導(dǎo)出為“.png”格式。

2 結(jié)果

2.1 一般情況描述自1997—2019 年,共檢索到立項(xiàng)項(xiàng)目2 069項(xiàng),剔除無關(guān)項(xiàng)目后共納入141個(gè)項(xiàng)目,總資助金額8 916.5 萬元,共涉及9 種項(xiàng)目類型(表1),其中面上項(xiàng)目、聯(lián)合基金項(xiàng)目、青年科學(xué)基金項(xiàng)目是主要立項(xiàng)類型,共計(jì)123項(xiàng)(88%),資助總額6 860萬元(76.93%),見圖1和圖2。

圖1 各年度項(xiàng)目立項(xiàng)項(xiàng)目數(shù)分布

圖2 各年度項(xiàng)目立項(xiàng)總金額分布

表1 立項(xiàng)項(xiàng)目類型及金額分布

納入項(xiàng)目主要分布在7 個(gè)學(xué)部,立項(xiàng)項(xiàng)目數(shù)目及資助金額前3 位的學(xué)部為信息科學(xué)部、地球科學(xué)部和管理科學(xué)部(表2),其中信息科學(xué)部立項(xiàng)項(xiàng)目94 項(xiàng)(66.67%),資助金額6 698萬元(75.12%)。17個(gè)知識圖譜研究涉及生命醫(yī)學(xué)內(nèi)容,在學(xué)科領(lǐng)域分布上,中醫(yī)學(xué)領(lǐng)域7 項(xiàng),藏醫(yī)學(xué)1 項(xiàng),現(xiàn)代醫(yī)學(xué)6 個(gè),生命科學(xué)3項(xiàng);分布在醫(yī)學(xué)科學(xué)部8 項(xiàng)、生命科學(xué)部4 項(xiàng)、信息科學(xué)部4項(xiàng),管理科學(xué)部1項(xiàng)。

表2 各學(xué)部立項(xiàng)項(xiàng)目及金額分布

納入項(xiàng)目分布在81家單位,資助金額前3位的單位為中國科學(xué)院,浙江大學(xué)和中國人民大學(xué)(表3),三家單位共立項(xiàng)項(xiàng)目16 項(xiàng)(11.40%),資助金額2 065 萬元(23.16%)。

表3 各單位立項(xiàng)項(xiàng)目及金額分布(前10位)

2.2 主題詞分析納入項(xiàng)目共包含274 個(gè)主題詞,共出現(xiàn)頻次486 次,出現(xiàn)頻次前10 位的主題詞包括:圖譜構(gòu)建(36,7.4%)、大規(guī)模(12,2.5%)、模型(11,2.3%)、大數(shù)據(jù)(11,2.3%)、關(guān)系推理(10,2.1%)、圖譜查詢(8,1.6%)、文本(8,1.6%)、中醫(yī)學(xué)(7,1.4%)、語義網(wǎng)絡(luò)(7,1.4%)、個(gè)性化(7,1.4%)。構(gòu)建主題詞的可視化網(wǎng)絡(luò)(圖3),對其進(jìn)行聚類分析并構(gòu)建時(shí)間疊加網(wǎng)絡(luò)(圖4)。主題詞可視化網(wǎng)絡(luò)(圖3)中,節(jié)點(diǎn)代表主題詞,主題詞頻次越高,節(jié)點(diǎn)直徑越大;節(jié)點(diǎn)間的連線表示兩主題詞在同一項(xiàng)目標(biāo)題中出現(xiàn),共同出現(xiàn)頻次越高,連線越粗(下同)。節(jié)點(diǎn)的顏色用于表示不同聚類,顏色相同的節(jié)點(diǎn)屬于同一聚類,納入主題詞共分為5個(gè)亞類,聚類一(紅色)圍繞知識圖譜技術(shù)模型,主要涉及“模型、大規(guī)模、關(guān)系推理、圖譜查詢、圖譜分析、圖譜補(bǔ)全、分布式”等主題詞;聚類二(綠色)以圍繞醫(yī)學(xué)領(lǐng)域知識圖譜應(yīng)用,主要涉及“中醫(yī)學(xué)、醫(yī)學(xué)、可視化、深度學(xué)習(xí)、知識發(fā)現(xiàn)”等主題詞;聚類三(藍(lán)色)圍繞圖譜構(gòu)建,主要涉及“文本、語義網(wǎng)絡(luò)、動(dòng)態(tài)、時(shí)空”等主題詞;聚類四(黃色)圍繞人工智能,主要涉及“個(gè)性化、推薦、自動(dòng)化、智能化、機(jī)器人、在線”等主題詞;聚類五(紫色)圍繞數(shù)據(jù)應(yīng)用,主要涉及“大數(shù)據(jù)、社交媒體、社交優(yōu)化”等主題詞。主題詞時(shí)間疊加網(wǎng)絡(luò)(圖4)中,節(jié)點(diǎn)顏色表示該主題詞出現(xiàn)的時(shí)間,每個(gè)主題詞的出現(xiàn)時(shí)間為其所在項(xiàng)目立項(xiàng)年度的平均值(下同),從圖中可以看出,“模型、主題模型、知識發(fā)現(xiàn)、圖譜分析、時(shí)空、人工知識”等主題詞為早期研究熱點(diǎn),“云制造、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、體制、嵌入式、多源數(shù)據(jù)、多目標(biāo)協(xié)同”等主題詞為目前研究前沿?zé)狳c(diǎn)。對納入研究的17 個(gè)生命醫(yī)學(xué)相關(guān)項(xiàng)目主題詞進(jìn)行亞組分析,構(gòu)建主題詞可視化網(wǎng)絡(luò)(圖5),共計(jì)62 個(gè)主題詞,出現(xiàn)87 次,其中“中醫(yī)學(xué)(7,8%)、醫(yī)學(xué)(6,6.9%)、圖譜構(gòu)建(4,4.6%)、古籍(3,3.4%)、知識發(fā)現(xiàn)(3,3.4%)”為出現(xiàn)頻次前5 位的主題詞。上述主題詞可分為5個(gè)亞類,其中聚類一(紅色)圍繞現(xiàn)代醫(yī)學(xué),主要涉及“生物、知識庫”等主題詞;聚類二(綠色)圍繞中醫(yī)學(xué),主要涉及“古籍、知識發(fā)現(xiàn)、可視化、本體”等主題詞;聚類三(藍(lán)色)圍繞圖譜技術(shù),主要涉及“圖譜構(gòu)建、非完整數(shù)據(jù)、個(gè)性化”等主題詞;聚類四(黃色)圍繞體質(zhì)研究,涉及“體質(zhì)、動(dòng)態(tài)”等主題詞;聚類五(紫色)圍繞針灸研究,涉及“針灸知識、古代、框架”等主題詞。

圖3 納入項(xiàng)目主題詞可視化網(wǎng)絡(luò)

圖4 納入項(xiàng)目主題詞時(shí)間疊加網(wǎng)絡(luò)

圖5 生命醫(yī)學(xué)領(lǐng)域項(xiàng)目主題詞可視化網(wǎng)絡(luò)

主題詞時(shí)間疊加網(wǎng)絡(luò)(圖6)提示“醫(yī)學(xué)、決策模型、群智能、關(guān)系推理、圖神經(jīng)網(wǎng)絡(luò)、知識補(bǔ)全、健康社區(qū)、體質(zhì)、動(dòng)態(tài)”等主題詞為目前研究前沿?zé)狳c(diǎn)。

圖6 生命醫(yī)學(xué)領(lǐng)域項(xiàng)目主題詞時(shí)間疊加網(wǎng)絡(luò)

3 討論

從NSFC 在知識圖譜研究資助課資助力度來看,自2003 年起不同類型項(xiàng)目的立項(xiàng)數(shù)量及總資助金額呈現(xiàn)波動(dòng)中增長的趨勢,其中青年科學(xué)基金項(xiàng)目在立項(xiàng)數(shù)量方面總體增長態(tài)勢較為明顯,但資助金額整體水平并不高,平均資助金額有限;面上項(xiàng)目在項(xiàng)目數(shù)量及資助總額呈現(xiàn)穩(wěn)步增長趨勢,是NSFC 在知識圖譜資助的主要類型。根據(jù)NSFC“十三五”發(fā)展規(guī)劃[8],將科學(xué)基金資助格局調(diào)整為探索、人才、工具、融合四大系列,在知識圖譜領(lǐng)域立項(xiàng)項(xiàng)目主要分布在探索系列和人才系列,近幾年主要資助融合系列及探索系列項(xiàng)目,工具系列的研究一直偏少。從立項(xiàng)項(xiàng)目學(xué)部分布情況來看,信息科學(xué)部為知識圖譜的熱點(diǎn)學(xué)部,相交于其他學(xué)部NSFC 立項(xiàng)項(xiàng)目和金額數(shù)占據(jù)絕對優(yōu)勢。在生命科學(xué)和醫(yī)學(xué)科學(xué)部,也可看到知識圖譜相關(guān)研究立項(xiàng),但目前資助力度還處于較低水平,個(gè)別生命醫(yī)學(xué)領(lǐng)域知識圖譜研究立項(xiàng)在其他學(xué)部。從立項(xiàng)項(xiàng)目單位分布情況來看,知識圖譜領(lǐng)域NSFC 的26.95%支持在前10位的單位,其中中國科學(xué)院的立項(xiàng)項(xiàng)目數(shù)目及基金總量均位于首位,其次為浙江大學(xué)與中國人民大學(xué),一定程度上反映出NSFC 項(xiàng)目對研究基礎(chǔ)的要求相對較高。

在研究關(guān)鍵詞分析方面,限于項(xiàng)目公示信息的限制,本研究根據(jù)立項(xiàng)項(xiàng)目標(biāo)題進(jìn)行了主題詞的拆分和預(yù)處理,雖然一定程度上引入了新的偏倚風(fēng)險(xiǎn),但考慮研究標(biāo)題對一個(gè)NSFC 項(xiàng)目的重要性,以其作為研究主題分析數(shù)據(jù)源,還是能夠最大程度上保留研究的原意。從研究主題詞分布來看,“知識獲取、創(chuàng)新、企業(yè)”等主題詞頻率遠(yuǎn)遠(yuǎn)高于其他主題詞,這也反映出NSFC資助基礎(chǔ)研究的戰(zhàn)略定位。對知識圖譜領(lǐng)域高頻主題詞的聚類分析提示,目前NSFC 在知識圖譜領(lǐng)域資助的項(xiàng)目主要圍繞圖譜技術(shù)模型、醫(yī)學(xué)應(yīng)用、圖譜構(gòu)建、人工智能、數(shù)據(jù)應(yīng)用等形成了五大熱點(diǎn)研究領(lǐng)域,根據(jù)主題詞的時(shí)間疊加網(wǎng)絡(luò)圖(圖4),可以清晰的看出,主題詞平均出現(xiàn)時(shí)間主要集中在2014—2019年,這與本時(shí)段NSFC 立項(xiàng)項(xiàng)目數(shù)量整體較高有關(guān),“云制造、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、體制、嵌入式、多源數(shù)據(jù)、多目標(biāo)協(xié)同”等成為我國基礎(chǔ)研究領(lǐng)域知識圖譜研究前沿。在生命醫(yī)學(xué)領(lǐng)域內(nèi),圍繞現(xiàn)代醫(yī)學(xué)、中醫(yī)學(xué)、針灸、體質(zhì)、圖譜技術(shù)形成五個(gè)研究熱點(diǎn)領(lǐng)域,其中“醫(yī)學(xué)、決策模型、群智能、關(guān)系推理、圖神經(jīng)網(wǎng)絡(luò)、知識補(bǔ)全、健康社區(qū)、體質(zhì)、動(dòng)態(tài)”為當(dāng)前研究前沿。

從目前NSFC在知識圖譜研究資助項(xiàng)目分布情況來看,資助項(xiàng)目數(shù)量波動(dòng)式上升,資助金額總量變化較大,研究主題豐富度逐漸增加,主要分布在探索系列和人才系列研究,融合系列有明顯提升,工具系列研究依舊薄弱,學(xué)科交叉型及成果轉(zhuǎn)化型研究有待進(jìn)一步提高。知識圖譜研究已經(jīng)滲透到金融、工業(yè)和醫(yī)學(xué)領(lǐng)域,對知識圖譜的定量和定性特征的科學(xué)理解已經(jīng)成為大數(shù)據(jù)、智能化時(shí)代科學(xué)研究中一個(gè)基礎(chǔ)性研究方向。在醫(yī)學(xué)特別是中醫(yī)學(xué)領(lǐng)域有著廣闊的應(yīng)用前景,目前已在中醫(yī)百科系統(tǒng)、中醫(yī)智能問答、臨床輔助決策、數(shù)據(jù)挖掘分析領(lǐng)域進(jìn)行了很多有益的嘗試[2],但目前我國基礎(chǔ)研究領(lǐng)域知識圖譜研究仍偏于技術(shù)應(yīng)用層面,知識圖譜關(guān)鍵基礎(chǔ)技術(shù)研究有待進(jìn)一步加強(qiáng)深化。

猜你喜歡
主題詞圖譜資助
高校資助育人成效的提升路徑分析
大學(xué)(2021年2期)2021-06-11 01:13:28
繪一張成長圖譜
“隱形資助”低調(diào)又暖心
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
主動(dòng)對接你思維的知識圖譜
美國防部資助研發(fā)能垂直起降的無人機(jī)
2600多名貧困學(xué)生得到資助
中國火炬(2015年2期)2015-07-25 10:45:24
我校學(xué)報(bào)第32卷第5期(2014年10月)平均每篇有3.04個(gè)21世紀(jì)的Ei主題詞
我校學(xué)報(bào)第32卷第6期(2014年12月)平均每篇有3.00個(gè)21世紀(jì)的Ei主題詞
2014年第16卷第1~4期主題詞索引
乐至县| 龙陵县| 巴青县| 凤庆县| 宁乡县| 五原县| 郧西县| 岗巴县| 托里县| 灵璧县| 永川市| 东兰县| 恭城| 乌审旗| 象山县| 柏乡县| 定日县| 南充市| 昭通市| 伊川县| 东乌珠穆沁旗| 安徽省| 延边| 米泉市| 大足县| 泰来县| 铜川市| 龙海市| 洛川县| 张家口市| 怀集县| 碌曲县| 安阳县| 兴宁市| 石泉县| 江阴市| 宝应县| 庆安县| 五寨县| 城步| 双流县|