国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于測繪期刊論文數(shù)據(jù)的可視分析

2016-07-15 05:10劉海硯
測繪通報(bào) 2016年6期
關(guān)鍵詞:文獻(xiàn)計(jì)量研究熱點(diǎn)統(tǒng)計(jì)

李 靜,劉海硯

(信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450000)

?

基于測繪期刊論文數(shù)據(jù)的可視分析

李靜,劉海硯

(信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450000)

摘要:結(jié)合文獻(xiàn)計(jì)量方法與可視化技術(shù),以《測繪學(xué)報(bào)》《測繪通報(bào)》《測繪科學(xué)》《測繪工程》2003—2013年共收集的5863篇學(xué)術(shù)論文為數(shù)據(jù)源,進(jìn)行了關(guān)鍵詞、論文作者及論文作者所在地3方面的統(tǒng)計(jì)分析,并將統(tǒng)計(jì)結(jié)果以統(tǒng)計(jì)圖表和地圖的形式展現(xiàn),直觀地反映了我國測繪學(xué)科研究熱點(diǎn)的演變,以及活躍作者群的人數(shù)、核心研究區(qū)的地理分布。研究顯示,涉及大地測量、地理信息系統(tǒng)和地圖制圖3方面研究內(nèi)容的論文占總論文數(shù)的59.9%,達(dá)一半以上;根據(jù)普賴斯定律確定的活躍作者群人數(shù)為131人;發(fā)文量排名前10的城市中,有90%為省會(huì)城市或直轄市。從研究結(jié)果可以得出,我國測繪學(xué)科的發(fā)展每年的研究熱點(diǎn)都不相同,其中大地測量、地理信息系統(tǒng)和地圖制圖的研究較為廣泛;測繪學(xué)科發(fā)展具有高質(zhì)量的活躍作者群體,但學(xué)科的發(fā)展具有地域不均衡性。

關(guān)鍵詞:統(tǒng)計(jì);可視化;研究熱點(diǎn);文獻(xiàn)計(jì)量;普賴斯定律

《測繪學(xué)報(bào)》《測繪通報(bào)》《測繪科學(xué)》《測繪工程》是測繪科學(xué)領(lǐng)域具有重要影響力的期刊。其論文數(shù)據(jù)是科研成果原理與思想的展示,在一定程度上反映了我國測繪科技水平的發(fā)展及測繪領(lǐng)域的最新成果,促進(jìn)了學(xué)者們的互相交流與學(xué)習(xí)。為實(shí)現(xiàn)對(duì)我國測繪科技發(fā)展?fàn)顩r從定性到定量的分析,本文結(jié)合文獻(xiàn)計(jì)量學(xué)的方法,對(duì)《測繪學(xué)報(bào)》《測繪通報(bào)》《測繪科學(xué)》《測繪工程》2003—2013年的所出版的5863篇科技論文進(jìn)行關(guān)鍵詞、作者及發(fā)文地等方面的統(tǒng)計(jì)和分析,并采用可視化技術(shù)將統(tǒng)計(jì)結(jié)果進(jìn)行直觀展現(xiàn),便于從繁多的數(shù)據(jù)中找出數(shù)據(jù)所蘊(yùn)藏的信息,進(jìn)而分析得出我國測繪學(xué)科研究內(nèi)容的變化情況,確定出活躍作者群的人數(shù),以及核心研究區(qū)的分布情況。

文獻(xiàn)計(jì)量學(xué)原理為本文中所進(jìn)行知識(shí)梳理和科學(xué)研究提供了理論基礎(chǔ)。所謂文獻(xiàn)計(jì)量學(xué),即用數(shù)學(xué)和統(tǒng)計(jì)學(xué)的方法定量地分析一切知識(shí)載體的交叉科學(xué)。它是集數(shù)學(xué)、統(tǒng)計(jì)學(xué)、文獻(xiàn)學(xué)為一體,注重量化的綜合性知識(shí)體系。其計(jì)量對(duì)象主要是:文獻(xiàn)量(各種出版物,尤以期刊論文和引文居多)、作者數(shù) (個(gè)人集體或團(tuán)體)、詞匯數(shù)(各種文獻(xiàn)標(biāo)識(shí),其中以敘詞居多),文獻(xiàn)計(jì)量學(xué)最本質(zhì)的特征在于其輸出的是“量”[1]。其中,普賴斯定律是文獻(xiàn)計(jì)量學(xué)方法中一個(gè)比較著名的定律,它是由被譽(yù)為“科學(xué)計(jì)量學(xué)”之父的普賴斯于1963年提出的。普賴斯認(rèn)為:“全部論文的一半系由該領(lǐng)域中全部作者的平方根的那些人所撰?!焙笥盅a(bǔ)充道:“如果設(shè)所發(fā)表的全部論文為n篇,可以發(fā)現(xiàn)其中低產(chǎn)作者論文總數(shù)相當(dāng)于少量高產(chǎn)作者論文總數(shù),在這種簡單的情況下,對(duì)稱性可能表明作者數(shù)量是符合平方根定律的。”該理論反映了作者與發(fā)文數(shù)量之間的數(shù)學(xué)關(guān)系,從而為本文中進(jìn)行活躍作者群的確定提供了數(shù)學(xué)方法和依據(jù)。

一、可視分析

1. 研究熱點(diǎn)演變

期刊論文數(shù)據(jù)不同于一般的文本數(shù)據(jù),它屬于半結(jié)構(gòu)化數(shù)據(jù),具有一定的結(jié)構(gòu)和要素。文獻(xiàn)中的關(guān)鍵詞在一定程度上反映了該篇論文的研究內(nèi)容。本文根據(jù)期刊論文數(shù)據(jù)特有的關(guān)鍵詞要素,以年為單位,采用武漢大學(xué)開發(fā)的ROST詞頻統(tǒng)計(jì)軟件對(duì)其進(jìn)行統(tǒng)計(jì),從而反映研究內(nèi)容在時(shí)間上的變化情況;并根據(jù)論文的題目、摘要、關(guān)鍵詞等要素信息對(duì)論文進(jìn)行整體分類,從而突出測繪研究內(nèi)容上的差異。

(1) 關(guān)鍵詞統(tǒng)計(jì)

表1中表示的是剔除掉無用詞后,2003—2013年間每年出現(xiàn)頻率最高的關(guān)鍵詞。從中可以看出,每年詞頻最高的關(guān)鍵詞都各不相同,這反映出11年來測繪科學(xué)每年的研究熱點(diǎn)都各不相同。其中詞頻的均值為9.7,最高的為13,即2005年的“地圖綜合”。從關(guān)鍵詞內(nèi)容上可以看出,2003—2007年,主要屬于GIS和地圖制圖范疇。

表1 2003—2013年最高詞頻關(guān)鍵詞統(tǒng)計(jì)

圖1是關(guān)鍵詞隨時(shí)間變化的統(tǒng)計(jì)圖,折線表示詞頻,條形圖表示該詞所占當(dāng)年所有關(guān)鍵詞的比例。從圖上可以看出,2003—2007年關(guān)鍵詞的詞頻與其所占比例基本上呈正相關(guān)關(guān)系,即該關(guān)鍵詞詞頻越高,其所占的比例越大,從而可以說明該詞具有一定代表性,可以反映當(dāng)年的研究熱點(diǎn)。2008—2013年,每年的關(guān)鍵詞總數(shù)增多,最高詞頻下降,最高詞頻關(guān)鍵詞所占比例也較之前明顯下降,這說明這幾年的研究內(nèi)容相比之下比較分散,更加多元化。

圖1 2003—2013年最高詞頻關(guān)鍵詞隨時(shí)間變化圖

(2) 論文內(nèi)容分類

本文根據(jù)論文的題目、關(guān)鍵詞、摘要對(duì)其進(jìn)行分類。表2表示2003—2013年間論文內(nèi)容分類的統(tǒng)計(jì)結(jié)果。從表2可以看出,近11年間,發(fā)文數(shù)量最高的為大地測量方面,共1407篇,占論文總數(shù)量的24%;第2位為GIS,占論文總數(shù)量的19.6%;第3位為地圖制圖,占論文總數(shù)量的16.3%,僅關(guān)于大地測量、GIS和地圖制圖方面的研究總和達(dá)到59.9%。這說明,在測繪領(lǐng)域的研究中,大地測量、GIS和地圖制圖等內(nèi)容被廣泛研究和發(fā)展。另一方面,對(duì)其他方面的研究也在不斷深入,從各個(gè)方面充實(shí)著測繪科技的發(fā)展。

圖2是根據(jù)UGGIS于2006年提出的地理信息科學(xué)與技術(shù)知識(shí)體系8個(gè)方面的內(nèi)容對(duì)論文進(jìn)行分類后所繪制的漏斗圖和玫瑰圖。從圖中可以看出,測繪領(lǐng)域研究主要是建立在對(duì)地理空間數(shù)據(jù)上的,地理空間數(shù)據(jù)是整個(gè)測繪學(xué)科研究的基礎(chǔ),地理空間數(shù)據(jù)的概念與獲取占有重要地位。從總體上看,數(shù)據(jù)建模、分析方法、地理計(jì)算、地圖與可視化主要涉及方法的研究與探索,其論文數(shù)量占到多數(shù);其次設(shè)計(jì)問題、地理信息科學(xué)與技術(shù)主要涉及地理信息的應(yīng)用與服務(wù),而其論文數(shù)量相對(duì)較少。這說明研究者更多地致力于對(duì)規(guī)律的探索、模型的建立、合理算法與研究方法的探尋。

表2 論文內(nèi)容分類統(tǒng)計(jì)

圖2 論文內(nèi)容分類統(tǒng)計(jì)

2. 論文作者分析

(1) 作者發(fā)文量統(tǒng)計(jì)

測繪期刊在2003—2013年間共刊登了5822篇署名作者的文章,共3652名作者以第一作者身份發(fā)表文章,其中單個(gè)作者發(fā)文量最高的為45篇,最低為1篇,平均發(fā)文量為1.59篇。

表3反映了不同發(fā)文量的作者數(shù)及不同發(fā)文量占總文章數(shù)的比例。其中發(fā)文量為1篇的作者數(shù)最多,且總發(fā)文量達(dá)到總文章數(shù)的45%,這說明四大期刊有豐富的作者資源。發(fā)文量大于3篇的比例總計(jì)為23.9%,這說明四大期刊有著權(quán)威的作者隊(duì)伍,實(shí)力雄厚,支持著整個(gè)測繪領(lǐng)域的發(fā)展。

(2) 活躍作者群的確定

所謂活躍作者群,是指在某一領(lǐng)域發(fā)表論文數(shù)量較多,且影響力較大的作者的集合。本文對(duì)11年間論文作者的發(fā)文量進(jìn)行了統(tǒng)計(jì)分析,并結(jié)合普賴斯定律確定在測繪領(lǐng)域的活躍作者群,現(xiàn)將發(fā)表論文數(shù)以N表示,單位為篇,計(jì)算公式如下

N=0.749×(Z)1/2

(1)

式中,Z為發(fā)文量最多的作者所發(fā)的文章數(shù)。根據(jù)表3可知Z為45篇,從而計(jì)算出N。

N=0.749×451/2≈5.024≈5

(2)

因此,根據(jù)普賴斯定律將活躍作者群的發(fā)文量確定為5篇和5篇以上,得到活躍作者群的總數(shù)為131人,占作者總數(shù)的3.6%,其活躍作者群所發(fā)表的論文占論文總數(shù)的17.3%,這說明在測繪領(lǐng)域有著穩(wěn)定的作者群,他們實(shí)力雄厚,基礎(chǔ)扎實(shí),雖然所占總?cè)藬?shù)的比例較小,但是具有較高的發(fā)文量,支撐著測繪事業(yè)的發(fā)展。

表4統(tǒng)計(jì)了發(fā)文量大于10篇的作者信息??梢园l(fā)現(xiàn),發(fā)文量大于10篇的作者總共有20人,其中發(fā)文量最多為45篇且只有一人。如圖3所示,發(fā)文量大于10篇的作者有45%分布在北京各個(gè)科研院校,15%分布在武漢,10%分布在西安。

表4 發(fā)文量大于10篇的作者情況統(tǒng)計(jì)

注:①按照第一作者進(jìn)行統(tǒng)計(jì);②作者所在地指該作者最新發(fā)表的論文中其所在單位。

圖3 發(fā)文量大于10篇的作者單位分布統(tǒng)計(jì)

3. 核心研究區(qū)分布

一個(gè)地區(qū)發(fā)文量的高低在一定程度上反映了該地區(qū)的師資力量和科研水平。本文根據(jù)發(fā)文量多少來確定測繪學(xué)科核心研究區(qū)的分布情況。

根據(jù)第一作者單位所在地,本文對(duì)發(fā)文地點(diǎn)進(jìn)行統(tǒng)計(jì)。表5羅列了發(fā)文量排在前10位的城市??梢钥闯?,第1位為北京,發(fā)文量占總論文數(shù)量比例為18.7%;第2位為武漢;第3位為鄭州。前10位城市發(fā)文量總和占到總論文數(shù)量的70%。研究發(fā)現(xiàn),排名前10位的城市,北京、上海為直轄市,除徐州外,其余均為省會(huì)城市。這說明,在經(jīng)濟(jì)發(fā)達(dá)和人口眾多的地區(qū),教育資源豐富,師資力量雄厚,學(xué)術(shù)交流便利,是測繪領(lǐng)域研究的核心區(qū)域。

表5 發(fā)文量排名前10位的城市統(tǒng)計(jì)

本文以5篇發(fā)文量為節(jié)點(diǎn),將發(fā)文量高于5篇的地區(qū)稱為高發(fā)文區(qū),低于5篇且大于0篇的地區(qū)稱為低發(fā)文區(qū)。據(jù)統(tǒng)計(jì),高發(fā)文地區(qū)主要集中分布在中東部地區(qū),且主要為省會(huì)、直轄市等大型城市;而低發(fā)文區(qū)分布在中東部地區(qū)和東南沿海城市,這些城市規(guī)模相對(duì)較小??傮w來看,無論高發(fā)文區(qū)或低發(fā)文區(qū)都主要分布在中東部地區(qū),城市規(guī)模的大小、經(jīng)濟(jì)水平的高低直接影響該區(qū)域科研水平與師資力量。

二、結(jié)論

從以上的統(tǒng)計(jì)分析可以表明,期刊論文數(shù)據(jù)具有非常高的研究價(jià)值,能夠定量描述某一學(xué)科的研究狀況及其發(fā)展。本文通過研究測繪期刊論文數(shù)據(jù)統(tǒng)計(jì)圖表及可視化圖形,可以得出以下結(jié)論:

1) 測繪學(xué)科研究熱點(diǎn)從時(shí)間上看,每年的研究熱點(diǎn)都有所不同,且研究內(nèi)容從2008年起更加豐富、多元化。2003—2007年間,測繪領(lǐng)域研究熱點(diǎn)主要集中在GIS與地圖制圖方面。

2) 測繪學(xué)科從研究內(nèi)容分類上看,大地測量、GIS和地圖制圖等內(nèi)容被廣泛研究和發(fā)展;而地理空間數(shù)據(jù)是整個(gè)測繪學(xué)科的研究基礎(chǔ);對(duì)于研究者來說,他們更致力于對(duì)科學(xué)方法的尋求及對(duì)規(guī)律的探索。

3) 測繪學(xué)科擁有一大批實(shí)踐經(jīng)驗(yàn)豐富、理論水平較高的作者隊(duì)伍。雖然所占總?cè)藬?shù)的比例較小,但是實(shí)力雄厚,基礎(chǔ)扎實(shí),支撐著測繪事業(yè)的發(fā)展。

4) 測繪學(xué)科主要分布在經(jīng)濟(jì)發(fā)達(dá)和人口眾多的中東部地區(qū),可以看出我國測繪學(xué)科的發(fā)展具有地域不均衡性。主要有以下原因:一是測繪領(lǐng)域科研高校主要集中在北京、武漢、鄭州等幾個(gè)城市,從而造成作者主要來自于這幾個(gè)地區(qū)。二是每個(gè)省市測繪地理信息局都可能會(huì)有自己的側(cè)重點(diǎn),側(cè)重點(diǎn)為理論研究的可能就有較高的發(fā)文量,而注重實(shí)用性的地區(qū)發(fā)文量就較低。這表明,在注重實(shí)踐的同時(shí),同樣應(yīng)當(dāng)注重理論研究的創(chuàng)新。三是偏遠(yuǎn)地區(qū)通信交通都較為不便,也在一定程度影響了該區(qū)域的發(fā)文量。

參考文獻(xiàn):

[1]溫克勒.基于科學(xué)計(jì)量學(xué)指標(biāo)的科研評(píng)價(jià)[M].馬崢,譯.北京:科學(xué)技術(shù)文獻(xiàn)出版社,2014.

[2]唐家渝, 劉知遠(yuǎn), 孫茂松. 文本可視化研究綜述[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2013, 25(3): 273-285.

[3]劉海硯, 孫群, 肖強(qiáng), 等. 數(shù)字地圖制圖中多源數(shù)據(jù) (資料) 的綜合應(yīng)用[J]. 測繪科學(xué)技術(shù)學(xué)報(bào), 2006, 23(3): 161-164.

[4]蔣穎.人文社會(huì)科學(xué)領(lǐng)域文獻(xiàn)計(jì)量學(xué)研究[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2013.

[5]周炤, 劉海硯, 李少梅, 等. 現(xiàn)代地圖語言[J]. 測繪工程, 2008, 17(2): 6-8.

[6]陳生,曾行吉,梁軍. 基于GIS的統(tǒng)計(jì)數(shù)據(jù)可視化研究[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2008, 29(14): 3757-3759.

[7]王曰芬. 文獻(xiàn)計(jì)量法與內(nèi)容分析法的綜合研究 [D]. 南京:南京理工大學(xué), 2007.

[8]王凱. 新聞文本集可視化模型研究[D]. 北京:中國地質(zhì)大學(xué) (北京), 2013.

[9]林鴻飛, 高天. 中文文本的可視化表示[J]. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版), 2000, 21(5): 501-504.

[10]鐘文娟. 基于普賴斯定律與綜合指數(shù)法的核心作者測評(píng)——以《 圖書館建設(shè)》 為例[J]. 科技管理研究, 2012, 32(2): 57-60.

[11]趙紅,趙良英.《測繪學(xué)報(bào)》論文及作者的統(tǒng)計(jì)分析[J]. 測繪學(xué)報(bào),1998,27(3):88-95.

[12]羅玲,王文福. 《測繪科學(xué)》在中國知網(wǎng)的文獻(xiàn)計(jì)量分析[J]. 測繪科學(xué),2013(4):209-212.

[13]普賴斯,張季婭.洛特卡定律與普賴斯定律[J]. 科學(xué)學(xué)與科學(xué)技術(shù)管理,1984(9):17-22.

[14]KEIMDA,MANSMANNF,SCHNEIDEWINDJ,etal.VisualAnalytics:ScopeandChallenges[J].LectureNotesinComputerScience, 2008(4404): 76-90.

[15]THOMASJJ,COOKKA.IlluminatingthePath:TheResearchandDevelopmentAgendaforVisualAnalytics[M].Piscataway:IEEEComputerSocietyPress, 2005.

[16]JIANP,ZENGCR,WUWW.Multi-grainHierarchicalTopicExtractionAlgorithmforTextMining[J].ExpertSystemswithApplications,2010(37):3202-3208.

[17]洪文學(xué),王金甲.可視化和可視化分析學(xué)[J]. 燕山大學(xué)學(xué)報(bào),2010(2):95-99,105.

[18]姜春林,劉盛博,丁堃.《中國科技期刊研究》研究熱點(diǎn)及其演進(jìn)知識(shí)圖譜[J]. 中國科技期刊研究,2008(6):954-958.

[19]劉紅紅. 基于復(fù)雜網(wǎng)絡(luò)的報(bào)告文本可視化模型研究[D].北京:中國地質(zhì)大學(xué)(北京),2012.

Visual Analysis of Paper Data from Surveying and Mapping Journals

LI Jing,LIU Haiyan

收稿日期:2016-01-15

基金項(xiàng)目:地理信息工程國家重點(diǎn)實(shí)驗(yàn)室開放基金(SKLGIE-M-4-3);國家自然科學(xué)基金(41501446;41471387)

作者簡介:李靜(1990—),女,碩士生,主要從事數(shù)據(jù)挖掘與文本可視化研究。E-mail:brandy12367@sina.cn

中圖分類號(hào):C82

文獻(xiàn)標(biāo)識(shí)碼:B

文章編號(hào):0494-0911(2016)06-0050-05

引文格式: 李靜,劉海硯. 基于測繪期刊論文數(shù)據(jù)的可視分析[J].測繪通報(bào),2016(6):50-54.DOI:10.13474/j.cnki.11-2246.2016.0188.

猜你喜歡
文獻(xiàn)計(jì)量研究熱點(diǎn)統(tǒng)計(jì)
我國醫(yī)學(xué)數(shù)字圖書館研究的文獻(xiàn)計(jì)量分析
近五年我國職業(yè)教育研究熱點(diǎn)綜析及未來展望
國內(nèi)外智庫研究態(tài)勢知識(shí)圖譜對(duì)比分析
國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
基于文獻(xiàn)計(jì)量分析我國生物科學(xué)素養(yǎng)研究狀況(2001~2016年)
基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢分析
2008—2015我國健美操科研論文的統(tǒng)計(jì)與分析
自閉癥譜系障礙兒童的教育干預(yù)
山東省交通運(yùn)輸投資計(jì)劃管理信息系統(tǒng)的設(shè)計(jì)
基于社會(huì)網(wǎng)絡(luò)分析的我國微課研究探析
娱乐| 九寨沟县| 河津市| 伊春市| 满洲里市| 景泰县| 玉林市| 晋州市| 灵宝市| 阿城市| 古田县| 驻马店市| 夏河县| 大港区| 曲沃县| 宁河县| 北京市| 久治县| 乃东县| 宜川县| 平安县| 南川市| 应城市| 舒城县| 潞城市| 伽师县| 巫溪县| 北宁市| 西昌市| 合山市| 富川| 宽甸| 桐乡市| 施甸县| 靖宇县| 津市市| 家居| 石林| 桂平市| 汝阳县| 忻城县|