王富強,韓宇平,王 朋,王 靜
(華北水利水電大學水利學院,河南鄭州 450045)
水資源學研究的關鍵詞共詞聚類分析
王富強,韓宇平,王 朋,王 靜
(華北水利水電大學水利學院,河南鄭州 450045)
以中國知網(wǎng)學術期刊網(wǎng)絡出版總庫中2003—2012年的水資源學科核心期刊論文為基礎,采用Bibexcel統(tǒng)計關鍵詞頻次,采用Ucinet和Netdraw繪制共詞網(wǎng)絡,運用SPSS進行共詞聚類分析與多維尺度分析,研究高頻關鍵詞之間的內(nèi)在聯(lián)系,評述水資源學科的研究熱點與研究現(xiàn)狀。研究結果表明,水資源學科在研究過程中形成了水資源可持續(xù)利用、社會可持續(xù)、水資源系統(tǒng)和水資源管理四大類群體,并且四者之間具有較強的關聯(lián)性。
水資源;關鍵詞;共詞聚類分析;共詞強度;共詞矩陣
隨著期刊數(shù)量的增長與學科的細化發(fā)展,科技文獻數(shù)量增長迅速,這給學者的研究工作帶來了極大便利,相應地對文獻的管理與分析利用也有了更高要求[1]。隨著信息技術的發(fā)展、應用和開辟,有必要整理與審視某一學科的研究熱點與研究現(xiàn)狀,以促進該學科的進一步發(fā)展,近幾年運用文獻計量學研究學科的發(fā)展已成為一種不可或缺的手段。自2003年以來,水資源的期刊論文數(shù)量增加顯著,但是運用文獻計量學來研究水資源學科的研究熱點與研究現(xiàn)狀的相關論文還沒有見到,本文嘗試以中國知網(wǎng)學術期刊網(wǎng)絡出版總庫在2003—2012年的相關論文為基礎,采用共詞聚類分析法來探討水資源學科的研究熱點與研究現(xiàn)狀,為該學科的建設和發(fā)展提供參考。
共詞聚類分析法屬于一種內(nèi)容分析法,主要統(tǒng)計一組詞中兩兩同時出現(xiàn)于一篇文獻的頻次(共詞強度),以這種共現(xiàn)頻次反映這些詞之間的關聯(lián)程度,兩個詞的共詞強度越高,則它們之間的關聯(lián)越緊密[2]。關鍵詞是文獻檢索標識,是表達文獻主題概念的自然語言詞匯,能夠簡單、直接、全面地概括文獻的核心研究內(nèi)容。高頻關鍵詞可以反映學科的研究熱點,而關鍵詞的變化也可以在一定程度上反映學科的發(fā)展趨勢[3]。關鍵詞共現(xiàn)分析法是指兩個關鍵詞同時出現(xiàn)在一篇文章中的頻次,反映了這兩個關鍵詞之間的關聯(lián)性,關聯(lián)性強的關鍵詞代表了學科研究的核心問題和熱點問題[4]。本文采用文獻計量軟件Bibexcel統(tǒng)計關鍵詞頻次、使用Ucinet和Netdraw繪制共詞網(wǎng)絡,同時利用SPSS軟件進行共詞聚類分析以及多維尺度分析,并與共詞網(wǎng)絡進行對比,來揭示水資源領域的研究熱點和研究現(xiàn)狀。
在中國知網(wǎng)中輸入“水資源”進行主題檢索,限定為核心期刊檢索,檢索時間為2003—2012年,共檢索出符合條件的期刊論文15090篇,論文數(shù)量年度分布如表1所示。
表1 水資源學科期刊論文數(shù)量年度分布
由表1可以看出,在2003—2008年間水資源學科的核心期刊論文數(shù)量不斷增加,在2008年以后,論文數(shù)量維持在1800篇左右,比較穩(wěn)定。對表1中的論文,依據(jù)關鍵詞、主題以及文章標題來排除與水資源學科相關性較小的論文。由于在一些論文中關鍵詞的表述不太規(guī)范,本文對于部分同義詞和近義詞進行了合并處理,如將水資源承載力、水資源承載能力、承載能力合并為水資源承載力;將水資源配置、水資源優(yōu)化配置合并為水資源配置等。使用Bibexcel統(tǒng)計2003—2012年與水資源學科相關性較大的期刊論文3 314篇,其中關鍵詞共4 737個,頻次大于10的有174個,頻次大于20的有63個。去除頻次最高的關鍵詞“水資源”,剩余62個關鍵詞在一定程度上反映了水資源學科研究的核心問題與熱點問題,關鍵詞頻次的降序排列如表2所示。
從表2可以看出,近10年的水資源研究現(xiàn)狀是:①關于水資源承載力、水資源配置的文獻較多,一直是研究熱點,這與中國的水資源短缺有很大關系;②水資源可持續(xù)利用與可持續(xù)發(fā)展出現(xiàn)也較為頻繁,這與社會可持續(xù)發(fā)展理念具有緊密的關聯(lián)性,因此研究較多;③氣候變化出現(xiàn)了105次,通過查閱文獻發(fā)現(xiàn),國內(nèi)關于氣候變化對水資源影響的研究起步較晚,但發(fā)展較快;④從水權、水價等關鍵詞發(fā)現(xiàn)對于水資源經(jīng)濟學的研究也較多;⑤水資源學科的主要研究方法有層次分析法、遺傳算法、主成分分析法等,其中越來越多的借助GIS來研究水資源;⑥虛擬水作為水資源一個新興的研究方向得到了較多的關注;⑦黃河流域和長江流域是水資源研究的典型區(qū)域,出現(xiàn)頻次較高。
高頻關鍵詞在一定程度上代表了水資源學科的研究熱點和研究方向,但僅按出現(xiàn)頻次對這些詞進行線性排列,還不能全面反映它們之間的關系,需要進行共詞分析。首先采用Bibexcel構建共詞矩陣,對以高頻關鍵詞進行兩兩配對,統(tǒng)計它們在3 314篇文獻中共現(xiàn)頻次,形成62×62的共詞矩陣,主對角線的數(shù)據(jù)為該詞出現(xiàn)的頻次,非主對角線上的數(shù)據(jù)表示兩個關鍵詞共同出現(xiàn)在同一篇論文中的頻次,部分數(shù)據(jù)如表3所示。
表2 水資源學科高頻關鍵詞
表3 部分高頻關鍵詞共詞矩陣
多元統(tǒng)計分析方法對矩陣的數(shù)據(jù)結構有不同的要求,為了統(tǒng)計分析方便,本文將共詞矩陣轉化為相關和相異矩陣。由于關鍵詞的頻次懸殊,共詞矩陣中數(shù)據(jù)相差也比較大,為了消除頻次懸殊造成的影響,可以用式(1)計算得Ochiia系數(shù),從而得到共詞相異矩陣。
圖1 高頻關鍵詞共現(xiàn)網(wǎng)絡可視圖
式中:y為Ochiia系數(shù);xAB為A、B兩詞同時出現(xiàn)的頻次;xA、xB分別為A詞、B詞出現(xiàn)的次數(shù)。
為了呈現(xiàn)關鍵詞之間的內(nèi)在相關關系,需要借助共詞網(wǎng)絡與多元統(tǒng)計分析方法來揭示這些關鍵詞之間的關系以及它們所反映的研究主題。根據(jù)高頻關鍵詞共詞矩陣,利用Ucinet將共現(xiàn)矩陣轉化為.##h的文件,用Netdraw繪制共詞網(wǎng)絡圖譜,得到高頻關鍵詞共詞網(wǎng)絡可視圖,如圖1所示。
圖1中節(jié)點越大表示其中心度越高,是網(wǎng)絡中最重要的節(jié)點。節(jié)點之間連線的粗細表示兩組關鍵詞出現(xiàn)頻次的高低,頻次越高,關鍵詞之間關系越密切。由圖1可以看出,水資源配置、可持續(xù)利用、可持續(xù)發(fā)展處于網(wǎng)絡的中心位置,其中心度最大,在一定程度上也反映了水資源學科的主要研究內(nèi)容與研究主題,圍繞它們形成了水資源保護、水資源短缺、水資源利用、水污染、氣候變化、生態(tài)環(huán)境等研究熱點結構,它們之間具有緊密的關聯(lián)性。另外,黃河流域、長江流域與其他關鍵詞之間的連線較密且較粗,共現(xiàn)的頻次較高,關系較為緊密,它們是近10年來水資源研究的主要區(qū)域。
以共詞矩陣為基礎,采用聚類分析法對高頻關鍵詞之間的連接強度進行分析。聚類分析法是根據(jù)事物本身的特性研究個體分類的統(tǒng)計方法,它基于數(shù)據(jù)的相似性分類,將當前最緊密的對象合并為一類,直到所有個體聚為一個大類[5]。聚類分析的基本思想是認為研究的變量之間存在著程度不同的相似性(親疏關系),可根據(jù)一批研究對象的多個變量指標,具體找出一些能夠測度這些變量指標之間相似程度的統(tǒng)計量,以這些統(tǒng)計量為劃分依據(jù),把一些相似程度較大的變量聚合為一類,關系密切的聚合到一個小的分類單位,關系疏遠的聚合到一個大的分類單位,直到把所有的變量都聚合完畢,把不同的類型一一劃出來,形成一個由小到大的分類系統(tǒng)[6]。在對關鍵詞進行聚類時,首先將每一個關鍵詞看成獨立的一類,把最近的兩類合并,然后重新計算類與類之間的距離,再把距離最近的兩類合并,每一步減少一類,一直持續(xù)到所有的關鍵詞歸為一類[7]。以公式(1)構造的相異矩陣為基礎,運用SPSS進行共詞聚類分析,得出共詞聚類冰掛圖和樹形圖,如圖2和圖3所示。
結合圖2與圖3,可以將高頻關鍵詞劃分為4個主要的聚類群體,如表4所示。高頻關鍵詞聚類群體劃分的依據(jù)是關鍵詞的共詞頻次,首先將關系密切的關鍵詞進行聚類,最后形成大的聚類群體。
由表4可以看出,群體1涉及的內(nèi)容較多,既有虛擬水、氣候變化,又有水資源開發(fā)利用、水經(jīng)濟和生態(tài)環(huán)境等,經(jīng)過文獻分析,可以把群體1的主要研究方向歸納為水資源的可持續(xù)利用。群體2涉及的內(nèi)容包含水資源評價、節(jié)水灌溉、城市化、水環(huán)境、節(jié)水等,主要研究水資源的可持續(xù)利用支撐經(jīng)濟社會的可持續(xù)發(fā)展。群體3涉及水資源供需平衡、水資源價值、水資源短缺、人類活動、水資源承載力等內(nèi)容,從水資源系統(tǒng)的視角進行水資源研究。群體4涉及灌區(qū)、南水北調(diào)、黃河流域、水資源量等內(nèi)容,以流域水資源管理為基礎進行研究。
圖2 共詞聚類分析冰掛圖
圖3 層次聚類分析樹狀圖
表4 高頻關鍵詞聚類群體劃分
為了更好的顯示關鍵詞的聚類群體,采用SPSS中的多維尺度分析功能來構建多維尺度可視化圖譜,從多維尺度分析結果可以直觀、形象地看出關鍵詞的聚類群體,結果如圖4所示。
圖4 多維尺度分析結果
圖4較好地顯示了關鍵詞聚類群體結果,與圖2、圖3的共詞聚類結果基本一致,根據(jù)每個群體在坐標中的位置(即歐幾里得距離),可以看出各類群體間的緊密程度,群體1、群體2、群體4聯(lián)系較為緊密,由圖2、圖3的分析可知,水資源可持續(xù)利用、社會可持續(xù)發(fā)展和水資源管理是緊密相關的,三者是水資源研究的主要目的與方向;群體3則與群體1、群體2存在聯(lián)系,水資源系統(tǒng)與水資源可持續(xù)利用、社會可持續(xù)發(fā)展互相影響,許多文章是從水資源系統(tǒng)的視角進行水資源研究的。
a.水資源學科的主要研究熱點集中于水資源配置、水資源承載力、可持續(xù)利用、可持續(xù)發(fā)展、水資源管理,圍繞著這幾個研究熱點形成了水資源學科新的研究視角。
b.基于共詞網(wǎng)絡分析可知,水資源配置、可持續(xù)利用、可持續(xù)發(fā)展、水資源承載力、水資源管理處于核心位置,是最重要的研究熱點方向,在其研究基礎上形成了水資源保護、水資源短缺、水資源利用、水污染、氣候變化、生態(tài)環(huán)境等研究熱點結構,它們之間的關聯(lián)性較為緊密。
c.基于共詞聚類分析與多維尺度分析可知,水資源學科在研究過程中形成了水資源可持續(xù)利用、社會可持續(xù)、水資源系統(tǒng)、水資源管理4大類群體,四者之間顯現(xiàn)出一定的相關性,相互存在聯(lián)系。
[1]任智軍,朱東華,謝菲.科技文本的可視化分析研究[J].北京理工大學學報:社會科學版,2007,9(1):13-17. (REN Zhijun,ZHU Donghua,XIE Fei.The visualization analysis of scientific text[J].Journal of Beijing Institute of Technology:Social Sciences Edition,2007,9(1):13-17. (in Chinese))
[2]FRY J,TALJA F.The intellectual and social organization of academic fields and the shaping of digital resources[J]. Journal of Information Science,2007,33(2):115.
[3]尹相旭,張更平,李曉菲.基于關鍵詞統(tǒng)計的情報學研究現(xiàn)狀分析[J].情報雜志,2009,28(11):38-41.(YIN Xiangxu,ZHANG Gengping,LI Xiaofei.A research situation analysis ofinformation sciencesbased on key words statistics[J].Journal of Information,2009,28(11):38-41. (in Chinese))
[4]舒瑯.基于社會網(wǎng)絡分析的項目管理學科熱點和主流知識群的研究[D].杭州:浙江大學,2010.
[5]李長玲,支嶺,紀雪梅,等.我國情報學研究進展:基于期刊論文關鍵詞的統(tǒng)計分析[J].圖書情報工作,2010,54 (24):31-36.(LI Changling,ZHI Ling,JI Xuemei,et al. Trend analysis on information science based on keyword statistics[J].Library and Information Service,2010,54 (24):31-36.(in Chinese))
[6]曹玲,楊靜,夏嚴.國內(nèi)競爭情報領域研究論文的共詞聚類分析[J].情報科學,2010,28(6):923-925.(CAO Ling,YANG Jing,XIA Yan.Co-word clustered analysis of competitive intelligence dissertations in China[J]. Information Science,2010,28(6):923-925.(in Chinese))
[7]許振亮,劉則淵,侯海燕,等.中國技術創(chuàng)新理論研究前沿共詞知識圖譜分析[J].圖書情報工作,2009,53(6): 46-49.(XU Zhenliang,LIU Zeyuan,HOU Haiyan,et al. Knowledge mapping of the theory fronts of China technology innovation:based on the view of author co-cited[J]. Library and Information Service,2009,53(6):46-49.(in Chinese))
Co-word cluster analysis of keywords in water resources science research//
WANG Fuqiang,HAN Yuping,WANG Peng,WANG Jing
(North China University of Water Conservancy and Electric Power,Zhengzhou 450045,China)
Cluster analysis and multivariate statistics analysis for the co-words are performed taking into account the keywords in core journal papers on water resources issued in China Academic Journal Network Publishing Database(CAJD) during 2003 to 2012.Further,the keyword frequency counted by Bibexcel,co-word network set up by Ucinet and Netdraw, co-word clustering analysis and multidimensional scaling analysis by SPSS,internal relations among high frequency keywords were studied.Additionally,the research focus and research status were analyzed.The results show that in the course of water resources science research four major communities of water resources research are developed:sustainable utilization,social sustainable development,water resources system and water resources management.Furthermore,these four major communities are greatly related with each other.
water resources;keyword;co-word cluster analysis;co-word intensity;co-word matrix
TV213.4;G353.1
:A
:1006-7647(2014)04-0029-05
10.3880/j.issn.1006-7647.2014.04.007
2013-0627 編輯:周紅梅)
《2014年聯(lián)合國世界水資源開發(fā)報告》簡介
(楚行軍供稿)
國家自然科學基金(51279063,51379078);教育部新世紀優(yōu)秀人才支持計劃(NCET-13-0794)
王富強(1979—),男,河南濟源人,博士,副教授,主要從事水文學及水資源研究。E-mail:fortunewang@163.com
韓宇平(1975—),男,寧夏彭陽人,博士,教授,主要從事水文學及水資源研究。E-mail:hanyp@ncwu.edu.cn
2014年3月,聯(lián)合國教科文組織出版了《2014年聯(lián)合國世界水資源開發(fā)報告》(The United Nations World Water Development Report 2014),由聯(lián)合國糧食及農(nóng)業(yè)組織、聯(lián)合國環(huán)境規(guī)劃署、聯(lián)合國人類住區(qū)規(guī)劃署、聯(lián)合國工業(yè)發(fā)展組織和世界銀行分別負責論證和起草該報告的不同分支主題,同時該報告還受益于聯(lián)合國水機制眾多正式成員及合作伙伴的相關工作成果?!?014年聯(lián)合國世界水資源開發(fā)報告》分為兩卷:第1卷是“水資源和能源”,宏觀探討目前及今后一段時期人類在水資源開發(fā)、利用和管理中存在的一些問題及其與能源之間的復雜關系;第2卷是“直面挑戰(zhàn)”,提供來自全球的13個案例,介紹各地在應對水資源和能源問題中的一些典型做法。編者致力于提供一個以基本事實為依據(jù)、以均衡中立為價值導向的綜合報告,期望其能夠代表當前人類對水資源和能源認識的最新水平,呼吁加強水資源和能源的綜合管理,弱化經(jīng)濟增長對水資源的依賴,改善經(jīng)濟發(fā)展的可持續(xù)性。這是聯(lián)合國推出的第15份《聯(lián)合國世界水資源開發(fā)報告》,也是首次以年度報告的形式編撰,同時《聯(lián)合國世界水資源開發(fā)報告》的年度主題將與世界水日的主題相一致,以相應擴大宣傳活動的影響力。