陳 露,顏 蘊(yùn),王 婷(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)
作物科學(xué)重點(diǎn)領(lǐng)域研究主題識別方法研究
——以中美法國家級農(nóng)業(yè)研究機(jī)構(gòu)為例
陳露,顏蘊(yùn),王婷
(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)
本文以Web of Science SCI引文數(shù)據(jù)庫與CABI Abstract數(shù)據(jù)庫為數(shù)據(jù)源,以中、美、法三個國家級農(nóng)業(yè)科研機(jī)構(gòu)為例,采用內(nèi)容詞分析、聚類分析以及關(guān)鍵詞機(jī)構(gòu)歸屬度等方法,著重分析作物遺傳與育種的研究主題。結(jié)果顯示三大機(jī)構(gòu)在重點(diǎn)研究主題上呈現(xiàn)相似的分布格局,又各具特色:中國農(nóng)業(yè)科學(xué)院在遺傳與育種領(lǐng)域更注重基礎(chǔ)性研究,在非生物脅迫等方面研究較為突出;美國農(nóng)業(yè)研究局青睞于對作物抗性育種、抗蟲性等方面的研究;法國農(nóng)業(yè)科學(xué)院注重遺傳工程研究。
農(nóng)業(yè)科研機(jī)構(gòu);作物科學(xué);內(nèi)容詞分析;主題分析
當(dāng)前階段世界農(nóng)業(yè)發(fā)展局勢巨變,作為農(nóng)業(yè)學(xué)科體系中的支柱性學(xué)科,作物科學(xué)也將面臨機(jī)遇與挑戰(zhàn)[1]。因此,在現(xiàn)今環(huán)境下,為加快推進(jìn)我國作物科學(xué)研究進(jìn)程,提升國內(nèi)作物科學(xué)研究水平,我們不僅需要洞悉和熟知國際作物科學(xué)研究的走向與趨勢,而且應(yīng)認(rèn)真總結(jié)國內(nèi)作物科學(xué)研究工作以及研究成果。本文基于文獻(xiàn)計量學(xué)理論,以中、美、法三國的國家級農(nóng)業(yè)科研機(jī)構(gòu)為例,對作物科學(xué)重點(diǎn)研究領(lǐng)域研究主題進(jìn)行比對分析,了解作物科學(xué)研究熱點(diǎn)及前沿動態(tài);通過對重點(diǎn)研究主題以及研究方向的分析,揭示研究領(lǐng)域的共性與個性特征以及優(yōu)劣差距,為我國作物科學(xué)布局、前沿發(fā)展等科技政策的制定提供數(shù)據(jù)支撐。
為識別3所機(jī)構(gòu)在作物科學(xué)重點(diǎn)研究領(lǐng)域的研究主題情況,通過對比分析,本文最終選用內(nèi)容詞分析法以及聚類分析法作為學(xué)科領(lǐng)域研究主題識別的主要方法。此外,當(dāng)前大部分研究都是借助高頻詞來代表機(jī)構(gòu)研究主題。實(shí)際上,高頻詞語義通常較為寬泛,可以在多個機(jī)構(gòu)同時出現(xiàn),但一般情況下科研機(jī)構(gòu)通常會側(cè)重于某些研究方向,同一關(guān)鍵詞對于不同的機(jī)構(gòu)可能側(cè)重點(diǎn)有所不同,在此類情況下,繼續(xù)使用高頻關(guān)鍵詞對研究機(jī)構(gòu)主題進(jìn)行對比,難以發(fā)現(xiàn)機(jī)構(gòu)的特色,也不易區(qū)分機(jī)構(gòu)間研究主題的差異。因此,本文借鑒武漢大學(xué)陳果關(guān)于機(jī)構(gòu)特色關(guān)鍵詞的計算方法[2],在統(tǒng)計文獻(xiàn)關(guān)鍵詞的同時,引入對每個關(guān)鍵詞的機(jī)構(gòu)歸屬度計算,最終輔助確定不同機(jī)構(gòu)的研究主題與研究重點(diǎn)。具體的主題分析如圖1所示。首先需要提取目標(biāo)機(jī)構(gòu)關(guān)鍵詞,對關(guān)鍵詞詞頻進(jìn)行統(tǒng)計分析,并計算出每個關(guān)鍵詞的機(jī)構(gòu)標(biāo)準(zhǔn)歸屬度;然后確定高頻關(guān)鍵詞閾值,選取高頻關(guān)鍵詞構(gòu)建共現(xiàn)矩陣,基于該矩陣進(jìn)行聚類分析,結(jié)合之前計算的關(guān)鍵詞機(jī)構(gòu)標(biāo)準(zhǔn)歸屬度,最終識別出目標(biāo)機(jī)構(gòu)研究主題情況。
2.1 內(nèi)容詞分析法
內(nèi)容詞是文獻(xiàn)中能直接反映文獻(xiàn)主題的一類詞[3]。所謂內(nèi)容詞分析,是指通過對文獻(xiàn)的內(nèi)容詞匯進(jìn)行定量分析,發(fā)現(xiàn)其間關(guān)系,從而找出文獻(xiàn)間的內(nèi)在聯(lián)系,并揭示學(xué)科結(jié)構(gòu)以及演化態(tài)勢。內(nèi)容詞分析法優(yōu)化了引文分析法,在揭示主題相似度方面,其針對性更強(qiáng),精確性更高[4]。
圖1 主題分析流程
共詞分析是內(nèi)容詞分析法中被廣泛運(yùn)用的一種[5]。本文主要將該方法引入作物學(xué)科重點(diǎn)領(lǐng)域的研究主題分析,借助經(jīng)過專業(yè)信息標(biāo)引的文獻(xiàn)數(shù)據(jù),最終完成對目標(biāo)機(jī)構(gòu)研究主題的揭示。在對目標(biāo)機(jī)構(gòu)在作物科學(xué)重點(diǎn)領(lǐng)域的文獻(xiàn)關(guān)鍵詞詞頻統(tǒng)計分析的基礎(chǔ)上,結(jié)合其詞頻的變化規(guī)律,確定高頻詞頻閾值。這里根據(jù)Donohue J C提出的高頻詞低頻詞界分公式(I1指關(guān)鍵詞詞頻為1的個數(shù),T是高頻詞低頻詞的邊界值)進(jìn)行確定,或者根據(jù)經(jīng)驗(yàn)判斷人工選定,從而劃分出高頻關(guān)鍵詞。本文主要選取3所目標(biāo)機(jī)構(gòu)每年發(fā)文中詞頻TOP100的關(guān)鍵詞作為高頻關(guān)鍵詞,然后基于高頻關(guān)鍵詞構(gòu)建關(guān)鍵詞共現(xiàn)矩陣,借助聚類分析方法,將關(guān)鍵詞進(jìn)行劃分歸類,從而揭示學(xué)科領(lǐng)域的研究主題情況。此外,還借助信息可視化技術(shù)[6],更加形象直觀地展現(xiàn)出分析結(jié)果[7],從而便于研究人員理解該學(xué)科領(lǐng)域的主題或者結(jié)構(gòu)情況。
2.2 聚類分析法
聚類分析的目的是將數(shù)據(jù)集合中各個樣本點(diǎn),按照一定的規(guī)則,聚集為不同的類別,使得類與類之間達(dá)到最大間距,類內(nèi)部實(shí)現(xiàn)每個樣本最小化間距,也就是最相似[8]。聚類分析屬于非監(jiān)督學(xué)習(xí)[9],也就是在不進(jìn)行樣本標(biāo)注的前提下僅僅依靠統(tǒng)計學(xué)原理,建立數(shù)學(xué)物理模型,優(yōu)化目標(biāo)函數(shù),通過迭代算法最終達(dá)到尋找最優(yōu)解的目的。正因?yàn)榫垲惙治霾恍枰疤嶂R庫的積累即可達(dá)到最優(yōu)化,所以應(yīng)用范圍很廣,并且根據(jù)聚類的目標(biāo)函數(shù)及優(yōu)化方法的不同,可分為劃分聚類、層次聚類、密度聚類、網(wǎng)格聚類分析等。
本文選定劃分方法中的K-Means算法[10]作為本文關(guān)鍵詞聚類的主要方法。該算法簡潔、快速,面對大數(shù)據(jù)集時,可伸縮性強(qiáng)并且高效;面對密集數(shù)據(jù)時,每個簇形狀是凸型的,不同簇之間的差異性較大,聚類效果更明顯。因此,本文在構(gòu)建關(guān)鍵詞共現(xiàn)矩陣的基礎(chǔ)上,基于K-Means對關(guān)鍵詞共現(xiàn)矩陣進(jìn)行聚類分析,最終識別出3所機(jī)構(gòu)在作物科學(xué)重點(diǎn)研究領(lǐng)域的研究主題情況。
2.3 關(guān)鍵詞機(jī)構(gòu)歸屬度
所謂關(guān)鍵詞的機(jī)構(gòu)歸屬度[2]是指在一定研究范疇的文獻(xiàn)集合中,某一關(guān)鍵詞總詞頻內(nèi)由特定機(jī)構(gòu)所貢獻(xiàn)的比例。機(jī)構(gòu)歸屬度越大,則關(guān)鍵詞越能揭示該機(jī)構(gòu)的研究特色。具體公式如下:
其中I(i,j)是指關(guān)鍵詞i在機(jī)構(gòu)j中的歸屬度,而freq(i,j)指機(jī)構(gòu)j中關(guān)鍵詞i的詞頻,freq(i,all)指在所有機(jī)構(gòu)中關(guān)鍵詞i的詞頻。考慮到不同機(jī)構(gòu)的產(chǎn)出規(guī)模不同,如果使用上述方法計算關(guān)鍵詞歸屬進(jìn)行比較,將有失公平。例如,機(jī)構(gòu)A與機(jī)構(gòu)B,A機(jī)構(gòu)的發(fā)文規(guī)模為100,B為10,關(guān)鍵詞K在A中出現(xiàn)10次,在B中出現(xiàn)5次,則K在A中的歸屬度為IA=10/15>IB=5/15,這一結(jié)果與實(shí)際情況不符,事實(shí)是機(jī)構(gòu)B更專注于關(guān)鍵詞K。因此,為了更為公平地比較不同機(jī)構(gòu)的情況,可以根據(jù)機(jī)構(gòu)的產(chǎn)出規(guī)模,對原先的計算歸屬度進(jìn)行標(biāo)準(zhǔn)化處理,具體公式如下:
其中,doc(all)指所有機(jī)構(gòu)全部發(fā)文量,doc(j)指機(jī)構(gòu)j的發(fā)文量。
SI(i,j)=1時,說明機(jī)構(gòu)對該主題的研究產(chǎn)出與機(jī)構(gòu)自身規(guī)模相應(yīng),即該機(jī)構(gòu)在研究中既沒有側(cè)重于此主題,也沒有削弱此主題。同理,SI(i,j)>1或SI(i,j)<1,則分別表明機(jī)構(gòu)在該主題的研究上有所強(qiáng)化或弱化。
本文利用該方法對目標(biāo)機(jī)構(gòu)所有關(guān)鍵詞的機(jī)構(gòu)標(biāo)準(zhǔn)歸屬度進(jìn)行計算,結(jié)合前期聚類結(jié)果,挑選出每個聚類簇中歸屬度較大的一些特色詞匯,經(jīng)過人工判斷并結(jié)合專家輔助,最終對每一個聚類簇打上主題標(biāo)簽,從而實(shí)現(xiàn)研究主題的識別。
3.1 數(shù)據(jù)采集
數(shù)據(jù)采集的完整性與準(zhǔn)確性是計量分析的重要前提。由于Web of Science引文數(shù)據(jù)庫自身分類體系并不支持將作物學(xué)科相關(guān)數(shù)據(jù)直接提取,因此作物學(xué)科數(shù)據(jù)采集范圍的確定是一個難點(diǎn)。本研究數(shù)據(jù)主要來源于兩個數(shù)據(jù)庫:Web of Science(SCI)數(shù)據(jù)庫與CABI Abstract數(shù)據(jù)庫。Web of Science(SCI)數(shù)據(jù)庫是三個國家級農(nóng)業(yè)科研機(jī)構(gòu)數(shù)據(jù)的主要采集來源,考慮到該數(shù)據(jù)庫沒有作物科學(xué)分類標(biāo)識,而CABI Abstract數(shù)據(jù)庫是世界權(quán)威農(nóng)業(yè)文摘數(shù)據(jù)庫,有全面完善的農(nóng)業(yè)學(xué)科分類體系(CABI Classification System),其中,作物學(xué)分類如表1所示,每篇文獻(xiàn)都經(jīng)過專業(yè)的信息標(biāo)引,主題詞專業(yè)、規(guī)范,所以,選擇CABI Abstract數(shù)據(jù)庫作為作物科學(xué)數(shù)據(jù)采集的輔助來源。
表1 作物科學(xué)分類表
3.2 數(shù)據(jù)處理
前期數(shù)據(jù)處理,主要包括3個階段:(1)數(shù)據(jù)檢索,從Web of Science數(shù)據(jù)庫采集了2008-2014年3所目標(biāo)機(jī)構(gòu)發(fā)文數(shù)據(jù)58 006條(中國農(nóng)業(yè)科學(xué)院8 570條,美國農(nóng)業(yè)研究局25 636條,法國農(nóng)業(yè)科學(xué)院23 800條),以及從CABI Abstract數(shù)據(jù)庫采集了2008-2014年分類代碼為FF類的作物科學(xué)全部發(fā)文數(shù)據(jù)701 746條;(2)數(shù)據(jù)預(yù)處理,對需要比對的字段進(jìn)行前期處理,主要包括WOS號提取、DOI/題名特殊字符處理、構(gòu)建期刊信息唯一標(biāo)識碼等;(3)數(shù)據(jù)匹配,通過WOS號、DOI號、發(fā)文期刊信息(ISSN、卷、期、頁碼)、人工處理等方式,將上述兩個數(shù)據(jù)庫數(shù)據(jù)進(jìn)行匹配,并將CABI學(xué)科分類代碼與敘詞表補(bǔ)充進(jìn)入SCI數(shù)據(jù),抽樣驗(yàn)證該方法匹配度約為79.6%,遠(yuǎn)超50%,對于整體的數(shù)據(jù)具有較高代表性,因此,該方法可行,具體流程如圖2所示。通過該匹配方法,最終獲得3所目標(biāo)機(jī)構(gòu)作物科學(xué)發(fā)文數(shù)據(jù)23 775條(中國農(nóng)業(yè)科學(xué)院3 667條,美國農(nóng)業(yè)研究局12 760條,法國農(nóng)業(yè)科學(xué)院7 348條)。
從作物科學(xué)研究領(lǐng)域分布看,全球作物科學(xué)研究領(lǐng)域分布(見圖3右邊)與三國農(nóng)業(yè)研究機(jī)構(gòu)作物科學(xué)研究領(lǐng)域分布(見圖3左邊)大體相似。作物成分(FF040)、作物遺傳與育種學(xué)(FF020)、作物生產(chǎn)(FF100)、作物蟲害(FF620)、作物病毒、細(xì)菌和真菌疾?。‵F610)以及作物生理生化(FF060)領(lǐng)域發(fā)文總和分別占中國農(nóng)業(yè)科學(xué)院、美國農(nóng)業(yè)研究局和法國農(nóng)業(yè)科學(xué)院作物科學(xué)全部論文量的76.1%、78.9%和72.8%,因此,這6個領(lǐng)域是三大農(nóng)業(yè)研究構(gòu)的主要研究領(lǐng)域。其中,作物遺傳與育種學(xué)(FF020)領(lǐng)域占比最大,既是全球作物科學(xué)也是三大農(nóng)業(yè)研究構(gòu)的重點(diǎn)研究領(lǐng)域。
圖2 前期數(shù)據(jù)處理流程圖
圖3 作物科學(xué)研究領(lǐng)域分布(2008—2014年)
結(jié)合中美法3所機(jī)構(gòu)在作物科學(xué)研究領(lǐng)域分布的結(jié)果,本研究著重對中美法3所農(nóng)業(yè)科研機(jī)構(gòu)在作物遺傳與育種(FF020)領(lǐng)域的主題進(jìn)行對比分析。本文主要借助文獻(xiàn)計量分析工具bibexcel,對前期整理好的目標(biāo)機(jī)構(gòu)在該領(lǐng)域的發(fā)文數(shù)據(jù)進(jìn)行關(guān)鍵詞提取,主要選擇的是經(jīng)過專業(yè)標(biāo)引的敘詞作為本文分析的關(guān)鍵詞,統(tǒng)計目標(biāo)機(jī)構(gòu)在該領(lǐng)域的關(guān)鍵詞詞頻,并計算每個關(guān)鍵詞的機(jī)構(gòu)歸屬度情況?;谠摻Y(jié)果,運(yùn)用信息可視化工具citespace[11-13],對目標(biāo)機(jī)構(gòu)在該領(lǐng)域內(nèi)的高頻關(guān)鍵詞進(jìn)行共詞聚類,結(jié)合之前計算的關(guān)鍵詞機(jī)構(gòu)歸屬度,最終識別出目標(biāo)機(jī)構(gòu)在該研究領(lǐng)域的主題情況,具體結(jié)果見圖4。
中國農(nóng)業(yè)科學(xué)院作物遺傳與育種領(lǐng)域的1 983篇文獻(xiàn),時間按照1年進(jìn)行切分,按詞頻排序,選取每年TOP100的關(guān)鍵詞,去重后獲得131個關(guān)鍵詞;對這131個關(guān)鍵詞進(jìn)行聚類分析,最終聚成6大研究主題,分別為分子育種、非生物脅迫、種質(zhì)資源、作物生長發(fā)育、生物進(jìn)化、基因工程、抗病育種。分子育種的主要物種是水稻、玉米;非生物脅迫研究主要是關(guān)于作物的耐旱性、耐鹽性方面的研究;種質(zhì)資源側(cè)重于地方品種種質(zhì)資源建設(shè);作物生長發(fā)育,主要對象是大豆,對其生長發(fā)育進(jìn)行調(diào)控;生物進(jìn)化基因工程主要是進(jìn)行基因測序;抗病育種,主要研究對象是小麥。
圖4 中美法3所國家級農(nóng)業(yè)科研機(jī)構(gòu)作物遺傳與育種領(lǐng)域主題聚類圖集(2008—2014年)
美國農(nóng)業(yè)研究局作物遺傳與育種領(lǐng)域的4 653篇文獻(xiàn),時間按照1年進(jìn)行切分,按詞頻排序,選取每年TOP100的關(guān)鍵詞,去重后獲得141個關(guān)鍵詞;對這141個關(guān)鍵詞進(jìn)行聚類分析,最終被聚成5大主題,分別為分子生物學(xué)、抗性育種、分子育種、種質(zhì)資源、生物進(jìn)化。分子生物學(xué)的主要對象是玉米、水稻、大麥、番茄,其中,大麥的機(jī)構(gòu)歸屬最高,即對大麥的相關(guān)研究重視度最高;抗性育種,主要對象是土豆、小麥、冬小麥,在土豆抗性研究上表現(xiàn)較為突出;此外,在抗蟲性研究上優(yōu)勢明顯。
法國農(nóng)業(yè)科學(xué)院作物遺傳與育種領(lǐng)域的2 775篇文獻(xiàn),時間按照1年進(jìn)行切分,按詞頻排序,選取每年TOP100的關(guān)鍵詞,去重后獲得165個關(guān)鍵詞;對這165個關(guān)鍵詞進(jìn)行聚類分析,最終被聚成5大研究主題,分別是分子生物學(xué)、分子育種、生物進(jìn)化與基因組學(xué)、抗性育種、遺傳工程。分子生物學(xué),優(yōu)勢在于其技術(shù)在遺傳育種領(lǐng)域的應(yīng)用;分子育種,基本與其他機(jī)構(gòu)類似;生物進(jìn)化與基因組學(xué),主要對象是小麥、水稻;抗性育種,主要對象是葡萄,側(cè)重于對其抗病性的研究;遺傳工程,主要對象是油菜、玉米,側(cè)重于雜交。
總之,如表2所示,在作物遺傳與育種領(lǐng)域的研究主題上,三國農(nóng)業(yè)科研機(jī)構(gòu)既有共性又有各自不同的側(cè)重點(diǎn)。其中,分子育種、抗性育種以及生物進(jìn)化、基因組學(xué)是三個機(jī)構(gòu)的共有研究主題;在非生物脅迫、作物生長發(fā)育研究方面,中國農(nóng)業(yè)科學(xué)院表現(xiàn)突出;美國農(nóng)業(yè)研究局抗性育種方面是強(qiáng)項(xiàng),法國農(nóng)業(yè)科學(xué)院在遺傳工程方面優(yōu)勢明顯。從研究對象上看,中國農(nóng)業(yè)科學(xué)院在水稻、玉米的分子育種方面表現(xiàn)突出,美國農(nóng)業(yè)研究局側(cè)重于土豆、小麥等抗蟲性育種,法國農(nóng)業(yè)科學(xué)院傾向于葡萄的抗性育種。
表2 中美法國家級農(nóng)業(yè)科研機(jī)構(gòu)作物遺傳與育種領(lǐng)域研究主題對比
本文基于文獻(xiàn)計量學(xué)的理論,提出運(yùn)用共詞分析法、聚類分析法并結(jié)合關(guān)鍵詞機(jī)構(gòu)歸屬度計算進(jìn)行學(xué)科領(lǐng)域研究主題識別的方法。在數(shù)據(jù)源選擇上,選用Web of Science與CABI Abstract兩個數(shù)據(jù)庫,將兩者的數(shù)據(jù)進(jìn)行融合,作為主要的數(shù)據(jù)來源,提高了數(shù)據(jù)的整體質(zhì)量,一定程度上避免了由于作者主觀因素所造成的偏差。結(jié)合該方法,最終識別出目標(biāo)機(jī)構(gòu)在作物科學(xué)遺傳與育種領(lǐng)域的研究主題的情況,清晰揭示了我國農(nóng)業(yè)科研機(jī)構(gòu)與國外農(nóng)業(yè)科研機(jī)構(gòu)在作物科學(xué)重點(diǎn)領(lǐng)域的差異和特點(diǎn),為我國農(nóng)業(yè)科研機(jī)構(gòu)作物科學(xué)研究布局提供科學(xué)定量的依據(jù)。
盡管該方法在主題的揭示上準(zhǔn)確性高、科學(xué)性強(qiáng),但其自身仍存在一定的局限性,一定程度上依賴于對文獻(xiàn)數(shù)據(jù)的標(biāo)引,標(biāo)引準(zhǔn)確性越高,最終主題識別的結(jié)果也越好??紤]到當(dāng)前情況下大部分的文獻(xiàn)都未經(jīng)過專業(yè)的文獻(xiàn)標(biāo)引,因此準(zhǔn)確性上將有所降低。此外,本文選擇的詞都是高頻關(guān)鍵詞,而一些低頻關(guān)鍵詞可能也是未來的研究重點(diǎn),在本研究中沒有考慮。最后,本文在對研究主題分析方面,并未考慮時間因素對研究主題的影響情況,而在實(shí)際情況下,學(xué)科領(lǐng)域的研究主題在一定程度上會隨著時間而改變。因此,在后續(xù)研究中,可以考慮引入時間因素,從更全面的角度對研究主題進(jìn)行探測。
[1] 萬建民.中國作物科學(xué)“十一五”的發(fā)展方向[J].作物雜志,2006(1):1-4.
[2] 陳果.基于特色關(guān)鍵詞的科研機(jī)構(gòu)研究主題揭示:方法與實(shí)證[J].圖書情報工作,2014(16):110-115.
[3] Braam R R, Moed H F. Mapping of Science by Combined Co-Citation and Word Analysis: Structure Aspects [J]. Journal of The American Society for Information Science, 1991, 42(4): 233-251.
[4] 葛菲,譚宗穎.基于文獻(xiàn)計量學(xué)的科學(xué)結(jié)構(gòu)及其演化的研究方法述評[J].情報雜志,2012,31(12):34-39,50.
[5] 馮璐,冷伏海.共詞分析方法理論進(jìn)展[J].中國圖書館學(xué)報,2006, 32(2):88-92.
[6] 侯劍華,陳悅,王賢文.基于信息可視化的組織行為領(lǐng)域前沿演進(jìn)分析[J].情報學(xué)報.2009(3):422-430.
[7] 侯海燕,劉則淵,陳悅.當(dāng)代國際科學(xué)學(xué)研究熱點(diǎn)演進(jìn)趨勢知識圖譜[J].科研管理,2006,27(3):90-96.
[8] 鐘偉金,李佳,楊興菊.共詞分析法研究(三):共詞聚類分析法的原理與特點(diǎn)[J].情報雜志,2008(7):118-120.
[9] 王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟(jì)大學(xué)學(xué)報(自然科學(xué)版),2004,32(2): 246-252.
[10] 仇新玲.K-均值聚類算法改進(jìn)及應(yīng)用[D].北京:北京郵電大學(xué),2012.
[11] 李長玲,翟雪梅.基于碩士學(xué)位論文的我國圖書館學(xué)與情報學(xué)研究熱點(diǎn)分析[J].情報科學(xué),2008(7):1056-1060.
[12] 皇甫青紅,華薇娜,劉艷華,等.國際數(shù)字圖書館領(lǐng)域研究熱點(diǎn)及作者團(tuán)體分析:基于共詞分析和社會網(wǎng)絡(luò)分析[J].情報雜志,2013,23(1):118-123.
[13] Chen Chaomei, Kuljis J. The rising landscape: A visual exploration of superstring revolution in physics [J]. Journal of the American Society for information Science and Technology, 2003, 54(5): 435-446.
Method Study on Topic Identification of Main Research Field of Crop Science: A Case Study on National Agricultural Research Institutions of China,USA and France
CHEN Lu,YAN Yun,WANG Ting
(Agricultural Information Institute of CAAS, Beijing 100081, China)
Based on Web of Science SCI citation database and CABI Abstract database as the major data source, this paper takes three national agricultural research institutions in China, USA, France as examples, with the method of content words analysis, cluster analysis, institution relevancy of keywords and so on, emphatically analyzes the research topics of the field of plant breeding and genetics. Results show that in the main research topics, this three institutions presents similar distribution, but each has its own characteristics. In the field of plant breeding and genetics, CAAS pays more attention to basic research, especially the abiotic stress research; ARS favors resistance breeding of crops, such as insect resistance, INRA focuses on genetic engineering research.
Agricultural Research Institution; Crop Science; Content Words Analysis; Thematic Analysis
TP391
10.3772/j.issn.1673-2286.2016.4.005
陳露,女,1991年生,碩士研究生,研究方向:信息資源管理,E-mail:luchen0730@sina.com。
顏蘊(yùn),女,1964年生,研究館員,研究方向:文獻(xiàn)資源建設(shè),通訊作者,E-mail:yanyun@caas.cn。
王婷,女,1968年生,研究館員,研究方向:文獻(xiàn)資源建設(shè)、信息計量學(xué),E-mail:wangting@caas.cn。
2016-04-12)