沈晚笑 蔡劍 滕憶希 王旭波
(1.浙江育英職業(yè)技術(shù)學(xué)院 浙江 杭州 310012;2.浙江省疾病預(yù)防控制中心 浙江 杭州 310051;3.浙江大學(xué)公共衛(wèi)生學(xué)院 浙江 杭州 310058;4.麗水學(xué)院 浙江 麗水 323000)
國(guó)家自然科學(xué)基金(以下簡(jiǎn)稱“NSFC”)自設(shè)立以來(lái),因其公平、公正的評(píng)審程序、深遠(yuǎn)的影響力和覆蓋全面的資助范圍,受到科研工作者的廣泛認(rèn)可。NSFC在推動(dòng)國(guó)家基礎(chǔ)研究發(fā)展、促進(jìn)學(xué)科建設(shè)和培養(yǎng)科技創(chuàng)新人才等方面也取得了巨大的成就。然而,由于申請(qǐng)數(shù)量的持續(xù)增加,競(jìng)爭(zhēng)日益激烈。項(xiàng)目課題名稱是項(xiàng)目的核心,能直觀的展現(xiàn)出所研究的主要內(nèi)容和方向,因此本文對(duì)2014年至2016年立項(xiàng)項(xiàng)目進(jìn)行詞云分析,力求從一個(gè)全新的角度,形象、客觀地揭示自然科學(xué)基金的研究熱點(diǎn)和趨勢(shì),為更好總結(jié)資助結(jié)構(gòu)、提升科研人員項(xiàng)目申請(qǐng)中標(biāo)率提供參考。
研究數(shù)據(jù)來(lái)源于互聯(lián)網(wǎng)檢索出的2224個(gè)2014-2016年的NSFC立項(xiàng)項(xiàng)目和1305個(gè)2015年浙江省自然科學(xué)基金立項(xiàng)項(xiàng)目。
本文采用R軟件對(duì)2014-2016年NSFC立項(xiàng)項(xiàng)目課題進(jìn)行詞云分析,以txt的格式導(dǎo)入每年的立項(xiàng)項(xiàng)目,利用R軟件的4個(gè)包RColorBrewer、wordcloud、rJava、Rwordseg分析立項(xiàng)課題的詞頻,并進(jìn)行可視化操作,比較不同年份詞云圖中的關(guān)鍵詞以分析NSFC立項(xiàng)項(xiàng)目研究熱點(diǎn)及演變趨勢(shì)。
檢索到2014年NSFC立項(xiàng)項(xiàng)目212個(gè),對(duì)立項(xiàng)項(xiàng)目課題進(jìn)行詞云分析,拆分為872個(gè)詞匯,其中“研究”出現(xiàn)頻率最高,共出現(xiàn)160次,頻次為8.5%,遠(yuǎn)高于位列第二的“機(jī)制”2.2%。刪除“研究”進(jìn)一步對(duì)立項(xiàng)課題熱點(diǎn)詞進(jìn)行分析,通過(guò)詞云圖的方式對(duì)排名靠前的高頻詞進(jìn)行呈現(xiàn),結(jié)果顯示,2014年NSFC排名前十的熱點(diǎn)詞為“機(jī)制”、“基于”、“及其”、“作用”、“機(jī)理”、“方法”、“技術(shù)”、“應(yīng)用”、“細(xì)胞”和“控制”。所分析的2014年NSFC項(xiàng)目中出現(xiàn)頻次小于0.15%的詞語(yǔ)共742個(gè),有“喚醒”、“天線”、“出行”等。
2.2.1 2015年NSFC立項(xiàng)項(xiàng)目
檢索到2015年NSFC立項(xiàng)項(xiàng)目550個(gè),對(duì)立項(xiàng)項(xiàng)目課題進(jìn)行詞云分析,拆分為1725個(gè)詞匯,其中,出現(xiàn)最多的詞是“研究”,出現(xiàn)頻次為7.9%,其次是“機(jī)制”,出現(xiàn)頻次3.1%,“基于”出現(xiàn)頻次1.8%,如表1所示。刪除“研究”后通過(guò)詞云圖進(jìn)一步對(duì)立項(xiàng)課題熱點(diǎn)詞進(jìn)行分析,2015年排名前十的的熱點(diǎn)詞為“機(jī)制”、“基于”、“作用”、“機(jī)理”、“及其”、“細(xì)胞”、“調(diào)控”、“分子”、“技術(shù)”和“功能”。在2015年NSFC立項(xiàng)項(xiàng)目中,僅出現(xiàn)一次的詞語(yǔ)為1138個(gè),占總詞數(shù)23.02%,其中有157個(gè)詞在2014年NSFC立項(xiàng)課題中出現(xiàn),包括“遙感”、“木質(zhì)素”、“瀝青”等。
2.2.2 2015年NSFC生命科學(xué)部立項(xiàng)項(xiàng)目
對(duì)檢索到的2015年自然科學(xué)基金立項(xiàng)題目進(jìn)行深入分析,其中2015年NSFC生命科學(xué)部立項(xiàng)項(xiàng)目共108項(xiàng),占2015年NSFC立項(xiàng)項(xiàng)目的20%。詞云分析結(jié)果顯示可拆分為447個(gè)詞語(yǔ)?!把芯俊背霈F(xiàn)頻率依然最高,出現(xiàn)頻次為3%,其次是“機(jī)制”、“調(diào)控”、“細(xì)胞”,出現(xiàn)頻率均超1.5%。剔除“研究”后,對(duì)2015年NSFC生命科學(xué)部立項(xiàng)課題進(jìn)一步分析發(fā)現(xiàn),2015年NSFC生命科學(xué)學(xué)部排名前十的熱點(diǎn)詞分別為“機(jī)制”、“調(diào)控”、“細(xì)胞”、“作用”、“信號(hào)”、“分子”、“植物”、“免疫”、“基因”、“機(jī)理”。在2015年NSFC生命科學(xué)學(xué)部立項(xiàng)課題中,僅出現(xiàn)一次的詞語(yǔ)共310個(gè),占2015年NSFC所有課題出現(xiàn)一次的詞語(yǔ)27.24%。在這些詞中,除了生命科學(xué)相關(guān)詞匯外也出現(xiàn)了其他學(xué)科詞匯,例如“互聯(lián)網(wǎng)”、“動(dòng)力學(xué)”等。
2.2.3 2015年浙江省自然科學(xué)基金立項(xiàng)項(xiàng)目
檢索獲得1305個(gè)2015年浙江省自然科學(xué)立項(xiàng)項(xiàng)目,對(duì)立項(xiàng)項(xiàng)目課題進(jìn)行詞云分析,可拆分為2871個(gè)詞匯,其中,出現(xiàn)最多的詞是“研究”,出現(xiàn)頻次為8%,其次是“機(jī)制”出現(xiàn)頻次3%,“基于”2%。剔除“研究”后通過(guò)詞云圖進(jìn)一步對(duì)立項(xiàng)課題熱點(diǎn)詞進(jìn)行分析可發(fā)現(xiàn),2015年浙江省自然科學(xué)基金立項(xiàng)項(xiàng)目熱點(diǎn)詞語(yǔ)與2015年NSFC立項(xiàng)課題熱點(diǎn)詞完全相同,2015年排名前十的浙江省自然科學(xué)基金熱點(diǎn)詞為“機(jī)制”、“基于”、“作用”、“調(diào)控”、“及其”、“機(jī)理”“細(xì)胞”、“分子”、“技術(shù)”和“功能”。除熱點(diǎn)詞外,“電子束”、“大功率”、“程序”等也出現(xiàn)在浙江省自然科學(xué)立項(xiàng)項(xiàng)目中。
2016年NSFC立項(xiàng)項(xiàng)目1462個(gè),對(duì)立項(xiàng)項(xiàng)目課題進(jìn)行詞云分析,拆分為2247個(gè)詞匯,“研究”出現(xiàn)頻次居于榜首,為7.58%,其次是“基于”3.18%、“機(jī)制”2.02%。提出“研究”后通過(guò)詞云圖進(jìn)一步對(duì)立項(xiàng)課題熱點(diǎn)詞進(jìn)行分析發(fā)現(xiàn),2015年排名前十的NSFC的熱點(diǎn)詞為“基于”、“機(jī)制”、“影響”、“視角”、“行為”、“企業(yè)”、“理論”、“模型”、“風(fēng)險(xiǎn)”和“網(wǎng)絡(luò)”。與前兩年相比,2016年國(guó)家更注重商業(yè)、互聯(lián)網(wǎng)與金融方向。除熱點(diǎn)詞之外,“農(nóng)戶”、“農(nóng)村”等有關(guān)三農(nóng)問(wèn)題的詞屢屢出現(xiàn)。
國(guó)家自然科學(xué)基金是支持自然科學(xué)發(fā)展而設(shè)立的基金項(xiàng)目,申請(qǐng)和執(zhí)行國(guó)家自然科學(xué)基金項(xiàng)目,已經(jīng)成為科研人員學(xué)術(shù)生涯中重要的組成部分,但是隨著申請(qǐng)數(shù)量的持續(xù)增加,競(jìng)爭(zhēng)也日益激烈。因此提高NSFC中標(biāo)率是每一位科研工作者申請(qǐng)前應(yīng)該思考的問(wèn)題,而申請(qǐng)項(xiàng)目的研究?jī)?nèi)容、創(chuàng)新性、科學(xué)價(jià)值是能否申請(qǐng)成功的重要依據(jù)之一[1]。馮莉等提出通過(guò)改善申請(qǐng)書的質(zhì)量,能提高NSFC的中標(biāo)率[2]。目前針對(duì)改善項(xiàng)目創(chuàng)新性和科學(xué)價(jià)值的研究和類似分析報(bào)道較少見(jiàn)。本文通過(guò)對(duì)2014-2016年NSFC立項(xiàng)項(xiàng)目進(jìn)行詞云分析,形象揭示自然科學(xué)基金的研究熱點(diǎn)和NSFC的資助結(jié)構(gòu),為廣大科研人員申請(qǐng)NSFC提供參考。如根據(jù)本研究結(jié)果,結(jié)合高頻詞匯分析后,可為課題研究的思路擴(kuò)展有所幫助。比如, 2014年中標(biāo)的典型題目可以是《基于新型納米機(jī)器人驅(qū)動(dòng)技術(shù)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)調(diào)控機(jī)制研究》(虛構(gòu)),2015年中標(biāo)的典型標(biāo)題可為《基于空間網(wǎng)絡(luò)控制系統(tǒng)特性基礎(chǔ)上的復(fù)合式量子傳感器對(duì)恢復(fù)城市生物污染的作用機(jī)理研究》(虛構(gòu))和2016年的典型標(biāo)題《基于異質(zhì)性視角的動(dòng)態(tài)交互管理對(duì)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)演化風(fēng)險(xiǎn)評(píng)估》(虛構(gòu))。
根據(jù)2014至2016年NSFC立項(xiàng)課題,對(duì)比所有詞匯的重復(fù)程度可發(fā)現(xiàn),每年的立項(xiàng)項(xiàng)目存在較強(qiáng)的獨(dú)立性,主題之間的關(guān)聯(lián)度較低,研究主題豐富?!白饔谩?、“機(jī)制”、“機(jī)理”等詞在中標(biāo)項(xiàng)目的持續(xù)出現(xiàn),提示NSFC仍然高度支持基礎(chǔ)研究的發(fā)展,在建立完善規(guī)范的科學(xué)體系上不斷努力[3]。由此推斷,未來(lái)基礎(chǔ)科學(xué)研究仍然會(huì)是NSFC所大力支持的方向。
研究表明2006-2009年生命科學(xué)部的資助比例占總資助率的一半以上[4],同時(shí)“細(xì)胞”、“免疫”等生命科學(xué)有關(guān)詞匯出現(xiàn)頻繁,且2016年與三農(nóng)有關(guān)的詞匯出現(xiàn)頻次大幅度上升,這與同期黨的十八和五中全會(huì)提出的綠色發(fā)展戰(zhàn)略不無(wú)關(guān)系。近年來(lái),國(guó)家自然科學(xué)基金委提出將重點(diǎn)支持18個(gè)相關(guān)“藍(lán)綠”學(xué)科發(fā)展,這意味著NSFC將會(huì)在未來(lái)傾斜支持有關(guān)“藍(lán)綠”學(xué)科項(xiàng)目[5]。由此提示分析和研究黨和國(guó)家的發(fā)展戰(zhàn)略,對(duì)自然科學(xué)基金中標(biāo)具有積極意義。
與2014年基礎(chǔ)研究熱潮相比,2016年出現(xiàn)了“企業(yè)”、“視角”等熱點(diǎn)詞匯,且冷門詞匯每年重復(fù)出現(xiàn),都提示新興學(xué)科和交叉學(xué)科逐漸成為NSFC推動(dòng)方向。在2018國(guó)家自然科學(xué)基金申請(qǐng)代碼中,新增了人工智能和交叉學(xué)科中的信息科學(xué),這也意味著從研究領(lǐng)域與學(xué)科劃分的角度來(lái)看,國(guó)家自然科學(xué)基金委在響應(yīng)國(guó)家科技發(fā)展戰(zhàn)略[5]上有了更明顯的側(cè)重點(diǎn)。
2015年浙江省自然科學(xué)基金立項(xiàng)項(xiàng)目熱點(diǎn)詞與2015年NSFC熱點(diǎn)詞完全一致,說(shuō)明浙江省自然科學(xué)基金的資助體系與NSFC相匹配,與國(guó)家自然科學(xué)層面的項(xiàng)目銜接平衡。除了大量生命科學(xué)項(xiàng)目之外,“電子束”、“大功率”等詞在浙江省自然科學(xué)基金中頻繁出現(xiàn),卻在NSFC中出現(xiàn)頻率較低,體現(xiàn)浙江采取了差異化發(fā)展戰(zhàn)略,做強(qiáng)優(yōu)勢(shì)學(xué)科的同時(shí),加大浙江特色產(chǎn)業(yè)有關(guān)學(xué)科扶持力度,來(lái)快速提升浙江基礎(chǔ)研究的綜合實(shí)力。因此高端工業(yè)自動(dòng)化、物聯(lián)網(wǎng)、云計(jì)算與大數(shù)據(jù)、智慧城市、智慧海洋、電子商務(wù)等“兩化”深度融合領(lǐng)域的基礎(chǔ)科學(xué)研究在浙江省自然科學(xué)基金申請(qǐng)中標(biāo)率上有更大可能。由于本文數(shù)據(jù)來(lái)源為互聯(lián)網(wǎng)查詢檢索所得,數(shù)據(jù)完整性有待商榷。
本文研究的方法是用是基于R軟件的詞云分析[6,],通過(guò)生成的詞頻和詞云圖對(duì)研究目標(biāo)進(jìn)行分析和形象展示,具有直觀性、全局性和實(shí)用性等優(yōu)點(diǎn),該分析方法可用詞語(yǔ)字體大小形象直觀地反映出NSFC立項(xiàng)課題熱點(diǎn)詞,為科研工作者開(kāi)展文本信息挖掘和類似的研究提供參考。除詞云分析外,孫偉等使用Cite Space軟件進(jìn)行關(guān)鍵詞共現(xiàn)統(tǒng)計(jì),繪制知識(shí)圖譜,通過(guò)節(jié)點(diǎn)大小反映關(guān)鍵詞的出現(xiàn)的頻率[8],郭婷等利用EXCEL分析文獻(xiàn)集的外部特征,利用SPSS對(duì)關(guān)鍵詞矩陣進(jìn)行因子分析、聚類分析和多維尺度分析,也是文本挖掘、信息可視化的研究方式之一。相比之下,EXCEL實(shí)用性較高,受眾群體廣泛,SPSS界面友好、統(tǒng)計(jì)功能強(qiáng)大 。Cite Space具有良好的點(diǎn)選擇縮減功能,圖譜顯示方式多樣 ,而R語(yǔ)言的優(yōu)勢(shì)是免費(fèi)、開(kāi)放源代碼的平臺(tái),無(wú)需編譯過(guò)程,程序運(yùn)行簡(jiǎn)單。
本研究表明自然科學(xué)基金的資助結(jié)構(gòu)保持一定的穩(wěn)定態(tài)勢(shì),探索性基礎(chǔ)性研究雖然風(fēng)險(xiǎn)更大,但更受NSFC青睞,中標(biāo)率較高。新興學(xué)科和交叉學(xué)科反映學(xué)科發(fā)展規(guī)律和創(chuàng)新潛力,近幾年出現(xiàn)率有上漲傾向。與此同時(shí),關(guān)注國(guó)家政策指向并與國(guó)家發(fā)展戰(zhàn)略目標(biāo)緊密相連例的研究,能提升中標(biāo)率。