国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科研論文基金項目“一文多注”和不實標注研究

2020-04-06 03:25:19葉文豪洪磊唐夢嘉張逸勤
圖書與情報 2020年6期

葉文豪 洪磊 唐夢嘉 張逸勤

摘? ?要:學術(shù)期刊數(shù)據(jù)庫的建設(shè)為科研論文標注基金的深入研究提供了條件。文章以國家社科基金項目為例,從CNKI數(shù)據(jù)庫獲取了基金項目的論文成果,對這些論文的基金標注情況進行了統(tǒng)計分析。采用Word2vec模型計算了論文與標注基金研究內(nèi)容的相關(guān)性,并結(jié)合人工,識別出基金不實標注的現(xiàn)象。結(jié)果表明,論文一文多注的情況較為常見;在基金不實標注的數(shù)據(jù)中,重大項目和重點項目作為高學術(shù)影響力的項目被不實標注的比例較高。

關(guān)鍵詞:科研論文;國家社科基金;一文多注;基金不實標注

Abstract The construction of the academic journal database provides possibility for in-depth research on the labeling of fund projects in scientific papers. In this research, the National Social Science Fund projects and the papers which labeled these fund projects were obtained from the CNKI database, and a statistical analysis was carried out on the fund labeling of these papers. Word2vec model was used to calculate the similarity of the research content between the paper and its labeled funds. Two human annotate teams were organized to make further identification of the false labeling of funds. The results show that it is common for papers to label multiple funds. Among the false labeling examples, the proportion of major projects and key projects are considerably higher.

Key words scientific paper; National Social Science Fund Projects; multiple labeling; false labeling

1? ?引言

自我國科學基金制度建立以來,國家不斷完善資助體系,逐年提高資助經(jīng)費,大力資助高等院校和科研機構(gòu)科研工作者開展研究。目前已形成包括國家自然科學基金、國家哲學社科基金及其他省部級基金資助的基金資助體系,對學術(shù)理論創(chuàng)新起著支撐性作用,對推動經(jīng)濟、社會發(fā)展的實踐應(yīng)用也具有指導意義?;鹳Y助課題通常代表了某學科領(lǐng)域內(nèi)的研究熱點或研究前沿,基金項目立項需要經(jīng)過較為嚴格的程序,要求產(chǎn)出較高水準的論著。因此,各類基金成果論文憑借自身較高的學術(shù)價值和較大的影響力贏得學術(shù)期刊的青睞。2008年《中文核心期刊要目總覽》將“基金論文比”引入期刊評價中。然而一旦被作為評價指標,就會存在被人為操縱的情況。許多期刊紛紛為基金論文開辟綠色通道,以吸引基金論文投稿。

“基金論文比”這項指標是考察期刊所刊載論文得到基金項目資助的比例,許多期刊評價體系將其作為考察期刊學術(shù)影響的重要指標之一。另一方面,各基金項目管理機構(gòu)要求項目成果必須標注基金資助信息。所以,學術(shù)期刊重視基金資助論文,有的期刊甚至歧視非基金資助論文。同樣,基金項目承擔者為了完成項目,只要完成了論文,不論是否與項目主題關(guān)聯(lián),均標注上自己承擔的項目,有的甚至把同事間的非相關(guān)基金項目都標注上,使得論文基金標注的真實性難以考證,由此帶來了論文基金項目不實標注的不正之風。一些學者為提高論文錄用幾率,在其論文成果中不實標注基金項目。韓磊和邱源[1]在研究中發(fā)現(xiàn)除了論文作者主動的基金不實標注行為,還存在期刊為了自身評比的需要,暗示作者為論文用其他不相關(guān)基金項目掛名的行為?;痦椖坎粚崢俗乐赜绊懥税l(fā)表論文的真實性與公平性,極度不利于學術(shù)的發(fā)展。

論文是基金項目的主要成果形式,因此論文產(chǎn)出情況是量化評價基金項目實施情況的主要指標之一??茖W項目成果中存在填報不實成果的做法(如用其他論文或他人論文充數(shù)、隨意拔高研究成果水平或成果多頭交賬的情況)。成果多頭交賬可能導致科學基金重復資助問題,不利于科學基金發(fā)展規(guī)劃總體布局和目標實現(xiàn)。

針對存在問題,本文以國家社科基金項目為例,結(jié)合計算基金標題與資助論文題錄信息的文本相似度與人工判別方法,判斷論文與其標注的基金在研究內(nèi)容上是否大致相同。識別科研論文基金標注過程中出現(xiàn)的問題,鑒別學術(shù)不端行為,旨在讓我國科研環(huán)境更加公平公正;使我國科學基金的投向更趨合理,取得更好的實際使用效益,為我國未來社會和經(jīng)濟發(fā)展提供動力。

2? ?相關(guān)文獻

在國家對科研投入不斷增長的背景下,設(shè)立不同層次和類型的科學研究基金已成為國家推動科技事業(yè)發(fā)展的重要方式。科技論文是科研基金項目重要的研究成果產(chǎn)出,而論文科學基金的標注可以反映科技投入、分配與產(chǎn)出關(guān)系等重要信息[2]?;鹫撐拇碇芯款I(lǐng)域發(fā)展的動向,同時也反映學科的科技基金資助情況。因此,科學基金標注在一定程度上可以體現(xiàn)論文的學術(shù)水平。針對以科學基金評價學者、以科學基金表現(xiàn)論文水平的現(xiàn)象,眾多學者從標注不端行為產(chǎn)生的原因和解決方法兩方面對科學基金規(guī)范化標注進行了詳細研究。

2.1? ? 科學基金項目標注問題產(chǎn)生的原因

針對科學基金項目標注問題產(chǎn)生的原因,學者從編輯部、論文作者和科學基金三個層面進行探索。在編輯部層面,期刊質(zhì)量評價體系中強調(diào)發(fā)表基金項目尤其是國家級基金項目論文,“基金論文比”這一重要指標引導了編輯在初審時對基金資助項目稿件的盲目追求[3];同時編輯部對基金項目信息的審核不嚴也導致虛假標注的現(xiàn)象層出不窮,如編造、掛靠、牽強等情況[4]。在論文作者層面,科技論文作者數(shù)量多、所屬科研單位復雜等署名與基金存在的問題無形中使需要標注的基金數(shù)目增多,將科學基金項目標注復雜化,容易出現(xiàn)署名學術(shù)不端、問題推諉、重復資助等情況[5];部分作者自律意識淡薄,還存在編造虛假基金項目、掛名發(fā)表等不實標注的行為來提高科研論文的分量、增加錄取的可能性[6]。在基金層面,由于基金資助存在馬太效應(yīng),科研項目的高度集中帶來了科研壟斷的隱患,造成了論文中科研基金扎堆的現(xiàn)象[7]。同一項目接受不同科研基金的重復贊助也導致科技資源分配不公、利用效率低下,嚴重影響了科研人員工作積極性[8]。

2.2? ? 解決科學基金標注問題的方法

在上述研究的基礎(chǔ)上,學者從數(shù)據(jù)庫的完善、標注規(guī)范思想的建立和人工智能方法三個層面來探索解決科學基金標注問題的方法。在數(shù)據(jù)庫層面,眾多數(shù)據(jù)庫的構(gòu)建和完善促進了科技論文的數(shù)字化,增加了論文發(fā)表的透明度,使作者對科學基金標注更加謹慎。近年來,Web of Science哲社核心數(shù)據(jù)庫[9]、超星數(shù)據(jù)[10]、CNKI數(shù)據(jù)庫[11]、CSSCI數(shù)據(jù)庫[12]的不斷更新和完善為學者對科技論文相關(guān)信息進行深度挖掘、歸納和分析提供便利,使得學者對科學基金標注問題的深入研究有了新的思路。苗亞靜[13]提出通過加強各類基金資助機構(gòu)之間的信息共享來強化對科技論文和科學基金標注的審核。在標注規(guī)范思想層面,陳沙沙和劉春平[14]通過規(guī)范化科學基金項目著錄標準,提高了標注的科學性。白雪娜等[15]通過人工查詢核實了209個國家基金項目的178篇論文,發(fā)現(xiàn)同一項目在多篇論文中隨意掛靠的現(xiàn)象較為普遍,提出了編輯人員應(yīng)嚴格審查項目、提高對基金項目編號的甄別能力等要求。同時在人工智能方法層面,隨著自然語言處理技術(shù)的不斷發(fā)展,蘇新寧和王東波[16]提出通過數(shù)據(jù)驅(qū)動探究學術(shù)研究的規(guī)律,運用人工智能方法對科技論文進行信息抽取、深入而精確地挖掘?qū)W術(shù)文獻的多維度信息。葉文豪等[17]通過計算余弦相似度發(fā)現(xiàn)存在科學基金與論文主題不符的現(xiàn)象,基于孿生網(wǎng)絡(luò)模型構(gòu)建了科學基金與論文相關(guān)性判別模型來抑制基金不實標注行為。

3? ?數(shù)據(jù)來源與分析

3.1? ? 數(shù)據(jù)源簡介

由于基金在文章中沒有統(tǒng)一的著錄標準,基金字段存在多種不同格式,大多數(shù)沒有標注出“基金類型‘基金名稱[基金號]”的完整信息。在數(shù)據(jù)抓取過程中為保證檢索結(jié)果可靠性,本文以基金批準號作為唯一檢索條件進行基金成果論文檢索。首先,通過編寫網(wǎng)絡(luò)爬蟲抓取了“國家社科基金項目數(shù)據(jù)庫”中自2014年開始,截至到2018年的23個學科的社科基金重大項目、重點項目、一般項目和青年項目,共計20325項?;痦椖啃畔⒅饕椖颗鷾侍?、項目負責人、項目類別、學科分類、項目名稱、立項與結(jié)項時間等。利用獲取到的基金項目批準號在《中國學術(shù)期刊(網(wǎng)絡(luò)版)》(中國學術(shù)期刊全文數(shù)據(jù)庫)中,通過“支持基金”字段,選擇精確匹配檢索模式進行論文信息檢索,獲取由社科基金項目資助的論文的題錄信息。時間跨度為 2014年至 2019 年 7月。對檢索結(jié)果中被多個基金重復資助的論文去重后得到文獻80762篇,對應(yīng)的資助基金項目共14894項。本文統(tǒng)計了2014-2018年23個學科的國家社科基金項目立項數(shù)和已發(fā)表論文成果的項目數(shù)量(見圖1),匯總了各個學科國家社科基金資助的論文成果數(shù)量(見表1)。

3.2? ? 論文標注基金項目現(xiàn)狀分析

中國知網(wǎng)的學術(shù)期刊全文數(shù)據(jù)庫中提供了論文的基金信息,為研究論文的基金不實標注情況提供了條件。首先歸納不同類型基金項目批準號的編碼規(guī)范。如以國家社科基金為例:國家社科基金項目批準號的規(guī)范為:“兩位數(shù)字+一位項目類型代碼+兩位學科代碼+三位數(shù)字序號”。前兩位數(shù)字表示項目立項年份,項目類型代碼為[ A, B, C, X, F, W, K ],分別代表重點項目、一般項目、青年項目、西部項目、后期資助項目、中華學術(shù)外譯項目和成果文庫。此外重大項目采用“ZD”代碼表示(**ZDA***),存在部分沒標明學科的重點項目采用“ZD”代碼替代學科類別代碼(**AZD***)。

在對數(shù)據(jù)的觀察過程中發(fā)現(xiàn),江蘇省社科基金項目批準號采用與國家社科基金項目批準號一致的學科代碼,項目批準號也采用“兩位數(shù)字+三位字母+三位數(shù)字”的編碼規(guī)范,用三位字母中的前兩位表示學科代碼以區(qū)分國家社科基金項目批準號。并且部分地方社科基金項目批準號與國家社科基金項目批準號存在沖突的情況,包括湖南省社科基金項目,廣西哲學社會科學規(guī)劃項目,山東省社科基金項目,新疆維吾爾自治區(qū)社科項目,遼寧省社科規(guī)劃基金項目,西藏自治區(qū)哲學社會科學,河南省哲學社會科學規(guī)劃項目等。由于目前各大期刊數(shù)據(jù)庫建設(shè)日益健全,項目批準號沖突的情況會導致科研人員在檢索論文或進行學術(shù)評價時發(fā)生誤檢,影響了檢索效果。

然后采用正則表達式從獲取的成果論文的基金字段中抽取出基金項目批準號,基金項目批準號抽取過程如下:

步驟1:去除中文及標點,僅保留數(shù)字、字母與部分符號;

步驟2:去除連續(xù)字母和5位以下連續(xù)數(shù)字,得到所有類型的項目批準號,并統(tǒng)計數(shù)量;

步驟3:獲取“兩位數(shù)字+三位字母+三位數(shù)字”格式的項目批準號;

步驟4:根據(jù)項目類型代碼和學科代碼刪除江蘇省社科基金,并統(tǒng)計剩余項目批準號數(shù)量;

步驟5:統(tǒng)計基金詳情中“國家社*|國家哲學|全國哲學”等Patten的出現(xiàn)次數(shù),與步驟4統(tǒng)計的項目批準號數(shù)量進行校對;

步驟6:步驟5中數(shù)量不一致的條目,通過人工校對的方式篩選出國家社科基金項目批準號。

對論文標注基金項目的數(shù)量進行統(tǒng)計(見表2),可以看到經(jīng)濟與管理科學的論文成果傾向于標注多個基金,管理學標注一個基金的論文占該學科全部論文成果的比重為38%,應(yīng)用經(jīng)濟與統(tǒng)計學占比均為39%,理論經(jīng)濟占比42%。其中應(yīng)用經(jīng)濟與管理學標注6個以上基金項目的論文數(shù)量也達到200篇以上。

國家社科基金的“一文多注”現(xiàn)象所占比例相較所有基金類型有大幅度降低,因為國家社科基金項目代表著各學科最新興的研究方向,基金項目的立項需要經(jīng)過嚴格的專家評審,即使在同一學科所申請的項目,其兩兩之間的研究主題差別也較大,因此部分學術(shù)期刊在投稿要求中明確表示不允許同時標注兩個及以上國家社科基金項目號。在統(tǒng)計的標準國家社科基金論文中仍有6129篇論文(去除學科之間重復項)標注了兩個以上國家社科基金,標注基金項目數(shù)量最多達到5項。針對這些“一文多注”的論文,筆者統(tǒng)計了所標注國家社科基金之間立項時間的最大年份間隔(見圖2)。其中標注的基金間隔一年的最多,有2130篇;其次為間隔兩年,有1374篇;標注同一年立項的國家社科基金項目的論文數(shù)量排第三,為1113篇。標注基金批準號“98ASH001”的4篇論文是年份間隔最大的論文,通過查詢基金字段的詳情得出,其原因是該項目為國家社科基金重大滾動項目。

筆者采用Vosviewer軟件將國家社科基金項目共同資助情況以關(guān)系圖的形式呈現(xiàn)出來(見圖3),圖中用節(jié)點大小表示各個學科的共同資助數(shù)量(包括同一學科項目之間共同資助),不同學科之間的共同資助數(shù)量用邊的粗細表征,節(jié)點采用不同顏色表明學科之間的聚類情況。由圖可以看出各個學科根據(jù)共同資助的情況主要聚成4個類,應(yīng)用經(jīng)濟、管理學和理論經(jīng)濟項目共同資助的情況最為常見,同一學科內(nèi)的項目共同資助數(shù)量分別達到390次、281次和155次,應(yīng)用經(jīng)濟與理論經(jīng)濟、管理學之間的共同資助數(shù)量為203次和200次。此外,語言學、社會學、馬列·科社、體育學等學科,學科內(nèi)共同資助數(shù)量較多,從總體上看,學科內(nèi)的共同資助比學科間的共同資助多。

使用熱力圖呈現(xiàn)出不同類型基金項目之間共同資助一篇論文的情況(見圖4),可以發(fā)現(xiàn),學者發(fā)表論文時傾向于將重大項目與其他項目共同標注,這可能是因為重大項目研究內(nèi)容是各學科的基礎(chǔ),意義重大,影響深遠。同時,與其他類型項目相比,重大項目規(guī)模更大,涵蓋的研究內(nèi)容更廣,容易與其他類型項目研究內(nèi)容產(chǎn)生重疊。

4? ?研究論文與標注的基金情況分析

為探究研究論文與其標注的基金項目研究內(nèi)容之間的相關(guān)性,判別科研論文發(fā)表過程中是否存在基金不實標注的問題,筆者探索了文本相似度方法在本研究中的應(yīng)用。根據(jù)抓取的數(shù)據(jù)源,基金項目的大致研究內(nèi)容只能通過項目標題呈現(xiàn),論文成果的研究內(nèi)容可以通過標題、摘要和關(guān)鍵詞體現(xiàn)。

4.1? ? word2vec 模型

Word2vec[18]是Mikolov于2013年提出的一種神經(jīng)語言模型,使用Skip-Gram模型或Continuous Bag of Words(CBOW)模型預(yù)測上下文和中心詞是否共現(xiàn),能夠充分捕獲詞的上下文語義、語法信息。傳統(tǒng)的詞袋模型假設(shè)特征詞兩兩之間獨立,在面對數(shù)據(jù)稀疏問題時不能很好地判定句子之間語義相關(guān)性。Word2vec模型將詞匯表示為定長分布式向量的形式,詞匯之間的語義相似度可以通過向量之間的距離或夾角余弦值衡量。本文以騰訊AI Lab提供的開源中文詞向量作為預(yù)訓練詞向量[19],將獲取到的國家社科基金項目標題與受資助論文標題、摘要、關(guān)鍵詞等題錄信息作為訓練語料,采用結(jié)巴分詞工具進行分詞,并使用Skip-Gram模型將本文獲取的語料在騰訊詞向量的基礎(chǔ)上進行fine-tune訓練,得到進一步研究的領(lǐng)域詞向量。

本文進一步將基金項目標題與受資助論文標題、摘要、關(guān)鍵詞等信息通過詞向量表示為分布式向量形式,利用余弦相似度公式計算向量之間的相似度,得到了受資助論文與社科基金之間的相關(guān)性,并展示了不同相似度區(qū)間中基金標題與論文標題的相關(guān)性示例(見表3)。

從表3各個相似度區(qū)間的示例可以看出,分布式詞向量對語義的理解較為充分,從第5行的結(jié)果來看,分布式詞向量規(guī)避了傳統(tǒng)詞袋模型的獨立性假設(shè),能夠可靠地表達句子之間的語義相似度。從第2行中的論文標題來看,這篇論文屬于自然科學研究范疇,與本文的數(shù)據(jù)來源——國家社科基金資助的社會科學論文成果差異明顯。為確保數(shù)據(jù)獲取過程中不存在錯誤,筆者追溯原始數(shù)據(jù)發(fā)現(xiàn)這篇論文的基金字段注明“國家自然科學基金資助項目(17BSH044)”。然而該項目批準號與國家自然科學基金編碼格式不相符,且筆者通過該項目批準號在“國家自然科學基金管理信息系統(tǒng)”中檢索不到項目信息,初步判定該論文基金項目標注錯誤,致使本研究在數(shù)據(jù)抓取過程中,根據(jù)項目批準號匹配到了2017年社會學國家社科基金一般項目“建立城鄉(xiāng)統(tǒng)一的社會養(yǎng)老保障制度體系研究”。實驗結(jié)果表明,借助Word2vec文本相似度方法能夠計算出論文與所標注基金項目的相關(guān)性,進而為判斷基金不實標注的情況提供依據(jù)。

4.2? ? 國家社科基金“一文多注”研究

很多學者在基金標注規(guī)范研究中探討過“一文多注”現(xiàn)象,目前論文發(fā)表普遍存在“一文多注”的現(xiàn)象,即大多數(shù)論文在投稿時標注了多個基金資助項目。分析這一現(xiàn)象的成因,一方面體現(xiàn)了科研合作與交流普遍存在,另一方面,也反映出可能存在基金重復資助或基金項目號不實標注的情況。針對國家社科基金項目“一文多注”的情況,筆者篩選出標注了兩個以上國家社科基金資助的論文??紤]到檢測出基金不實標注可能造成的社會影響,本研究首先根據(jù)分布式詞向量計算論文題錄信息與基金標題的語義相似度,再通過人工校驗確保結(jié)果的可靠性。

本文選擇6129篇標注了兩個以上國家社科基金的論文,這些論文共形成了12750條論文與基金項目的標注關(guān)系。存在部分項目信息沒有收錄在國家社科基金項目數(shù)據(jù)庫中,因此能查閱到項目批準號對應(yīng)項目標題的數(shù)據(jù)有12188條,選擇其中出現(xiàn)兩次以上的論文數(shù)據(jù)進行人工判別,共11660條。為避免人工判別的主觀性,本研究組織了兩名博士研究生和兩名本科生分成兩組獨立進行評判工作,然后比對兩組評判結(jié)果,只保留意見一致的結(jié)果。

人工評判遵循以下三條標準:

(1)論文內(nèi)容與標注的基金項目研究內(nèi)容是否存在差異;

(2)一篇論文標注的幾個基金項目之間研究內(nèi)容是否存在差異;

(3)標注了同一個基金項目的不同論文之間研究內(nèi)容是否存在差異。

最終得到410條論文-基金數(shù)據(jù)存在研究內(nèi)容不一致的情況,涉及到278篇論文和283個基金項目,存在部分論文與標注的多個基金項目在研究內(nèi)容上不相關(guān),部分基金項目被多篇不相關(guān)的論文標注。

本文節(jié)選了部分論文與標注的基金項目研究內(nèi)容不相關(guān)數(shù)據(jù)示例(見表4)。在278篇論文中,有120篇論文與標注的基金項目研究內(nèi)容都存在差異,稱為集合A;有158篇論文與標注的部分基金項目在研究內(nèi)容上相近,部分基金項目研究內(nèi)容有差異,稱為集合B。

在集合A的論文中筆者發(fā)現(xiàn)一篇文章的基金字段標注了“國家哲學社會科學課題青年項目“邊疆民族地區(qū)基層社會治理創(chuàng)新實踐與規(guī)范化建設(shè)研究”(15CJL049)”,而“15CJL049”實際是項目“垂直專業(yè)化背景下中國制造業(yè)國內(nèi)技術(shù)含量的動態(tài)變化及影響因素研究”的批準號,呼吁作者投稿和編輯部審稿過程中需要仔細檢查這類書寫錯誤。并且在這120篇論文中絕大多數(shù)在基金字段都只標注了項目類型和項目批準號,沒有標注項目名稱,筆者無法根據(jù)作者提供的信息判斷是否為書寫錯誤。

集合B中的論文標注了研究內(nèi)容相近的基金項目,同時標注了存在差異的基金項目,筆者認為這充分說明作者存在標注不實基金的主觀意圖。對這部分存在差異的基金項目類型統(tǒng)計得到:一般項目67項,青年項目37項,重點項目28項,重大項目27項??紤]到每年的一般項目和青年項目立項數(shù)遠高于重點項目和重大項目,證明了學者在投稿時為了提高錄用概率,標注重點和重大項目等有影響力的項目以拔高論文水平的現(xiàn)象確實存在。

5? ?總結(jié)與討論

本文以2014-2018年的國家社科基金項目為例,采用網(wǎng)絡(luò)爬蟲抓取了基金項目的論文成果,通過實證研究探索了論文中基金項目的“一文多注”和不實標注情況?!耙晃亩嘧ⅰ钡那闆r目前較為常見,主要體現(xiàn)在標注不同等級的基金項目,同時標注多項國家社科基金項目的論文比例相對減少,占比7.6%。“一文多注”情況呈現(xiàn)出明顯的學科差異,經(jīng)濟與管理學科較為常見。從國家社科基金項目類型來看,重大項目與其他類型項目共同標注較多。隨著人工智能技術(shù)的進展,深度學習模型已經(jīng)能夠較好的識別語義。Word2vec模型的實驗結(jié)果表明,僅通過自動化模型已經(jīng)能識別論文與所標注基金項目研究內(nèi)容存在的差異。但基金不實標注與其他學術(shù)不端行為相比更具隱蔽性,基金標注的真實性需要付出大量精力進行考證,呼吁學者在投稿時不要出現(xiàn)這類投機行為。期刊編輯部在審稿過程中應(yīng)重視基金項目的審核,確保作者填寫完整的基金信息。同時,相關(guān)部門應(yīng)加大力度建設(shè)、完善相應(yīng)基金項目數(shù)據(jù)庫,國家與地方各級基金項目統(tǒng)籌管理,項目批準號作為基金項目的唯一標識符不應(yīng)出現(xiàn)不同項目共用的現(xiàn)象。

參考文獻:

[1]? 韓磊,邱源.學術(shù)期刊須警惕基金論文中基金項目不實標注現(xiàn)象[J].編輯學報,2017,29(2):151-154.

[2]? 陳曉文,屈寶強,劉蔚,等.基于論文著錄信息的基金類別共現(xiàn)分析[J].中華醫(yī)學圖書情報雜志,2018,27(12):50-57.

[3]? 金偉.科技期刊論文基金項目標注的混亂性、真實性問題[J].遼寧師范大學學報(自然科學版),2014,37(4):547-550.

[4]? 王楚鴻.科技論文“一文多注(標注)”現(xiàn)象分析[J].科學學研究,2009,27(5):711-715.

[5]? 藍永洪.科技論文中成果所屬作者、單位、基金和作者貢獻標注的探討[J].科技視界,2018(36):53-54.

[6]? 王小艷.科技論文基金項目標注不實分析及對策[J].中國科技期刊研究,2014,25(7):954-957,974.

[7]? 趙麗瑩,楊波,張榮麗,等.關(guān)于科技論文多項基金標注的幾點建議[J].中國科技期刊研究,2009,20(4):729-731.

[8]? 古繼寶,周捷,梁樑.科技論文資助重復率統(tǒng)計分析與形成機制研究[J].科學學與科學技術(shù)管理,2008(9):24-28.

[9]? 楊敏敏,Gretchen McAllister.國際學界“一帶一路”研究的熱詞與最前沿——基于Web of Science(2014-2018)的文本計量與細讀[J].西南民族大學學報(人文社科版),2020,41(5):234-240.

[10]? 李宗剛,謝慧聰.70年來《魯迅全集》注釋研究熱點與前沿動態(tài)分析——基于1949-2018年超星數(shù)據(jù)的分析[J].西南民族大學學報(人文社科版),2020,41(4):229-235.

[11]? 洪磊,王昊.公安情報研究現(xiàn)狀及熱點分析——基于CNKI期刊論文的計量學和關(guān)鍵詞聚類研究[J].西南民族大學學報(人文社科版),2019,40(7):234-240.

[12]? 賈文龍.新世紀以來國內(nèi)高校圖書館研究領(lǐng)域的全景回顧及未來展望——基于CSSCI來源期刊(2000-2017)的知識圖譜分析[J].西南民族大學學報(人文社科版),2019,40(8):233-240.

[13]? 苗亞靜.科技論文中基金項目多重標注歸因分析及對策研究[J].寶雞文理學院學報(社會科學版),2013,33(4):109-112.

[14]? 陳沙沙,劉春平.關(guān)于學術(shù)期刊論文基金項目著錄的編輯問題[J].編輯學報,2008(3):231-232.

[15]? 白雪娜,張輝玲,黃修杰.科技論文基金項目標注的不端行為及防范對策研究——基于178篇論文標注209個國家自然科學基金項目的實證分析[J].編輯學報,2017,29(3):260-264.

[16]? 蘇新寧,王東波.學術(shù)評價相關(guān)問題與思考[J].信息資源管理學報,2018,8(3):4-11.

[17]? 葉文豪,王東波,沈思,等.基于孿生網(wǎng)絡(luò)的基金與受資助論文相關(guān)性判別模型構(gòu)建研究[J].情報學報,2020,39(6):609-618.

[18]? Mikolov T,Chen K,Corrado G,et al.Efficient estimation of word representations in vector space[J].arXiv preprint arXiv:1301.3781,2013.

[19]? Song Y,Shi S,Li J,et al.Directional Skip-Gram: Explicitly Distinguishing Left and Right Context for Word Embeddings[C].Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies,2018:175-180.

作者簡介:葉文豪(1994-),男,南京大學信息管理學院、江蘇省數(shù)據(jù)工程與知識服務(wù)重點實驗室博士研究生,研究方向:文本挖掘;洪磊(1988-),男,南京大學信息管理學院博士研究生,講師,研究方向:安全情報和數(shù)據(jù)挖掘;唐夢嘉(1997-),女,南京農(nóng)業(yè)大學信息管理學院本科生;張逸勤(2000-),女,南京農(nóng)業(yè)大學信息管理學院本科生。

黎平县| 金阳县| 健康| 高碑店市| 阆中市| 安义县| 壶关县| 大邑县| 滦平县| 利津县| 旬阳县| 准格尔旗| 上犹县| 茶陵县| 阳信县| 五指山市| 临高县| 南丹县| 东莞市| 德格县| 巧家县| 清远市| 安福县| 正镶白旗| 班玛县| 南城县| 平谷区| 安陆市| 敦煌市| 沭阳县| 青铜峡市| 肥西县| 江安县| 天祝| 太谷县| 黄浦区| 潮州市| 广州市| 永丰县| 巢湖市| 南和县|