陳 穎 李曉瑛 夏光輝 單連慧 李 勇 侯 麗
1.中國醫(yī)學科學院醫(yī)學信息研究所資源建設部,北京 100005;2.中國醫(yī)學科學院醫(yī)學信息研究所醫(yī)學科技評價研究室,北京 100020;3.中國醫(yī)學科學院醫(yī)學信息研究所醫(yī)學信息標準研究室,北京 100020
甲狀腺癌(thyroid carcinoma,TC)是一種起源于甲狀腺濾泡上皮或濾泡旁上皮細胞的惡性腫瘤,也是頭頸部最為常見的惡性腫瘤[1]。甲狀腺癌是最常見的內分泌惡性腫瘤,約占全球頭頸部惡性腫瘤的1/3。近年來發(fā)病率不斷增加,受到公眾日益關注[2]。2021 年1 月,世界衛(wèi)生組織國際癌癥研究機構發(fā)布了2020 年全球最新癌癥負擔數據,預估了全球185 個國家36 種癌癥類型的最新發(fā)病率、死亡率情況,以及癌癥發(fā)展趨勢,指出甲狀腺癌是全球發(fā)病率排名第9 的癌癥[3]。我國近幾年甲狀腺癌增幅較大,在女性惡性腫瘤發(fā)病譜中已位居第4 位[3]。本研究旨在梳理近十年甲狀腺癌相關文獻,運用文獻計量學方法客觀評價該領域研究現狀,以期為研究人員及時把握研究方向提供科學依據。
數據來源為中國知網(CNKI)。檢索條件為篇名=“甲狀腺癌”,檢索時間限定為2011 年1 月至2020 年12 月,文獻類型為中文學術期刊。通過閱讀文獻題目,剔除衛(wèi)生政策、臨床教學等與甲狀腺預防、診療、護理不相關的文獻。
為從多視角揭示分析甲狀腺癌研究現狀,建立共現矩陣并通過編寫程序實現關鍵詞-關鍵詞、基金-基金、機構-機構、機構-關鍵詞、作者-關鍵詞的關聯分析,調整權值大小可視化展示關聯關系。
通過聚類分析、人工審核等方法歸一化處理科研實體,以提高研究準確度。以基金為例,歸一原則為:①分級歸類,指按管理機構、基金類別兩個層級梳理科研基金類別;②別名統(tǒng)一,指將同一基金的多別名形式歸一到唯一官方規(guī)范名。以基金數據“國家自然科學基金青年項目資助課題”“國家自然科學基金青年項目資金支持”為例,首先屬于國家自然科學基金委員會管理基金,其次他們都屬于國家自然科學基金青年項目的別名形式。因科研實體規(guī)范不是本文重點,暫不詳述。
檢索出6805 篇學術期刊論文,剔除不符合條件的論文,最后納入6790 篇。2011 年440 篇,2015 年687 篇,2015 年是2011 年的1.56 倍,2017—2020 年均為800 篇以上。近十年甲狀腺癌相關研究發(fā)文量呈逐年穩(wěn)定增加趨勢,與我國近幾年甲狀腺癌發(fā)病率一直上升相吻合。發(fā)文機構共2500 余個(第一機構1800 余個);作者共11 200 余個(第一作者4078 個);關鍵詞共4100 余個;基金共1100 余個。高頻情況(≥5 次):第一機構52 個,第一作者24 個,關鍵詞410 個。
通過CNKI 統(tǒng)計研究主題,見表1。關鍵詞共現圖譜中最高頻共現詞群是以甲狀腺腫瘤為核心的一組詞,共現100 次以上的有甲狀腺切除術119 次、超聲檢查237 次、頸淋巴結清掃術109 次、免疫組織化學113 次、診斷144 次等,見圖1。
圖1 關鍵詞關聯圖
資助基金見表2。主要分三類:國家級基金(國家自然科學基金、國家科技支撐計劃、國家重點基礎研究發(fā)展計劃)、省級自然科學基金、省級衛(wèi)生科技基金。前15 個資助基金發(fā)文量54 篇,其中國家自然科學基金333 篇,占61.55%。與國家自然科學基金較高共現的基金主要有衛(wèi)生部行業(yè)科研專項、遼寧省自科、遼寧省科技攻關項目、鄭州市科技領軍人才項目等,見圖2。
圖2 基金共現圖
表2 基金分布
2.3.1 合作機構 發(fā)文機構見表3。前三個機構分別是中國醫(yī)學科學院北京協(xié)和醫(yī)院、鄭州大學第一附屬醫(yī)院、中國醫(yī)科大學附屬第一醫(yī)院,腫瘤領域知名的中國醫(yī)學科學院腫瘤醫(yī)院發(fā)文量排第13。聯合發(fā)文能較好體現機構間在臨床、教學、科研等方面合作情況。形成多個合作網絡,主要有“中國醫(yī)學科學院北京協(xié)和醫(yī)院、中國醫(yī)學科學院腫瘤醫(yī)院、青島大學附屬醫(yī)院、北京大學國際醫(yī)院”(共現4 次以上),“鄭州大學第一附屬醫(yī)院、河南省高等學校臨床醫(yī)學重點學科開放實驗室、河南省醫(yī)藥科學研究院(共現5 次以上)”,“中國醫(yī)科大學附屬第一醫(yī)院、中國醫(yī)科大學基礎醫(yī)學院、中國醫(yī)科大學附屬盛京醫(yī)院、遼寧省內分泌疾病重點實驗室(共現5 次以上)”。此外,還有以浙江省腫瘤醫(yī)院為核心的,包括南京、杭州多個醫(yī)院的合作網絡等。
表3 機構分布
2.3.2 合作作者 發(fā)文作者見表4。林巖松發(fā)文量遠高于其他作者,是第2 名的2 倍多。作者共現能間接體現機構之間合作關系。以林巖松為核心的作者群有梁軍、李方、趙騰、楊珂等,見圖3。以高明為核心的作者群及共現數為李亦工(10)、魏松鋒(13)、鄭向前(14)等,以譚建為核心的作者群及共現數為孟召偉(17)、王任飛(5)、張桂芝(10)等。對作者歸一處理。以梁軍為例,通過閱讀文獻和查找作者簡介發(fā)現兩個機構中梁軍是同一作者,梁軍2015 年前在青島大學附屬醫(yī)院工作,之后到北京大學國際醫(yī)院,機構轉變引起文獻分散。
圖3 合作作者圖
表4 作者分布
2.4.1 機構-關鍵詞多維分析 機構關鍵詞共現可了解機構研究主題、興趣點和關注點,進而評估機構的科研或業(yè)務布局。以中國醫(yī)科大學附屬第一醫(yī)院為例,其主要關鍵詞有細胞凋亡、病理學、蛋白酶體抑制劑等。中國醫(yī)科大學附屬第一醫(yī)院與中國醫(yī)科大學基礎醫(yī)學院在上述關鍵詞領域合作較多,并通過關鍵詞甲狀腺癌與遼寧省內分泌疾病重點實驗室產生關聯。見圖4。
圖4 機構-關鍵詞多維分析圖
2.4.2 作者-關鍵詞多維分析 一位作者關聯多項研究主題并通過不同主題與其他作者產生關聯?;谧髡?關鍵詞多維分析有助于尋找小同行、潛在合作者、發(fā)現可擴展的研究主題等。以高產作者林巖松為例,圖5 可見其研究內容較豐富,主要有分化型甲狀腺瘤、甲狀腺球蛋白抗體、外科治療、放射療法、碘放射性同位素等,其研究主題主要在腫瘤的放射療法方面。一項研究內容對應多位作者并形成以主題為核心的作者群。因關鍵詞甲狀腺癌發(fā)展趨勢較寬泛,暫不細述。以放射療法為核心的作者群包括梁軍、趙騰、楊珂、李方等,以分化型甲狀腺癌為核心作者群包括梁軍、李嬌、叢慧、趙騰等,以臨床病理特征為核心作者群包括梁軍、趙丹、孟超。上述作者在相關領域和林巖松有同樣的研究興趣。
圖5 作者-關鍵詞多維分析圖
本文通過專家咨詢、閱讀文獻等方法驗證實驗結果。研究發(fā)現近十年我國甲狀腺癌主題論文穩(wěn)定增長,研究主題較為豐富,資助基金以國自然和省自然居多,主要發(fā)文機構是知名醫(yī)院,機構、作者間合作常圍繞特定主題等。存在問題包括主題范圍過于集中,資助基金來源不夠廣泛,前沿性研究較少等。
近十年主題以手術、診斷、臨床意義為主,基礎性研究論文較少,如病因、高危因素、突變基因等相關研究。甲狀腺癌發(fā)病率逐年上升,雖然和檢查手段進步、甲狀腺B 超納入健康調查項目有關[4-5],但也可能與人們生活習慣、飲食結構變化密切相關[6-7]。因此,建議重視流行病學相關研究。目前研究中“治未病”等科普類論文較少。癌癥屬于慢性病,如何科學預防、帶病生存等研究也應得到重視。
基金資助分析可了解科技投入、分配及產出之間的關系,改善科研資源配置效率,為科研人員申請科研基金提供指引。深入分析基金共現還可避免重復資助,以促進科技資源的合理分配和使用[8]。研究發(fā)現多基金共同資助情況較多,說明其研究可能涉及不同專業(yè)、類型的科研人才,由不同類別基金共同資助來達到較好的科研產出?;鹳Y助機構以政府居多,少有企業(yè)或社會資助,從側面說明科研成果的轉化和應用還需提高,應爭取多領域、不同類型機構的基金支持,共同促進科研進步和臨床應用。
甲狀腺癌研究涉及多學科、多領域的協(xié)調配合。應加強不同單位和部門之間、醫(yī)院與科研機構之間、國內外同行之間的交流合作,形成一個個小的主題研究網絡(如“2.4.2”中分別以放射療法[9-10]、分化型甲狀腺癌[11-14]、臨床病理特征[15-16]為核心形成的網絡),進而構成大的多主題、跨領域的研究網絡,以強帶弱,強強聯合,共同促進我國甲狀腺癌研究快速發(fā)展。
中國醫(yī)學科學院腫瘤醫(yī)院在中國醫(yī)學科學院醫(yī)學信息研究所“中國醫(yī)院/中國醫(yī)學院科技量值”、復旦大學醫(yī)院管理研究所“中國醫(yī)院??坡曌u排行榜”和“中國醫(yī)院排行榜”均排第一,在本研究中排第13。作為國內腫瘤界有名、患者比較認可的醫(yī)院,其發(fā)文量相對少和機構別名多是排名靠后的主要原因,因機構數據形式多樣,有簡稱、非規(guī)范名稱等,導致統(tǒng)計結果分散。
隨著學科日益發(fā)展和人才充分流動,作者唯一身份認證是確認作者準確身份的有效途徑。目前很多出版社、期刊和數據庫商都要求作者在發(fā)文時標注開放研究者與貢獻者身份識別碼。做好機構名稱規(guī)范化和機構變遷關系識別,推進作者發(fā)文署名機構的規(guī)范名稱自查和作者唯一身份認證工作,有利于實現科研成果的準確標注和記錄,推動科研合作。
目前國內甲狀腺研究仍以經驗研究為主,但經驗研究發(fā)展到一定程度,必須轉向前沿性問題研究,關注跟蹤國際知名機構和會議,提高科研水平,引領學科發(fā)展。信息技術的進步、醫(yī)學大數據的發(fā)展都為深入挖掘和利用醫(yī)學文獻、臨床數據中隱含的寶貴知識提供了手段和工具。結合大數據、人工智能、機器學習等技術開展疾病風險預測、醫(yī)學影像[17]、輔助診療[18]、藥物挖掘、健康管理等研究是今后甲狀腺癌研究的前沿熱點。