壽鑫甜,王禹萌,段城林,賈秋蕾,袁果真,張雪松,薛文靜,尤雅萍,范少瑋,柴若寧,胡元會
心血管常見疾?。ㄈ缧牧λソ摺⑿募」K?、心律失常、高血壓病等)嚴重危害人類健康。20世紀末,國際心血管病專家Braunwald預言,心房顫動(房顫)和慢性充血性心力衰竭將是21世紀心血管領域的主要堡壘[1]。在分子生物學中,組學是某種生物樣本的系統(tǒng)集合,主要包括基因組學、蛋白組學、代謝組學、轉(zhuǎn)錄組學、糖組學、免疫組學等。目前組學研究尤其是多組學聯(lián)合分析疾病具有較好的研究價值與前景。通過分子生物學技術,運用組學可研究疾病的病理機制,從而制定疾病預防、診斷、治療策略。本研究運用CiteSpace文獻計量軟件對心血管病組學研究進行分析,統(tǒng)計研究領域發(fā)文數(shù)量,了解作者、機構(gòu)、地區(qū)合作關系,探究文獻關鍵詞、共被引文獻體現(xiàn)的該領域研究熱點與意義,評估組學應用于心血管疾病優(yōu)勢,探究該領域未來的研究方向。
1.1 文獻檢索與處理以Web of Science Core Collection(WOSCC)為來源數(shù)據(jù)庫,以omics and cardiovascular*進行全字段檢索,檢索時間為2000~2021年,英語語種,文獻類型選擇article和review。此次檢索于2021年12月21日完成。將文獻的全記錄與引用的參考文獻以純文本的格式導出,并以download_*-*.txt命名。使用CiteSpace 5.8.R3 軟件進行文獻分析,數(shù)據(jù)以每年進行分塊,每次分析節(jié)點選擇1個。本次研究對合作分析節(jié)點“作者”、“機構(gòu)”、“國家”和共現(xiàn)分析節(jié)點“關鍵詞”,以及“引文”節(jié)點進行了分析。合作分析節(jié)點選擇k=10的g-index模型,關鍵詞選擇TOP 50并且使用pathfinder和pruning sliced networks進行圖譜精簡化。共被引分析選擇k=10的g-index模型并裁剪。
在CiteSpace圖譜網(wǎng)絡中,節(jié)點間連線越粗,兩者之間的聯(lián)系越多,連線顏色越鮮亮,合作時間越新近。中介中心性表示圖譜中節(jié)點的關鍵性強度,中介中心性越大,節(jié)點代表的中介聯(lián)系作用越大。圖譜中外圈顯示為紫色的即代表中介中心性強的節(jié)點(中心度>0.1)。CiteSpace圖譜中的關鍵詞是根據(jù)下載的文本內(nèi)容從文獻中提取的。高頻率的關鍵詞代表了組學研究在心血管病某些階段的研究熱點。一個關鍵詞的中心度代表了它在網(wǎng)絡中的關鍵程度以及它與其他節(jié)點之間的關聯(lián)性。我們使用對數(shù)似然比(Log-Likelihood Ratio,LLR)算法對密切相關的關鍵詞進行聚類。共現(xiàn)詞(特征詞或關鍵詞)可以幫助識別研究熱點,尤其是在使用突發(fā)詞功能時[2,3]。關鍵詞突現(xiàn)顯示了某一時期內(nèi)關鍵詞的頻率以及關鍵詞的影響強度,突現(xiàn)詞的開始和結(jié)束之間的時間表示關鍵詞突現(xiàn)的時期。同一篇文章共引的兩篇文章形成共被引關系。共被引文獻代表了組學研究領域的核心文獻。文獻共被引圖譜可以通過使用圖譜上的關鍵節(jié)點幫助分析研究主題的演變[2]。文獻的學術影響力在一定程度上可以通過兩個指標來量化:共被引頻率和中介中心性。時間軸視圖關注集群之間的關系和集群內(nèi)關鍵節(jié)點的歷史跨度[2]。
2.1 年度發(fā)文量與引用頻次檢索得到心血管組學研究文獻共660篇。其中h-index為56,每項平均引用次數(shù)為21.63,被引頻次總計13 968篇(去除自引),施引文獻13 078篇(去除自引)。年度發(fā)文量與引用從2016年起迅速增加,說明心血管組學研究近5年發(fā)展迅速,熱度仍持續(xù)增加(圖1)。
圖1 年度發(fā)文量
2.2 合作關系分析—作者、地區(qū)和機構(gòu)CiteSpace運行后得到235個節(jié)點和478條連線組成的作者合作關系(圖2)。發(fā)文量前10的作者(表1)中,Matthias Schittmayer和Ruth Birnergruenberger(各10次)排名最高。作者中介中心性均不高(<0.1),圖譜網(wǎng)絡較稀疏(網(wǎng)絡密度為0.0174),表明組學在心血管研究領域仍處于初級階段,需要鼓勵學者進一步研究,同時表明該領域大有發(fā)展空間。
圖2 作者合作可視化圖譜
地區(qū)圖譜由81個節(jié)點和563條連線組成,196個節(jié)點和628條連線組成了機構(gòu)圖譜(圖3~4)。地區(qū)與機構(gòu)的主體是發(fā)達國家和醫(yī)學院校,其排名最高的分別是美國和哈佛醫(yī)學院,它們的頻次分別為256次和37次。另外,三個地區(qū)(英國、新西蘭、法國)和三個機構(gòu)(哈佛醫(yī)學院、格拉斯哥大學、萊頓大學)的中介中心性>0.1,是組學在心血管疾病研究的核心地區(qū)與機構(gòu),并且起到了較好的紐帶作用(表1)。
圖3 地區(qū)合作可視化圖譜
表1 發(fā)文量前10的作者、地區(qū)、機構(gòu)
圖4 機構(gòu)合作可視化圖譜
2.3 關鍵詞共現(xiàn)分析關鍵詞共現(xiàn)圖譜由1098個節(jié)點和4552條邊組成,出現(xiàn)頻次前三的關鍵詞是心血管疾病(160次)、基因表達(136次)和風險(119次),前20名高中介中心性的詞是冠狀動脈疾?。╟oronary artery disease,CAD)和血壓(圖5,表2)。該研究領域主要涉及心血管病基因表達與疾病風險評估等,其中CAD和血壓異常與大部分研究相關。
圖5 關鍵詞共現(xiàn)圖譜
2.4 關鍵詞聚類關鍵詞聚類可以將關鍵詞進行提煉分類,每一個聚類名稱即為該類的代表性關鍵詞。按關鍵詞數(shù)量對聚類進行排名,對前10個聚類進行分析,其聚類名稱分別為慢性腎病、心血管疾病、齊同性、蛋白質(zhì)組學、重度抑郁癥、風險預測、鏈式脂肪酸、激素結(jié)合球蛋白、臨床試驗和表達(表3)。聚類圖譜總體的Modularity=0.7933(>0.3)、Mean Silhouette=0.9097 (>0.4),說明聚類合理且內(nèi)部同質(zhì)性好,聚類可信[4](圖6)。
圖6 關鍵詞聚類圖譜
表3 排名前10的關鍵詞聚類
2.5 關鍵詞突現(xiàn)運行CiteSpace共獲得19個突現(xiàn)詞,持續(xù)時間最長的是全基因組關聯(lián)和動脈粥樣硬化,突現(xiàn)強度最強的是風險,其次是心臟疾?。▓D7)。另外,近年出現(xiàn)的關鍵詞包括炎癥、死亡率、體外、位點、風險、廣泛相關性、腸道微生物群等是當前的研究熱點。有趣的是,突現(xiàn)詞從2015年才開始出現(xiàn),提示心血管疾病組學的興起較晚。
圖7 關鍵詞突現(xiàn)圖譜
2.6 文獻共被引分析文獻共被引分析得到節(jié)點346個和804條連線。文獻被引頻次較高且有紫色外圈的節(jié)點有Nikpay M(2015)[5]、Kundaje A(2015)[6]、Wang TJ(2011)[7],表示這些文獻是研究的基礎與經(jīng)典,影響較大(圖8,表4)。
表4 排名前10的共被引文獻
圖8 文獻共被引圖譜
2.7 關鍵詞時間軸圖關鍵詞時間軸圖主要關注聚類間的相關關系以及聚類內(nèi)部研究熱點的趨冷趨熱變化。聚類#0和聚類#1熱度不減,各聚類間的聯(lián)系均較密切,尤其以聚類#0和#1最相關。組學相關的條目逐漸趨冷,而與疾病相關的條目則保持高熱狀態(tài)。聚類#2中Hunt E(2004)的研究是最早出現(xiàn)的心血管組學研究[8],為該領域奠定了一定的研究基礎(圖9)。
圖9 關鍵詞時間軸圖譜
隨著組學技術的不斷發(fā)展與成熟,組學運用于心血管疾病研究的發(fā)文量逐年增多,尤其是近5年發(fā)文量呈爆發(fā)增長趨勢,且熱度持續(xù)升高。
在作者、地區(qū)和機構(gòu)方面,研究該領域的地區(qū)和機構(gòu)的主體是發(fā)達國家和各大醫(yī)學院校,且研究的核心地區(qū)與機構(gòu)具有較高的中介中心性,起到了較好的紐帶作用。但是作者比較分散,作者間的合作不足,并且缺乏核心作者,未能形成具有學術代表性的研究主題,可能與本領域研究發(fā)展時間尚短有關,應鼓勵學者們進一步研究。
關鍵詞共現(xiàn)分析表明組學在心血管疾病中主要為CAD和對血壓的影響的研究。全基因組的鑒定為CAD的遺傳結(jié)構(gòu)提供了擴展[9]。蛋白組學提供了年齡對高血壓血管影響的證據(jù),包括年齡因素通過 RhoA/Rho 激酶途徑改變血管肌動蛋白細胞骨架[10]。另一項研究發(fā)現(xiàn)餐后血壓和年齡在CAD低風險亞洲人群中檢測動脈粥樣硬化具有出色的預測性能[11]。關鍵詞聚類中,#0聚類提示代謝組學和蛋白質(zhì)組學在動脈粥樣硬化的研究中發(fā)揮重要作用,#1聚類提示組學研究主要在心血管疾病如冠心病、房顫、心衰以及與心血管病密切相關的病理狀態(tài)如肺動脈高壓、炎癥、壓力改變等領域,與關鍵詞共現(xiàn)分析結(jié)果相符。有趣的是,慢性腎病與心血管病風險分層有關,組學研究較適用于研究慢性腎病與心血管病之間的關系[12]。時間軸視圖顯示關鍵詞聚類間聯(lián)系較密切,蛋白質(zhì)組學和代謝組學在以上心血管疾病研究中保持較高熱度,并且研究者從組學技術的研究逐漸轉(zhuǎn)向組學對疾病本身的診斷、治療、危險因素的預測等輔助作用上。
關鍵詞突現(xiàn)提示某一關鍵詞在某一時期是研究熱點。雖然心血管疾病組學研究起步較早,但直至2016年起才呈爆發(fā)式發(fā)展,疾病風險、炎癥、死亡率、腸道微生物群研究火爆,其中疾病風險在近年出現(xiàn)的熱點詞中突現(xiàn)強度最大。一項綜合性CAD全基因組關聯(lián)薈萃分析顯示全基因組關聯(lián)分析(GWAS)具有研究復雜性狀的遺傳結(jié)構(gòu)的能力,如HDAC9與CAD的關聯(lián)性強于與心肌梗死(MI) 的關聯(lián),表明它可能易患動脈粥樣硬化,但不會導致MI的誘發(fā)事件,提示組學關聯(lián)研究可預測易患何種心血管病[5]。在一項利用定量核磁共振代謝組學來確定長期隨訪期間發(fā)生心血管疾病的生物標志物的研究(FINRISK)中,研究者發(fā)現(xiàn)了4個生物標志物,并通過比較另外兩項研究[Southall和Brent Revisited (SABRE) ]的數(shù)據(jù)改善了預測風險,證實了高通量代謝組學對于生物標志物發(fā)現(xiàn)和改進風險評估的價值,提示循環(huán)代謝物的高通量分析可能會改善對已確定風險因素的心血管風險預測[13]。另有研究發(fā)現(xiàn)代謝物的鑒定可區(qū)分CAD并預測心血管事件的風險[14-17]。
文獻共被引頻次越高,將它與其他文獻同時引用的文獻數(shù)量越多,共被引文獻的重要性越高。中介中心性則直接表明該文獻在共被引文獻中的中介作用。在3篇被引頻次和中介中心性均較高的文獻中,Nikpay M(2015)等基于1000個基因組的CAD全基因組進行關聯(lián)薈萃分析,確定了10個CAD新基因座[5]。Kundaje A(2015)等[6]的研究揭示不同人類特征的生物學相關細胞類型,并為解釋人類疾病的分子基礎提供資源。Wang TJ(2011)等[7]是較早運用代謝組學技術對患糖尿病風險新預測因子進行了鑒定并進行了臨床驗證。它們?yōu)榻M學運用于心血管病的研究提供了方法和明確了實用價值。
精準醫(yī)學是心血管疾病預防和治療的綜合方法,通過將臨床數(shù)據(jù)與多種組學結(jié)合,可從生物遺傳信息、功能表達認識疾病表型與疾病的關系,并選擇藥物治療或確定潛在的蛋白質(zhì)-藥物或藥物-藥物相互作用,達到精準治療的目的[18]。未來,基于高通量技術的治療策略可以嵌入到系統(tǒng)生物學、神經(jīng)科學和藥理學方法中,將有助于克服傳統(tǒng)的臨床癥狀的描述和以綜合征為中心的結(jié)構(gòu)的限制[19]。通過結(jié)合組學的心血管病研究有助于認識疾病本質(zhì),達到精準預測、精準診斷和精準治療的目的。
從2016~2021年心血管病組學研究有大量文獻發(fā)表且熱度持續(xù)增加。該領域機構(gòu)與地區(qū)合作較好,但缺乏核心作者且作者間的合作不足。代謝組學和蛋白質(zhì)組學在動脈粥樣硬化、冠心病、房顫、心衰以及與心血管病密切相關的病理狀態(tài)如肺動脈高壓、炎癥、壓力改變等領域運用較廣且熱度持續(xù)。研究者從組學技術的研究轉(zhuǎn)向組學對疾病本身的診斷、治療、危險因素的預測等輔助作用,目前研究熱點集中于疾病風險、炎癥、死亡率、腸道微生物群的研究。因此,組學應用于心血管疾病研究具有診斷、治療、預測疾病風險等作用,可發(fā)現(xiàn)疾病本質(zhì)并用于開發(fā)新的治療方法。組學運用于精準醫(yī)學或?qū)⑹俏磥碓擃I域研究的趨勢。
本文獻計量學分析的局限性在于:首先,該研究傾向于從文獻計量學的角度組織研究,這是大多數(shù)人的觀點,可能無法總結(jié)所有組學知識。其次,本研究數(shù)據(jù)范圍僅限于Web of Science數(shù)據(jù)庫,雖然足以滿足我們的目標,但可能不包含所有關于組學在心血管病研究的已發(fā)表研究。