国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)整合策略探究肌萎縮側(cè)索硬化癥易感基因

2022-05-30 12:30楊翊研宋佳玥曾琳琳付學(xué)奇
關(guān)鍵詞:硬化癥肌萎縮表型

楊翊研, 宋佳玥, 曾琳琳, 付學(xué)奇

(1. 吉林大學(xué) 校醫(yī)院, 長春130012; 2. 吉林大學(xué) 生命科學(xué)學(xué)院, Edmond Fischer細(xì)胞信號(hào)傳導(dǎo)實(shí)驗(yàn)室, 長春130012)

肌萎縮性側(cè)索硬化癥(amyotrophic lateral sclerosis, ALS), 又稱運(yùn)動(dòng)神經(jīng)元病, 以上下運(yùn)動(dòng)神經(jīng)元變性為特征, 導(dǎo)致肌肉無力, 最終癱瘓甚至死亡. 近年來, ALS被歸為神經(jīng)肌肉領(lǐng)域, 新的影像學(xué)和神經(jīng)病理學(xué)數(shù)據(jù)表明, 疾病病理中有非運(yùn)動(dòng)神經(jīng)軸參與, 一部分患者有家族性疾病, 并且在神經(jīng)元功能中有不同程度的基因突變[1], 但ALS的發(fā)病機(jī)制尚不清楚. 其發(fā)病機(jī)理的分子機(jī)制復(fù)雜, 如遺傳因素、 氧化應(yīng)激損傷、 神經(jīng)遞質(zhì)運(yùn)輸障礙、 蛋白質(zhì)折疊異常、 線粒體功能障礙、 膠質(zhì)細(xì)胞炎性反應(yīng)等病理生理過程在ALS過程中均有涉及[2]. 隨著基因組測(cè)序技術(shù)等先進(jìn)技術(shù)平臺(tái)廣泛開發(fā)應(yīng)用, 在越來越多的ALS患者中發(fā)現(xiàn)新的致病基因及其突變, 為ALS的早期診斷和臨床治療提供了重要思路和靶點(diǎn)[3].

隨著信息化的快速發(fā)展, 利用多種數(shù)據(jù)挖掘工具對(duì)醫(yī)療和臨床大數(shù)據(jù)進(jìn)行分析可使傳統(tǒng)醫(yī)學(xué)向精準(zhǔn)醫(yī)學(xué)轉(zhuǎn)變. 近年來, 生物學(xué)相關(guān)大數(shù)據(jù), 如基因序列分析、 蛋白質(zhì)相互作用數(shù)據(jù)、 基因轉(zhuǎn)錄組學(xué)和蛋白表達(dá)數(shù)據(jù)等增加了疾病基因預(yù)測(cè)軟件的功能, 目前已有多種致病基因預(yù)測(cè)軟件, 如Endeavour[4]、 GLAD4U[5]和ProphNet[6]等, 通過大數(shù)據(jù)整合, 運(yùn)用這些軟件進(jìn)行生物學(xué)系統(tǒng)分析可預(yù)測(cè)致病基因. 本文通過一系列數(shù)據(jù)庫和致病基因預(yù)測(cè)軟件對(duì)ALS的早期診斷進(jìn)行預(yù)測(cè), 為提高臨床決策能力、 精準(zhǔn)預(yù)防能力和快速治療提供新的思路和方向.

1 資料與方法

1.1 數(shù)據(jù)來源

首先, 從在線人類孟德爾遺傳(online Mendelian inheritance in man, OMIM)網(wǎng)站獲取肌萎縮側(cè)索硬化癥的基因數(shù)據(jù), 在OMIM.org上的OMIM是關(guān)于基因和遺傳表型以及二者相互聯(lián)系的綜合信息存儲(chǔ)庫, 包含了現(xiàn)在已知的所有遺傳病和超過15 000個(gè)基因信息, 側(cè)重于疾病的表型及與其密切相關(guān)的致病基因信息. 同時(shí), OMIM也連接了很多相關(guān)和互補(bǔ)的數(shù)據(jù)庫, 為查詢疾病和基因提供了便利. OMIM采用自由文本格式, 結(jié)構(gòu)靈活, 以有效的方式搜尋并描述基因和基因表型之間復(fù)雜而微妙的關(guān)系. OMIM也有衍生的基因表型和遺傳表型, 即病態(tài)圖譜. 表現(xiàn)型系列的建立是為便于觀察表現(xiàn)型的遺傳異質(zhì)性. 臨床概要特征通過UMLS(unified medical language system)、 人類表型本體、 形態(tài)學(xué)術(shù)語元素和圖像鏈接得到增強(qiáng). 所有OMIM數(shù)據(jù)都可下載. OMIM基于專家對(duì)生物醫(yī)學(xué)文獻(xiàn)的評(píng)論綜合和總結(jié)新的重要信息. 通過文獻(xiàn)數(shù)據(jù)的整合發(fā)現(xiàn), OMIM也在遺傳表型的命名和分類中發(fā)揮著主導(dǎo)作用. 隨著新測(cè)序技術(shù)的出現(xiàn), 推測(cè)基因表現(xiàn)型關(guān)系的報(bào)告迅速增加. OMIM工作人員審查與基因相關(guān)的新聞源, 并在信息編入OMIM的過程中識(shí)別文章[7]. 通過GeneMap即可查詢OMIM, 先利用GeneMap獲取疾病基因定位的詳細(xì)資料, 再查詢OMIM明確導(dǎo)致特定疾病的特定基因. OMIM系統(tǒng)根據(jù)搜索關(guān)鍵詞的疾病特征及表型, 整合數(shù)據(jù)庫的相關(guān)信息, 從相關(guān)基因在染色體中的位置、 基因結(jié)構(gòu)、 表達(dá)、 功能以及相關(guān)臨床病例等信息中綜合篩選出50個(gè)基因列表文件, 列于表1. 表1返回的所有數(shù)據(jù)均被證實(shí)與肌萎縮側(cè)索硬化癥有關(guān), 排名不分先后.

表1 OMIM對(duì)肌萎縮側(cè)索硬化癥基因排序結(jié)果

續(xù)表1

1.2 方 法

文獻(xiàn)及臨床病例證明, 基因突變是很多疾病發(fā)生發(fā)展的重要因素, 因此致病基因預(yù)測(cè)方法及其準(zhǔn)確性具有重要的科學(xué)意義. 目前, 通過已研發(fā)的多種致病基因預(yù)測(cè)軟件, 整合多種數(shù)據(jù)庫和文獻(xiàn)信息, 可進(jìn)行致病基因的預(yù)測(cè). 近年來大量生物數(shù)據(jù)的積累已顯著提高了疾病基因預(yù)測(cè)軟件的準(zhǔn)確性, 已普及多種致病基因預(yù)測(cè)軟件, 如Endeavour、 GLAD4U和ProphNet等, 綜合這些軟件對(duì)數(shù)據(jù)進(jìn)行生物學(xué)分析并準(zhǔn)確預(yù)測(cè)致病基因已成為生物信息學(xué)的通用方法. 為進(jìn)一步明確肌萎縮側(cè)索硬化癥的靶點(diǎn), 以表1中的50個(gè)基因?yàn)榛A(chǔ), 用運(yùn)算軟件整合數(shù)據(jù)庫信息, 進(jìn)一步篩選密切相關(guān)的基因.

1) Endeavour軟件. Endeavour軟件通過跨多個(gè)基因組數(shù)據(jù)源對(duì)候選基因進(jìn)行排序, 并將這種異質(zhì)性信息整合到全球排名中. 首先通過查閱相關(guān)疾病文獻(xiàn)或數(shù)據(jù)庫后得到一組訓(xùn)練基因, 其次用一組測(cè)試基因根據(jù)已獲得訓(xùn)練基因特征的相似度進(jìn)行比對(duì)并排行, 最后整合來自各數(shù)據(jù)庫的基因并進(jìn)行預(yù)測(cè)和排名, 基于不同標(biāo)準(zhǔn)進(jìn)行加權(quán)統(tǒng)計(jì)評(píng)分, 得到基因的整體優(yōu)先級(jí)[8]. 將表1的結(jié)果作為訓(xùn)練基因, 通過Endeavour軟件進(jìn)行運(yùn)算, 結(jié)果列于表2. 表2中對(duì)肌萎縮側(cè)索硬化癥基因融合排序前10的結(jié)果, 均被證實(shí)與該癥狀相關(guān).

表2 Endeavour對(duì)肌萎縮側(cè)索硬化癥基因排序結(jié)果

2) GLAD4U軟件. 基因序列自動(dòng)生成工具(gene list automatically derived for you, GLAD4U)是一個(gè)新的基于網(wǎng)絡(luò)免費(fèi)基因檢索和排序工具. GLAD4U利用NCBI的現(xiàn)有資源確保計(jì)算效率, 可為三個(gè)基因本體論(GO)術(shù)語和三個(gè)疾病術(shù)語創(chuàng)建基因列表的質(zhì)量使用公共數(shù)據(jù)庫中相應(yīng)的“黃金標(biāo)準(zhǔn)”列表進(jìn)行評(píng)估[5]. 表3為使用GLAD4U工具查詢肌萎縮側(cè)索硬化癥基因的結(jié)果. 表3中所有基因均被證實(shí)與肌萎縮側(cè)索硬化癥相關(guān), 根據(jù)黃金標(biāo)準(zhǔn)排名, 排名從高到低.

表3 GLAD4U對(duì)肌萎縮側(cè)索硬化癥基因排序結(jié)果

3) ProphNet軟件. ProphNet軟件建立在異構(gòu)網(wǎng)絡(luò)上, 先收集不同類型生物實(shí)體的數(shù)據(jù), 將這些信息全面整合, 再整理篩選出特定類型的實(shí)體, 將它們與需要查詢集的實(shí)體關(guān)系程度進(jìn)行積分排序. 該方法的工作原理是通過網(wǎng)絡(luò)整合和篩選信息, 查看已傳播的查詢值和實(shí)體目標(biāo)集之間的相互聯(lián)系[6]. ProphNet的方法較靈活, 可將相應(yīng)的數(shù)據(jù)進(jìn)行整理和排序, 為科研提供數(shù)據(jù)支持. 表4為使用ProphNet致病基因預(yù)測(cè)軟件查詢肌萎縮側(cè)索硬化癥相關(guān)基因的結(jié)果. 表4中所有基因均被證實(shí)與肌萎縮側(cè)索硬化癥相關(guān), 排名從高到低.

表4 ProphNet對(duì)肌萎縮側(cè)索硬化癥基因排序結(jié)果

1.3 評(píng)定排名標(biāo)準(zhǔn)

分別利用Endeavour、 GLAD4U和ProphNet三種致病基因預(yù)測(cè)軟件, 經(jīng)數(shù)據(jù)分析, 整理篩查, 確定3組與ALS相關(guān)的基因數(shù)據(jù), 將3組數(shù)據(jù)進(jìn)行處理、 整合、 排列, 得到基因出現(xiàn)次數(shù)≥3的數(shù)據(jù)即為最終結(jié)果.

2 結(jié)果與討論

將OMIM數(shù)據(jù)庫與Endeavour、 GLAD4U、 ProphNet工具軟件中查找到的與肌萎縮側(cè)索硬化癥高度相關(guān)的基因進(jìn)行整合, 得到一個(gè)含有39個(gè)與ALS致病相關(guān)的基因列表(表5), 其出現(xiàn)次數(shù)均≥3次, 通過查找基因相關(guān)研究文獻(xiàn)后進(jìn)行驗(yàn)證分析, 結(jié)果表明這39個(gè)基因均與肌萎縮側(cè)索硬化癥密切相關(guān). 將生物學(xué)信息與計(jì)算機(jī)軟件相結(jié)合, 篩選出更精確的致病基因, 為ALS分子機(jī)制的研究提供了新方法, 并且節(jié)約了大量查閱文獻(xiàn)的時(shí)間, 更快速鎖定靶點(diǎn).

表5 OMIM、 Endeavour、 GLAD4U和ProphNet綜合分析肌萎縮側(cè)索硬化癥基因結(jié)果

綜上, 本文通過查找OMIM數(shù)據(jù)庫, 利用Endeavour、 GLAD4U、 ProphNet致病基因預(yù)測(cè)軟件對(duì)數(shù)據(jù)進(jìn)行整合分析和處理, 推測(cè)出與肌萎縮側(cè)索硬化癥相關(guān)的致病基因并進(jìn)行了驗(yàn)證, 證實(shí)以上基因與肌萎縮側(cè)索硬化癥的發(fā)病及治療均有重大聯(lián)系. 其中,TARDBP、SOD1、C9orf72等基因均在ALS中起重要作用, 有望成為基因治療靶點(diǎn).

TARDBP是97%的ALS患者在患病組織中表現(xiàn)出共同的表型, 即TAR-DNA結(jié)合蛋白TDP-43沉積. TDP-43沉積也是tau陰性額顳葉癡呆(FTD) 的主要特征, 其顯示出與ALS臨床重疊[9]. 細(xì)胞內(nèi)聚集超氧化物歧化酶1 (SOD1) 是人類家族性肌萎縮側(cè)索硬化的神經(jīng)病理學(xué)特征[80]. 9號(hào)染色體開放閱讀框72(C9orf72)非編碼區(qū)的六核苷酸重復(fù)擴(kuò)增是家族性ALS的主要原因[30]. 以上基因均為肌萎縮側(cè)索硬化癥的重要發(fā)病基因, 肌萎縮側(cè)索硬化癥目前尚無有效的治愈方法, 但本文為將來運(yùn)用基因治療肌萎縮側(cè)索硬化癥提供了一定的理論支持, 通過適當(dāng)?shù)幕蛑委煟?可緩解甚至治愈肌萎縮側(cè)索硬化癥, 并為預(yù)防肌萎縮側(cè)索硬化癥提供了基因預(yù)測(cè)方法.

猜你喜歡
硬化癥肌萎縮表型
渤健Vumerity獲歐盟CHMP推薦治療多發(fā)性硬化癥
基于衰老相關(guān)分泌表型理論探討老年慢性阻塞性肺疾病患者衰弱發(fā)生機(jī)制
肌肉萎縮真有那么可怕嗎
Adventurer on the wheels輪椅上的華麗冒險(xiǎn)
體型表型與亞臨床動(dòng)脈粥樣硬化有關(guān)
慢性阻塞性肺疾病急性加重期臨床表型及特征分析
作物表型組學(xué)和高通量表型技術(shù)最新進(jìn)展(2020.2.2 Plant Biotechnology Journal)
首兒所關(guān)愛脊髓性肌萎縮癥兒童
兩種肌萎縮側(cè)索硬化基因表達(dá)譜差異性比較
Stephen Hawking wants to be a Bond villain