本報評論員
新冠病毒生物特性怎么樣?致病機理是什么?傳播機制是什么?病原體與宿主間的相互作用又是什么?這些問題關(guān)系著疫苗研發(fā)和找到特效藥。目前全球多領(lǐng)域多學(xué)科的科學(xué)家正在與時間賽跑,希望快馬加鞭研發(fā)出疫苗,找到特效藥。在這場科學(xué)與病毒的賽跑中,信息技術(shù)正與科學(xué)家們一起加速奔跑。
制服新冠病毒的關(guān)鍵環(huán)節(jié)在于盡快縮短新藥和疫苗研發(fā)周期,而新藥和疫苗從研發(fā)到上市需要進行大量的數(shù)據(jù)分析、大規(guī)模文獻(xiàn)篩選和知識圖譜建立,同時需要大規(guī)模超算工作。如果我們將大數(shù)據(jù)、人工智能算法、算力運用到藥理毒理研究、蛋白篩選、新藥研發(fā)中,能夠大幅加快老藥新指征與疫苗的研制進程。例如,在2015年抗擊埃博拉病毒的新藥研制中,Atomwise公司準(zhǔn)備了埃博拉病毒入侵生物細(xì)胞的“爪”模型,利用類似人腦神經(jīng)的網(wǎng)絡(luò)進行藥物成分分析,檢測已知的7000種可對抗這種“爪”的藥物,用不到一天的時間就在7000種藥物中成功找到能控制埃博拉病毒的兩種候選藥物,且成本不超過1000美元。如果利用傳統(tǒng)的方法進行分析篩選,需要數(shù)月甚至是數(shù)年。
新冠肺炎可能成為百年不遇的大流行病,其速度和嚴(yán)重程度與1918年的流感疫情不相上下。全球需要加快針對新冠肺炎的療法研究和疫苗開發(fā)工作。目前利用已通過安全性測試的化合物庫和新的篩選技術(shù)(包括機器學(xué)習(xí)),科學(xué)家們能夠在幾周內(nèi)篩選出可用于大規(guī)模臨床試驗的抗病毒藥物,從而加快藥物研發(fā)進程。日前,英特爾、聯(lián)想以及華大基因宣布,三家公司正攜手加快新型冠狀病毒的基因組特性分析。利用聯(lián)想超算技術(shù)和基因組分析工具,可為全基因組測序和全外顯子測序的計算提供高達(dá)40倍的加速,幫助華大基因高效處理數(shù)據(jù),更快地生成可靠的基因組分析成果,從而縮短科研和臨床觀察的時間。
在基因測序工作中,每毫升體液通常會包含數(shù)百萬個不同的病毒體,而每個病毒體的基因組則包含大約3萬個DNA堿基或字母。華大基因正在對眾多感染患者和疑似感染患者的微生物進行基因測序,而這些研究工作將會生成TB級乃至PB級的海量數(shù)據(jù)。要想高效地快速處理這些重要數(shù)據(jù),就需要采用更為先進的高性能計算(HPC)基礎(chǔ)架構(gòu)、計算技術(shù)以及優(yōu)化的基因組分析方法。
尋找疫苗和救治方法,在這場科學(xué)與病毒的賽跑中,目前許多信息技術(shù)公司正與不同的科學(xué)家團隊展開合作,為他們的研發(fā)提供算力、算法工具,助其快馬加鞭。例如,阿里云提供超大規(guī)模計算力、人工智能算法等技術(shù),支持鐘南山院士團隊的科研人員加快開展對新冠病毒的新藥研發(fā)、病毒基因測序、蛋白篩選等相關(guān)工作,縮短攻關(guān)周期。正如中國工程院院士陳薇所說,新型冠狀病毒變異再快,也在冠狀病毒這個大類里,目前大數(shù)據(jù)研究發(fā)展迅速,一旦有新變異出現(xiàn),可以馬上通過生物信息學(xué)或大數(shù)據(jù)挖掘找到共用的靶抗原、發(fā)病機制或受體,快速指導(dǎo)疫苗的改良。
信息技術(shù)已經(jīng)成為當(dāng)今世界的“石油”,在對抗新冠肺炎病毒的戰(zhàn)役中,新一代信息技術(shù)功不可沒也責(zé)無旁貸。