徐 玄,于連超,任思源
(中國計(jì)量科學(xué)研究院,北京 100029)
當(dāng)前,生命科學(xué)已成為前沿科學(xué)研究活躍領(lǐng)域,而生物技術(shù)正在成為推動(dòng)未來發(fā)展的關(guān)鍵因素。隨著生物技術(shù)的快速發(fā)展,以基因組學(xué)、遺傳學(xué)和神經(jīng)信息學(xué)等為代表的各學(xué)科領(lǐng)域積累了龐大的數(shù)據(jù)信息資源,與此同時(shí),生物數(shù)據(jù)以其數(shù)據(jù)量大、價(jià)值高和多樣化等特征,在疾病預(yù)防、疾病診斷以及疾病治療等領(lǐng)域的重要性正日益彰顯。《自然》雜志2018 年10 月刊以封面文章展示了通過收集50 萬人的體液、血液以及他們的家族病史和生活習(xí)慣等生物信息,建立了前所未有的高質(zhì)量生物信息數(shù)據(jù)庫,極大地促進(jìn)全球數(shù)千名科學(xué)家開展研究,深入理解人類疾?。?]。因此,生物數(shù)據(jù)已成為生命科學(xué)進(jìn)步的重要引擎,并且正在從根本上改變生物健康產(chǎn)業(yè)的發(fā)展格局。
以美國為首的西方國家高度重視生物大數(shù)據(jù)的發(fā)展,發(fā)布了一系列相關(guān)戰(zhàn)略規(guī)劃,積極推動(dòng)基因組學(xué)研究、醫(yī)學(xué)遺傳學(xué)以及生物信息學(xué)等領(lǐng)域的創(chuàng)新融合,研究其生物數(shù)據(jù)戰(zhàn)略的政策內(nèi)容及特點(diǎn)對(duì)我國相關(guān)戰(zhàn)略的制定具有較高的借鑒價(jià)值。黨的十八大以來,我國在生命科學(xué)研究與生物產(chǎn)業(yè)發(fā)展領(lǐng)域取得了巨大的成果,對(duì)生物數(shù)據(jù)的重視也在日益提升。2017 年12 月,我國正式啟動(dòng)世界最大規(guī)模的人類基因組計(jì)劃,旨在通過構(gòu)建中國人的精密基因組圖譜,深入研究疾病與健康之間的基因遺傳關(guān)系。2021 年3 月,《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要》(以下簡稱“十四五”規(guī)劃)中也明確提出構(gòu)建國家生物數(shù)據(jù)中心體系、制定完善人類遺傳資源和生物資源目錄等要求。同時(shí),我國生物數(shù)據(jù)的發(fā)展也面臨不少挑戰(zhàn),生物數(shù)據(jù)資源開發(fā)利用體系尚不完備,生物數(shù)據(jù)發(fā)展缺乏頂層設(shè)計(jì)和統(tǒng)籌協(xié)調(diào)等,需科學(xué)分析國內(nèi)外生物數(shù)據(jù)發(fā)展形勢,把握面臨的風(fēng)險(xiǎn)挑戰(zhàn),科學(xué)規(guī)劃、系統(tǒng)推進(jìn)我國生物數(shù)據(jù)戰(zhàn)略規(guī)劃。
為推動(dòng)我國生物數(shù)據(jù)戰(zhàn)略進(jìn)一步發(fā)展,本文全面梳理美國生物數(shù)據(jù)戰(zhàn)略演進(jìn)歷程,掌握其基本發(fā)展規(guī)律,總結(jié)美國生物數(shù)據(jù)戰(zhàn)略實(shí)施過程中的關(guān)鍵舉措和主要特點(diǎn),立足于我國生物數(shù)據(jù)發(fā)展現(xiàn)狀與問題,系統(tǒng)性設(shè)計(jì)我國生物數(shù)據(jù)發(fā)展路徑,以期為我國生物數(shù)據(jù)戰(zhàn)略的頂層設(shè)計(jì)提供參考借鑒。
戰(zhàn)略的演進(jìn)緣于戰(zhàn)略制定的與時(shí)俱進(jìn)。所謂戰(zhàn)略制定,就是根據(jù)當(dāng)下時(shí)局為背景,立足于國家利益為根本出發(fā)點(diǎn),制定適合未來國家發(fā)展的宏觀方略和微觀方案的過程。美國生物數(shù)據(jù)戰(zhàn)略經(jīng)過比爾·克林頓到約瑟夫·拜登五屆政府的發(fā)展后,其戰(zhàn)略體系逐漸完善,戰(zhàn)略框架日漸清晰。通過對(duì)美國生物數(shù)據(jù)戰(zhàn)略演進(jìn)的研究,掌握其基本發(fā)展規(guī)律,研判其未來發(fā)展的基本方向,具有極為重要的意義。
美國作為隱私權(quán)的發(fā)源地,歷來高度重視個(gè)人隱私的保護(hù)。早在1890 年,美國學(xué)者沃倫和布蘭迪斯共同在《哈佛法律評(píng)論》發(fā)表了一篇題為《隱私權(quán)》的論文,被學(xué)界認(rèn)為是最早在法理上對(duì)“隱私權(quán)”的論述[2]。為維護(hù)美國公民隱私,美國國會(huì)于1974年12 月通過《隱私權(quán)法》,該法案對(duì)涉及美國政府有關(guān)部門收集和利用個(gè)人數(shù)據(jù)等方面做出規(guī)定。
與此同時(shí),隨著生物科技的飛速發(fā)展,人體的指紋、面容等個(gè)人生物識(shí)別信息的獲取和應(yīng)用越來越便利和普及,美國對(duì)個(gè)人生物信息安全的關(guān)注度日益提升[3]。與一般個(gè)人信息數(shù)據(jù)相比,生物識(shí)別信息具有唯一性、永久性和不可替代性的特點(diǎn),因而可能會(huì)引發(fā)侵犯隱私、種族歧視等風(fēng)險(xiǎn)。1996年8 月,克林頓總統(tǒng)簽署通過《1996 年健康保險(xiǎn)可移植性與責(zé)任法案》(HIPAA 法案),HIPAA 法案主要關(guān)注醫(yī)療保健數(shù)據(jù)的隱私安全問題[4]。1999年11 月,美國衛(wèi)生與公共服務(wù)部(HHS)發(fā)布了征求公眾意見的《HIPAA 隱私規(guī)則》建議版本,對(duì)HIPAA 法案進(jìn)一步充實(shí)完善,其中規(guī)定了例如指紋和聲紋、面容特征等個(gè)人生物識(shí)別信息使用和披露標(biāo)準(zhǔn),并確保了病人對(duì)其個(gè)人生物信息的控制權(quán)和隱私保護(hù)。根據(jù)這些意見,美國衛(wèi)生與公眾服務(wù)部于2000 年12 月發(fā)布了《個(gè)人可識(shí)別健康信息的隱私標(biāo)準(zhǔn)》,強(qiáng)調(diào)確保公民的醫(yī)療健康信息得到有效合規(guī)利用,從而為大眾提供更優(yōu)質(zhì)的醫(yī)療服務(wù)。HIPAA 法案奠定了美國生物數(shù)據(jù)政策的基礎(chǔ),對(duì)隨后的相關(guān)法律和政策制定產(chǎn)生了深遠(yuǎn)影響。
美國生物戰(zhàn)略源于對(duì)公民生物信息的保護(hù),在其后續(xù)的發(fā)展過程中,隨著生物技術(shù)的快速發(fā)展與美國國家需求的變化,美國生物數(shù)據(jù)戰(zhàn)略也不斷擴(kuò)展其范圍和內(nèi)涵。
一是持續(xù)在生命健康領(lǐng)域擴(kuò)展。隨著HIPAA 法案生效至今,經(jīng)歷了20 余次的修訂完善,已經(jīng)比較完備地對(duì)公民生物信息保護(hù)做出了規(guī)定。2008 年國際金融危機(jī)爆發(fā)后,美國在保障人民生活的公共物品供給領(lǐng)域出現(xiàn)了嚴(yán)重不足,尤其是醫(yī)療保障領(lǐng)域的供給嚴(yán)重缺乏。為應(yīng)對(duì)這一問題,奧巴馬政府將改革美國醫(yī)療保障體系作為執(zhí)政重點(diǎn)之一,目標(biāo)是建立覆蓋廣泛而又費(fèi)用低廉的醫(yī)療保障體系。奧巴馬醫(yī)改涉及了眾多方面的改革,包括擴(kuò)大醫(yī)療保險(xiǎn)覆蓋范圍、推動(dòng)醫(yī)療記錄的電子化等。2009 年2 月,美國國會(huì)通過了《經(jīng)濟(jì)和臨床健康信息技術(shù)法案》(HITECH 法案)[5],鼓勵(lì)全美各醫(yī)院與相關(guān)機(jī)構(gòu)通過數(shù)字化的方式儲(chǔ)存電子病歷等相關(guān)生物信息數(shù)據(jù)。HITECH 法案順應(yīng)了電子時(shí)代個(gè)人健康醫(yī)療數(shù)據(jù)逐步電子化的趨勢,進(jìn)一步擴(kuò)展了HIPAA 法案的適用范圍。在醫(yī)療改革的框架下,奧巴馬政府意識(shí)到生物數(shù)據(jù)對(duì)精準(zhǔn)醫(yī)療的重要性,2015 年1 月,奧巴馬政府推出精準(zhǔn)醫(yī)療計(jì)劃,旨在通過收集和分析患者的遺傳、生活方式等大規(guī)模生物學(xué)和臨床數(shù)據(jù)集,實(shí)現(xiàn)對(duì)每個(gè)患者進(jìn)行精準(zhǔn)的疾病風(fēng)險(xiǎn)預(yù)測、早期篩查、診斷和提供個(gè)體化治療方案,以提高疾病防治效果和患者生活質(zhì)量。此外,精準(zhǔn)醫(yī)療計(jì)劃也關(guān)注了數(shù)據(jù)隱私和倫理問題,政府致力于確保在收集、存儲(chǔ)和共享個(gè)人生物信息時(shí),保護(hù)患者的隱私和數(shù)據(jù)安全。
二是滿足國家安全的整體需要。由于“9·11”事件的影響,布什政府極為重視貫徹實(shí)施信息安全戰(zhàn)略的措施,特別是在炭疽攻擊事件發(fā)生后,美國多次發(fā)現(xiàn)恐怖組織試圖開發(fā)生物武器,這引起了政府的極大關(guān)注。隨著生物學(xué)的快速發(fā)展,特別是對(duì)人類與微生物之間長期共生關(guān)系的新認(rèn)識(shí),布什政府強(qiáng)調(diào)了“先發(fā)制人”戰(zhàn)略,并決心提高美國國家的生物安全能力。生物安全能力的提升不僅包括疫苗、藥物和檢測診斷等醫(yī)學(xué)應(yīng)對(duì)措施,還涉及到各種監(jiān)測設(shè)施與網(wǎng)絡(luò)系統(tǒng)、大規(guī)模生物數(shù)據(jù)的收集與大型計(jì)算機(jī)的分析處理系統(tǒng)等多個(gè)方面。2004 年4月,布什政府出臺(tái)《21 世紀(jì)生物防御》行政令確立以感知、預(yù)防、檢測、響應(yīng)為主生物防御領(lǐng)域的四大支柱。在這背景下,美國特別注重構(gòu)建生物監(jiān)測能力和推動(dòng)核心技術(shù)的研發(fā),在2005 財(cái)年預(yù)算中增加了2.74 億美元資助生物監(jiān)測計(jì)劃。2012 年7 月,奧巴馬政府發(fā)布的《國家生物監(jiān)測戰(zhàn)略》再次強(qiáng)調(diào)要整合國家生物監(jiān)測系統(tǒng)的重要性,以便在危急情況下及時(shí)為決策者提供信息。2018 年9 月,特朗普政府發(fā)布美國首個(gè)全面解決各種生物威脅的系統(tǒng)性戰(zhàn)略《國家生物防御戰(zhàn)略》,提出要建立高效的生物威脅監(jiān)測和應(yīng)對(duì)網(wǎng)絡(luò),加強(qiáng)國內(nèi)外生物信息的及時(shí)共享和交流,以提高對(duì)突發(fā)生物威脅的防范和應(yīng)對(duì)能力。
隨著新冠疫情的暴發(fā),百年變局加速演進(jìn),世界經(jīng)濟(jì)形勢總體極為嚴(yán)峻。全球主要經(jīng)濟(jì)體增速放緩或負(fù)增長,國際貿(mào)易和投資大幅萎縮。以美國為首的發(fā)達(dá)國家通脹率居高不下,美聯(lián)儲(chǔ)連續(xù)加息導(dǎo)致金融環(huán)境收緊。與此同時(shí),俄烏沖突引發(fā)糧食能源危機(jī),進(jìn)一步加劇通脹壓力。各國面臨的經(jīng)濟(jì)下行壓力和通脹壓力“雙疊加”,當(dāng)前全球經(jīng)濟(jì)增長動(dòng)能明顯不足,復(fù)蘇乏力。
相較美國前任政府的生物數(shù)據(jù)戰(zhàn)略,拜登政府更加注重生物數(shù)據(jù)在促進(jìn)美國科學(xué)與經(jīng)濟(jì)發(fā)展中的作用。2022 年8 月,美國總統(tǒng)拜登在白宮正式簽署了《芯片和科學(xué)法案》,該法案分為半導(dǎo)體、科學(xué)研究兩個(gè)部分,其中在科學(xué)研究部分就對(duì)生物經(jīng)濟(jì)的發(fā)展提出建設(shè)性意見。其中,該法案針對(duì)生物數(shù)據(jù)庫及相關(guān)工具的發(fā)展提出四點(diǎn)建議:一是在不危害國家安全及數(shù)據(jù)隱私的前提下,支持建立、篩選和維護(hù)包括植物、動(dòng)物和微生物在內(nèi)的基因組學(xué)、表觀遺傳學(xué)和其他相關(guān)的組學(xué)數(shù)據(jù)庫,以供研究人員開展工程生物學(xué)研究;二是制定生物數(shù)據(jù)庫的相關(guān)標(biāo)準(zhǔn),包括篩選標(biāo)準(zhǔn)、互操作性標(biāo)準(zhǔn)以及隱私和安全保護(hù)標(biāo)準(zhǔn);三是支持開發(fā)包括人工智能工具在內(nèi)計(jì)算工具,以加速基于這些數(shù)據(jù)庫進(jìn)行的研究和創(chuàng)新活動(dòng);四是對(duì)聯(lián)邦政府所有的生物數(shù)據(jù)庫進(jìn)行評(píng)估,根據(jù)發(fā)展需要對(duì)其進(jìn)行適當(dāng)改進(jìn),并為生物數(shù)據(jù)基礎(chǔ)設(shè)施投資提供決策信息。
2022 年9 月,拜登政府宣布啟動(dòng)《國家生物技術(shù)和生物制造計(jì)劃》,其中為了促進(jìn)美國生物經(jīng)濟(jì)的發(fā)展,提出將建立生物經(jīng)濟(jì)數(shù)據(jù)共享倡議(Data Initiative)。該倡議提出一是加大對(duì)促進(jìn)衛(wèi)生、氣候、能源、糧食、農(nóng)業(yè)和生物制造發(fā)展相關(guān)的基因組和多組學(xué)信息等生物數(shù)據(jù)的研發(fā);二是支持建立生物數(shù)據(jù)庫平臺(tái),從而確保高質(zhì)量、廣泛、易于獲取和安全的生物數(shù)據(jù)庫能夠推動(dòng)美國生物經(jīng)濟(jì)取得突破。2023 年3 月,為跟進(jìn)《國家生物技術(shù)和生物制造計(jì)劃》,美國白宮科技政策辦公室(OSTP)聯(lián)合能源部、農(nóng)業(yè)部、商務(wù)部、衛(wèi)生與公眾服務(wù)部、國家科學(xué)基金會(huì)共同發(fā)布報(bào)告《美國生物技術(shù)和生物制造戰(zhàn)略目標(biāo)和優(yōu)先事項(xiàng)》,用以推進(jìn)美國本土的生物技術(shù)和生物制造,強(qiáng)調(diào)要在 5 年內(nèi)進(jìn)一步發(fā)展生物數(shù)據(jù)基礎(chǔ)設(shè)施與先進(jìn)數(shù)據(jù)共享機(jī)制,通過基于生物數(shù)據(jù)的相關(guān)標(biāo)準(zhǔn)、工具和功能的研發(fā)和集成,支持生物技術(shù)促進(jìn)商業(yè)化和貿(mào)易的發(fā)展。
隨著經(jīng)濟(jì)社會(huì)不斷發(fā)展和國際局勢的變革,美國生物數(shù)據(jù)戰(zhàn)略也在不斷的調(diào)整與轉(zhuǎn)型,從過去側(cè)重公民生物信息保護(hù),向更加全面和系統(tǒng)的方向發(fā)展。在這一轉(zhuǎn)型的進(jìn)程中,美國采取了一系列舉措以滿足包括推動(dòng)生物經(jīng)濟(jì)發(fā)展、提高公民醫(yī)療健康水平、加強(qiáng)生物信息安全管控等多重需求。
由于生命的復(fù)雜性,生命科學(xué)研究往往面臨著實(shí)驗(yàn)結(jié)果數(shù)據(jù)高度不可復(fù)現(xiàn)的嚴(yán)峻挑戰(zhàn)。根據(jù)全球生物標(biāo)準(zhǔn)研究所(Global biological Standards Institute,GBSI)的研究結(jié)論顯示,生命科學(xué)領(lǐng)域研究導(dǎo)致實(shí)驗(yàn)數(shù)據(jù)不可復(fù)現(xiàn)主要因素包括生物試劑和標(biāo)準(zhǔn)物質(zhì)、實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析方案以及實(shí)驗(yàn)室操作程序[6]。研究測量結(jié)果的可復(fù)現(xiàn)和可溯源,本身就是計(jì)量科學(xué)的范疇,而參考測量方法和標(biāo)準(zhǔn)物質(zhì)研究正是生物計(jì)量學(xué)所研究的核心[7]。以美國國家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)為首的科研機(jī)構(gòu)一直以來通過開發(fā)核酸、蛋白質(zhì)、代謝物和細(xì)胞系統(tǒng)的定量分析測量工具,以及制定相關(guān)關(guān)鍵標(biāo)準(zhǔn)與方法等舉措,為生物技術(shù)研究人員提供測量幫助。2022 年8 月,美國《芯片與科學(xué)法案》中再次明確要求NIST 開展基因測量、生物分子及系統(tǒng)測量、研發(fā)測量標(biāo)準(zhǔn)和標(biāo)準(zhǔn)物質(zhì)等研發(fā)任務(wù),以保證美國相關(guān)行業(yè)在全球中的競爭力。
與此同時(shí),隨著高通量測序技術(shù)的不斷發(fā)展,組學(xué)數(shù)據(jù)已經(jīng)從以基因組為代表的PB 量級(jí)時(shí)代提升到多組學(xué)融合的EB 量級(jí)時(shí)代,如何保證生物數(shù)據(jù)的分析結(jié)果準(zhǔn)確可靠成為目前研究的熱門話題。美國政府長期以來大力支持計(jì)量與大數(shù)據(jù)技術(shù)的深度融合與創(chuàng)新,并從國家層面持續(xù)推動(dòng)生物信息核心技術(shù)體系建設(shè)。早在2016 年5 月,美國國家科技委員會(huì)發(fā)布國家大數(shù)據(jù)戰(zhàn)略性文件《聯(lián)邦大數(shù)據(jù)研發(fā)戰(zhàn)略計(jì)劃》,強(qiáng)調(diào)新興技術(shù)對(duì)推進(jìn)大數(shù)據(jù)發(fā)展的重要性。緊隨其后,2018 年6 月,NIH 也相應(yīng)地提出《NIH數(shù)據(jù)科學(xué)戰(zhàn)略計(jì)劃》,指出要從生物醫(yī)學(xué)數(shù)據(jù)的精準(zhǔn)采集、數(shù)據(jù)的標(biāo)準(zhǔn)化管理以及大數(shù)據(jù)分析技術(shù)入手,最終確保由 NIH 資助的全部科學(xué)數(shù)據(jù)符合 FAIR(definable,accessible,interoperable and reusable)原則,以加速生物醫(yī)學(xué)研究的進(jìn)展[8]。2022 年9 月,拜登簽署的《關(guān)于促進(jìn)生物技術(shù)和生物制造創(chuàng)新以建立可持續(xù)、安全和有保障的美國生物經(jīng)濟(jì)的行政命令》,進(jìn)一步強(qiáng)調(diào)新興生物技術(shù)的基礎(chǔ)研發(fā)要與計(jì)量、標(biāo)準(zhǔn)等技術(shù)進(jìn)步相結(jié)合。通過生物計(jì)量技術(shù)和大數(shù)據(jù)等計(jì)算機(jī)技術(shù)的深度融合,將為多組學(xué)時(shí)代的大數(shù)據(jù)分析的廣泛使用和大型數(shù)據(jù)集的集成帶來新的機(jī)遇,進(jìn)而驅(qū)動(dòng)生物經(jīng)濟(jì)迭代發(fā)展。
美國高度重視生物數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),深刻認(rèn)識(shí)到強(qiáng)大的基礎(chǔ)設(shè)施對(duì)實(shí)現(xiàn)生物信息應(yīng)用價(jià)值的戰(zhàn)略意義。為此,美國政府在國家層面持續(xù)大力投入,培育和壯大了一系列頂尖的公共生物信息數(shù)據(jù)庫,如美國國家生物技術(shù)信息中心(NCBI)、國家標(biāo)準(zhǔn)參考數(shù)據(jù)中心(NSRDC)等。這些數(shù)據(jù)庫為科學(xué)家提供海量的數(shù)據(jù)資源,支持開展前沿生物領(lǐng)域的科學(xué)研究,推動(dòng)生物技術(shù)成果轉(zhuǎn)化。
以NCBI 為例,它由美國國立衛(wèi)生研究院于1988 年創(chuàng)立,致力于研發(fā)尖端信息技術(shù)來助力解析生命的奧秘,創(chuàng)建可存儲(chǔ)、分析、共享各類生物信息的大型自動(dòng)化系統(tǒng),并大力推廣數(shù)據(jù)庫和軟件工具在科研中的廣泛應(yīng)用。NCBI 的建設(shè)和運(yùn)行主要依靠政府財(cái)政撥款支持,2017—2021 年期間,NCBI 每年獲得3 億~4 億美元的穩(wěn)定資助[9]。在資金持續(xù)投入的促進(jìn)下,NCBI 已經(jīng)發(fā)展成為全球最大最全面的公共生物信息數(shù)據(jù)庫,據(jù)2023 年1 月的最新數(shù)據(jù)顯示:NCBI 共擁有35 個(gè)不同數(shù)據(jù)庫,這些數(shù)據(jù)庫總共包含3 億條記錄[10]。以NCBI 下屬用于儲(chǔ)存高通量測序數(shù)據(jù)的SRA(Sequence Read Archive)數(shù)據(jù)庫為例,2018—2021 年的年均增長率均在30%以上,2021 年底SRA 的數(shù)據(jù)規(guī)模已超過36PB。
NCBI 數(shù)據(jù)庫資源的高速擴(kuò)張,充分反映了美國政府在加強(qiáng)生物信息基礎(chǔ)設(shè)施建設(shè)方面的戰(zhàn)略決心和持續(xù)投入力度。隨著生物數(shù)據(jù)量呈幾何級(jí)數(shù)增長,美國開始關(guān)注構(gòu)建聯(lián)盟式的分布式數(shù)據(jù)庫網(wǎng)絡(luò)。拜登政府2022 年9 月的《關(guān)于促進(jìn)生物技術(shù)和生物制造創(chuàng)新以建立可持續(xù)、安全和有保障的美國生物經(jīng)濟(jì)的行政命令》明確提出建立生物數(shù)據(jù)共享聯(lián)盟,旨在通過連接各種分布式數(shù)據(jù)庫資源,最大限度匯聚信息以釋放更大應(yīng)用價(jià)值。這表明美國將打造靈活的分布式網(wǎng)絡(luò)作為數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的新方向。美國在生物數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)上持續(xù)進(jìn)行巨額投入,并建立了長期穩(wěn)定的支撐機(jī)制。與此同時(shí),美國還及時(shí)根據(jù)生物數(shù)據(jù)爆炸的現(xiàn)實(shí)情況,進(jìn)而調(diào)整技術(shù)路線。這種持續(xù)的資金支持與靈活的技術(shù)策略調(diào)整,都服務(wù)于美國全力促進(jìn)生物經(jīng)濟(jì)快速發(fā)展的國家戰(zhàn)略目標(biāo)。
科學(xué)數(shù)據(jù)的有效匯交與高效共享,對(duì)推動(dòng)生命科學(xué)與生物經(jīng)濟(jì)發(fā)展具有戰(zhàn)略意義。數(shù)據(jù)匯聚可以避免重復(fù)建設(shè)和研究,共享可使更多科研人員獲得已有成果,充分發(fā)揮協(xié)同效應(yīng)。此外,共享機(jī)制還可加速研究成果轉(zhuǎn)化,使更多社會(huì)群體從中受益,這也是美國政府持續(xù)推進(jìn)生物信息流通體系建設(shè)的重要原因。美國主要從3 個(gè)層面持續(xù)推動(dòng)生物數(shù)據(jù)的有效匯聚與廣泛共享。
在生物數(shù)據(jù)匯聚端,美國各大科研資助機(jī)構(gòu)、大型科學(xué)研究計(jì)劃要求其資助的研究項(xiàng)目提交科學(xué)數(shù)據(jù)的管理計(jì)劃。美國主要的科研資助機(jī)構(gòu)如國家國立衛(wèi)生研究院(NIH)、美國國家科學(xué)基金會(huì)(NSF)、美國國家標(biāo)準(zhǔn)與技術(shù)研究院等都制定了數(shù)據(jù)提交制度。以NIH 為例,2023 年1 月《NIH 數(shù)據(jù)管理和共享政策》正式生效,該政策進(jìn)一步強(qiáng)化了NIH 的長期承諾,即通過有效和高效的數(shù)據(jù)管理和數(shù)據(jù)共享實(shí)踐向公眾提供NIH 資助的研究的結(jié)果。同時(shí),“人類基因組計(jì)劃”“DNA 元件百科全書計(jì)劃”等大型科學(xué)研究計(jì)劃建立了數(shù)據(jù)匯交制度,從而實(shí)現(xiàn)數(shù)據(jù)共享。此外,美國擁有Science、Cell等全球高質(zhì)量的生物醫(yī)學(xué)期刊,長期吸引著全球高水平的生物醫(yī)學(xué)研究成果發(fā)表。這些期刊規(guī)定研究人員要將科學(xué)數(shù)據(jù)匯交到 NCBI 指定的數(shù)據(jù)庫中。正是這種可持續(xù)的數(shù)據(jù)匯聚,才使NCBI 能穩(wěn)步快速擴(kuò)張,發(fā)展成為全球最大的基因序列數(shù)據(jù)庫之一。
在生物數(shù)據(jù)儲(chǔ)存端,美國相關(guān)機(jī)構(gòu)一致認(rèn)為標(biāo)準(zhǔn)化儲(chǔ)存是推進(jìn)生物科學(xué)研究的關(guān)鍵環(huán)節(jié)。具體來看,NSF 資助的研究計(jì)劃都明確要求利用數(shù)據(jù)庫等標(biāo)準(zhǔn)化格式來儲(chǔ)存科研過程中產(chǎn)生的數(shù)據(jù)。早在2011 年,NSF 就在其《申請(qǐng)與資助政策指南》中首次增加了數(shù)據(jù)管理計(jì)劃(DMP)的要求,提出研究人員若條件允許,應(yīng)當(dāng)優(yōu)先使用大型的、可公開訪問的社區(qū)公認(rèn)數(shù)據(jù)存儲(chǔ)庫來儲(chǔ)存各類研究數(shù)據(jù),并針對(duì)不同數(shù)據(jù)類型使用符合標(biāo)準(zhǔn)的儲(chǔ)存格式和元數(shù)據(jù)格式。此外,NSF 還采用了項(xiàng)目負(fù)責(zé)人負(fù)責(zé)制來實(shí)施數(shù)據(jù)管理要求,要求研究計(jì)劃在申請(qǐng)書中詳細(xì)描述各參與方在數(shù)據(jù)管理過程中的職責(zé)分工,并且項(xiàng)目的年度報(bào)告和最終報(bào)告中也必須包含數(shù)據(jù)管理計(jì)劃的具體執(zhí)行情況,這些詳細(xì)的要求反映出NSF對(duì)標(biāo)準(zhǔn)化生物數(shù)據(jù)儲(chǔ)存的高度重視。與此同時(shí),NIH也非常關(guān)注生物信息標(biāo)準(zhǔn)化儲(chǔ)存,《NIH 數(shù)據(jù)科學(xué)戰(zhàn)略計(jì)劃》提出要解決海量生物醫(yī)學(xué)研究數(shù)據(jù)的存儲(chǔ)效率和安全性問題。隨著生物信息學(xué)進(jìn)入大數(shù)據(jù)時(shí)代,生物數(shù)據(jù)類型日趨復(fù)雜豐富,美國相關(guān)科研機(jī)構(gòu)正在采用了可擴(kuò)展的數(shù)據(jù)庫技術(shù)來儲(chǔ)存不同格式的生物數(shù)據(jù),并重點(diǎn)實(shí)施數(shù)據(jù)的生命周期管理,從而有效挖掘與整合分析這些不同類型的數(shù)據(jù),進(jìn)而實(shí)現(xiàn)生物信息學(xué)的理論與應(yīng)用研究[11]。
在生物數(shù)據(jù)共享端,美國則注重建立用戶友好的數(shù)據(jù)庫服務(wù)平臺(tái),以便數(shù)據(jù)被廣泛使用。例如NCBI 就利用網(wǎng)絡(luò)技術(shù)、可視化圖形、人機(jī)交互等前沿手段,使其旗下生物數(shù)據(jù)庫更易于訪問和理解[12]。此外,美國還通過立法持續(xù)支持開發(fā)更多生物信息分析工具,以進(jìn)一步擴(kuò)展數(shù)據(jù)庫的應(yīng)用場景。2022年8 月,《芯片與科學(xué)法》中再次提出支持開發(fā)計(jì)算工具,包括人工智能工具,能夠加速利用這些數(shù)據(jù)庫進(jìn)行研究和創(chuàng)新。2022 年9 月,《國家生物技術(shù)和生物制造計(jì)劃》明確表示未來生物數(shù)據(jù)庫平臺(tái)建設(shè)應(yīng)滿足可查找、可訪問、可互操作和可重用四類要求。這種數(shù)據(jù)庫技術(shù)創(chuàng)新的思路,使美國生物信息平臺(tái)在世界范圍內(nèi)數(shù)一數(shù)二,并且通過匯聚、儲(chǔ)存、共享3 個(gè)層面的協(xié)調(diào)發(fā)展,美國形成了高效的生物數(shù)據(jù)流轉(zhuǎn)體系,為生物經(jīng)濟(jì)快速推進(jìn)提供了有力支撐。
美國構(gòu)建了較為完善的政府?dāng)?shù)據(jù)開放和公民隱私保護(hù)的法規(guī)體系?!缎畔⒆杂煞ā贰峨[私權(quán)法》等法律在規(guī)范美國政府信息利用以及公民隱私權(quán)保護(hù)方面發(fā)揮著重要作用,這些法律成為美國政府?dāng)?shù)據(jù)開放制度的關(guān)鍵基石[13]。針對(duì)醫(yī)療衛(wèi)生數(shù)據(jù),美國衛(wèi)生與公眾服務(wù)部頒布了《HIPAA 隱私規(guī)則》以滿足HIPAA 法案的要求。并且,由于信息技術(shù)的發(fā)展,對(duì)公民信息的保護(hù)難度會(huì)逐漸提升。國會(huì)因此要求指出美國衛(wèi)生與公共服務(wù)部需要在HIPAA 法案中納入對(duì)個(gè)人健康信息的隱私保護(hù)條款。在科研數(shù)據(jù)方面,美國NIH、NSF 等科研機(jī)構(gòu)也高度重視參與者隱私的保護(hù),并將其視為研究者和機(jī)構(gòu)共同的責(zé)任。在2022 年9 月,為促進(jìn)高效的科學(xué)數(shù)據(jù)共享,保護(hù)研究參與者的隱私,NIH 跟進(jìn)發(fā)布了《NIH數(shù)據(jù)管理和共享政策補(bǔ)充信息: 共享人類研究參與者數(shù)據(jù)時(shí)保護(hù)隱私》,其中建議對(duì)科學(xué)數(shù)據(jù)進(jìn)行最大程度的去標(biāo)識(shí)化,建立數(shù)據(jù)共享和使用協(xié)議以及宣傳教育等手段防止數(shù)據(jù)泄露與濫用。
全球正迎來一場新一輪科技革命和產(chǎn)業(yè)變革,大數(shù)據(jù)技術(shù)的廣泛應(yīng)用大幅提升了生命科學(xué)與生物技術(shù)的研發(fā)效率。與此同時(shí),測序技術(shù)的迅猛發(fā)展推動(dòng)了各種組學(xué)技術(shù)快速成熟并逐步應(yīng)用于臨床領(lǐng)域,使得生命科學(xué)進(jìn)入了大數(shù)據(jù)、大平臺(tái)、大發(fā)現(xiàn)的時(shí)代[14],而海量的生物數(shù)據(jù)已經(jīng)成為支撐科學(xué)研究和產(chǎn)業(yè)創(chuàng)新不可或缺的寶貴資源[15]。在這樣的背景下,生物數(shù)據(jù)在推動(dòng)科學(xué)研究、促進(jìn)生物產(chǎn)業(yè)發(fā)展以及保障國家安全等方面的重要性不言而喻,因此,我國正在積極推動(dòng)生物數(shù)據(jù)戰(zhàn)略的制定與實(shí)施。
一是開展生物數(shù)據(jù)戰(zhàn)略頂層設(shè)計(jì)。2021 年3 月,《“十四五”規(guī)劃》提出了在生物安全領(lǐng)域的規(guī)劃,其中包括統(tǒng)籌布局生物安全基礎(chǔ)設(shè)施,構(gòu)建國家生物數(shù)據(jù)中心體系,加強(qiáng)高級(jí)別生物安全實(shí)驗(yàn)室體系建設(shè)和運(yùn)行管理。強(qiáng)化生物安全資源監(jiān)管,制定完善人類遺傳資源和生物資源目錄,建立健全生物技術(shù)研究開發(fā)風(fēng)險(xiǎn)評(píng)估機(jī)制,為我國新時(shí)期生物數(shù)據(jù)戰(zhàn)略指明方向。同年10 月,國家發(fā)展和改革委員會(huì)緊跟發(fā)布《“十四五”生物經(jīng)濟(jì)發(fā)展規(guī)劃》,其中強(qiáng)調(diào)建立國家層面生物資源共享體系。推進(jìn)生物資源受控共享和安全交換,推進(jìn)生物資源在科學(xué)研究、工業(yè)生產(chǎn)、臨床診療等領(lǐng)域的應(yīng)用。建立統(tǒng)一的資源數(shù)字信息管理接口標(biāo)準(zhǔn),實(shí)現(xiàn)跨地區(qū)、跨類型的資源數(shù)據(jù)集成及無縫連接,提高生物資源共享和生物數(shù)據(jù)高效利用能力。統(tǒng)籌實(shí)現(xiàn)我國生物數(shù)據(jù)資源統(tǒng)一匯交共享。
二是進(jìn)一步夯實(shí)生物數(shù)據(jù)基礎(chǔ)設(shè)施。2017 年4月,科技部印發(fā)《“十三五”生物技術(shù)創(chuàng)新專項(xiàng)規(guī)劃》,其中強(qiáng)調(diào)以國家目標(biāo)和戰(zhàn)略需求為導(dǎo)向,加強(qiáng)科研平臺(tái)和基礎(chǔ)設(shè)施建設(shè),積極推進(jìn)國家生物信息中心和人類遺傳資源庫、生物醫(yī)學(xué)大數(shù)據(jù)等重大戰(zhàn)略資源平臺(tái)建設(shè)。2022年1月28日,國務(wù)院印發(fā)《計(jì)量發(fā)展規(guī)劃(2021—2035 年)》,明確提出在生命健康領(lǐng)域培育一批計(jì)量數(shù)據(jù)建設(shè)應(yīng)用基地,建設(shè)國家標(biāo)準(zhǔn)參考數(shù)據(jù)庫[16]。
三是推動(dòng)生物數(shù)據(jù)資源共享和管理規(guī)范化。早在2018 年 2 月,科學(xué)技術(shù)部、財(cái)政部印發(fā)《國家科技資源共享服務(wù)平臺(tái)管理辦法》,強(qiáng)調(diào)規(guī)范管理國家科技資源共享服務(wù)平臺(tái),推進(jìn)科技資源向社會(huì)開放共享[17]。隨后,2018 年 4 月,國務(wù)院辦公廳印發(fā)《科學(xué)數(shù)據(jù)管理辦法》,進(jìn)一步規(guī)范管理戰(zhàn)略生物資源數(shù)據(jù)。并在2019 年6 月,科技部、財(cái)政部聯(lián)合發(fā)布了《關(guān)于國家科技資源共享服務(wù)平臺(tái)優(yōu)化調(diào)整名單的通知》,其中包括了生命科學(xué)和醫(yī)學(xué)等20 個(gè)國家科學(xué)數(shù)據(jù)中心[18]。并且,在2019 年國家生物信息中心也已正式掛牌,標(biāo)志著我國生物大數(shù)據(jù)管理進(jìn)入實(shí)質(zhì)建設(shè)階段。
四是加強(qiáng)生物安全與數(shù)據(jù)安全管理。為確保生物數(shù)據(jù)安全與合理利用,中國于2020 年10 月頒布了《中華人民共和國生物安全法》,該法明確指出建立統(tǒng)一的國家生物安全信息平臺(tái),有關(guān)部門應(yīng)當(dāng)將生物安全數(shù)據(jù)、資料等信息匯交國家生物安全信息平臺(tái),實(shí)現(xiàn)信息共享[19]。隨后,在2021 年4 月,《中華人民共和國數(shù)據(jù)安全法》正式出臺(tái),強(qiáng)調(diào)要堅(jiān)持以數(shù)據(jù)開發(fā)利用和產(chǎn)業(yè)發(fā)展促進(jìn)數(shù)據(jù)安全,以數(shù)據(jù)安全保障數(shù)據(jù)開發(fā)利用和產(chǎn)業(yè)發(fā)展,該法對(duì)生物數(shù)據(jù)的安全利用以及實(shí)現(xiàn)生物經(jīng)濟(jì)有著重要的指導(dǎo)意義[20]。
這些政策的制定與實(shí)施為中國生物數(shù)據(jù)的合理管理、科學(xué)研究的推進(jìn)以及生物產(chǎn)業(yè)的發(fā)展提供了堅(jiān)實(shí)的法律和戰(zhàn)略基礎(chǔ)。然而,我國生物數(shù)據(jù)發(fā)展依舊面臨問題,主要有以下幾個(gè)方面:
一是運(yùn)用計(jì)量技術(shù)、大數(shù)據(jù)等工具促進(jìn)生物數(shù)據(jù)發(fā)展的應(yīng)用機(jī)制不健全。生物計(jì)量是計(jì)量科學(xué)中的前沿領(lǐng)域[21],能夠?yàn)樯镏圃焯峁?zhǔn)確數(shù)據(jù)和參考標(biāo)準(zhǔn),是保障國家安全和實(shí)現(xiàn)生物經(jīng)濟(jì)中的關(guān)鍵支撐。大國競爭形勢下,美國極其重視計(jì)量、大數(shù)據(jù)等技術(shù)研發(fā)工作,雖然我國已提出要推動(dòng)生物技術(shù)創(chuàng)新,但更多聚焦于生物能源、生物材料等領(lǐng)域,相比美國在生物信息核心技術(shù)體系建設(shè)方面的全面布局與前期積累,我國在生物計(jì)量技術(shù)和大數(shù)據(jù)分析應(yīng)用等方面的研發(fā)投入力度還稍顯不足。
二是生物數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)與我國生命科學(xué)研究與產(chǎn)業(yè)快速發(fā)展的需求不匹配。生命健康領(lǐng)域被視為最有望實(shí)現(xiàn)革命性突破的重點(diǎn)領(lǐng)域之一,而生命健康產(chǎn)業(yè)快速發(fā)展的根基在于生物信息資源的收集、整合與應(yīng)用。目前我國存在生物數(shù)據(jù)庫數(shù)量有限、數(shù)據(jù)庫更新不及時(shí)、數(shù)據(jù)缺乏標(biāo)準(zhǔn)化、數(shù)據(jù)庫穩(wěn)定性差、數(shù)據(jù)主體形式單一以及數(shù)據(jù)共享性差等情況[22],嚴(yán)重限制了科學(xué)研究、醫(yī)療創(chuàng)新和生物科技領(lǐng)域的進(jìn)步,進(jìn)而導(dǎo)致未能有效滿足產(chǎn)業(yè)快速發(fā)展的需求。
三是生物數(shù)據(jù)管理機(jī)制不完善,戰(zhàn)略部署欠缺。目前,我國針對(duì)生物數(shù)據(jù)的頂層規(guī)劃設(shè)計(jì)大都只停留在鼓勵(lì)建設(shè)相關(guān)數(shù)據(jù)庫的層面,而在生物數(shù)據(jù)的采集、管理、應(yīng)用以及共享等方面,缺乏相應(yīng)的制度設(shè)計(jì)。另一方面,我國各有關(guān)部門對(duì)生物數(shù)據(jù)資源的職責(zé)劃分不夠清晰,數(shù)據(jù)共享和開放程度有限,人力和資金資源投入有限,統(tǒng)籌不足,尚未形成工作合力。
聚焦計(jì)量、大數(shù)據(jù)等工具等生物信息核心技術(shù),發(fā)揮我國集中力量辦大事的制度優(yōu)勢,盡快縮小與世界領(lǐng)先水平的差距。堅(jiān)持密切跟蹤國際技術(shù)前沿,組建高水平創(chuàng)新團(tuán)隊(duì),著力培養(yǎng)具有世界科技前沿水平的高層次領(lǐng)軍人才。強(qiáng)化國家戰(zhàn)略科技力量的引領(lǐng)作用,加強(qiáng)生物計(jì)量科學(xué)家、計(jì)算機(jī)與大數(shù)據(jù)專家與生物學(xué)家的交流,通過學(xué)科間深度交叉融合,使得計(jì)量科學(xué)的相關(guān)理論方法可以提升生物研究過程中的實(shí)驗(yàn)實(shí)踐基礎(chǔ)能力,從而幫助研究者對(duì)其所研究的實(shí)驗(yàn)結(jié)果數(shù)據(jù)盡可能接近真實(shí)。
堅(jiān)持“四個(gè)面向”,強(qiáng)化財(cái)政經(jīng)費(fèi)保障,優(yōu)先支持生物信息領(lǐng)域關(guān)鍵技術(shù)研發(fā)與國家亟需的生物大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),努力實(shí)現(xiàn)我國生物數(shù)據(jù)資源的獨(dú)立自主和安全可控。此外,由于我國長期以來存儲(chǔ)和管理數(shù)據(jù)的經(jīng)驗(yàn)不足,并且生物信息技術(shù)攻關(guān)存在較大難度等因素,建議我國通過“賽馬制”“揭榜掛帥”等考核機(jī)制,遴選一批高水平、基礎(chǔ)扎實(shí)的研究團(tuán)隊(duì)實(shí)行有效的穩(wěn)定支持,確保我國生物數(shù)據(jù)資源的高效利用和可持續(xù)發(fā)展。
加快制定統(tǒng)一完善的生物數(shù)據(jù)管理法規(guī)體系,明確不同部門和單位在生物數(shù)據(jù)管理中的職責(zé),加強(qiáng)統(tǒng)籌協(xié)調(diào),保障生物數(shù)據(jù)合規(guī)合法利用。借鑒發(fā)達(dá)國家成功經(jīng)驗(yàn),結(jié)合我國國情建立有效的生物數(shù)據(jù)匯聚和共享機(jī)制,通過制定激勵(lì)政策鼓勵(lì)科研工作者提交實(shí)驗(yàn)數(shù)據(jù),并監(jiān)督管理數(shù)據(jù)質(zhì)量。積極推動(dòng)生物數(shù)據(jù)領(lǐng)域的標(biāo)準(zhǔn)化工作,提升科研數(shù)據(jù)質(zhì)量,研發(fā)用戶友好的生物數(shù)據(jù)庫服務(wù)平臺(tái),實(shí)現(xiàn)不同系統(tǒng)之間的互操作性,促進(jìn)生物數(shù)據(jù)被廣泛高效的使用。