王天一,田國祥,謝新雅,賀海蓉,呂軍
英國生物銀行(UK Biobank)即英國生物樣本庫,是目前全世界規(guī)模最大的生物醫(yī)學(xué)樣本數(shù)據(jù)庫,于2017年4月30日正式對全球科研人員開放全部數(shù)據(jù)。在2006~2010年間,UK Biobank從英國各地招募了50萬例40~69歲的志愿者,獲取他們的基線數(shù)據(jù)[1],包括家族病史、藥物史和健康狀況等信息,收集約1500萬個(gè)血液、尿液和唾液等生物樣本,對所有參與者進(jìn)行基因分型[2],并正在進(jìn)行血液生化分析,且將長期跟蹤記錄他們之后的健康和醫(yī)療檔案信息,收集所有已通過這些研究數(shù)據(jù)或生物樣本獲得的研究結(jié)果,并向其他研究人員提供,旨在研究遺傳因素、環(huán)境因素、生活習(xí)慣等與人類重大疾病的關(guān)聯(lián)[3]。
在此基礎(chǔ)上,UK Biobank已于2014年開始一項(xiàng)全新的大規(guī)模醫(yī)學(xué)影像數(shù)據(jù)收集計(jì)劃,著手使用核磁共振成像(MRI)技術(shù)和X射線技術(shù)對超過10萬例志愿者的大腦、心臟、骨骼等進(jìn)行成像分析,以建立內(nèi)臟器官掃描圖像數(shù)據(jù)庫[4],這也將成為迄今為止世界上最大的健康影像研究。這些龐大的數(shù)據(jù)有助于科研人員分析如癌癥、心臟病、糖尿病、關(guān)節(jié)炎、阿爾茨海默癥等多種疾病的人群分布差異和成因,甚至改變科學(xué)家對此類慢性及流行病的研究方式。本文將介紹如何利用UK Biobank申請研究數(shù)據(jù)和生物樣本。
研究者在申請UK Biobank研究數(shù)據(jù)和生物樣本前,需在UK Biobank官方網(wǎng)站注冊一個(gè)Access Management System(AMS)賬號。登陸UK Biobank官方網(wǎng)站(https://www.ukbiobank.ac.uk/),界面如圖1所示,點(diǎn)擊首頁導(dǎo)航按鈕“Researcher Login”(圖1紅圈處),可轉(zhuǎn)至UK Biobank Access Management System登錄注冊頁面“AMS Login”,(圖2)。
在AMS Login頁面中,點(diǎn)擊“Sign up to access UK Biobank resources”按鈕,進(jìn)入Sign up頁面(圖3)。
在Sign up頁面中必須填寫姓名、E-mail地址(建議使用研究者所在研究機(jī)構(gòu)的郵箱地址,而不要使用類似騰訊、網(wǎng)易等公共郵箱,原因在下文中會(huì)詳細(xì)提及)、密碼等信息。用戶名可選擇填寫,若不填寫則默認(rèn)用戶名為郵箱地址。填寫完成后勾選“I'm not a robot”,然后點(diǎn)擊Sign up即可完成賬號注冊。
但要注意,賬號注冊完成后并沒有立刻獲得數(shù)據(jù)庫的訪問權(quán),會(huì)出現(xiàn)如圖4所示的提示語。要獲得數(shù)據(jù)庫訪問權(quán)限需進(jìn)一步完善個(gè)人信息的登記注冊。點(diǎn)擊“Registration”按鈕進(jìn)入信息登記頁面(圖5)。
圖1 UK Biobank官網(wǎng)頁面
圖2 AMS Login頁面
圖3 Sign up頁面
在Registration頁面,根據(jù)要求繼續(xù)完成個(gè)人有關(guān)信息的登記,包括完善個(gè)人科研背景并上傳個(gè)人英文履歷(CV)和完善研究者所在研究機(jī)構(gòu)的相關(guān)信息。上文提到建議使用研究者所在研究機(jī)構(gòu)的郵箱注冊,原因就在于這里還要求輸入研究者在研究機(jī)構(gòu)的郵箱,筆者曾因沒有使用筆者所在研究機(jī)構(gòu)的郵箱而使用了騰訊郵箱,導(dǎo)致申請被審核人員駁回,在重新修改郵箱后才得以通過,如圖6所示。
在完成以上所有信息的填寫后,在所示頁面中,勾選“I agree to comply with all Terms and Conditions of Access”,然后點(diǎn)擊“Submit registration”即可提交申請。
圖4 Sign up完成后的提示
圖5 Registration頁面
在申請?zhí)峤缓?,?huì)出現(xiàn)提示頁面,表示申請正在審核,正常情況下需3~5個(gè)工作日。在此期間,研究者沒有權(quán)限申請研究數(shù)據(jù)和生物樣本,但請注意登陸AMS系統(tǒng),留意查看UK Biobank管理團(tuán)隊(duì)可能發(fā)來的郵件,因?yàn)閁K Biobank是第一次收到筆者所在的研究機(jī)構(gòu)發(fā)來的申請,所以筆者收到了多封UK Biobank管理團(tuán)隊(duì)發(fā)來的要求補(bǔ)充各種信息的郵件。最終經(jīng)過多次補(bǔ)充信息的提供后,筆者獲得了Access Management System的訪問權(quán)限。
由此可見,UK Biobank的申請過程中對研究者和研究機(jī)構(gòu)的研究背景、研究目的和研究動(dòng)機(jī)是有較高要求的,包括需要提供近期發(fā)表的相關(guān)學(xué)術(shù)成果進(jìn)行證明,以確保研究是出于善意的科研目的[5]。
獲得AMS的訪問權(quán)限后,即可在AMS Login頁面(圖2)中輸入U(xiǎn)esrname和Password登陸,此時(shí)即可進(jìn)入AMS主頁。
圖6 審核人員要求筆者修改E-mail adress
其中“Showcase”一欄是對UK Biobank數(shù)據(jù)的展示,研究者可通過所需的數(shù)據(jù)字段對數(shù)據(jù)庫進(jìn)行檢索,該數(shù)據(jù)展示功能概括了所有研究數(shù)據(jù)和生物樣本的分布情況、獲取方式和現(xiàn)有研究結(jié)果等信息,以便研究者更好的了解可用的研究數(shù)據(jù)和生物樣本的情況并作出申請[6]。
研究人員可在Showcase頁面,如圖7所示,通過輸入關(guān)鍵詞、編碼或查看分類目錄等多種方式對相關(guān)數(shù)據(jù)和樣本情況進(jìn)行檢索。對于初次使用者來說,強(qiáng)烈建議閱讀用戶指南,“點(diǎn)擊User Guide”即可打開用戶指南。本文以肺癌為例,使用Showcase系統(tǒng)對收錄資源進(jìn)行檢索。單擊“Search”按鈕,在彈出的搜索頁面中輸入關(guān)鍵詞“l(fā)ung cancer”,研究者可自定義所需數(shù)據(jù)的類型和屬性,勾選越多則返回的搜索結(jié)果范圍越廣泛,我們選擇Data-Field,其他保持默認(rèn)(圖8)。確定要檢索的數(shù)據(jù)類型和屬性后,點(diǎn)擊“Search”即可獲取所有與癌癥相關(guān)的數(shù)據(jù)收錄情況(圖9),共返回69個(gè)數(shù)據(jù)字段。點(diǎn)擊第一項(xiàng)“Age lung cancer diagnosed by doctor”,即可查看所有收錄的數(shù)據(jù)中肺癌患者的診斷年齡,我們可知目前數(shù)據(jù)庫中共有156例參與者被診斷肺癌,平均診斷年齡為61.391歲,以及其他年齡的分布情況(圖10)。
在了解數(shù)據(jù)和樣本的基本情況后,若要下載使用數(shù)據(jù)和樣本,則需進(jìn)行申請。在AMS主頁中,點(diǎn)擊“Application”按鈕,在彈出頁面中點(diǎn)擊“Start new application”,在“New application”頁面中(圖11),按要求逐項(xiàng)填寫申請信息,包括研究的簡要概述、研究方法、目標(biāo)和預(yù)期產(chǎn)出、所需數(shù)據(jù)集的類型和大小、研究的關(guān)鍵詞、研究項(xiàng)目的持續(xù)時(shí)間等內(nèi)容。如研究項(xiàng)目有合作者,則還需填寫合作者的相關(guān)信息。全部填寫完成后點(diǎn)擊“Submit form”即可提交申請。在申請中要注意,研究者需明確是否僅申請研究數(shù)據(jù)還是需要申請生物樣本或與參與者重新聯(lián)系,后兩者的申請需經(jīng)過更嚴(yán)格的科學(xué)性或倫理性審查。申請的數(shù)據(jù)或樣本不是免費(fèi)提供,費(fèi)用取決于所批準(zhǔn)的研究項(xiàng)目需要的數(shù)據(jù)和樣本量的大小[7]。若申請中無法明確研究期限,那么審核團(tuán)隊(duì)將會(huì)設(shè)置一個(gè)為期3年的不固定期限,在此期間研究者需要每年更新研究進(jìn)度。
圖7 Showcase頁面
圖8 Search頁面
圖9 搜索到的數(shù)據(jù)字段
圖10 肺癌患者的診斷年齡分布
圖11 New application頁面
在研究者提交申請后,UK Biobank管理團(tuán)隊(duì)的審核委員會(huì)會(huì)分小組對每一份申請進(jìn)行科學(xué)性審查,最終確定批準(zhǔn)或拒絕申請。審核小組還會(huì)要求研究者在下載數(shù)據(jù)前簽署數(shù)據(jù)轉(zhuǎn)讓協(xié)議,承諾不試圖識(shí)別任何數(shù)據(jù)和樣本提供者,保證數(shù)據(jù)安全,并僅將其用于批準(zhǔn)的研究目的。研究者還須承諾發(fā)布其研究成果并返饋其方法、數(shù)據(jù)或分析結(jié)果的詳細(xì)信息到UK Biobank,以便將其納入U(xiǎn)K Biobank的數(shù)據(jù)庫并提供給其他獲得批準(zhǔn)的研究人員[8]。
UK Biobank的最大優(yōu)點(diǎn)在于其招募的所有志愿者都在英國國家健康服務(wù)體系(NHS)中進(jìn)行了注冊,并同意關(guān)聯(lián)他們的醫(yī)療相關(guān)記錄,這使得UK Biobank可以通過國家醫(yī)療數(shù)據(jù)詳細(xì)跟蹤所有志愿者的疾病與健康狀況[9]。
前瞻性隊(duì)列研究對于疾病危險(xiǎn)因素的確定和疾病的預(yù)防、治療和具有重要意義,然而過小的隊(duì)列對于罕見疾病和不同危險(xiǎn)因素與疾病復(fù)雜關(guān)系的研究是不利的。UK Biobank的前瞻性和超大樣本規(guī)模以及與健康記錄的持續(xù)結(jié)合為研究人員提供了解決各種研究問題的良好平臺(tái)。
UK Biobank的缺點(diǎn)在于樣本提供者必須填寫一份詳細(xì)的基本情況調(diào)查表,包含自己的名字、性別、國民健康服務(wù)號碼、疾病信息等,存在一定的隱私泄露隱患[10],同時(shí)注冊、申請過程較為復(fù)雜和繁瑣、時(shí)間周期較長,對于初次申請者來說,可能較為困難。
我們相信,UK Biobank將在未來提供愈發(fā)全面的研究數(shù)據(jù)和生物樣本覆蓋,期待它能為全球研究人員提供更加高效便捷的資源注冊、申請和使用服務(wù),以及更有保障的信息安全,成為科研人員的好幫手。