孔 琪,夏霞宇,秦 川
(中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所,北京協(xié)和醫(yī)學(xué)院比較醫(yī)學(xué)中心;衛(wèi)生部人類(lèi)疾病比較醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室;國(guó)家中醫(yī)藥管理局人類(lèi)疾病動(dòng)物模型三級(jí)實(shí)驗(yàn)室,北京 100021)
?
復(fù)雜性狀遺傳CC小鼠信息資源及研究應(yīng)用
孔琪,夏霞宇,秦川*
(中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所,北京協(xié)和醫(yī)學(xué)院比較醫(yī)學(xué)中心;衛(wèi)生部人類(lèi)疾病比較醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室;國(guó)家中醫(yī)藥管理局人類(lèi)疾病動(dòng)物模型三級(jí)實(shí)驗(yàn)室,北京100021)
復(fù)雜性狀遺傳CC小鼠(CC小鼠)由不同遺傳背景的小鼠品系雜交后,近交培育而成,用于研究人類(lèi)復(fù)雜性狀疾病和疾病的遺傳差異。CC小鼠能體現(xiàn)不同小鼠亞種的遺傳差異,其單核苷酸多態(tài)性是傳統(tǒng)近交系小鼠的四倍。CC小鼠在生命科學(xué)與醫(yī)學(xué)研究領(lǐng)域的應(yīng)用越來(lái)越廣泛。本文通過(guò)信息檢索等方式對(duì)CC小鼠相關(guān)信息資源進(jìn)行梳理,闡述了CC小鼠的起源、數(shù)據(jù)庫(kù)、應(yīng)用工具,以及研究領(lǐng)域等,以推動(dòng)CC小鼠資源在中國(guó)得到廣泛應(yīng)用。
復(fù)雜性狀遺傳CC小鼠,小鼠品系,資源,數(shù)據(jù)庫(kù),人類(lèi)疾病
小鼠(mice,Musmusculus)是研究人類(lèi)疾病理想而且常用的模式動(dòng)物。隨著基因工程技術(shù)的發(fā)展,使得小鼠品系資源愈加豐富,在人類(lèi)疾病研究中的應(yīng)用也更廣泛。復(fù)雜性狀疾病,即多基因病,是指由多個(gè)基因共同參與,且和環(huán)境因素相互作用決定表型的遺傳病,如高血壓、冠心病、糖尿病、哮喘和某些癌癥等。
采用單一遺傳背景的小鼠已無(wú)法有效復(fù)制人類(lèi)多基因相互作用引起的復(fù)雜性狀疾病。復(fù)雜性狀遺傳CC小鼠(Collaborative Cross mice,CC小鼠)應(yīng)運(yùn)而生,成為模擬人類(lèi)復(fù)雜性狀疾病的利器,具有更豐富的性狀差異,更豐富的遺傳多態(tài)性,能夠體現(xiàn)不同人群對(duì)病因敏感的差異性,可應(yīng)用于精準(zhǔn)醫(yī)療、基因功能發(fā)現(xiàn)、疾病模型建立和人類(lèi)復(fù)雜性狀疾病等方面研究。
本文通過(guò)信息檢索、文獻(xiàn)查閱、數(shù)據(jù)庫(kù)搜索等方式對(duì)CC小鼠相關(guān)信息資源進(jìn)行梳理,闡述了CC小鼠的概述、數(shù)據(jù)資源、應(yīng)用工具,以及研究應(yīng)用等,以使我國(guó)科研人員深入了解和更好的使用CC小鼠,支撐人類(lèi)復(fù)雜性狀疾病研究和精準(zhǔn)醫(yī)療等相關(guān)領(lǐng)域發(fā)展。
CC小鼠來(lái)源于復(fù)雜性狀聯(lián)盟(Complex Trait Community, CTC)啟動(dòng)的一個(gè)項(xiàng)目。其目的是發(fā)展一種更適用于研究復(fù)雜性狀或復(fù)雜病因疾病的研究工具,以模擬人群基因多樣性進(jìn)行復(fù)雜性狀相關(guān)研究[1]。包括數(shù)百種不同基因型的小鼠品系,來(lái)自多個(gè)原始種系。截止到2016年3月美國(guó)北卡大學(xué)(University of North Carolina, UNC)共對(duì)外提供72個(gè)CC小鼠品系[2]。
研究人員采用CC小鼠進(jìn)行正常肝組織的表達(dá)數(shù)量性狀基因座(expression Quantitative Trait Loci,eQTL)[3, 4],過(guò)敏性氣道炎(allergic airway inflammation)[5],黑色素瘤易感性[6],流行性感冒與埃博拉等病毒易感性[7, 8]基因型與性狀相關(guān)的研究。CC小鼠名聲大噪源于Science雜志在線發(fā)表的一篇《Host genetic diversity enables Ebola hemorrhagic fever pathogenesis and resistance》文章[8]。作者在47個(gè)CC小鼠品系中測(cè)試了埃博拉病毒引發(fā)的宿主應(yīng)答。病毒感染對(duì)不同品系小鼠造成的影響不同,揭示了人類(lèi)對(duì)埃博拉易感性不同源于其存在的遺傳學(xué)差異。與此同時(shí),以CC小鼠為基礎(chǔ)的數(shù)據(jù)庫(kù)以及研究工具也逐步建立起來(lái),極大程度地豐富了科研人員的研究資源。
2.1UNC CC小鼠數(shù)據(jù)庫(kù)
UNC數(shù)據(jù)庫(kù)介紹了CC小鼠項(xiàng)目的發(fā)展歷程,并提供了當(dāng)前發(fā)布的72個(gè)CC小鼠品系的相關(guān)數(shù)據(jù),包括名稱﹑八種初始品系的基因組組成﹑雜合比例﹑健康狀況﹑飼養(yǎng)環(huán)境﹑圖片等基礎(chǔ)信息,毛色﹑眼睛色﹑繁殖能力等生理數(shù)據(jù),以及相應(yīng)的基因型﹑單倍型等多種數(shù)據(jù),供研究人員下載使用。
UNC同時(shí)也提供了一系列的可視化工具對(duì)CC小鼠的基因型等數(shù)據(jù)進(jìn)行展示。通過(guò)UNC的CC小鼠瀏覽器2.0(http://csbio.unc.edu/CCstatus/index.py?run=CCV),研究人員可以獲取其基因型﹑單倍型及系統(tǒng)進(jìn)化等信息。通過(guò)CC小鼠表達(dá)譜瀏覽器(http://csbio.unc.edu/gecco/),研究人員可直觀了解不同CC小鼠中基因表達(dá)水平異同。除發(fā)布的CC小鼠品系信息,UNC還整合了部分其它相關(guān)數(shù)據(jù)。
UNC系統(tǒng)遺傳學(xué)中心負(fù)責(zé)CC小鼠項(xiàng)目后期的繁殖,保種與信息發(fā)布。其數(shù)據(jù)庫(kù)包含了最全面的CC小鼠品系相關(guān)信息,并通過(guò)官網(wǎng)(http://csbio.unc.edu/CCstatus/index.py)提供給相關(guān)科研人員。
2.2Sanger小鼠基因組數(shù)據(jù)庫(kù)
CC小鼠作為研究復(fù)雜性狀疾病分子機(jī)制的工具,通過(guò)其基因圖譜定位可以找出決定性狀的關(guān)鍵因素。而根據(jù)CC小鼠的來(lái)源,可以將其基因組近似表征為八種純系小鼠基因組的嵌合體。因此,這八種純系小鼠的基因組數(shù)據(jù)是所有后續(xù)相關(guān)研究的基礎(chǔ)。
這些基因組數(shù)據(jù)均可以通過(guò)Sanger小鼠基因組項(xiàng)目獲得。自2011年開(kāi)始,Sanger小鼠基因組數(shù)據(jù)庫(kù)(http://www.sanger.ac.uk/resources/mouse/genomes/)便發(fā)布了所有八種純系小鼠以及其它九種常見(jiàn)的實(shí)驗(yàn)小鼠品系的高通量全基因組重測(cè)序數(shù)據(jù)[9]。與此同時(shí)發(fā)布的還有各實(shí)驗(yàn)小鼠品系與小鼠參考基因組(C57BL/6J, CRCm38版)的比對(duì)及變異,包括單核苷酸多態(tài)性(Single nucleotide polymophism, SNP)﹑短片段插入/刪除(Insertion/Deletion, Indel),以及結(jié)構(gòu)變異(Structural variation)等數(shù)據(jù)信息。其中,SNP及短片段Indel均已通過(guò)Ensembl Variant Effect Predictor加以注釋[10],研究人員可通過(guò)基因組位置﹑基因名稱﹑小鼠品系﹑變異類(lèi)型及預(yù)測(cè)功能等關(guān)鍵詞進(jìn)行相關(guān)信息的檢索及可視化瀏覽。截止2016年3月,數(shù)據(jù)庫(kù)中所包含的實(shí)驗(yàn)小鼠品系數(shù)已增加至36種,其中有19種(包括構(gòu)建CC小鼠所采用的八種)已整合進(jìn)UNC數(shù)據(jù)庫(kù)中。
2.3MDA小鼠基因型數(shù)據(jù)庫(kù)
美國(guó)Jackson實(shí)驗(yàn)室建立的小鼠MDA基因型數(shù)據(jù)庫(kù)(http://cgd.jax.org/datasets/diversityarray.shtml)已收錄了包括UNC CC小鼠在內(nèi)的1,902份實(shí)驗(yàn)小鼠的原始及處理后芯片數(shù)據(jù),可供研究人員下載使用。
小鼠多樣性芯片(Mouse Diversity Array, MDA)是最早針對(duì)實(shí)驗(yàn)小鼠發(fā)明的高密度基因分型芯片[11]。MDA芯片基于Affymetrix平臺(tái),包含了60余萬(wàn)種實(shí)驗(yàn)小鼠全基因組范圍的SNP,及另外90余萬(wàn)種用于檢測(cè)拷貝數(shù)變異的功能性保守標(biāo)簽信息[11]。雖然不如全基因組測(cè)序精度高,MDA小鼠分型芯片仍被廣泛應(yīng)用于CC前期(G2:F1代)及后期(前CC)基因分型及功能研究中[3, 5, 7, 12]。
2.4MUGA及MegaMUGA基因型數(shù)據(jù)庫(kù)
MUGA和MegaMUGA是另外兩種專門(mén)針對(duì)CC小鼠所設(shè)計(jì)的基因分型芯片,基于Illumina Infinium平臺(tái),主要用于確定各CC小鼠品系中八個(gè)純系小鼠基因組的貢獻(xiàn),以及繁殖過(guò)程中不同CC小鼠品系間的剩余雜合率[13]。MUGA芯片包含7,851種SNP分型標(biāo)記,其升級(jí)版MegaMUGA(第二代小鼠基因分型芯片)則是其10倍。MUGA及MegaMUGA芯片是UNC推薦使用的小鼠基因分型工具。
CC小鼠構(gòu)建過(guò)程中部分樣本的MUGA或MegaMUGA基因型檢測(cè)數(shù)據(jù)均已有UNC收錄。其中,MUGA數(shù)據(jù)共計(jì)626份,包括168份八種純系及F1代的參考基因型數(shù)據(jù),以及另458份其它樣本檢測(cè)數(shù)據(jù);MegaMUGA數(shù)據(jù)共計(jì)792份,包括72種成熟CC小鼠品系基因型數(shù)據(jù),以及720份其它樣本的檢測(cè)數(shù)據(jù)。MUGA/MegaMUGA數(shù)據(jù)庫(kù),以及芯片相關(guān)的分析工具,均可通過(guò)UNC官方網(wǎng)站獲取。
2.5小鼠表型數(shù)據(jù)庫(kù)
美國(guó)Jackson實(shí)驗(yàn)室建立的小鼠表型數(shù)據(jù)庫(kù)(Mouse Phenome Database,MPD)旨在為研究人員提供一個(gè)近交系實(shí)驗(yàn)小鼠基因組變異信息分類(lèi)集的Web接口[14]。其Genotype模塊(http://phenome.jax.org/db/q?rtn=snp/home)包含了Sanger實(shí)驗(yàn)小鼠基因組及Jax-UNC小鼠的MDA變異信息,以及部分其它的結(jié)構(gòu)變異數(shù)據(jù)集。
研究人員可通過(guò)基因組位置﹑基因名稱﹑小鼠品系﹑變異類(lèi)型及預(yù)測(cè)的功能等關(guān)鍵詞進(jìn)行相關(guān)信息的檢索。此外,Genotype模塊還提供了不同小鼠品系的兩兩基因型比較,基因型數(shù)據(jù)獲取等功能。
2.6小鼠基因型重估數(shù)據(jù)庫(kù)
經(jīng)典近交系小鼠通常由單一品系近交培育而成,遺傳相似度在99%以上。每個(gè)近交系小鼠個(gè)體的基因組可近似認(rèn)為是由祖先株單倍型片段組成的嵌合體。Yang等人對(duì)100種經(jīng)典小鼠品系的MDA基因型數(shù)據(jù)進(jìn)行了四配子檢驗(yàn),以界定家鼠(M.m.domesticus)的單倍型域[15]。隨后,Wang等人結(jié)合這些單倍型域,以及12個(gè)品系的全基因組重測(cè)序數(shù)據(jù),對(duì)1.2×1010個(gè)位點(diǎn)進(jìn)行了高置信度基因型重估[16]。所有單倍型域及重估數(shù)據(jù)可以通過(guò)UNC的模塊(http://msub.csbio.unc.edu/和http://csbio.unc.edu/imputation/)獲取。這些結(jié)果對(duì)于后續(xù)CC小鼠相關(guān)的數(shù)量性狀遺傳位點(diǎn)(Quatitative trait location, QTL)分析研究工作至關(guān)重要。
3.1單倍型重構(gòu)工具
CC小鼠是由多個(gè)純系小鼠重組而來(lái),其基因組中不同祖先株的單倍型域組成極大程度影響了后續(xù)的QTL分析與研究。單倍型重構(gòu)是應(yīng)用CC小鼠進(jìn)行QTL分析研究的第一步。以CC小鼠基因型芯片數(shù)據(jù)為基礎(chǔ),研究人員通常采用HAPPY[17]與GAIN[18]軟件包來(lái)實(shí)現(xiàn)。
HAPPY與GAIN均以隱馬科夫模型(Hidden markov model,HMM)為基礎(chǔ),并根據(jù)基因型芯片數(shù)據(jù)的觀測(cè)值估算每個(gè)位點(diǎn)祖先株相應(yīng)的概率[19]。HAPPY是一個(gè)R軟件包,起源較早,包括一系列針對(duì)封閉群進(jìn)行QTL分析的函數(shù)。GAIN函數(shù)主要是針對(duì)CC小鼠所設(shè)計(jì),通過(guò)結(jié)合HMM算法與系譜相關(guān)知識(shí)有效推斷祖先株的概率。HAPPY軟件包及相關(guān)數(shù)據(jù)可通過(guò)Wellcome Trust人類(lèi)遺傳中心網(wǎng)站(http://mus.well.ox.ac.uk/CC/)在線獲取。
所有已發(fā)布的CC小鼠品系的單倍型重構(gòu)數(shù)據(jù)信息可以通過(guò)CC小鼠瀏覽器(http://csbio.unc.edu/CCstatus/index.py?run=CCV)進(jìn)行瀏覽與下載。
3.2QTL定位工具
BAGPIPE(http://valdarlab.unc.edu/software/bagpipe)[20]及BAGPHENOTYPE(http://valdarlab.unc.edu/bagphenotype.html)[21]是兩種針對(duì)CC小鼠進(jìn)行QTL定位研究的軟件包。兩個(gè)軟件包均以HAPPY的固定效應(yīng)模型(fixed-effects model)為基礎(chǔ),模擬加性效應(yīng)與顯性效應(yīng),通過(guò)八種原始株的單倍型概率矢量對(duì)表型值進(jìn)行擬合。其它如實(shí)驗(yàn)(如:批次)及生物學(xué)(如:性別)等協(xié)變量可采用固定或隨機(jī)效應(yīng)模型。統(tǒng)計(jì)顯著性程度可通過(guò)非限制性排列進(jìn)行估算。
BAGPIPE及BAGPHENOTYPE均以小鼠的單倍型概率矩陣為輸入值,通過(guò)命令行進(jìn)行操作。BAGPIPE通常適用于群體結(jié)構(gòu)未知的正態(tài)分布性狀的單位點(diǎn)定位,而B(niǎo)AGPHENOTYPE則采用了重采樣模型平均及多位點(diǎn)模型。此外,BAGPHENOTYPE也可以根據(jù)廣義線性模型對(duì)非正態(tài)分布性狀(如:枚舉、二元性狀等)進(jìn)行定位。
3.3高通量測(cè)序分析工具
高通量測(cè)序讀段與參考基因組的比對(duì)是測(cè)序相關(guān)研究的第一步。其保真度與有效性隨著測(cè)序物種與參考基因組的基因距離增大而降低,將導(dǎo)致雜合樣本的研究產(chǎn)生誤差。理想的參考基因組可以盡可能地融合更多的待測(cè)樣本信息,包括二倍性等,以減少誤差。以此為核心,美國(guó)北卡大學(xué)的McMillan團(tuán)隊(duì),以及美國(guó)Jackson實(shí)驗(yàn)室的Churchill團(tuán)隊(duì)先后研發(fā)了兩個(gè)等位基因特異性比對(duì)流程[22, 23]。兩種方法的原理較為相似,均首先以一個(gè)參考基因組及另一個(gè)個(gè)體特異性的變異位點(diǎn)(相對(duì)于參考基因組)列表為輸入值,構(gòu)建一個(gè)改進(jìn)的﹑重構(gòu)的﹑二倍體參考基因組(偽基因組),測(cè)序讀段繼而與偽基因組進(jìn)行比對(duì)。對(duì)比質(zhì)量改進(jìn),以及等位基因特異性,有利于后續(xù)的分析。
以“Collaborative cross mice”為關(guān)鍵詞對(duì)Web of ScienceTM核心合集數(shù)據(jù)庫(kù)進(jìn)行檢索(截止2016年3月),共得到206條記錄,其中研究類(lèi)文獻(xiàn)共計(jì)152篇,出版年份為2006年至今,呈現(xiàn)逐年遞增趨勢(shì)。其中,121篇(79.6%)研究文獻(xiàn)來(lái)源于美國(guó)的研究機(jī)構(gòu)。
對(duì)研究方向進(jìn)行統(tǒng)計(jì)分析表明,超過(guò)50.0%(80篇)CC小鼠相關(guān)的科學(xué)研究均為基因遺傳領(lǐng)域,其次為分子生物學(xué)(37,24.3%)﹑生物技術(shù)應(yīng)用微生物學(xué)(31,21.4%),神經(jīng)生物學(xué)(11, 7.2%)等。此外,CC小鼠在細(xì)胞生物學(xué)﹑行為科學(xué)﹑微生物學(xué)﹑毒理學(xué)及生理學(xué)等領(lǐng)域均有所應(yīng)用。
CC小鼠項(xiàng)目自2004年正式啟動(dòng)至今已經(jīng)經(jīng)歷了12年,三個(gè)繁殖中心已建立起了百余種CC小鼠品系,并逐漸開(kāi)始廣泛應(yīng)用于生命科學(xué)研究中。與此同時(shí),相關(guān)的小鼠基因組與遺傳數(shù)據(jù)也逐漸得以積累,在一定程度上推動(dòng)了相關(guān)數(shù)據(jù)庫(kù)與分析工具的構(gòu)建。
UNC等數(shù)據(jù)庫(kù)已整合了多種CC小鼠相關(guān)的數(shù)據(jù)資源,供科研人員瀏覽和下載使用。諸如HAPPY﹑GAIN等針對(duì)CC小鼠而發(fā)展的分析工具也已逐步發(fā)展。對(duì)Web of ScienceTM數(shù)據(jù)庫(kù)中收錄的CC小鼠為主題的科研論文進(jìn)行統(tǒng)計(jì)分析也表明近年來(lái)呈現(xiàn)出了高速增長(zhǎng)的態(tài)勢(shì)。可以預(yù)期,未來(lái)隨著人們對(duì)復(fù)雜性狀疾病的日益重視,以及CC小鼠項(xiàng)目在中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所落地,將進(jìn)一步推動(dòng)其在中國(guó)范圍內(nèi)的廣泛應(yīng)用。
[1]Churchill GA, Airey DC, Allayee H,etal. The Collaborative Cross, a community resource for the genetic analysis of complex traits [J]. Nat Genet. 2004,36:1133-1137.
[2]UNC Systems Genetics.[OL][2016-03-26].http://www.csbio.unc.edu/CCstatus/index.py.
[3]Aylor DL, Valdar W, Foulds-Mathes W,etal. Genetic analysis of complex traits in the emerging Collaborative Cross [J]. Genome Res. 2011, 21:1213-1222.
[4]Weiser M, Mukherjee S, Furey TS,etal. Novel distal eQTL analysis demonstrates effect of population genetic architecture on detecting and interpreting associations [J]. Genetics 2014, 198:879-893.
[5]Kelada SNP, Carpenter DE, Aylor DL,etal. Integrative genetic analysis of allergic inflammation in the murine lung [J]. Am J Respir Cell Mol Biol. 2014, 51:436-445.
[6]Ferguson B, Ram R, Handoko HY,etal. Melanoma susceptibility as a complex trait: genetic variation controls all stages of tumor progression [J]. Oncogene. doi:10.1038/onc.2014.227.
[7]Ferris MT, Aylor DL, Bottomly D,etal. Modeling host genetic regulation of influenza pathogenesis in the Collaborative Cross [J]. PLoS Pathog. 2013,9:e1003196.
[8]Rasmussen AL, Okumura A, Ferris MT,etal. Host genetic diversity enables Ebola hemorrhagic fever pathogenesis and resistance [J]. Science. 2014, doi:10.1126/science.1259595
[9]Keane TM, Goodstadt L, Danecek P,etal. Mouse genomic variation and its effect on phenotypes and gene regulation [J]. Nature. 2011, 477:289-294.
[10]McLaren W, Pritchard B, Rios D,etal. Deriving the consequences of genomic variants with the Ensembl API and SNP effect predictor [J]. Bioinformatics. 2010, 26:2069-2070.
[11]Yang H, Ding Y, Hutchins LN,etal. A customized and versatile high-density genotyping array for the mouse [J]. Nat Methods. 2009,6:663-666.
[12]Liu EY, Morgan AP, Chesler EJ,etal. High-resolution sex-specific linkage maps of the mouse reveal polarized distribution of crossovers in male germline[J]. Genetics. 2014,197:91-106.
[13]Collaborative Cross Consortium, The Genome Architecture of the Collaborative Cross Mouse Genetic Reference Population [J]. Genetics. 2012, 190, 2:389-402.
[14]Maddatu TP, Grubb SC, Bult CJ, Bogue MA. Mouse Phenome Database (MPD) [J]. Nucleic Acids Res. 2012, Jan; 40(Database issue):D887-94.
[15]Yang H, Wang JR, Didion JP,etal. Subspecific origin and haplotype diversity in the laboratory mouse [J]. Nat Genet. 2011, 43:648-655.
[16]Wang J, Moore KJ, Zhang Q,etal. Genome-wide compatible SNP intervals and their properties. In: Proceedings of the first a CM international conference on bioinformatics and computational biology—bCB’10 [M]. ACM Press, New York.2010.43
[17]Mott R, Talbot CJ, Turri MG,etal. A method for fine mapping quantitative trait loci in outbred animal stocks [J]. Proc Natl Acad Sci USA. 2000,97:12649-12654.
[18]Liu EY, Zhang Q, McMillan L,etal. Efficient genome ancestry inference in complex pedigrees with inbreeding [J]. Bioinformatics. 2010, 26:i199-i207.
[19]Baum, L. E.; Petrie, T. Statistical Inference for Probabilistic Functions of Finite State Markov Chains [J]. The Annals of Mathematical Statistics. 1966, 37 (6): 1554-1563.
[20]Valdar W, Solberg LC, Gauguier D,etal. Genome-wide genetic association of complex traits in heterogeneous stock mice [J]. Nat Genet. 2006,38: 879-887.
[21]Valdar W, Holmes CC, Mott R, Flint J,etal. Mapping in structured populations by resample model averaging [J]. Genetics. 2009,182:1263-1277.
[22]Huang S, Holt J, Kao C-Y,etal. A novel multi-alignment pipeline for high-throughput sequencing data [J]. Database 2014:bau057.
[23]Munger SC, Raghupathy N, Choi K,etal. RNA-seq alignment to individualized genomes improves transcript abundance estimates in multiparent populations [J]. Genetics. 2014, 198:59-73.
The Collaborative Cross mice resource information and application
KONG Qi, XIA Xia-yu, QIN Chuan*
(Institute of Laboratory Animal Science, Chinese Academy of Medical Sciences & Comparative Medical Center,Peking Union Medical College, Key Laboratory of Human Disease Comparative Medicine, Ministry of Health;Key Laboratory of Human Diseases Animal Model, State Administration of Traditional Chinese Medicine, Beijing 100021, China)
Collaborative Cross mice (CC mice) are series of inbred mice strains generated from hybrid strains of mice with different genetic background which used for human complex diseases and genetic diversity diseases studies. Genetic diversity of CC mice can reflect different mouse subspecies, the single nucleotide polymorphism is four times than traditional inbred mice. CC mice are more and more widely used in the field of life science and medical research. Based on information retrieval of CC mice, we introduced the related information resources of CC mice origin, database, application tools, and research results, to promote CC mice resources to be used widely in China.
Collaborative Cross mice;Mouse strain;Resource;Database;Human disease
中央科研院所基本業(yè)務(wù)費(fèi)(DWS200709,DWS201208,DWS201512);傳染病科技重大專項(xiàng)(2009ZX10004-503)。
孔琪(1978-),助理研究員,博士,研究方向:實(shí)驗(yàn)動(dòng)物學(xué)。E-mail: infor@cnilas.org。
秦川,研究員,博士生導(dǎo)師,研究方向:實(shí)驗(yàn)病理學(xué)。E-mail: qinchuan@pumc.edu.cn。
專題研究
R-332
A
1671-7856(2016)07-0011-05
10.3969.j.issn.1671-7856.2016.07.002
2016-04-05