近日,“橡膠樹等主要熱帶作物功能基因組學研究”創(chuàng)新團隊負責搭建的橡膠樹HeveaDB基因組數(shù)據(jù)庫平臺(hevea.catas.cn)上線運行(圖1),并在國際橡膠研究與發(fā)展委員會(IRRDB)各成員國間開展測試工作。經(jīng)過1個月的測試,數(shù)據(jù)庫平臺各項指標保持穩(wěn)定,運行可靠,達到預期效果。
近些年來,隨著基因組測序技術(shù)的進步,已有4個國家(馬來西亞、泰國、中國和日本)獨立繪制并公開發(fā)表了橡膠樹基因組圖,其中以中國熱科院橡膠所完成的草圖版本質(zhì)量最高。同時還產(chǎn)生了大量轉(zhuǎn)錄組數(shù)據(jù),這些數(shù)據(jù)亟需一個整合的數(shù)據(jù)平臺來儲存、分發(fā)和共享,并進行二次挖掘利用。2017年在印尼雅加達召開的IRC2017國際橡膠會議上提出要搭建橡膠樹基因組數(shù)據(jù)中心的計劃。在IRRDB理事會上中國熱科院代表經(jīng)過爭取,獲得了牽頭搭建橡膠樹基因組數(shù)據(jù)中心的任務(wù),并由“橡膠樹等主要熱帶作物功能基因組學研究”創(chuàng)新團隊承擔開發(fā)工作。經(jīng)過幾個月的努力,創(chuàng)新團隊成功搭建了橡膠樹基因組數(shù)據(jù)庫HeveaDB初期版本,并在2018年4月底在國內(nèi)外開展試運行測試。
HeveaDB數(shù)據(jù)庫主要儲存了橡膠樹4個版本的基因組草圖、1個遺傳圖譜、142個轉(zhuǎn)錄組數(shù)據(jù)、49 235條EST序列、30 200個基因注釋、12個基因家族的信息,以及5 049個IRRDB 1981野生種質(zhì)資源材料和18 328個魏克漢材料信息,并以中國熱科院橡膠所完成的熱研7-33-97品種的基因組數(shù)據(jù)為參考基因組,進行了二次挖掘和分析,進行可視化展示。主要特色功能有:基因組Gbrowse和Jbrowse可視化瀏覽、基因表達譜的heatmap展示和檢索、共表達網(wǎng)絡(luò)展示等。
在數(shù)據(jù)庫測試期間,項目開發(fā)成員還編寫了使用說明,并通過微信平臺進行宣傳,提高了數(shù)據(jù)庫的易用性。
經(jīng)過1個月的試運行,HeveaDB數(shù)據(jù)庫訪問量達到一千六百余次,共有來自中國、馬來西亞、法國、巴西、日本、印度、越南、英國、印度尼西亞等十余個國家和地區(qū)的兩百多位獨立訪客點擊訪問了HeveaDB數(shù)據(jù)庫,并反饋了意見和建議。下一步,將根據(jù)建議在數(shù)據(jù)庫易用性、后基因組數(shù)據(jù)分析等方面進行二次開發(fā)和功能升級,并根據(jù)橡膠樹基因組研究進展及時更新數(shù)據(jù)內(nèi)容。
HeveaDB數(shù)據(jù)庫由中國熱科院橡膠研究所程漢研究員牽頭搭建,相關(guān)工作得到了中國熱科院“橡膠樹等主要熱帶作物功能基因組學研究”創(chuàng)新團隊和像膠研究所基本業(yè)務(wù)費項目國際合作專項的資助。
(摘自中國熱科院橡膠研究所網(wǎng),http://www.catas.cn/index.html,2018-06-05)