圖為最新版樹鼩基因組與數據庫?!≈袊茖W院昆明動物研究所供圖 攝
記者21日從中國科學院昆明動物研究所獲悉,近期,該所科研人員完成了新版的樹鼩基因組高精度測序、組裝和注釋。新版樹鼩基因組填補了第一版基因組中約73%的拼裝缺口。
據介紹,樹鼩是一種與實驗大鼠差不多大小的小型哺乳動物,為靈長類動物的近親,在生物醫學研究中頗具潛力。目前,樹鼩已被用于感染性疾病如乙型肝炎、丙型肝炎、皰疹病毒感染、禽流感病毒感染等模型創建,在視覺系統研究、近視模型,以及一些腫瘤模型構建方面,顯示了很好的前景。
2013年,為了解決樹鼩用于疾病動物模型創建時缺少基因組學等遺傳信息的問題,中國科學院昆明動物研究所姚永剛課題組牽頭組織中科院動物模型與人類疾病機理重點實驗室相關研究團隊,聯合華大基因,發表了利用二代測序技術測定的中緬樹鼩的全基因組,較為全面地獲取了樹鼩的遺傳特性,證實樹鼩與靈長類動物的親緣關系最近?;诖税鏄潼毣蚪M數據,姚永剛課題組建立了首個樹鼩基因組數據庫,實現了樹鼩基因組數據的自由訪問和共享。但由于二代測序讀長過短等技術局限,第一版樹鼩基因組中存在一些問題。
近期,來自姚永剛課題組的博士范宇利用單分子實時測序技術,結合高通量染色質構象捕獲技術測序數據,完成了新版的樹鼩基因組高精度測序、組裝和注釋。這一版樹鼩基因組填補了第一版基因組中約73%的拼裝缺口(163,220個),其中處于基因編碼區的缺口全部得到填補。此外,新版樹鼩基因組中,蛋白編碼基因的數量與序列長度較第一版基因組有明顯的質量提升,基因結構的精確度也明顯上升。
基于第二版基因組信息,范宇等人完成了基因組重復序列的分析,發現120多個長轉座子和400多萬個包含短重復序列(長度小于150bp)和長重復序列(長度大于5kb)的衛星區域。對LINE1的分析發現,樹鼩基因組中的LINE1占基因組的18.54%,這種基因組占比和人類的類似。與包括人類、獼猴和小鼠的基因組結構變異對比分析后發現,相比較于人類,樹鼩基因組中含有221個結構變異,獼猴基因組中有188個結構變異,而小鼠基因組中的結構變異多達387個。有趣的是,一些結構變異,如位于MYSM1基因和SLC35D1基因間的區域,只出現在樹鼩和靈長類動物中,這一結果也從結構變異的角度說明,相比于小鼠,樹鼩與靈長類動物在基因組方面有更高的相似性。
據悉,為了更好地展示最新版的樹鼩基因組信息,課題組將新版基因組數據、注釋信息、群體遺傳學參數、預測的基因共表達網絡等數據,增加或更新在第二版樹鼩基因組數據庫中。這些用戶友好型的數據庫構建與更新,將為樹鼩動物模型的研究提供相關基礎數據,有望繼續惠及樹鼩研究領域。
上述研究工作以“Chromosomal level assembly and population sequencing of the Chinese tree shrew genome”為題,發表在動物學領域SCI期刊《Zoological Research》上。該研究工作得到國家自然科學基金委、中國科學院和云南省的資助。(完)
(記者 胡遠航)
關鍵詞: