IMM发布恒河猴“一站式”基因组知识库RhesusBase

生物技术服务 » 讨论区 » 分析生活 » IMM发布恒河猴“一站式”基因组知识库RhesusBase

需要登录并加入本群才可以回复和发新贴

打印 | 推荐 | 订阅 | 收藏

标题:IMM发布恒河猴“一站式”基因组知识库RhesusBase

艰苦奋斗[使用道具]
二星
Rank: 7

UID 71375
精华 5
积分 10524
帖子 16352
信誉分 106
可用分 24337
专家分 1
阅读权限 255
注册 2011-8-24
状态离线

发表于 2012-9-29 22:12 资料个人空间短消息加为好友

小中大

　与蛋白编码基因相比，长非编码RNA的生物学功能是后基因组时代的热门话题。日前，北京大学分子医学研究所与北京大学生命科学学院、中国科学院动物所等单位合作,采用新一代测序技术，创建了恒河猴“一站式”基因组知识库RhesusBase，发现了长非编码RNA参与基因起源的新机制，首次提出长非编码RNA可能是孕育蛋白编码基因过程中的“半成品”（semi-product）。相关论文于近日发表于Nucleic Acids Research和PLOS Genetics。

　　人类基因组计划揭示, 占基因组95以上的区域并不编码蛋白质, 长期以来被认为是没有功能的垃圾序列（Junk DNA）。然而，最新研究表明，某些非编码区域可以转录形成长非编码RNA，解读其生物学功能迅速成为该领域的前沿热点问题。而从比较基因组学角度，系统追溯基因及长非编码RNA起源过程，可为解开长非编码RNA之谜提供启迪。

　　恒河猴与人类分歧时间大约为2500万年，从进化距离上是研究这一问题的最佳模型。研究组对恒河猴全身组织进行了转录组测序，总测序片段数达到12亿条，对全转录组的覆盖度达到97，在全基因组尺度上实现了对两万多个恒河猴基因的精细结构修正。论文的通讯作者李川昀博士指出，“正如我们猜想的那样，通过对数以亿计的恒河猴表达片段进行拼接和进一步的实验验证，我们发现现有数据库中近三分之一的基因结构注释存在错误”。研究组采用纠错修正后的精细基因组框架图，对近百个数据来源的基因功能信息进行整合，构建了一个集基因结构、表达、调控、遗传变异、疾病、功能及药物开发等信息于一体的、拥有56亿条独立注释信息的恒河猴“一站式”基因组知识库RhesusBase（cuturl('http://www.rhesusbase.org')），力争打造整合恒河猴研究的“一家店”（Nucleic Acids Research, 2012）。

　　恒河猴基因组信息的完善，为认识人类基因的起源和调控提供了独特的视角。进一步的研究捕捉到了从长非编码RNA转变为蛋白编码基因的精彩过程：研究首次发现24个类人猿物种特有的蛋白编码基因（Hominoid-specific, 包括人类和黑猩猩），而在与人类近缘的恒河猴基因组中，这些基因绝大多数（83）以长非编码RNA形式存在。更有意思的是，它们已具有与人类同源基因相似的转录结构和基因表达模式。研究者提出，部分长非编码RNA是蛋白编码基因的前体，处于向蛋白编码基因转化的过渡阶段。简言之，非编码RNA是新基因诞生的温床（PLOS Genetics, 2012）。