解析基因组百万个新调控元件

近日由美国哈佛-麻省理工的博德研究所的科学家领导的一个国际小组通过比较分析29种哺乳动物的基因组序列,发现了人类基因组中存在的数百万个新调控元件,这一基因组分析图谱为科学家们解析与成千上万人类疾病相关的遗传学改变提供了重要的研究数据。
  科学家们曾在早期对人类和小鼠基因组的比较研究中间接地推断出了这些基因调控序列的存在,但长期以来只找到其中的一小部分。就像构成宇宙的主要物质——暗物质和暗能量一样,科学家们无法看到,也无法探测到它们。



  在过去的5年里,来自博德研究所、华盛顿大学基因组中心和贝勒医学院人类基因组测序中心的研究人员对包括兔子、蝙蝠、大象在内的29种有胎盘哺乳动物进行了全基因组测序。在这篇文章中,他们比较分析了这29种哺乳动物的全部基因组序列,找出了这些物种基因组中基本保持不变的区域。



  “除了少数几个物种中的个别调控区域,”文章的末位作者、麻省理工学院的计算机科学系副教授Manolis  Kellis表示:“新图谱揭示了存在于这些哺乳动物基因组非编码区的大约300万个新元件,这些元件的中断似乎与人类的疾病有着密切的相关性。”



  研究人员表示那些有可能导致疾病的突变在数百万年的进化中被保存下来,但通常在人类罹患某种特定疾病时则会发生中断。揭示出这些致病突变以及它们的潜在功能,将有助于科学家们揭示潜在的疾病机制,发现有潜力的药物靶标。



  在对这些新元件进行进化标记和实验数据比较分析后,科学家从中鉴别出了大约4000种新外显子,1万个调控蛋白质生成的高度保守元件,超过1000个在基因调控中发挥不同作用的RNA二级结构新家族以及270万个预测的转录因子靶标。



  “与人类常见疾病相关的大部分遗传变异通常都发生在基因组的非蛋白质编码区域。然而对于研究者而言,在这些区域准确地找到致病突变却存在极大的困难,”文章的首作者、博德研究所脊椎动物基因组生物学系主任Kerstin  Lindblad-Toh表示:“新图谱将帮助科学家更轻松地破译人类基因组中疾病相关的遗传变异。”