测序“垃圾”数据变身宝藏

基因组测序中曾经被视为是垃圾的数据,现在能够用来为人们提供重要的疾病线索。St. Jude儿童研究医院——华盛顿大学儿童癌症基因组项目的研究人员独辟蹊径,在染色体末端DNA重复片段的测序数据中,挖掘到了宝贵的癌症信息。



染色体末端的DNA重复片段被称为端粒,此前这种重复片段往往在二代测序研究中被忽视。这是由于二代测序技术难以定位重复片段,为此这类数据常被研究者们视为垃圾。但现在,St. Jude儿童研究医院的研究人员发现,端粒DNA量的改变与特定癌症之间存在着关联,文章发表在最近一期的Genome Biology杂志上。

机体中端粒DNA序列是不变的,但其重复的次数却是不同的,这直接关系到端粒的长度,而端粒长度限制了细胞分裂的次数。端粒随着细胞分裂逐渐缩短,直到细胞停止分裂。不过癌细胞能够绕过端粒的缩短机制持续进行分裂,端粒的维持和延长也是癌细胞不断分裂增值的标志。

研究人员对235位正在与13种不同癌症作斗争的儿童患者进行了全基因组测序,其中还包括13位成人癌症患者的DNA用以进行比对。这也是到目前为止最大规模的,针对端粒DNA含量的全基因组测序项目。

研究显示,在不同癌症中端粒的量差异较大,例如在恶性儿科肿瘤中,有32%的实体瘤和4%的脑瘤基因组端粒量增加,但造血系统恶性瘤就不存在这一现象。研究人员还发现,端粒DNA量增加的肿瘤更倾向于携带染色体变异,包括染色体内和染色体间的重排。此外,不同类型的癌症也有着不同的端粒DNA变化模式。这些变化在某些情况下反映了端粒的延长机制,即端粒延伸替代机制(alternative lengthening of telomeres)。

“我们的文章显示,端粒DNA数据并不是‘垃圾’,它们能够提升整个基因组测序的价值,”文章第一作者Matthew Parker博士说。“端粒能够体现独特的癌症信息。”

在全基因组测序研究中,端粒的重复DNA往往因为难以定位而被研究者们忽视。但这项新研究却独辟蹊径,比较了正常细胞和癌细胞之间端粒DNA含量的差异,凸现了这一数据的宝贵价值。研究人员相信,这项研究将为开发新一代的癌症治疗临床工具奠定基础。