千人基因组图谱想说爱你不容易

作者简介:曾庆平现为广州中医药大学教授,美国植物生物学者学会会员,曾留学芬兰赫尔辛基大学,从事过转基因研究、合成生物学研究、病原基因诊断及DNA疫苗研究、分子病理学和分子药理学研究。下文是曾庆平教授对“千人基因组”的评论全文。

从“人类基因组”到“千人基因组”

近20年来,基因组“大科学”不断推出“大手笔”:1990年10月1日人类基因组计划启动,2000年6月26日人类基因组测序工作草图绘制完成,2003年4月14日人类基因组全部测序任务宣告完成;2007年12月19日,被誉为人类“第二基因组计划”的人类微生物组项目启动;2008年2月,千人基因组计划启动。

“千人基因组”与人们熟知的“人类基因组”有何关系呢?千人基因组计划将分析2500人(来自非洲、亚洲、欧洲和美洲的14个民族)的基因组,包括每个人的全基因组测序、外显子目标序列捕获和单核苷酸多态性分型,而人类基因组计划只测定了5位健康自愿者(包括3位女性和2位男性,分别为非裔美国人、西班牙裔墨西哥人、中国人和高加索人)的基因组混合序列。人类基因组计划注重人类基因组的共性,而千人基因组计划强调个体基因组的个性,但最终成果都是绘制人类基因组图谱。

人类基因组图谱按精细程度分为4个层次:第一层次是以染色体位点交换率绘制的遗传连锁图谱,或简称连锁图谱;第二层次是以染色体位点辐射断裂率绘制的细胞遗传图谱;第三层次是用分子杂交或扩增等方法绘制的物理图谱,包括指纹图谱、限制片段长度多态性(RFLP)图谱、随机扩增多态性DNA(RAPD)图谱、扩增片段长度多态性(AFLP)图谱、序列标签位点(STS)图谱、表达序列标签(EST)图谱、单核苷酸多态性(SNP)图谱;第四层次是用全基因组测序技术绘制的序列图谱。

遗传图谱或细胞遗传图谱都是分辨率较低的基因图谱,给出的是基因标记之间的相对距离;物理图谱是分辨率较高的基因图谱,显示的是基因标记之间的绝对距离。当然,分辨率最高的基因图谱当属序列图谱,每个核苷酸依次排列。目前,基因作图的发展趋势是将多种作图技术结合起来绘制综合图谱。以基因序列为主体,结合遗传图谱、细胞遗传图谱和物理图谱的综合图谱已经面世。

把基因序列通译为“字典”

已经有了人类共同的基因组综合图谱,为什么还要开展个体基因组测序和分析呢?据千人基因组计划项目相关人士介绍,无论民族还是地域,人与人之间超过99%的基因都相同,罕见变异发生的频率仅为1%或更少,但这些变异与癌症、心脏病、糖尿病等重大疾病都有关系。如果绘制出一张涵盖低频突变位点的高分辨率人类基因变异图谱,将有助于探索人类疾病中表型与基因型之间的特定联系。

衡量基因组图谱是否有价值以及价值有多大,关键是看它们被“注释”的程度,基因序列属于结构基因组学范畴,而基因注释属于功能基因组学范畴。如果将人类基因组计划与千人基因组计划作一个比较,那么可以说人类基因组计划的完成是印刷了一部生命的“天书”,而千人基因组计划的完成就是把这部“天书”重印或再版一次,只不过其间作过重大修改。为什么把人类基因组图谱视作“天书”呢?因为基因序列与生物表型的关系目前并没能一一对应起来。形象地说,基因序列恰如一本火星文小说,没有几个地球人能读懂!怎么才能破解人类基因组序列所代表的生物学意义呢?当然必须有一本把基因序列通译为生物表型的“字典”,尤其需要有一本能诠释基因变异的“字典”。基因变异包括能改变表型的“有意义”变异与不改变表型的“无意义”变异,但将基因变异通译成疾病风险的“字典”还没有完全编撰出来。

依靠基因组图谱真的能看病吗

医生根据病人症状看病可以如实告诉病人的发病情况;遗传学家根据婴儿染色体进行产前诊断可以把婴儿已经患有遗传病或即将发生遗传病的情况告诉孕妇;基因测序工作者根据基因图谱预测疾病风险只能把将来患病的可能性告诉被测试者,至于发不发病就说不定了,因为还取决于基因与环境的相互作用。

理论上,如果基因“有问题”,意味着先天异常,必须更换基因才行。可是,以目前的医术及伦理准则,任何人都不能为你更换基因(实施基因治疗)!因此,当你知道自己的疾病风险后,要么从此背上沉重的心理包袱,寝食难安,甚至惶惶不可终日,要么更加珍惜自己的身体,从此远离吸烟、酗酒及其他不良生活习惯。

尽管个人基因组序列差异甚微,但其他由基因组衍生的数据,如转录物组学、蛋白质组学、代谢物组学、离子组学、相互作用组学、表观遗传学数据等,在不同个体中差异巨大,而且在各种疾病的关联性上比基因组学数据有更显著意义。然而,这些数据的采集难度大、成本高、耗时长,预计不可能在短期内投入实际应用。此外,基因组学数据固然有精细之优点,但缺点也很突出,那就是“见树不见林”,不易“窥一斑而知全豹”,捡了基因那个“芝麻”,丢了病源这个“西瓜”。

拥有贮存个人基因组序列数据的“健康风险身份证”是否有必要?基因组序列数据无疑是健康档案的重要参数之一,但用它来诊病或治病还嫌不够。除非是常规诊断方法无法确诊的病例,一般没有必要求助于个体化基因组图谱!如果将来把各种血液、细胞、生理、生化、病理指标连同基因水平的数据一起集成在一张“电子卡”里,倒是可能成为真正具有疾病诊断和治疗价值的“健康身份证”!