【分享】遗传因素推动下的表观遗传学调控

DNA序列变异与那些改变基因表达水平、导致性状出现数量差异的因素和表观遗传状态密切相关。

人与人之间由于多种性状(例如身高、头发颜色、行为和疾病易感性)的不同而有所差异。而遗传因素(先天性)和环境因素(后天性)是导致这种差异的“罪魁祸首”。近年来,大规模的遗传研究已经在人群中确定了成千上万个与不同性状密切相关的特殊DNA变异。然而,这些研究都没有回答一个关键问题:绝大多数DNA变异是通过何种方式来改变细胞行为、引起特殊性状(例如身高)出现差异的?本期期刊中的三篇文章(第750页由Kasowski等人撰写的文章,第744页由Kilpinen等人撰写的文章,第747页由McVicker等人撰写的文章)向我们提供了一个研究框架,以便于研究者们探索人群中遗传变异与性状差异之间关联性的潜在机制。特别值得一提的是,他们发现DNA变异可通过序列特异性的转录因子活性,影响一种名为表观遗传学(epigenetics)的基因调控机制。

在过去的10年里,遗传学领域中最重要的研究发现之一是:绝大部分与性状相关联的DNA变异都存在于一些曾经被称为“垃圾DNA”的基因组区域中;这些基因组区域之所以被称为“垃圾DNA”,是因为它们不能编码蛋白质。我们现在已经了解到,这些基因组区域含有一些调控性遗传因素,能够控制特定的基因在何时、何处、以何种程度进行表达,从而生成功能性的RNA与蛋白质产物。因此,大多数性状相关性DNA变异改变的并不是基因本身,而是改变了那些控制基因表达过程的调控性遗传因素。在过去的3年里,研究者们已经认识到一些基因调控性变异与性状(例如血胆固醇浓度)和疾病(例如糖尿病、骨关节炎、前列腺癌)密切相关。尽管我们获得了如此傲人的研究进展,但是大多数调节性变异究竟是如何改变基因表达的——我们还知之甚少。

众所周知,表观遗传学机制能够调控可遗传性的基因表达过程;但通常认为这种调控机制不依赖于DNA序列。DNA被包裹在一种名为染色质的三维结构中,而染色质的基本重复单位是核小体(nucleosome),它的组成结构为一条长约146个核苷酸的DNA,周围环绕着由名为组蛋白(histone)的专门蛋白组成的八聚体。这八个组蛋白的氨基酸“尾部”均从核小体上突出来,而这些尾部上的特殊氨基酸在各种核酶的催化作用下,会出现各种各样的化学修饰,例如甲基化、乙酰化或磷酸化。“组蛋白密码假说(histone code hypothesis)”认为,组蛋白尾部修饰(表观遗传标志)的特定组合与可增加或降低基因表达水平的转录因子之间存在着相关性。

Kasowski等人、Kilpinen等人以及McVicker等人采集了众多个体和三口之家成员的类淋巴母细胞系,并对这些细胞系的各种数据进行了综合性分析。他们指出,组蛋白尾部修饰在人群中存在着高度差异性,但是可跨代遗传。这些研究确定了数百个与组蛋白尾部修饰差异及基因表达差异都相关的DNA变异,从而说明遗传因素能够调节表观遗传学因素对基因调控的效应。但是DNA序列变异是如何影响组蛋白尾部化学修饰的呢?这三项研究均指出,转录因子的活性是其中缺失的一个重要环节。

大多数转录因子可直接结合到DNA上,且每种转录因子都倾向于结合特定的DNA序列。一些DNA变异能够极大地改变转录因子对特定基因组区域的结合能力,因而影响基因的转录过程。Kasowski等人、Kilpinen等人与McVicker等人借用一些经过计算机预测和实证确定了的转录因子结合资料,从而确定了数百个影响转录因子结合能力的DNA变异。这些DNA变异中大多数都与组蛋白尾部修饰的差异相关联。

这些研究发现提出了一种可能的机制,转录因子与DNA的结合通过这种机制,启动了组蛋白修饰酶的招募,从而确定了组蛋白尾部的修饰类型。因此,一个可能的模式(下图)是,性状相关性DNA变异(大多数变异在本质上属于基因调控性变异)影响了转录因子的招募过程及其与DNA的结合过程。转录因子结合的差异能够导致各种各样的组蛋白尾部修饰,可共同影响基因表达。而基因表达的差异则表现为性状的差异。



人类性状的差异。 (A)导致人类性状(例如身高)存在差异的部分原因是——影响多种基因表达水平的遗传变异之间存在的联合效应。(B)在某个特殊的基因组区域上,某种核苷酸,例如腺嘌呤(A)使DNA容易被接近,从而促进DNA与转录因子的结合。这一步骤可引起组蛋白尾部修饰,形成一种有利于邻近基因表达的染色质环境。(C)在同一个基因组区域中,变异的核苷酸,例如鸟嘌呤(G)与转录因子的结合能力较低,从而形成了一种不利于基因表达的染色质环境。Pol II:聚合酶II(polymerase II)


这三项研究的部分研究结果非常独特;其中McVicker等人指出,单个DNA变异就能够影响多个相关基因组区域中的组蛋白修饰情况,从而提示了它们之间的功能学关联。Kasowski等人发现,个人的血统情况决定了哪些基因组区域会产生基因推动下的染色质标记可变性。Kilpinen等人指出,DNA变异的协同效应除了能影响转录因子结合与组蛋白尾部修饰以外,还可以影响基因调节过程的其它方面,例如转录速率。有趣的是,这三项研究均发现,许多DNA变异与转录因子结合及组蛋白尾部修饰的可变性相关,但是却与基因表达水平的可变性无关。这就提示我们,机体内存在着大量的非间接性调控变异;且/或存在着广泛性调控机制,以补充调控性遗传变异的效应;且/或一些转录因子结合事件的基因调控效应只有在某些特殊的、未被细胞培养实验发现的环境条件下才会表现得比较明显。

Kasowski等人、Kilpinen等人以及McVicker等人所发表的文章为探明影响复杂性状与疾病的遗传机制提供了新的视角,同时也阐明了基因调控的基本过程,但是他们并没有解答这两个问题中的任何一个。例如,正如三篇文章的作者所强调的那样,并不是所有的调控性遗传变异都能引起性状的差异,或者甚至基因表达的差异。对于性状可变性或疾病风险而言,为什么一些调控性DNA变异会比其它遗传变异更加重要呢?为了回答这个问题以及其它相关的问题,我们还需要进行更多的研究,但是这些研究让我们在探索之路上前行了一步,也向我们提供了一个深入研究该主题的框架。