温度调控高效液相色谱探索人类基因组变异的进展

摘要温度调控高效液相色谱法是探索人类基因组DNA序列变异的新手段。温度调控高效液相色谱法通过比较异源双链与同源双链,而非逐个样本直接测序,可以敏感而准确地发现DNA变异,唯发现的变异需进一步测序鉴定。对于旨在发现新突变或新多态性的课题,该方法可以明显减少测序工作量,而对于检出稀少的变异型,可明显降低所需成本。通过自动化操作,更能显著加快获取数据的速度。本文介绍温度调控高效液相色谱法的原理与命名、技术的主要优点及应用进展。

  人类基因组计划的迅速进展使探索基因组DNA序列变异的任务变得十分迫切。DNA序列变异绝大多数是单核苷酸的改变。大规模的单核苷酸变异检测不论对于含有大量外显子的单个基因,还是引起多因子疾病的多个基因,都是巨大的技术挑战。发展高通量技术以大规模高效地检测单核苷酸多态性(singlenucleotidepolymorphism,SNP)或突变,是目前基因组计划的前沿课题之一。

  离子对反相高效液相色谱法(ion-pairreversed-phasehighperformanceliquidchromatography)作为DNA分析的技术早已存在,但发掘这种技术的潜能并用于探索人类基因组DNA序列变异却是近5年的事。基于DNA变性与复性对温度的依赖性,离子对反相高效液相色谱法能以3种方式操作。(1)在不变性温度条件下,色谱仪类似凝胶电泳仪,可分离分子量不同的双链DNA分子,制备分子克隆所需的DNA片段或分析具有长度多态性的片段,类似RFLP,AmpFLP分析。(2)在充分变性温度条件下,单链DNA或者RNA分子能被区分,适用于寡核苷酸合成纯度质量控制和基于引物延伸的基因型分析。(3)在DNA部分变性的温度条件下进行。此时,变异型和野生型的PCR产物不仅分别形成同源双链,同时也错配形成异源双链。异源双链与同源双链融解温度(meltingtemperature,Tm)的差异使色谱固定相保留它们的能力有所不同。这样,根据柱上的保留时间可以分辨异源双链与同源双链,从而识别变异型。

   DHPLC是一个不够明确的术语。首先,分析过程中变性的是DNA分子,而不是高效液相色谱仪,也不是高效液相色谱方法。其次,分析过程中高效液相色谱仪的检测温度并非全部DNA分子的变性温度,因为Tm是指由DNA分子构成的群体中,半数双链DNA分子解链时的温度。接近DNA融解温度的色谱条件意味着半数以上双链DNA分子没有变性。其三,此时检测的是异源双链与同源双链,它们处于复性状态,而不是变性状态。DHPLC这个术语使人难以理解的是,一方面DNA分子在变性,另一方面检测的目标却是双链DNA分子。与DHPLC相比,TMHA定义明确,而后者不足之处在于没有包含高效液相色谱概念。对于以凝胶电泳为主要分析手段的人们,不一定都知道TMHA是由高效液相色谱完成的,因为TMHA同样可以由凝胶电泳完成;而从事分析化学的人们也不一定都知道他们所操作的高效液相色谱仪可以进行TMHA。为此,我们建议把在接近DNA融解温度条件下进行的,旨在探索与发现DNA序列变异的离子对反相高效液相色谱技术称为温度调控高效液相色谱法(temperature-modulatedhigh-performanceliquidchromatography,TmHPLC)。这样既有TMHA的含意,也有高效液相色谱的传统缩写。更重要的是,TmHPLC隐含有基于野生型DNA的Tm值选择高效液相色谱温度的概念。事实上,Kuklin等也称这是一种基于温度调控的液相色谱新技术(Thenewtechnologybasedontemperature-modulatedliquidchromatography)。

  许多学者评估了TmHPLC检测人类基因组DNA序列变异的效能。O’Donovan等用盲法分析了TmHPLC的特异性和灵敏度,对Ⅸ因子基因外显子H和神经纤维瘤病NFI基因外显子16的分析显示,55名个体含有的全部48种突变都能正确检出。Choy等比较了构象敏感凝胶电泳、单链构象多态分析和TmHPLC检测结节性硬化症基因TSC2突变的能力,在84例用CSGE检测TSC2基因前20个外显子的患者中,TmHPLC不仅检测出了CSGE观察到的全部变异型,而且发现了14个新变异。在18个由SSCP检测观察到的变异型中,TmHPLC不仅检测出了17个变异型,而且发现了7个新变异。对TSC2单核苷酸变异的检出率,SSCP和CSGE分别为69%和54%,而TmHPLC为100%。提示TmHPLC优于SSCP和CSGE,特别是在检出单核苷酸变异方面。Dobson-Stone等比较了TmHPLC方法和荧光单链构象多态分析检测EXT1和EXT2基因突变的能力。42个变异型中,TmHPLC检出了40个,F-SSCP检出了39个,检出率分别为95%和93%,并认为两种方法有相同的突变检出效能。Skopek等比较了TmHPLC和变性梯度凝胶电泳的异源双链分析特性,发现TmHPLC和DGGE测量的都是异源双链分子的融解特性,认为TmHPLC是检出突变和分离纯化变异型DNA的有效手段。Arnold等比较了直接测序与TmHPLC方法分析BRCA1基因突变的能力。对确证为患遗传性乳腺癌和卵巢癌的46名女性患者,用TmHPLC分析了整个BRCA1基因33个DNA片段的1518份PCR产物,直接测序了626份。结果证明TmHPLC检出了全部直接测序找到的变异体。在纯合子中,没有见到假阳性;在有BRCA1突变和多态的女性中也没有见到假阴性。Gross等用TmHPLC分析了直接测序BRCA1基因的113个DNA片段,发现TmHPLC突变检出率为100%,而SSCP为94%。Liu等的研究结果显示TmHPLC的突变检出率为92.5%,而无突变的196个PCR产物无一例假阳性。这些研究表明,TmHPLC是检测人类基因组DNA序列变异敏感而且准确的手段。

  TmHPLC的优点不仅在于把分析单个样本所需时间缩短到了几分钟,更重要的是容易实现自动化操作,从而可从大量样品中快速搜索出未知的变异型,节约人力、物力和时间。Giordano等采用全自动TmHPLC系统地搜索了人类染色体5pter-q13区域的124个序列标签,在28个STS中发现了30个SNP,并且与该区域已知遗传标记的重叠小于10%,达到了关联分析观察连锁不平衡所需的遗传标记密度,即平均每一cM一个遗传标记。Wagner等用TmHPLC研究了BRCA1和BRCA2基因,在71个乳腺癌和乳腺卵巢癌家系和95名对照个体的BRCA2编码区10257bp和非编码区2799bp中发现简单序列变异在编码区为每194bp一个,而非编码区为每108bp一个,得出了简单序列变异在BRCA2十分常见的结论。Underhill等用自动TmHPLC对718份样本进行了Y染色体分析,结果发现了22种Y染色体SNP,其中19种以前未见报道。Liu等用自动TmHPLC分析了94例Marfan综合症患者fibrillin-1(FBN1)基因全部65个外显子,观察到25种多态性和39种突变,其中37种是新发现的突变。这些研究表明,TmHPLC通过自动化操作能明显加快获取数据速度,适用于大群体中基因突变的搜索。

  自Oefner和Underhill建立TmHPLC方法以来,美国Transgenomic公司开发出了能以不变性温度、充分变性温度和TMHA等3种方式操作的离子对反相高效液相色谱自动分析仪,命名为WAVE。同期,国内外学者也探索了用普通高效液相色谱仪进行TmHPLC分析的可能性。其中,德国学者Arnold等采用Bio-TekKontron公司的高效液相色谱仪,国内学者廖林川、孟海英及苏智广等将惠普公司的高效液相色谱仪用于基因多态性分析也获得了成功。这些工作表明,在有梯度发生器、柱温控制器和小流通池的高效液相色谱仪上进行TmHPLC分析也是可行的。目前,TmHPLC技术发展包括改善检测信号强度与质量、选择更好的分离介质以及提高预测突变性质的能力。Jones等设计的TmHPLC最佳温度分析软件和Stanford大学的Tm计算网站,为TmHPLC分析提供了计算机辅助选择温度的手段。Hecker等用荧光标记PCR产物、激光荧光检测器分析的方案证明,TmHPLC可以区别含量相差500倍的两个等位基因,这使多份样本混和检测成为可能。同时,荧光标记单链使色谱图的解释变得更加容易。Arnold等比较了不同的分离介质,在前500次进样中,poly(styrenedivinylbenzene)柱和end-cappedsilica柱的敏感度没有显著性差异,但在500次进样后,silica柱分辨异源双链和同源双链的能力会迅速下降。Arnold等的研究还表明,在已知的遗传变异中,TmHPLC能预测突变的性质。

  总之,TmHPLC通过比较异源双链与同源双链,可以敏感而准确地发现DNA变异,唯发现的变异需进一步测序鉴定。这对于发现新突变或新多态性的课题,可明显减少测序工作量。尤其对鉴别稀少的变异型,可明显降低成本,并加快获取数据的速度。因此,TmHPLC是一种检测人类基因组DNA序列变异敏感、准确、而且经济的手段。