分析测试百科

标题: 国内外SNPs研究的进展及展望 [转自丁香园论坛] [打印本页]

作者: 快乐的大脚 时间: 2011-8-15 16:53 标题: 国内外SNPs研究的进展及展望 [转自丁香园论坛]

国内外SNPs研究的进展及展望 [转自丁香园论坛]

当前，SNPs研究在国际上有很大的进展，NATURE、Science、New England 、PNAS等顶尖杂志在近几年发表了大量的论文，国内各种医学权威期刊几乎每期都刊登关于SNPs的论文。当然，国内与国外相比还是有很大差距的，这体现在国内的小样本、研究内容不深入（仅限于关联研究）、基因分型技术手段落后等等方面。众所周知，研究生是科研的主力军，大多数论文工作都是由我们研究生完成，因此，本版块特开辟此专帖，大家集中讨论关于SNPs研究的一些最新进展，希望大家积极参与，互相促进，在此热贴下跟帖者会给予优先奖励。
此次讨论共分5个方面，大家可以选择一个侧面或者多个侧面阐述之，主要包括：

1. SNPs的基础知识介绍(SNP basics, definition)
2. SNPs的分型方法(SNP genotyping methods)
3. 如何选择研究的SNPs(Selection of targeted SNPs)
4. 如何采用分子流行学的方法对SNPs进行研究 (Association studies using molecular epidemiology)
5. SNPs的功能学验证(Identification of Functional SNPs)

请大家多多交流发言，这样才能更好的相互促进！！

首先抛砖，引自上月本人写的一篇中文综述，即将在中华劳卫上见刊的，提前以飨各位
SNPs是指DNA序列上发生的单个核苷酸碱基之间的变异,在人群中这种变异的发生频率至少大于1%, 它是基因组中存在的一种数量非常丰富的变异形式,占人类基因组中遗传多态性的90％以上。针对不同人种基因组的测序结果表明,在人类群体中存在大约1000万个SNP位点,在公共数据库中至少有500多万个SNPs已被报道,SNPs在基因组的分布密度达到每300-500个碱基就存在一个SNP[1-4]。
1. SNPs检测技术的进展
随着分子生物学技术的飞跃发展, SNPs基因分型技术和方法不断涌现。虽然经典的一些检测SNPs的技术,如限制性片段长度多态性（restriction fragment length polymorphism, RFLP）和单链构象多态性（single-strand conformation polymorphism, SSCP）等技术仍在实践中广泛使用,但一些高灵敏度、高通量的基因分型方法日益受到重视,这些检测技术包括：TaqMan探针法、SNPlex基因分型法、连接酶检测反应法（ligase detection reaction, LDR）、焦磷酸测序法、DNA芯片/阵列分析法、微球法（Illumina）,以及质谱分析和温控高效液相色谱法[5-7],可以满足大样本及多SNPs位点的基因分型要求。
2. 人类基因组单体型图
虽然人类基因组SNPs数量众多,但是染色体上相邻SNPs的等位位点倾向于以一个整体遗传给后代,这些位于染色体上某一区域的一组相关联的SNP等位位点被称作单体型（haplotype）。大多数染色体区域只有少数几个常见的单体型（每个具有至少5%的频率）,它们代表了一个群体中的大部分多态性。一个染色体区域可以有很多SNP位点,但是少数几个标签SNPs（TagSNPs）就能够提供该区域内大多数的遗传多态模式。人类基因组单体型计划通过对约100万个SNPs进行基因分型,拟构建人类DNA序列中多态位点的常见模式[8]。人类基因组单体型图谱的逐渐绘制完成,提供了详尽的人类DNA序列的变异信息,对人类个体遗传背景的研究提供了强大的机遇和挑战[9]。
3. 生物信息学的发展
在功能基因组时代,不断产生的海量信息极大的促进了生物信息学这一新兴学科的发展。各大生物信息数据库存在的基因组全序列信息为SNPs的研究提供了极大的便利：例如通过再测序手段对SNPs的存在及频率信息进行确定,对不同人群进行SNPs的基因分型都需借助这些序列信息才能得以进行；同时,针对SNPs进行连锁分析、单体型构建以及标签SNPs寻找的生物信息软件也不断推出；而且,功能基因组学的发展甚至开始尝试对SNPs进行功能学预测,比如预测启动子SNPs位点与转录因子结合的改变,编码区SNPs对蛋白质的空间结构,生物功能的影响等,这对我们在浩繁的人类SNPs中选择潜在功能性的SNPs位点进行研究具有极大的帮助。
4. 从SNPs的关联研究到功能学探讨
随着SNPs检测技术的进展,SNPs在人群中的检测日益得到广泛应用,特别是对于当前多基因复杂疾病如肿瘤、冠心病的遗传易感性的探讨,传统的以家系为基础的连锁分析在检测能力上已经有了明显的局限性,而病例-对照等易于开展的关联性研究方法有显著的优势。因此,近几年探讨SNPs作为复杂性疾病的遗传标记的关联性研究大量涌现。但是即使对于同一SNP位点与相同疾病的关联性研究,不同研究中心的结果往往也存在很大差异甚至完全相反[10]；而且,与疾病具有显著关联的SNPs到底是发挥功能性作用,或者仅仅是与功能性SNPs相连锁的遗传标记失甚至二者只是某种联系上的假象,这都需要进行功能学研究来加以证实。预计引起细胞功能学改变的SNPs在人类所有SNPs中只占极小一部分（约五万到二十五万个SNPs）,大多仅仅在疾病发生过程中介导低度或中度的效果,主要包括分布在基因启动子区域可能发挥调节转录效应的SNPs（regular SNPs, rSNPs）和蛋白质编码区域引起编码氨基酸改变的SNPs（非同义SNPs或错义SNPs）[11, 12]。当前分子生物学技术的进展推动了SNPs功能学研究的深入[13-17],如比较成熟的对于启动子区域SNPs功能学研究技术包括：①报告基因转染技术,这一技术主要用于研究启动子SNPs对于mRNA转录效率的影响, 通过观察转录结局来判断SNPs是否具有功能。②凝胶迁移滞后实验(electrophoretic mobility shift assays, EMSA),该技术通过在体外合成含SNPs位点的寡核苷酸与转录因子特异性结合,观察二者结合的强度和效率,但是该技术由于只是人工合成较短长度的寡核苷酸,没有考虑SNPs位点周围遗传背景环境的影响。③染色质免疫沉淀分析（chromatin immunoprecipitation assay, ChiP）,该技术通过超声将染色体碎片化,再将碎片化的核酸片段与转录因子结合, 然后通过PCR技术扩增观察判断二者结合的效率和强度。当然,对于关联研究的结果的评价和验证需要综合SNPs所在序列信息、进化保守性的有无、人群遗传学、实验室功能学证据、暴露评价（如基因型-环境交互作用研究）和流行病学证据,如Rebbeck等根据上述综合证据把SNPs是否具有功能效应分为强支持功能显著性、中度支持功能显著性及无功能显著性三类[16, 18]。

[ 本帖最后由快乐的大脚于 2011-8-15 16:57 编辑 ]

作者: 快乐的大脚 时间: 2011-8-15 16:58

给大家点资料参考！

(single nucleotide polymorphism ， SNP，发音为“snips”), 主要是指在基因组水平上由单个核苷酸的变异所引起的 DNA 序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的 90% 以上。 SNP 在人类基因组中广泛存在，平均每 500 ～ 1000 个碱基对中就有 1 个，估计其总数可达 300 万个甚至更多。

SNP 所表现的多态性只涉及到单个碱基的变异，这种变异可由单个碱基的转换 (transition) 或颠换 (transversion) 所引起，也可由碱基的插入或缺失所致。但通常所说的 SNP 并不包括后两种情况。

理论上讲， SNP 既可能是二等位多态性，也可能是 3 个或 4 个等位多态性，但实际上，后两者非常少见，几乎可以忽略。因此，通常所说的 SNP 都是二等位多态性的。这种变异可能是转换 (C T ，在其互补链上则为 G A) ，也可能是颠换 (C A ， G T ， C G ， A T) 。转换的发生率总是明显高于其它几种变异，具有转换型变异的 SNP 约占 2/3 ，其它几种变异的发生几率相似。 Wang 等的研究也证明了这一点。转换的几率之所以高，可能是因为 CpG 二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点，其中大多数是甲基化的，可自发地脱去氨基而形成胸腺嘧啶。

在基因组 DNA 中，任何碱基均有可能发生变异，因此 SNP 既有可能在基因序列内，也有可能在基因以外的非编码序列上。总的来说，位于编码区内的 SNP(coding SNP,cSNP) 比较少，因为在外显子内，其变异率仅及周围序列的 1/5 。但它在遗传性疾病研究中却具有重要意义，因此 cSNP 的研究更受关注。

从对生物的遗传性状的影响上来看， cSNP 又可分为 2 种：一种是同义 cSNP(synonymous cSNP), 即 SNP 所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列，突变碱基与未突变碱基的含义相同；另一种是非同义 cSNP(non-synonymous cSNP), 指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变，从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。 cSNP 中约有一半为非同义 cSNP 。

先形成的 SNP 在人群中常有更高的频率，后形成的 SNP 所占的比率较低。各地各民族人群中特定 SNP 并非一定都存在，其所占比率也不尽相同，但大约有 85% 应是共通的。

SNP 自身的特性决定了它更适合于对复杂性状与疾病的遗传解剖以及基于群体的基因识别等方面的研究：

SNP 数量多，分布广泛。据估计，人类基因组中每 1000 个核苷酸就有一个 SNP ，人类 30 亿碱基中共有 300 万以上的 SNPs 。 SNP 遍布于整个人类基因组中，根据 SNP 在基因中的位置，可分为基因编码区 SNPs （ Coding-region SNPs ， cSNPs ）、基因周边 SNPs （ Perigenic SNPs ， pSNPs ）以及基因间 SNPs （ Intergenic SNPs ， iSNPs ）等三类。

SNP 适于快速、规模化筛查。组成 DNA 的碱基虽然有 4 种，但 SNP 一般只有两种碱基组成，所以它是一种二态的标记，即二等位基因（ biallelic ）。由于 SNP 的二态性，非此即彼，在基因组筛选中 SNPs 往往只需 +/- 的分析而不用分析片段的长度，这就利于发展自动化技术筛选或检测 SNPs 。

SNP 等位基因频率的容易估计。采用混和样本估算等位基因的频率是种高效快速的策略。该策略的原理是：首先选择参考样本制作标准曲线，然后将待测的混和样本与标准曲线进行比较，根据所得信号的比例确定混和样本中各种等位基因的频率。易于基因分型。 SNPs 的二态性，也有利于对其进行基因分型。对 SNP 进行基因分型包括三方面的内容： (1) 鉴别基因型所采用的化学反应，常用的技术手段包括： DNA 分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术； (2) 完成这些化学反应所采用的模式，包括液相反应、固相支持物上进行的反应以及二者皆有的反应。 (3) 化学反应结束后，需要应用生物技术系统检测反应结果。

以下一个个链接供参考：

cuturl('http://www.5ibio.com/html/RNA/transcription/20070318/11100.html') （讲怎么样设计去做SNP，个人觉得不错）

作者: 快乐的大脚 时间: 2011-8-15 16:59

SNPs的基础知识介绍和文献！

SNP 的概念:

SNP 是指基因组水平上由单个核苷酸的变异所引起的DNA 序列多态性,在群体中的发生频率不小于1 %。包括单个碱基的转换、颠换、插入和缺失等。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤( G2A) 、嘧啶与嘧啶( T2C) 间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T) 之间的替换。依据排列组合原理,SNP 一共可以有6种替换情况,即A/ G、A/ T、A/ C、C/ G、C/ T 和G/ T ,但事实上,转换的发生频率占多数,而且是C2T 转换为主,其原因是Cp G的C 是甲基化的,容易自发脱氨基形成胸腺嘧啶T , Cp G 也因此变为突变热点。
SNP 在动物基因组中分布广泛,每一个核苷酸发生突变的概率大约为10 - 9 。由于选择压力,SNP在单个基因、整个基因组中以及种群间的分布是不均匀的。SNP 在非编码区中要多于编码区,而且在编码区也是非同义突变(有氨基酸序列的改变) 的频率比其他方式突变的频率低得多[4 ] 。而基因间,同一种基因中的编码SNP (coding SNP ,cSNP) 的数目也不相同,可从0～29 个不等。多项研究同时发现不同种族间SNPs 的数目也是不同的,非洲人群及非裔种族中SNPs 数量最多,而其他种群的SNPs 要少得多,因此通过比较亚群间等位基因的频率将有助于阐明种族的结构和进化。

作者: 快乐的大脚 时间: 2011-8-15 16:59

SNP 的检测方法

人们对SNP 的研究方法进行了许多探索和改进。SNP 分析技术按其研究对象主要分为两大类,即: ①对未知SNP 进行分析,即找寻未知的SNP 或确定某一未知SNP 与某遗传病的关系。检测未知SNP 有许多种方法可以使用,如温度梯度凝胶电泳( TGGE) 、变性梯度凝胶电泳(DGGE) 、单链构象多态性(SSCP) 、变性的高效液相色谱检测(DHPLC) 、限制性片段长度多态性(RFL P) 、随机扩增多态性DNA(RAPD) 等,但这些方法只能发现含有SNP 的DNA 链,不能确知突变的位置和碱基类别,要想做到这一点,必须对那些含有SNP 的DNA 链进行测序。②对已知SNP 进行分析,即对不同群体SNP遗传多样性检测或在临床上对已知致病基因的遗传病进行基因诊断。筛查已知SNP 的方法有等位基因特异寡核苷酸片段分析(ASO) 、突变错配扩增检验(MAMA) 、基因芯片技术(gene chips) 等。由于人类基因工程的带动,许多物种都已开始了基因组的项目,并建立了大量数据库,比较这些来自不同实验室不同个体的序列, 就可以检测到
SNP。目前,可供利用的公开SNP 网上资源主要包括: ①由美国国立卫生研究院( National Institutes of Health ,NIH) 提供的主要是与癌症和肿瘤相关的
候选SNP 数据库: http :/ / cgap. nci. nih. gov/ GAI ;②由NIH 开辟的适于生物医学研究的dbSNP 多态性数据库: http :/ / www. ncbi. nlm. nih. gov/ SNP ; ③德国的HGBAS 网站提供的人类SNP 数据库:http :/ / hgbas. Cgr. ki. sei 等。另外, 日本建立了J STSNP 数据库:http : / / snp. Ims. utolkyo. ac. jp ;我国也于2001 年底启动了“863”计划,进行中华民族基因组SNP 系统目录的构建与研究。

作者: 快乐的大脚 时间: 2011-8-15 16:59

SNP 研究中存在的问题

SN P s 研究现在正处于发展之中, 虽然它有很好的前景, 但目前仍存在不少问题.
1.复杂疾病相关分析中的问题
在Skok lo ster 举行的国际SN P 及复杂基因分
析会议上透露出许多问题[ 2 ] , 利用SN P 寻找致病基因的工作并不象最初想象的那样简单。研究者除需要大量的SN P s, 有时需要弄清被研究人群的历史,如他们的迁移模式等, 在对心脏病危险因素L PL 基因的研究中, 由于减数分裂中的基因重组, 使SN P的关联分析很困难; Ro salind Harding 用SN P s 研究镰刀细胞贫血的B球蛋白基因时也遇到了困难,她认为研究者除依靠SN P 外,还需知道疾病的模式及被研究人群的历史。
2.技术问题
目前虽然有大量检测SN P 的方法, 但大都价格昂贵, 速度较慢, 这限制了其在法庭科学中的应用,所以迫切需要有低成本, 高生产率的新方法涌现。
3.SNP 命名问题
目前没有一个统一标准的命名方法, 这对于Y2SN P 来说尤为紧迫, 由于不同SN P 由不同实验室测定, 现在至少存在6 种不同的命名系统。

作者: 快乐的大脚 时间: 2011-8-15 16:59

基于SNPs 研究的单倍型图谱计划

　寻找标记SNPs 的国际遗传变异图谱计划，即国际单倍型图谱计划(Haplotype Map Project)已于2002年10月正式启动，2003 年中国承担了“国际单倍型图谱计划”10% 的任务，这表明我国基因科学研究能力的提高和在国际生命科学领域学术地位的提升。该计划的启动将为人类致病基因的寻找提供一条捷径。在DNA 上位置比较接近的很多SNPs，会组成单倍型块并作为一个整体遗传。通过极少数的几个标记SNPs，可以识别出不同的单倍型块。单倍型图谱(HapMap)被认为是DNA 的基本结构单位，大约由5 000~20 000 对碱基组成。不同种族、不同个体之间的基因组序列大约99.9% 都具有一致性，正是0.1%的碱基排列顺序的差异决定了人类的遗传多态性，即人与人之间的个体差异。HapMap 计划就是研究这0.1% 差异的排列顺序。HapMap 计划的目标在于，确定人类基因组中普通模式的D N A 序列变异，通过测定序列变异特
征、变异频率、它们之间的关联，绘出人类基因组的单倍型块，以及不同单倍型块的标记SNPs[6]。单倍型块数据库(cuturl('http://www.hapmap.org'))主要为基因
型数据，可供研究者使用、下载、分析数据[ 7 ] 。在I 期计划中，从世界上4 个地区的人群中采集269份DNA 样本，现已从中顺利测定110 多万条SNPs
的基因型信息，11 500 个错义cSNPs 被成功分型[8]。由此获得的HapMap，也将成为利用人类基因组图谱寻找与疾病有关的遗传变异的重要参考。通过确
定单体型，使单体型图成为用于进行关联研究的一个工具。在关联研究中，研究人员将患者的单体型与健康人(对照)的单体型相比较。破译人类基因组的单倍型图，将能大规模比较不同个体的不同单倍型图来发现与疾病相关的基因变异，为人类疾病和遗传关联分析、致病基因和致病因子的确定，药效
和疾病风险的分析及人类起源进化、迁徙历史研究等提供完整的人类基因信息。这将有助于更好理解疾病发生的原因及其生理基础，从而将可能用于疾
病的早期诊断，甚至能在基因突变前预测癌症的风险性。SNPs 及HapMap 策略的提出引发整个遗传学界基因组研究的又一热潮，其研发和应用必将大大
加速人类遗传学和药物基因组学的研究。

作者: 快乐的大脚 时间: 2011-8-15 17:00

SNP数据库：

国际上较重要的网站有：
美国的NCBI SNP数据库IDatabase of Single Nuleotide Polymorphisms (dbSNP)

欧洲SNP数据库Human Genome Variation Database (HGVbase)

mIT美国麻省理工 SNP数据库

International HapMap Project

其它的SNP站点还有：
华盛顿大学SNP数据库

CHLC

美国人类基因组研究所SNP数据库

作者: 快乐的大脚 时间: 2011-8-15 17:01

介绍人类基因组中多态性最强的HLA区域的完整的单体型图谱的文章。
Am. J. Hum. Genet. 73:580–590, 2003.

作者: 快乐的大脚 时间: 2011-8-15 17:02

确实的说，经费是非常重要的，如果从大样本的流行病学到细胞功能学的过程，这个问题一方面需要各个高校科研单位的共同合作，如样本的拼凑，paper的分享等，如已经开展几年的某973项目（ECPs致机体损伤和防御的研究），针对中国人群的特有SNPs做了大量的关联研究，在1-2年内发了多篇SCI的论文。另一方面，显然大多数科研单位都无法参与到这样的大项目中去，这样导致的结果是各自为政大量的垃圾文章出现；同时，关于SNPs研究做了这么多年，出了那么多的阳性结果，而很多结果在不同的单位或者人群中是不一致甚至完全相反的，这导致了现在相关的meta分析方面的paper 也出现了很多---------总结别人的结果也是高于综述的创新了！！我个人认为当前小的科研单位一方面要走入合作中去，另一方面可以在思路上创新的，比如今后几年来该领域的大方向应该是大样本和功能研究，可是功能研究的方法和手段一直跟不上关联研究的步伐？？？有好的功能研究的技术和idea也同样会受到大家的重视！

作者: 快乐的大脚 时间: 2011-8-15 17:02

只能说很热或者过热，但是是不是成熟了现在还很难说！
毕竟SNPs应用于实践好像还为之过早，虽然现在国内外已经有一些公司大吹特吹，我觉得简直是骗钱，毕竟人类基因组太复杂了，做出的一些阳性SNPs大多是弱或者中度效果，如何把这些SNPs整合起来综合判断与疾病的发病危险的关联还为之过早~~~~~
一句话，前途是光明的，道路是曲折的，呵呵

作者: 快乐的大脚 时间: 2011-8-15 17:03

我认为可以考虑整体一起讨论snp
cnv、转录后修饰，表达通路调控
对疾病整体的影响。不要局限于
基因组单点结构。
不过我们现在研究重点是中国人自己
的snp等数据库构建，尤其是疾病相关位点
区域和途径的数据库构建，这个我们只能借鉴
国外的技术路线而不能照搬国外数据

作者: 快乐的大脚 时间: 2011-8-15 17:04

cSNP的非同义突变怎么说法不一呢？有的说占50%，有的说远低于同义突变

作者: 快乐的大脚 时间: 2011-8-15 17:04

好资源，非常感激大家的贡献！
刚刚开始要做大规模SNP芯片筛查，但是本人刚刚入门，望各位同行不吝指教，谢谢！！！

作者: 快乐的大脚 时间: 2011-8-15 17:05

给一些功能学验证的资料吧，谢谢

作者: 快乐的大脚 时间: 2011-8-15 17:06

一个阳性结果到底重复性如何?样本量如何?有多少位点?这都是实验设计和技术上的问题~
很明确的是,国内和国外在做SNPs已经在思路和概念上完全不同,如果仅仅是"简单啊，不过就是做做PCR嘛然后做个测序或者酶切就是了啊！"这种想法,我只有说那太肤浅~
建议你多看看最新的nature genetic上面的一些专述,非常ok ~~~~~~
大家共同努力~~~

作者: 快乐的大脚 时间: 2011-8-15 17:08

是的，我觉得大家对SNP的认识太肤浅了，现在看了更多的文献，发现很多是值得我们去探讨和研究的，而且根本不是件很容易的事情也不仅仅是做做PCR或者基因分型那么简单的事情，分子遗传机制不是一两句话说的清楚的，所以希望大家多努力，多交流，一定不能让这个帖子沉下去。

作者: 快乐的大脚 时间: 2011-8-15 17:08

如果只作SNPs的关联研究，现在来说肯定存在很多的问题，如:是不是真的有关联？在其他类群中是不是也有类似的关联？有没有实际应用的价值？......很值得我们去进一步的研究，真正能把SNPs的机理和作用搞清楚。

作者: 快乐的大脚 时间: 2011-8-15 17:09

问一个很菜的问题,是否能对某一个具体的基因,进行分析呢,

作者: 快乐的大脚 时间: 2011-8-15 17:10

这是一个非常好的讨论，不过覆盖面有点大。

实际上作association study有许多要求，尤其是样本数量上的。做这种研究主要是在其他传统遗传学研究方法无法进行，而孪生子或其他流行病学研究结果显示有遗传关联因素的时候进行的。目前许多此类文章的样本就几百，一看方法就是漏洞百出，结果和讨论部分也是勉为其难地得出一个P<0.05，需要对这类文章引起警惕。

SNP的进展在最近，可能最引人注目的时候随着人类基因组计划的完成，几个大公司参与其中部分合作或者抢先取得了部分专利，因而出现了Affymetrix的500k到现在的6.0，illumina也推出了更具竞争力的Chip。应该说把SNP应用到这个技术上是近年的巨大进步之一，主要表现为网罗性的全基因scan。

洗耳倾听大家的讨论。

作者: 快乐的大脚 时间: 2011-8-15 17:10

全基因组关联研究确实是最近的热点，高分的杂志发了很多这类文章。目前国际上对复杂疾病（complex disease）的态度现在是做关联了。但是太费钱了。也确实是一个框架性的工作。Nature. 2007 Jun 7;447(7145):661-78.
Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls.Wellcome Trust Case Control Consortium.

作者: 快乐的大脚 时间: 2011-8-15 17:15

请教大侠一个问题，SNP在同一个体的不同时期也可以有吗？

作者: 快乐的大脚 时间: 2011-8-15 17:15

这个讨论实在不错，我一路看来，受益匪浅。我一直在做SNPs的试验，现在要处理数据了，分析完病例对照的基因型分布后想再进行haplotype分析，却苦于相关知识所知太少，希望各位高手上传一些haplotype的知识，先谢谢了！

作者: 快乐的大脚 时间: 2011-8-15 17:15

值得探讨--但在法庭科学的价值现在认为应用价值不是太大,可能有点过热!

作者: 快乐的大脚 时间: 2011-8-15 17:16

你好我也正准备做snp，准备做几个位点，然后做单体型分析，但是看了一些文献上写,要做连锁不平衡分析，然后使用什么phase program 构建单体型，说实在的不会用，我最近下载了个haploview，但是还不知道如何构建单体型，建议你也先去下载个，估计到时候用的上，我现在不知道到哪里下载那个什么的phase program.

作者: 快乐的大脚 时间: 2011-8-15 17:17

我本来没打算进行haplotype分析，一个在国外的老师看了，他主张分析分析，数据他已经分析过了，要我下结论，我却对haplotype了解很少，你那里有haplotype的相关文献吗？

作者: 快乐的大脚 时间: 2011-8-15 17:18

我这里有部分，其实你可以先到人类单体型计划的官方网站去了解下单体型计划到底是什么，网址是cuturl('www.hapmap.org')，有中文版的，然后选择project information 可以有个初步的了解，然后到pubmed 上去找相关的文献吧，我现在也不知道如何构建单体型，似乎要做位点之间的连锁不平衡分析，计算ＬＤ值之类的，现在正在做实验，还没写文章，也没有好好研究到底怎么做，只是构思了下，不过实验已经让我很郁闷了，有机会多指点指点我啊！

作者: 快乐的大脚 时间: 2011-8-15 17:19

我也是做多态性关联的，可是我不知道从哪儿下手，真的很郁闷！不过看了你们的帖子，心里好受多了

作者: 快乐的大脚 时间: 2011-8-15 17:19

SNP研究是随着human genome project的发展而发展，随着International HapMap Phase I/II的完成而不断完善。目前SNP的研究已经逐渐促成了一个新的产业，预计几年内会形成10亿美元的产值。

我也准备陆续给大家介绍一些好的文献，以期通过大家的讨论，提高对SNP研究的兴趣和认识。

作者: 快乐的大脚 时间: 2011-8-15 17:19

向大家推荐一个检测大样本量的SNP位点的新技术平台--sequenom。利用质谱技术，通过“称量”寡核苷酸的分子量来分析SNP。适用于对样本数很大，但筛查位点相对较少（几百个）的研究。大家可以上网搜一下这个技术。

作者: 快乐的大脚 时间: 2011-8-15 17:20

sequenom有几个缺点
1、成本偏高
2、它只能做hapmap数据中80%的数据
3、他的成功率也大约是80%

还有他要是坏了修起来很麻烦

作者: 快乐的大脚 时间: 2011-8-15 17:20

向大家推荐一个检测大样本量的SNP位点的新技术平台--sequenom。利用质谱技术，通过“称量”寡核苷酸的分子量来分析SNP。适用于对样本数很大，但筛查位点相对较少（几百个）的研究。大家可以上网搜一下这个技术。

作者: 快乐的大脚 时间: 2011-8-15 17:20

呵呵,我有个恒温检测SNPs的方法,可惜是公司商业秘密,个人觉得是检测技术里最好的,是相当的simple.

作者: 快乐的大脚 时间: 2011-8-15 17:21

这个帖子实在说snp的发展和疾病的关系
商业活动就算了吧

作者: 快乐的大脚 时间: 2011-8-15 17:21

在HapMap之后，与SNP有关的另外一个需要密切关注的发展方向是Cancer Genome project: 美国NIH的Cancer Genome Atlas Project。

cuturl('http://cancergenome.nih.gov/index.asp')

The Cancer Genome Atlas (TCGA) is a comprehensive and coordinated effort to accelerate our understanding of the molecular basis of cancer through the application of genome analysis technologies, including large-scale genome sequencing.

通过对癌症病人的genome sequencing，希望发现相关的致病变异，其中主要包括SNP。Cancer Genome Atlas 的前期工作主要会集中对三种癌症的测序，包括 brain (glioblastoma), lung (squamous cell), and ovarian cancer.

相似在Breast Cancer和Colorectal Cancer的Genome Sequencing研究已经在去年的这篇Science文章上发表了, 不过不是Cancer Genome Atlas做的。

作者: 快乐的大脚 时间: 2011-8-15 17:22

The figures below show the basic principles of the process when using Wild Type (WT) Primers.
The FIP and BIP are designed to contain a SNP nucleotide (in this case of Wild Type allele) at 5' end, respectively.
Using the WT primers, when the target gene is the WT allele, DNA synthesis from dumbbell-like starting structure proceeds and the LAMP amplification cycling continues. In contrast, when the target gene is the Mutant (MUT) allele, no DNA synthesis proceeds from dumbbell-like structure and the LAMP amplification cycling dose not occur. Even if DNA synthesis proceeds in one step due to miscopy, the amplification reaction is either halted in other steps or is delayed since repetition of this reaction continually checks at each cycling step of the DNA replication.

顺便说一下，我可不是这个公司的~~~只是对这个感兴趣~~

图片附件: 63424848.gif (2011-8-15 17:22, 18.15 KB) / 该附件被下载次数 7
http://bbs.antpedia.com/attachment.php?aid=8286

作者: 快乐的大脚 时间: 2011-8-15 17:23

目前在帮师兄做SNP,但很多东西不清楚,看了你们的东西,受益匪浅.谢谢

作者: 快乐的大脚 时间: 2011-8-15 17:23

呵呵，snp的发展还不是要靠最好的检测技术来推动，最好的检测技术应该是simple,use-friendly，robust ，equipment-free，如果一项技术动不动就要昂贵的仪器，专业的技术人员操作，那关于它的研究也应该是很受限制的，科学的真谛最于用简单的方法去处理复杂的问题，反之则是偏离的。

作者: 快乐的大脚 时间: 2011-8-15 17:24

现在的研究方法最主要是可靠
我现在只认为经过大样本量验证的
技术才可以应用，本身snp的关联解析
就有很多假阳性，如果在参杂机器的因素
根本就不能有效的验证，最近的有人已经提出
要对关联分析得出的结果作详细验证。
不要因为节约几个费用而是整个项目失败

作者: 快乐的大脚 时间: 2011-8-15 17:25

我来介绍一下DHPLC吧：
用以检测T2DM的众多候选基因突变所需要的技术，既要求能够自动化、高通量进行，也要求除PCR之外，勿需进行PCR引物修饰、购买特殊试剂、检测标记信号或作其它的样品处理；而目前已有的许多DNA突变分析技术诸如单链构象多态性 (single-strand conformation polymorphism，SSCP) 、变性梯度凝胶电泳法(denaturing gradient gel electrophoresis, DGGE)等均不能满足此要求。近年来建立并迅速发展的DHPLC是一种新型基因突变筛查技术，符合上述的要求，可用于单核苷酸多态性(single nucleotide polymorphism, SNP)，小片段缺失或插入等多种基因突变的检测。DHPLC具有高通量检测、自动化程度高、灵敏度和特异性较高、检测DNA片段和长度变动范围广、相对价廉等优点。与传统的SSCP 、DGGE等方法相比，DHPLC有较多的优点。SSCP的结果受血样质量、提取方法等因素的影响，并且需要跑胶、电泳；DGGE则需要标记引物，存在放射性污染，这两种方法都比较费时费力。而DHPLC则高度自动化，可以自动取样，检测每个样品只需要8分钟左右[3]。DHPLC与其他检测DNA突变方法的最大不同在于，它能够纯化DNA片断。当然，只能检测杂合突变是DHPLC的不足之处，但是这可以利用混合的方法（即将纯合突变样品和野生型样品混合）来解决。
其原理是：在部分变性的条件下，通过杂合与纯合二倍体在柱中保留时间的差异,发现DNA突变。异源双链DNA与同源双链DNA的解链特性不同，在部分变性条件下，异源双链因有错配区的存在而更易变性，在色谱柱中的保留时间短于同源双链，故先被洗脱下来，在色谱图中表现为双峰或多峰的洗脱曲线。
用DHPLC筛查突变的时候，要注意以下几个方面：⑴PCR产物要有高度特异性，以免用DHPLC检测时产生假阳性结果。可以使用pfu酶来代替Taq酶，以消除主峰前面那个由于使用Taq酶而出现的杂峰，避免出现假阳性。⑵退火温度的估算很重要。利用Navigator software计算出的退火温度通常能够筛查到大部分的突变，如果与δ螺旋等计算方法联合应用，来估算退火温度，将更加准确。⑶当筛查大样本量的时候，要注意经常用已知突变的样本来做对照，检测条件是否合适，以保证良好的重复性。只要保证以上几个方面，用DHPLC就基本可以筛查到100%的SNP以及插入/缺失片断突变。
以上是我论文的一部分，写出来跟大家分享。

作者: 快乐的大脚 时间: 2011-8-15 17:25

楼上你说的那个做snp的准确性不是很好
做大规模筛查还可以，还有就是每次必须调整好
一次就做了，重复性也不好

作者: 快乐的大脚 时间: 2011-8-15 17:26

支持版主的观点，仅仅关联研究是不够的，功能研究很重要，以前SNP研究着重CDS区的非同义SNP以及promotor区的SNPs，往往忽略同义SNP，下面Science一文阐述非同义SNP尽管不改变蛋白的一级结构，但它们改变了mRNA的空间构型，导致转录后mRNA的稳定性及翻译效率的差异，使我们意识到有时非同义较之同义SNP对功能的影响更为重要。cuturl('http://www.sciencemag.org/cgi/reprint/314/5807/1930.pdf')

作者: 快乐的大脚 时间: 2011-8-16 10:18

其实最近国内做的做好的SNP位点检测还是用HRM的方法好，简单经济实惠呀，灵敏度高

作者: 快乐的大脚 时间: 2011-8-16 10:19

国内HRM技术还相当不成熟。。但不否定此技术的技术优势，跟比较普及的SNP检测技术如：MALDI-TOF-MS、taqman相比，HRM从成本上有着绝对的优势。高通量，高灵敏，使得HRM在其他方面上也毫不逊色。总体说来，HRM应用于SNP检测是一个历史突破，新的技术必须要靠我们去进一步去完善，让我们中国的生物技术立于世界不败之地。

作者: 快乐的大脚 时间: 2011-8-16 10:19

一口气化了大价钱下了好多关于SNPs的资料，感觉知识的海洋啊，真强大，呵呵，不过回去要慢慢学习。

作者: 快乐的大脚 时间: 2011-8-16 10:20

现在我也开始做有关SNP的实验，样本量不大，case-control 一共不到500例，就这些也收集了2-3年了，刚接触，按照师兄们的一间。使用Taqman 探针做，总选择2个位点，所以成本4000元，现在准备做，如有结果，会及时与大家讨论

作者: 快乐的大脚 时间: 2011-8-16 10:20

目前的GWAS，烧钱！

作者: 快乐的大脚 时间: 2011-8-16 10:25

介绍一个数据库：SNP500Cancer,网址为：cuturl('http://snp500cancer.nci.nih.gov/')

作者: 快乐的大脚 时间: 2011-8-16 10:26

一直关注这个帖子，确实很经典的一个帖子，对于我们学生来说，毕业课题做多态性的人应该很多，也许大家对这个都会有所了解，我想知道的是目前对SNP的检测技术到底有哪些，优劣在哪里，怎么去选择最合适的检测技术，是不是有一种最好的技术存在的可能，我们怎么去选择最好的多态位点，又怎么去做一个全新的多态位点，请各位战友帮忙传相关知识上来，期待中！

作者: 快乐的大脚 时间: 2011-8-16 10:26

snp现有检测技术有主要的3大类别
1、测序主要发现新的snp位点和比较集中的snp位点如hla区域
但成本就高，工作量大，不适合大样本做疾病关联分析
2、taqman探针，使结果比较可靠的，国外文章也大量应用，不过
对于国内成本偏高，同类还有snpshot技术，abi和贝克曼都相应试剂盒
成本和成功率都比taqman要低
3、snp芯片，国外大规模筛查疾病关联分析常用，illumina和affy都有
不同密度的成熟产品，单位点成本很低，但点较多，样本多时也会很高花费
但结果准确，适合复杂疾病,有实力的项目组一般大型机器点在384-群基因组
可以订制，但成本会高；illumina开发了一台小的芯片极其适合1-384,可以订制
成本在2-5元/人点，但还没有很成熟的流程，具体效果和成功率要进一步看

剩下的就是传统方法如酶切，pcr-sscp等，也有杂志接受，但一般需要测序验证
缺点工作量太大，结果不准确，不是所有位点都可以做，但成本很低
突变数据库
Human Gene Mutation Database (HGMD)
cuturl('http://www.uwcm.ac.uk/uwcm/mg/hgmd0.html')
The Genome Database (GD
cuturl('http://www.gdb.org')
SNP数据库
Database of Single Nuleotide Polymorphisms (dbSNP)
cuturl('http://www.ncbi.nlm.nih.gov/SNP/')
Human Genome Variation Database (HGVbase)
cuturl('http://hgvbase.cgb.ki.se/')
The Snp Consortium， LTD.（TSC）
cuturl('http://snp.cshl.org/')

cuturl('www.hapmap.org')

作者: 快乐的大脚 时间: 2011-8-16 10:27

我也是这个方面刚入门的新手.
现在做到一个小阶段了,想做一下简单的数据统计分析,可是论文中常常提到的Hardy-Weinberg平衡和odds ratio怎么用SPSS软件计算?

作者: 快乐的大脚 时间: 2011-8-16 10:28

好久都没有来看了，这个贴不能让他沉下去，要让大家知道其实很多人说的国际上不留行做的SNP其实是一个非常非常热的话题，只是限于国内SNP文章漫天飞的原因，大家都觉得没有什么新意。但是要做的工作似乎很多哦，看这方面的文章越多就觉得越有必要做下去。

作者: 快乐的大脚 时间: 2011-8-16 10:28

我的试验做完了，现在在试验数据统计了，现在有些问题想问问，不知道版主和楼主是否还在关注这个问题呢？1，做Hardy-Weinberg equilibrium到底如何做，如何分析？第二，我在试验数据统计的时候发现，有两个SNP位点，同一个基因上的SNP位点，相隔比较仅，在基因分型时，如果某个标本前一个位点的基因型是CT，另外一个位点的基因型似乎肯定就是TC型，如果前一个是TT型，另外一个似乎必定是CC型，依次类推，似乎我只需要知道前一个位点的基因型就能判断另外一个位点的基因型，几乎所有的标本都是这样的。这个说明了什么问题，是不是说明这两个位点完全连锁或者强连锁！我对连锁分析还是一知半解，希望楼主和版主指导。谢谢！我自己正在看这方面的文章，但是文献中一般只说做了连锁分析，到底怎么分析没有说出来！第三，如何做单体型分析！

作者: 快乐的大脚 时间: 2011-8-16 10:29

再次请教一个小问题：在分析中OR[95%CI]怎么描述？大于1时和小于1时（当然p值是小于0.05的情况）分别代表什么意义？谢谢！

作者: 快乐的大脚 时间: 2011-8-16 10:29

OR值代表的是优势比odds ratio, 大于1说明该研究因素是所研究疾病的危险因素，小于1是保护因素。这是流行病学研究中最常用的一个名词，你也可以查一下相关的流行病学教材，里面介绍的很详细。

作者: 快乐的大脚 时间: 2011-8-16 10:29

大家有没有关于 SNP与先心病方面的资料

作者: 快乐的大脚 时间: 2011-8-16 10:30

请教大家谁有做SNP的TaqMan的文章啊，
谢谢

作者: 快乐的大脚 时间: 2011-8-16 10:30

第二篇是发表在NATURE 上的一篇综述，主要内容是关于如何评价关联研究中SNPs的功能的，给出了把潜在功能性SNPs分为强功能性，中度功能性及无功能性三类SNPs的标准，从SNPs所在序列信息、进化保守性的有无、人群遗传学、实验室功能学证据、暴露评价（如基因型-环境交互作用研究）和流行病学证据等各个方面综合加一界定。

作者: 快乐的大脚 时间: 2011-8-16 10:31

版主你这篇文章对我来说真是场及时雨啊，让我对SNP研究有了新的认识，不然我就一直躲在死胡同里面了！久旱逢甘霖，谢谢！

作者: 快乐的大脚 时间: 2011-8-16 10:31

Transferability of tag SNPs in genetic association studies
in multiple populations
这是发在nature gentics 上一篇很有意思的letter
证实了HapMap
DNA samples can be used to select tags for genome-wide
association studies in many samples around the world.
SNP genotype 和tag SNP的方法里面也有介绍.

作者: 快乐的大脚 时间: 2011-8-16 10:31

有没有朋友能系统地介绍下taqman？

作者: 快乐的大脚 时间: 2011-8-16 10:32

给大家分享一篇上海交通大学在BBRC上刚刚发表的SNP文章，用的是连接酶检测反应（ligase detection reaction），BBRC我查了，06年的IF是2.855好像。

作者: 快乐的大脚 时间: 2011-8-16 10:33

PCR-LDR这个方法检测SNPs不太好，重复行不好，而且探针设计麻烦，反应条件摸索很麻烦，总体来说不是能大量推广的技术~~

作者: 快乐的大脚 时间: 2011-8-16 10:33

我看了很多关于多态性的文章，在国内这类的文章实在是太多了，但是样本量都不是很大，上次在园子里面看了一篇关于做多态性，样本量的计算的问题，但是看得不是很明白，这里有哪位可以介绍介绍下吗？此外，我还想想问一问，是不不是绝大大多数的SNP都可以用PCR-RFLP的方法来测定！

作者: 快乐的大脚 时间: 2011-8-16 10:33

推荐一下Hi-Res Melting™技术（HRM）检测SNP或未知突变（或SNP）初筛，没有用过，看过原理，比较感兴趣，类似qPCR仪上的溶解曲线分析，但灵敏度比在qPCR上要好的多，应该重复性也不错，通量也很大。

Idaho公司的产品说明：
cuturl('http://www.rapidcycler.com/LifeScience/HiResMelting.htm')

BioTechniques上的protocol
cuturl('http://www.biotechniques.com/default.asp?page=protocol&subsection=article_display&id=112358')

另外：Rotor Gene 6000 qPCR仪据说也可以做到HRM分析

作者: 快乐的大脚 时间: 2011-8-16 10:34

建议上传相关文献，LDR这种方法据我所知目前在国内有很多单位和科研机构在使用，具体的优缺点广大战友不尽熟悉~

作者: 快乐的大脚 时间: 2011-8-16 10:34

谢谢斑竹的关注,我说的都是我们这里做的实验结果,可能其他实验室做的更好一点,不过文献我到可以上传一些,(电脑坏了,过一段时间我会上传的)

作者: 快乐的大脚 时间: 2011-8-16 10:34

很好的帖子,学到不少,但是为什么大家在SNPs的分析方法中都没有提到引物序列特异性PCR(PCR-SSP)技术呢,现在采用这种方法的文章也很多啊!而且我个人认为该方法的性价还是很好的,大家不妨看看相关的资料!

另外我有一个问题想向各位请教:我的课题是用PCR-SSP的方法分析4个位点的基因多态性,本来我4个位点的反应条件和反应体系均很稳定且高效,并且已经很顺利的完成了120份DNA标本4个位点的多态性分析,但是自此后,我其中一个位点就跑不出来,我起初怀疑引物出了问题(刚新稀释了引物,前面的用完了),于是先后从新合成了3遍(2次invitrogen,1次生工),并且彻底更换了所有试剂,并同时采用阴性和阳性对照,但结果仍无改观.我也怀疑过是DNA质量问题,但是同一批DNA跑其他3个位点都没问题.我几乎想尽了所有的办法,也向所里所有老师请教过,但都没有肯定的解释.昨天,我把以前该位点跑的好的DNA和跑不出来的DNA各5份加上阴性对照共11份做了比较,电泳结果显示:以前跑的好的DNA仍跑的很好,跑的不好的DNA仍没有跑出来,阴性对照显示没有污染.从这个结果看来很可能是DNA质量问题,但是其他3个位点却没有问题!这是什么原因呢?不知哪位师兄师姐有好的建议，请多指教！万分感激！
我用的DNA提取试剂盒是Qiagen GENTRA Puregene blood core kit B , Lot NO :GS22215.出问题前用的盒子是GENETRA Puregene blood kit , Lot NO : D-5000.厂家称GS22215与D-5000的组成完全相同,前者是后者换包装后的产品(品牌兼并的原因).

作者: 快乐的大脚 时间: 2011-8-16 10:35

楼上战友提高的SSP的分型技术目前在国内外应用还是很普遍的，特别是对小到中量样本的基因分型，该技术不需要做E切，只需要跑2次PCR，成本比较低廉。在高通量的分型技术出现之前可以弥补RFLP方法没有E切位点的郁闷。但是该方法需要对引物质量和特异性要求比较高，并且要设置内参。

另楼上战友遇到的问题是典型的模板质量问题，有的引物设计的质量好，所以质量稍次的模板也可以扩增的很好，但是遇到引物设计不是很好的，这种问题出现的就很普遍~

作者: 快乐的大脚 时间: 2011-8-16 10:35

请教如何从hapmap数据库中挑选候选基因的单体型标签SNP（haplotype-tagging SNP, htSNP)? 另外谁有Haploview软件，能不能给我发一个或者告诉我在那里能下载到

作者: 快乐的大脚 时间: 2011-8-16 10:35

Hapmap的网址：
cuturl('http://www.hapmap.org/')

haploview可以在这里免费下载，需要装Java.
cuturl('http://www.broad.mit.edu/mpg/haploview/download.php')

haploview可以分析hapmap数据，并选择tagging SNP。看看haploview的userguide可以知道了。

作者: 快乐的大脚 时间: 2011-8-16 10:36

贴张图，希望能帮助大家理解SNP-Haplotype-tagSNP三者之间的关系

图片附件: 60031728_snap.jpg (2011-8-16 10:36, 43.2 KB) / 该附件被下载次数 7
http://bbs.antpedia.com/attachment.php?aid=8287

作者: 快乐的大脚 时间: 2011-8-16 10:36

现在一直在做SNPs看了些文章，实在是迷茫了，说好又说坏，多态性的文章在国内反而大家都不屑一顾了，但是在国外还是非常热的，现在别人一听我做snps，就说简单啊，不过就是做做PCR嘛然后做个测序或者酶切就是了啊！如果是他们说的那么简单为什么我做起来还那么痛苦呢，问题就是很多人认为不需要什么技术啊，其实我个人认为，对SNPs的研究是非常有必要的啊，这是国际研究的热点，也是难点啊只是在国内做的很简单，所以大家都说很简单，国外都是大量资金在投入，而国内呢，我们现在是5-6千也做出来个阳性结果，你说这中间会是什么情况呢！哎呀，感叹啊！进退两难啊！谁能告诉我们在研究snp上该何去何从呢？？

作者: 快乐的大脚 时间: 2011-8-16 10:37

一个阳性结果到底重复性如何?样本量如何?有多少位点?这都是实验设计和技术上的问题~
很明确的是,国内和国外在做SNPs已经在思路和概念上完全不同,如果仅仅是"简单啊，不过就是做做PCR嘛然后做个测序或者酶切就是了啊！"这种想法,我只有说那太肤浅~
建议你多看看最新的nature genetic上面的一些专述,非常ok ~~~~~~
大家共同努力~~~

作者: 快乐的大脚 时间: 2011-8-16 10:37

看到这样的帖子,心里有爱有痛,
我也做的是SNP,PCR结果跑的还好,可是酶切的结果就不乐观了,
至今没有一个突变,切之前后没有变化,老板的意思是要切出来,
哪怕就一个,也是好的,虽然和一个没有切出来下的结论是一样的.
但是就是没有...
后来发现国内的文献做的也是一个没有切出来,
但是国人发到国外的就切了出来,没有突变纯合子,但是有杂合子,
老板知道后,说俺的方法不正确,再好好修改!!!!
我到底该怎么办?///都想哭了

作者: 快乐的大脚 时间: 2011-8-16 10:38

非常感谢楼主设立了这个讨论，可以和大家一起分享和交流SNP研究中的经验和问题。

对于SNP 研究，我个人的感觉是：曾经非常的“热”过，而现在，似乎有些降温。

这种降温在国内的研究领域内主要表现为：SNP研究做得非常多，甚至有些滥了，就象前面有的战友说的，随便做点PCR就可以在国内的杂志发文章了，文章太多太滥，没有多大的价值。

对于国外SNP研究领域，我认为现在也进入了理性思考期。SNP的文章还有很多，但是研究的思路和风格已经和以往不同了。记得2002-2004年的时候，几乎每一期的cancer research上面都有好几篇纯粹做SNP研究的文章，那时候的SNP多半都是老美做的，一边样本不过100，200例，位点不过2-3个，甚至只有1个，方法学方面也有很多是基于PCR的方法，但是cancer research好像是来者不拒。我想那应该是SNP研究的兴起和加速期吧。当然，实际上的源头还要早得多。

而现在，要想在SCI杂志上面发表SNP的文章，尤其是影响因子大于5的杂志，就没有那么容易了。我认为，目前SNP研究的方向大致发生了以下一些变化：

首先，对于病例对照的分子流行病学研究，不仅要有非常大的样本量（通常几百例，最好大于1000例），而且一定要结合相关的环境风险因素（如吸烟）一起进行统计学分析。当然，LD，单体型分析也都是不可缺少的。对于样本量，我们是比较有优势的，人口基数大，有大量的病例资源。而老外对于这一点的解决方法是：开展多中心的联合研究，横跨欧洲和北美，比如，2006年有一篇非何杰金氏淋巴瘤的文章发在Lancet Oncol上面，就是一个典型例子。为了避免实验室之间的偏倚，设立了严格的质量控制标准和实验的重复次数，从而使这类型研究更具有说服力。

第二，对于候选SNP的遴选，有很多种考虑，总的趋势和出发点是能够涵盖的SNP越多越好。可以根据以往文献，在所研究疾病的多个候选基因上面选择多个SNP，比如选择DNA修复通路中几个基因的重要SNP，一次研究的SNP大概有十几个到几十个，这是比较早期的做法。我感觉，现在国外的趋势更倾向于，对于某一疾病的重要候选基因，对于其基因全长进行重新测序（这一过程称为SNP rediscovery 或者是SNP resequencing），然后选出有意义的位点再进行genotype，并构建haplotype。

第三，是SNP的研究方法。目前国外SNP研究中用得比较多的是ABI 7900和测序。其他有些超高通量的SNP检测仪器，老外买得起的也不多，所以看来主要还是这两种。现在国内用ABI 7900和测序的也很多啦，比如2006年年初复旦大学的关于DDB2的一篇文章就发在Carcinogenesis上面，用的就是这两种方法。

第四，关于SNP的功能验证。记得对我很震撼的一件事情就是：2005年2月北京协和在Cancer Research上面发了一篇关于基因多态性的文章，病例数为1000例。2006年3月，在Cancer Research上面发了一篇同样是该基因多态性的文章，不仅病例数量超过1000例，而且同时还做了功能验证！这件事对我的震撼是：一，说明未来SNP研究的方向，功能验证将是重要的一环；二，SNP研究正在快速缩水，去年能发Cancer Research的素材，今年恐怕能发了5分出头的就不错了，所以“与时俱进”非常重要！

总体来说，我相信SNP研究的前景是非常光明的，未来将越来越向全基因组的方向靠拢，与此伴随的是大样本，高通量和功能验证。希望从事SNP研究的各位XDJM对未来充满信心，应该看到，目前在nature genetics和cell这样的顶级杂志，也不乏SNP的文章。只是偶是做肿瘤的，所以提Cancer Research提得比较多。另外就是，可能偶比较功利，花太多心思研究SCI，先自我检讨一下，呵呵。不过，有的时候也确实是“人在江湖，身不由己”，希望各位XDJM谅解！

最后，用我最近看到一篇文章中的一句话作为结束吧“The contribution of these rare variants to NHL susceptibility will likely only be assessed fully when higher throughput sequencing methods allow comprehensive sequencing of the whole gene in hundreds, or even thousands of NHL cases and controls.”

注：不好意思，罗罗嗦嗦地写了这么多，中间有些信息是凭着记忆写的，如果与实际有出入，或者某些概念有错误，欢迎大家提出指正或讨论。

作者: 快乐的大脚 时间: 2011-8-16 10:39

才打算做这方面的工作，正无法下手，因此非常感谢各位的贴子。我先学习，等有经验后一定给大家分享。

作者: 快乐的大脚 时间: 2011-8-16 10:39

请问北京有哪家研究单位或者公司可以做Taqman探针方法的SNP分型吗？我询问过2家单位他们虽然有ABI 7900，但是却不是用做SNP分型的，请有这方面经验的高手指教！

作者: 快乐的大脚 时间: 2011-8-16 10:39

要是做Taqman探针一个样本的成本大概多少？是不是一个反应只能测一个SNP？这个帖子真的很好，好多要学的东西呀！

作者: 快乐的大脚 时间: 2011-8-16 10:40

大家好，我做的是利用SNP的方法给欧文氏菌属的一个菌种进行生理小种分化鉴定。请教一下大家，用SNP该怎么进行此实验的设计呢？国内外有没有利用此方法进行过的实验先例呢？呵呵，谢谢大家指教。

作者: 快乐的大脚 时间: 2011-8-16 10:40

新手，打算做一些关于泌尿系肿瘤SNP方面的研究，楼上各位的帖子已浏览，获益匪浅，在此致谢。

作者: 快乐的大脚 时间: 2011-8-16 10:41

好帖，要顶~~~~~~~~~~~·

其实现在做高通量SNP研究的技术方法也是很多的，Maldi-TOF（质谱）技术是一种，Taqman技术也可以，而测序和RFLP已经是很原始的检测方法了。大家在实验的时候可以多分析比较，根据自己的实验特点：包括样本量、研究的目标位点数、经费等，综合去考虑，而不要一条路走到低。

作者: 快乐的大脚 时间: 2011-8-16 10:41

有人用beckman的snpstream做snp吗？

作者: 快乐的大脚 时间: 2011-8-16 10:41

新发展起来的依赖于锁式探针的滚环扩增检测技术是检测SNP的一个非常好的方法，特异性不亚于TaqMan探针技术。本人有设计锁式探针的经验，也有这方面的资料，可惜的是太多了不好上传。

作者: 快乐的大脚 时间: 2011-8-16 10:42

请问各位，Taqman外包多少钱？那一家好？一个SNP位点探针合成多少钱？

作者: 快乐的大脚 时间: 2011-8-16 10:43

我是临床医生，对这些技术了解较少，我理解疾病的机制的研究是不是一般这个思路：

1.通过基因芯片技术初步赛选病人几个异常表达的基因（还有哪些实用办法？），然后采用定量pcr来确定一下。
2.采用CHIP的方法来对比正常人分析上面几个基因里面的SNPs的异常（比较实际的办法还有哪些？），目的就是来了解是哪个SNP导致了它所在基因的异常表达。

请高手指点，虚心学习。

作者: 快乐的大脚 时间: 2011-8-16 10:43

思路还是可以的，但是要注意，芯片还是比较贵的，如果经费不是特别多的话，要仔细考虑了。
可以考虑其他的方法进行初步筛选

作者: 快乐的大脚 时间: 2011-8-16 10:43

简单一点讲：初步筛选基因－－主要看文献，看别人做过没有，做过，你再做，没意义。上NCBI，查你要做的这个SNP位点是不是在中国人中出现差异的比较大，一般要5％，小了研究也没多大意义，除非样本量很大。

然后就是，做一个Case--Control，看结果，做一下统计，是否在你所感兴趣的疾病中有统计意义。

如果是筛选未知的SNP位点，做芯片是好的，但就是花钱多。如果有仪器和技术就是做sscp吧，省钱。

除了做CHIP外，还可以做EMSA。

作者: 快乐的大脚 时间: 2011-8-16 10:44

SNP的快速筛选方法:HRM高熔点分辨曲线分析方法。基于roche的Lightcycler 480机器。

作者: 快乐的大脚 时间: 2011-8-16 10:44

HRM（High Resolution Melt）技术使得SNP的检测上大大节约了成本、时间和劳力。HRM“高分辨率熔解”是近几年来在国内外兴起的最新的SNP工具。

这种检测方法不受突变碱基位点与类型的局限，无需序列特异性探针，在PCR结束后直接运行高分辨率熔解，即可完成对样品基因型的分析。相关工作已获国际高等级杂志，如Nature Genetics（13）、Nature Protocols（14）等认可。在突变筛查、基因型分析，特别是SNP相关研究中HRM技术得到广泛的应用。

整个实验过程简单：引物设计合成-PCR-基因分型。

高通量：1次可检测1-384个样本，实现高通量检测

作者: 快乐的大脚 时间: 2011-8-16 10:45

新手~~~老板刚刚让开始准备SNP的实验，结果查了半个月的文献还没有在帖子里一个晚上学习到的多，谢谢各位的分享啦~~~

作者: 快乐的大脚 时间: 2011-8-16 10:45

大家好,我是个临床医生,对基础研究很陌生,看完这个帖子增加了不少SNP的知识.我想问各位高手,我有个病人,可能得了无汗性外胚层发育不全?通过对其家族的了解,没有发现明显的遗传性,因此选择做了EDAR和EDARADD基因的检测,发现有5个已知SNP,其中3个是纯合突变,（一个错义，两个同义）,2个杂合突变（一个错义，一个同义）.我想知道,这些SNP是否是致病原因?如何证明?大概要花多少费用?谢谢

作者: 快乐的大脚 时间: 2011-8-16 10:45

能不能介绍一些关于SNP的遗传统计学方法?还有Haploview怎么使用?谢谢

作者: 快乐的大脚 时间: 2011-8-16 10:46

谢谢大家，我也是刚开始要做SNP，简直是一头雾水，我想问一个很低的问题，就是要做BRCA1基因启动子的SNP，用组织标本可以吗？标本的保存方法-80度冰箱可以吗？

作者: 快乐的大脚 时间: 2011-8-16 10:46

千万别让此贴沉下去啊，学习了一晚，看到那么多高手的精彩片段，获益匪浅。尽管SNP的道路困难重重，但相信前途一定会是光明的。

欢迎光临分析测试百科 (http://bbs.antpedia.com/)