PCR仪 » 讨论区 » 经验共享 » 国内外SNPs研究的进展及展望 [转自 丁香园论坛]

采购询价

点击提交代表您同意 《用户服务协议》 《隐私政策》

 
需要登录并加入本群才可以回复和发新贴

标题:国内外SNPs研究的进展及展望 [转自 丁香园论坛]

快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
1
 

国内外SNPs研究的进展及展望 [转自 丁香园论坛]

国内外SNPs研究的进展及展望 [转自 丁香园论坛]


当前,SNPs研究在国际上有很大的进展,NATURE、Science、New England 、PNAS等顶尖杂志在近几年发表了大量的论文,国内各种医学权威期刊几乎每期都刊登关于SNPs的论文。当然,国内与国外相比还是有很大差距的,这体现在国内的小样本、研究内容不深入(仅限于关联研究)、基因分型技术手段落后等等方面。众所周知,研究生是科研的主力军,大多数论文工作都是由我们研究生完成,因此,本版块特开辟此专帖,大家集中讨论关于SNPs研究的一些最新进展,希望大家积极参与,互相促进,在此热贴下跟帖者会给予优先奖励。
此次讨论共分5个方面,大家可以选择一个侧面或者多个侧面阐述之,主要包括:

1. SNPs的基础知识介绍(SNP basics, definition)
2. SNPs的分型方法(SNP genotyping methods)
3. 如何选择研究的SNPs(Selection of targeted SNPs)
4. 如何采用分子流行学的方法对SNPs进行研究 (Association studies using molecular epidemiology)
5. SNPs的功能学验证(Identification of Functional SNPs)

请大家多多交流发言,这样才能更好的相互促进!!



首先抛砖,引自上月本人写的一篇中文综述,即将在中华劳卫上见刊的,提前以飨各位
SNPs是指DNA序列上发生的单个核苷酸碱基之间的变异,在人群中这种变异的发生频率至少大于1%, 它是基因组中存在的一种数量非常丰富的变异形式,占人类基因组中遗传多态性的90%以上。针对不同人种基因组的测序结果表明,在人类群体中存在大约1000万个SNP位点,在公共数据库中至少有500多万个SNPs已被报道,SNPs在基因组的分布密度达到每300-500个碱基就存在一个SNP[1-4]。
1. SNPs检测技术的进展
随着分子生物学技术的飞跃发展, SNPs基因分型技术和方法不断涌现。虽然经典的一些检测SNPs的技术,如限制性片段长度多态性(restriction fragment length polymorphism, RFLP)和单链构象多态性(single-strand conformation polymorphism, SSCP)等技术仍在实践中广泛使用,但一些高灵敏度、高通量的基因分型方法日益受到重视,这些检测技术包括:TaqMan探针法、SNPlex基因分型法、连接酶检测反应法(ligase detection reaction, LDR)、焦磷酸测序法、DNA芯片/阵列分析法、微球法(Illumina),以及质谱分析和温控高效液相色谱法[5-7],可以满足大样本及多SNPs位点的基因分型要求。
2. 人类基因组单体型图
虽然人类基因组SNPs数量众多,但是染色体上相邻SNPs的等位位点倾向于以一个整体遗传给后代,这些位于染色体上某一区域的一组相关联的SNP等位位点被称作单体型(haplotype)。大多数染色体区域只有少数几个常见的单体型(每个具有至少5%的频率),它们代表了一个群体中的大部分多态性。一个染色体区域可以有很多SNP位点,但是少数几个标签SNPs(TagSNPs)就能够提供该区域内大多数的遗传多态模式。人类基因组单体型计划通过对约100万个SNPs进行基因分型,拟构建人类DNA序列中多态位点的常见模式[8]。人类基因组单体型图谱的逐渐绘制完成,提供了详尽的人类DNA序列的变异信息,对人类个体遗传背景的研究提供了强大的机遇和挑战[9]。
3. 生物信息学的发展
在功能基因组时代,不断产生的海量信息极大的促进了生物信息学这一新兴学科的发展。各大生物信息数据库存在的基因组全序列信息为SNPs的研究提供了极大的便利:例如通过再测序手段对SNPs的存在及频率信息进行确定,对不同人群进行SNPs的基因分型都需借助这些序列信息才能得以进行;同时,针对SNPs进行连锁分析、单体型构建以及标签SNPs寻找的生物信息软件也不断推出;而且,功能基因组学的发展甚至开始尝试对SNPs进行功能学预测,比如预测启动子SNPs位点与转录因子结合的改变,编码区SNPs对蛋白质的空间结构,生物功能的影响等,这对我们在浩繁的人类SNPs中选择潜在功能性的SNPs位点进行研究具有极大的帮助。
4. 从SNPs的关联研究到功能学探讨
随着SNPs检测技术的进展,SNPs在人群中的检测日益得到广泛应用,特别是对于当前多基因复杂疾病如肿瘤、冠心病的遗传易感性的探讨,传统的以家系为基础的连锁分析在检测能力上已经有了明显的局限性,而病例-对照等易于开展的关联性研究方法有显著的优势。因此,近几年探讨SNPs作为复杂性疾病的遗传标记的关联性研究大量涌现。但是即使对于同一SNP位点与相同疾病的关联性研究,不同研究中心的结果往往也存在很大差异甚至完全相反[10];而且,与疾病具有显著关联的SNPs到底是发挥功能性作用,或者仅仅是与功能性SNPs相连锁的遗传标记失甚至二者只是某种联系上的假象,这都需要进行功能学研究来加以证实。预计引起细胞功能学改变的SNPs在人类所有SNPs中只占极小一部分(约五万到二十五万个SNPs),大多仅仅在疾病发生过程中介导低度或中度的效果,主要包括分布在基因启动子区域可能发挥调节转录效应的SNPs(regular SNPs, rSNPs)和蛋白质编码区域引起编码氨基酸改变的SNPs(非同义SNPs或错义SNPs)[11, 12]。当前分子生物学技术的进展推动了SNPs功能学研究的深入[13-17],如比较成熟的对于启动子区域SNPs功能学研究技术包括:①报告基因转染技术,这一技术主要用于研究启动子SNPs对于mRNA转录效率的影响, 通过观察转录结局来判断SNPs是否具有功能。②凝胶迁移滞后实验(electrophoretic mobility shift assays, EMSA),该技术通过在体外合成含SNPs位点的寡核苷酸与转录因子特异性结合,观察二者结合的强度和效率,但是该技术由于只是人工合成较短长度的寡核苷酸,没有考虑SNPs位点周围遗传背景环境的影响。③染色质免疫沉淀分析(chromatin immunoprecipitation assay, ChiP),该技术通过超声将染色体碎片化,再将碎片化的核酸片段与转录因子结合, 然后通过PCR技术扩增观察判断二者结合的效率和强度。当然,对于关联研究的结果的评价和验证需要综合SNPs所在序列信息、进化保守性的有无、人群遗传学、实验室功能学证据、暴露评价(如基因型-环境交互作用研究)和流行病学证据,如Rebbeck等根据上述综合证据把SNPs是否具有功能效应分为强支持功能显著性、中度支持功能显著性及无功能显著性三类[16, 18]。

  


[ 本帖最后由 快乐的大脚 于 2011-8-15 16:57 编辑 ]
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
2
 
给大家点资料参考!

(single nucleotide polymorphism , SNP,发音为“snips”), 主要是指在基因组水平上由单个核苷酸的变异所引起的 DNA 序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的 90% 以上。 SNP 在人类基因组中广泛存在,平均每 500 ~ 1000 个碱基对中就有 1 个,估计其总数可达 300 万个甚至更多。

SNP 所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换 (transition) 或颠换 (transversion) 所引起,也可由碱基的插入或缺失所致。但通常所说的 SNP 并不包括后两种情况。

理论上讲, SNP 既可能是二等位多态性,也可能是 3 个或 4 个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的 SNP 都是二等位多态性的。这种变异可能是转换 (C T ,在其互补链上则为 G A) ,也可能是颠换 (C A , G T , C G , A T) 。转换的发生率总是明显高于其它几种变异,具有转换型变异的 SNP 约占 2/3 ,其它几种变异的发生几率相似。 Wang 等的研究也证明了这一点。转换的几率之所以高,可能是因为 CpG 二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。

在基因组 DNA 中,任何碱基均有可能发生变异,因此 SNP 既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的 SNP(coding SNP,cSNP) 比较少,因为在外显子内,其变异率仅及周围序列的 1/5 。但它在遗传性疾病研究中却具有重要意义,因此 cSNP 的研究更受关注。

从对生物的遗传性状的影响上来看, cSNP 又可分为 2 种:一种是同义 cSNP(synonymous cSNP), 即 SNP 所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义 cSNP(non-synonymous cSNP), 指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。 cSNP 中约有一半为非同义 cSNP 。

先形成的 SNP 在人群中常有更高的频率,后形成的 SNP 所占的比率较低。各地各民族人群中特定 SNP 并非一定都存在,其所占比率也不尽相同,但大约有 85% 应是共通的。

SNP 自身的特性决定了它更适合于对复杂性状与疾病的遗传解剖以及基于群体的基因识别等方面的研究:

SNP 数量多,分布广泛。据估计,人类基因组中每 1000 个核苷酸就有一个 SNP ,人类 30 亿碱基中共有 300 万以上的 SNPs 。 SNP 遍布于整个人类基因组中,根据 SNP 在基因中的位置,可分为基因编码区 SNPs ( Coding-region SNPs , cSNPs )、基因周边 SNPs ( Perigenic SNPs , pSNPs )以及基因间 SNPs ( Intergenic SNPs , iSNPs )等三类。

SNP 适于快速、规模化筛查。组成 DNA 的碱基虽然有 4 种,但 SNP 一般只有两种碱基组成,所以它是一种二态的标记,即二等位基因( biallelic )。 由于 SNP 的二态性,非此即彼,在基因组筛选中 SNPs 往往只需 +/- 的分析而不用分析片段的长度,这就利于发展自动化技术筛选或检测 SNPs 。

SNP 等位基因频率的容易估计。采用混和样本估算等位基因的频率是种高效快速的策略。该策略的原理是:首先选择参考样本制作标准曲线,然后将待测的混和样本与标准曲线进行比较,根据所得信号的比例确定混和样本中各种等位基因的频率。 易于基因分型。 SNPs 的二态性,也有利于对其进行基因分型。对 SNP 进行基因分型包括三方面的内容: (1) 鉴别基因型所采用的化学反应,常用的技术手段包括: DNA 分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术; (2) 完成这些化学反应所采用的模式,包括液相反应、固相支持物上进行的反应以及二者皆有的反应。 (3) 化学反应结束后,需要应用生物技术系统检测反应结果。

以下一个个链接供参考:

cuturl('http://www.5ibio.com/html/RNA/transcription/20070318/11100.html') (讲怎么样设计去做SNP,个人觉得不错)
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
3
 
SNPs的基础知识介绍和文献!

SNP 的概念:

SNP 是指基因组水平上由单个核苷酸的变异所引起的DNA 序列多态性,在群体中的发生频率不小于1 %。包括单个碱基的转换、颠换、插入和缺失等。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤( G2A) 、嘧啶与嘧啶( T2C) 间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T) 之间的替换。依据排列组合原理,SNP 一共可以有6种替换情况,即A/ G、A/ T、A/ C、C/ G、C/ T 和G/ T ,但事实上,转换的发生频率占多数,而且是C2T 转换为主,其原因是Cp G的C 是甲基化的,容易自发脱氨基形成胸腺嘧啶T , Cp G 也因此变为突变热点。
SNP 在动物基因组中分布广泛,每一个核苷酸发生突变的概率大约为10 - 9 。由于选择压力,SNP在单个基因、整个基因组中以及种群间的分布是不均匀的。SNP 在非编码区中要多于编码区,而且在编码区也是非同义突变(有氨基酸序列的改变) 的频率比其他方式突变的频率低得多[4 ] 。而基因间,同一种基因中的编码SNP (coding SNP ,cSNP) 的数目也不相同,可从0~29 个不等。多项研究同时发现不同种族间SNPs 的数目也是不同的,非洲人群及非裔种族中SNPs 数量最多,而其他种群的SNPs 要少得多,因此通过比较亚群间等位基因的频率将有助于阐明种族的结构和进化。
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
4
 
SNP 的检测方法

人们对SNP 的研究方法进行了许多探索和改进。SNP 分析技术按其研究对象主要分为两大类,即: ①对未知SNP 进行分析,即找寻未知的SNP 或确定某一未知SNP 与某遗传病的关系。检测未知SNP 有许多种方法可以使用,如温度梯度凝胶电泳( TGGE) 、变性梯度凝胶电泳(DGGE) 、单链构象多态性(SSCP) 、变性的高效液相色谱检测(DHPLC) 、限制性片段长度多态性(RFL P) 、随机扩增多态性DNA(RAPD) 等,但这些方法只能发现含有SNP 的DNA 链,不能确知突变的位置和碱基类别,要想做到这一点,必须对那些含有SNP 的DNA 链进行测序。②对已知SNP 进行分析,即对不同群体SNP遗传多样性检测或在临床上对已知致病基因的遗传病进行基因诊断。筛查已知SNP 的方法有等位基因特异寡核苷酸片段分析(ASO) 、突变错配扩增检验(MAMA) 、基因芯片技术(gene chips) 等。由于人类基因工程的带动,许多物种都已开始了基因组的项目,并建立了大量数据库,比较这些来自不同实验室不同个体的序列, 就可以检测到
SNP。目前,可供利用的公开SNP 网上资源主要包括: ①由美国国立卫生研究院( National Institutes of Health ,NIH) 提供的主要是与癌症和肿瘤相关的
候选SNP 数据库: http :/ / cgap. nci. nih. gov/ GAI ;②由NIH 开辟的适于生物医学研究的dbSNP 多态性数据库: http :/ / www. ncbi. nlm. nih. gov/ SNP ; ③德国的HGBAS 网站提供的人类SNP 数据库:http :/ / hgbas. Cgr. ki. sei 等。另外, 日本建立了J STSNP 数据库:http : / / snp. Ims. utolkyo. ac. jp ;我国也于2001 年底启动了“863”计划,进行中华民族基因组SNP 系统目录的构建与研究 。
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
5
 
SNP 研究中存在的问题

SN P s 研究现在正处于发展之中, 虽然它有很好的前景, 但目前仍存在不少问题.
1.复杂疾病相关分析中的问题
在Skok lo ster 举行的国际SN P 及复杂基因分
析会议上透露出许多问题[ 2 ] , 利用SN P 寻找致病基因的工作并不象最初想象的那样简单。研究者除需要大量的SN P s, 有时需要弄清被研究人群的历史,如他们的迁移模式等, 在对心脏病危险因素L PL 基因的研究中, 由于减数分裂中的基因重组, 使SN P的关联分析很困难; Ro salind Harding 用SN P s 研究镰刀细胞贫血的B球蛋白基因时也遇到了困难,她认为研究者除依靠SN P 外,还需知道疾病的模式及被研究人群的历史。
2.技术问题
目前虽然有大量检测SN P 的方法, 但大都价格昂贵, 速度较慢, 这限制了其在法庭科学中的应用,所以迫切需要有低成本, 高生产率的新方法涌现。
3.SNP 命名问题
目前没有一个统一标准的命名方法, 这对于Y2SN P 来说尤为紧迫, 由于不同SN P 由不同实验室测定, 现在至少存在6 种不同的命名系统。
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
6
 
基于SNPs 研究的单倍型图谱计划

 寻找标记SNPs 的国际遗传变异图谱计划,即国际单倍型图谱计划(Haplotype Map Project)已于2002年10月正式启动,2003 年中国承担了“国际单倍型图谱计划”10% 的任务,这表明我国基因科学研究能力的提高和在国际生命科学领域学术地位的提升。该计划的启动将为人类致病基因的寻找提供一条捷径。在DNA 上位置比较接近的很多SNPs,会组成单倍型块并作为一个整体遗传。通过极少数的几个标记SNPs,可以识别出不同的单倍型块。单倍型图谱(HapMap)被认为是DNA 的基本结构单位,大约由5 000~20 000 对碱基组成。不同种族、不同个体之间的基因组序列大约99.9% 都具有一致性,正是0.1%的碱基排列顺序的差异决定了人类的遗传多态性,即人与人之间的个体差异。HapMap 计划就是研究这0.1% 差异的排列顺序。HapMap 计划的目标在于,确定人类基因组中普通模式的D N A 序列变异,通过测定序列变异特
征、变异频率、它们之间的关联,绘出人类基因组的单倍型块,以及不同单倍型块的标记SNPs[6]。单倍型块数据库(cuturl('http://www.hapmap.org'))主要为基因
型数据,可供研究者使用、下载、分析数据[ 7 ] 。在I 期计划中,从世界上4 个地区的人群中采集269份DNA 样本,现已从中顺利测定110 多万条SNPs
的基因型信息,11 500 个错义cSNPs 被成功分型[8]。由此获得的HapMap,也将成为利用人类基因组图谱寻找与疾病有关的遗传变异的重要参考。通过确
定单体型,使单体型图成为用于进行关联研究的一个工具。在关联研究中,研究人员将患者的单体型与健康人(对照)的单体型相比较。破译人类基因组的单倍型图,将能大规模比较不同个体的不同单倍型图来发现与疾病相关的基因变异,为人类疾病和遗传关联分析、致病基因和致病因子的确定,药效
和疾病风险的分析及人类起源进化、迁徙历史研究等提供完整的人类基因信息。这将有助于更好理解疾病发生的原因及其生理基础,从而将可能用于疾
病的早期诊断,甚至能在基因突变前预测癌症的风险性。SNPs 及HapMap 策略的提出引发整个遗传学界基因组研究的又一热潮,其研发和应用必将大大
加速人类遗传学和药物基因组学的研究。
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
7
 
SNP数据库:

国际上较重要的网站有:
美国的NCBI SNP数据库IDatabase of Single Nuleotide Polymorphisms (dbSNP)

欧洲SNP数据库Human Genome Variation Database (HGVbase)

mIT美国麻省理工 SNP数据库

International HapMap Project

其它的SNP站点还有:
华盛顿大学SNP数据库

CHLC

美国人类基因组研究所SNP数据库
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
8
 
介绍人类基因组中多态性最强的HLA区域的完整的单体型图谱的文章。
Am. J. Hum. Genet. 73:580–590, 2003.
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
9
 
确实的说,经费是非常重要的,如果从大样本的流行病学到细胞功能学的过程,这个问题一方面需要各个高校科研单位的共同合作,如样本的拼凑,paper的分享等,如已经开展几年的某973项目(ECPs致机体损伤和防御的研究),针对中国人群的特有SNPs做了大量的关联研究,在1-2年内发了多篇SCI的论文。另一方面,显然大多数科研单位都无法参与到这样的 大项目中去,这样导致的结果是各自为政大量的垃圾文章出现;同时,关于SNPs研究做了这么多年,出了那么多的阳性结果,而很多结果在不同的单位或者人群中是不一致甚至完全相反的,这导致了现在相关的meta分析方面的paper 也出现了很多---------总结别人的结果也是高于综述的创新了!!我个人认为当前小的科研单位一方面要走入合作中去,另一方面可以在思路上创新的,比如今后几年来该领域的大方向应该是大样本和功能研究,可是功能研究的方法和手段一直跟不上关联研究的步伐???有好的功能研究的技术和idea也同样会受到大家的重视!
顶部
快乐的大脚[使用道具]
三级
Rank: 3Rank: 3


UID 70429
精华 0
积分 211
帖子 161
信誉分 100
可用分 1501
专家分 0
阅读权限 255
注册 2011-8-10
状态 离线
10
 
只能说很热或者过热,但是是不是成熟了现在还很难说!
毕竟SNPs应用于实践好像还为之过早,虽然现在国内外已经有一些公司大吹特吹,我觉得简直是骗钱,毕竟人类基因组太复杂了,做出的一些阳性SNPs大多是弱或者中度效果,如何把这些SNPs整合起来综合判断与疾病的发病危险的关联还为之过早~~~~~
一句话,前途是光明的,道路是曲折的,呵呵
顶部