蛋白质与蛋白组学 » 讨论区 » 经验共享 » 【讨论帖】《Guide to Protein Purification, 2nd Edition》读书笔记

采购询价

点击提交代表您同意 《用户服务协议》 《隐私政策》

 
需要登录并加入本群才可以回复和发新贴

标题:【讨论帖】《Guide to Protein Purification, 2nd Edition》读书笔记

NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
11
 
1.2. Charge versus pH/titration curve, isoelectric point
Assuming a pKa for each ionizable group in a protein (the pKa is the pH at which that residue is half ionized), one can calculate the total charge as a function of pH of a given protein from its amino acid sequence. The pH at which the net charge is zero is defined as its isoelectric point or pI. This information is helpful in deciding which ion exchange chromatography resin to use. For example, if you assume that the protein is a monomer and not modified to change the charge, then an acidic protein (one that is negatively charged at pH 7) is likely to bind to a positively charged anion exchange resin such as MonoQ while a basic protein (one that is positively charged at pH 7) is likely to bind to a negatively charged cation exchange resin such as MonoS. There are exceptions to this generalization if the charge on the surface is not uniformly distributed. A protein could have a positive patch and a separate negative patch and be able to bind to both anion and cation exchange columns under the same conditions. To the first approximation, the greater the charge on a protein at the pH of the column buffer, the tighter it will bind and the higher the salt needed to elute it from the column resin. Of course, if the protein is part of a multiprotein complex, then you have no idea what its ion exchange column binding properties will be.

确定蛋白质中可解离基团的pKa后(pKa是指残基半解离时的pH),就可以根据氨基酸序列计算出给定蛋白质的总电荷与pH的关系。净电荷为零时的pH叫做等电点或pI。这些信息对如何选择离子交换介质很有用。例如,如果蛋白质为单体、没有修饰化引起的电荷改变,那么酸性蛋白,pH为7时带负电荷,很可能吸附于带正电荷的阴离子交换介质上,如Mono Q;而碱性蛋白,pH为7时带正电荷,很可能吸附于带负电荷的阳离子交换介质上,如Mono S。当然,如果蛋白质的表面电荷分布不均,也有一些例外的。当蛋白质的表面有一个正电荷区域,还有一个与此分开的负电荷区域时,那么在相同条件下,此蛋白既能够吸附阴离子,也能够吸附阳离子交换柱。在给定pH缓冲液条件下,蛋白质带电荷量越大,吸附柱就越强,柱洗脱所需的盐浓度就越高。当然,如果特定蛋白质只是一个多蛋白复合体的一部分,你就对它的离子交换柱吸附性质茫然了。

这一段比较长,很有用,就全部翻译过来了。理解它有几层含义:
1、蛋白质的净电荷含量是pH的函数,也就是滴定曲线(titration curve)。
下图就是一个碱性蛋白(pI9.215)滴定曲线的图:
2、可以根据净电荷(滴定曲线)来选择不同类型的离子交换介质。
如上图,缓冲体系pH大于9.215时,蛋白质带负电荷,可能吸附阴离子交换层析柱;pH小于9.215时,蛋白质带正电荷,可能吸附于阳离子交换层析柱。
3、蛋白质表面电荷的不均匀性有时候会影响到根据滴定曲线所选择的结果。
呵呵,又绕回来了,滴定曲线也不是万能的!试验结果是最重要的。
4、远离等电点的pH,蛋白质带电量大,吸附强,洗脱用盐浓度高。
这就是做纯化时为什么要试验不同的pH条件下的吸附洗脱情况。有可能在某个pH时,目标蛋白与主要杂蛋白吸附强度相同,洗脱分不开,但换一个pH,可能吸附强度就不同了。
5、复合体蛋白不能根据滴定曲线做理论指导。

离子交换层析里面有很多道道,有理论、有实践。真正考验一个纯化人员素质的地方应该就是离子交换层析了,设计巧妙的试验是真正的艺术!


查看积分策略说明
附件
2013-4-29 14:56
23977759.jpg (20.73 KB)
 
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
12
 
Finally, since a protein is generally least soluble at its pI, one can consider an isoelectric precipitation step (assuming that the protein is not in a stable complex with another protein or proteins) (see Chapter 20).

最后,由于蛋白质在pI条件下一般有着最小溶解度,可以考虑用等电点沉淀方法来纯化蛋白(要假设此蛋白不是处于与其他蛋白形成的稳定复合体中)。

等电点沉淀?我很不以为然!不知道大家在实际工作中看到过多少次等电点沉淀,或者是否利用过等电点沉淀,反正我在对样品调节pH时,从来没有看到过等电点沉淀!


查看积分策略说明
附件
2013-4-29 14:57
72545620.jpg (185.28 KB)
 
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
13
 
摩尔消光系数
在波长280nm处,未经修饰蛋白的光吸收值来源于其AA序列中色氨酸、酪氨酸和半胱氨酸。Gill 、von Hippel 和 Pace等人描述了怎样通过给定了氨基酸组成的蛋白质来估计其摩尔吸光或消光系数。基于试验数据,对色氨酸和酪氨酸在蛋白质分子表面和内部的平均比例做出了一些推定。这种方法也许是定量蛋白质浓度最有用的实际方法。例如,如果蛋白有6个色氨酸,7个酪氨酸,没有半胱氨酸,其摩尔消光系数为(ε280 nm) (6×5500)+(7×1490)+(0×125)=43,430。浓度为10-5M的这种蛋白溶液其吸收值(A280 nm)为0.43。更为有用一些的数据是1mg/ml的这种蛋白质溶液的A280 nm。有时称之为E1 mg/ml 280 nm。将摩尔消光系数与分子量MW相除得到E(例如,上面分子量为30000 Da 的蛋白质,43430/30000=1.45)。以适当的缓冲液作对照,仔细测定样品的A280 nm就可以得到蛋白浓度(例如,如果A280 nm的测定值是0.75,那么测定蛋白溶液的浓度为0.75/1.45=0.52mg/ml)。
应当强调的是,如果蛋白样品中含有任何核酸污染,或其他有280nm光吸收成分(如结合亚铁血红素,铁-硫中心[Fe–S],核苷酸底物,辅基等),或有荧光衍生物(如绿色荧光蛋白),那么这种测定蛋白质浓度的方法就无效。

呵呵,以前不知道蛋白质摩尔消光系数值的由来,原来是单个氨基酸的累加,有收获。但是这一段有几处有问题:

1、在波长280nm处,未经修饰蛋白的光吸收值来源于其AA序列中色氨酸、酪氨酸和半胱氨酸。
组成蛋白质的20多种氨基酸,在可见光区域都没有光吸收,在远紫外区(小于220nm)都有光吸收,但在近紫外光区,有280nm紫外吸收的氨基酸应该是色氨酸、酪氨酸和苯丙氨酸。280nm处的光吸收来自于R基的苯环共轭双键。书中把苯丙氨酸错换为半胱氨酸了。

2、This involves some assumptions, based on experimental data, on the average proportion of the tryptophan and tyrosine that are exposed on the surface versus buried in the interior
翻译的不好,这段就看原文吧。
文章把表面氨基酸和内部氨基酸的比例拿出来说事了,也许是有这个比例存在,但应该与消光系数无关。表面还是外部都应该有吸收。

3、文章没有谈及测定A280nm时的比色皿条件,相同浓度的蛋白质,用不同光径的比色皿,其测定值不同。也许它在潜意识中假定了光径为1cm,这也是多数紫外检测仪石英比色皿的常用值,但是在文章中不限定是不严谨的。

4、文章没有谈到另一种极端的情况。例如有些蛋白质其色氨酸、酪氨酸和苯丙氨酸很少,甚至完全没有,那么就不可能用A280nm来测定蛋白浓度。不要说这种情况不存在,完全存在啊,我就遇到过一种40个氨基酸左右的多肽蛋白,不含紫外280nm吸收氨基酸。
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
14
 
1.4. Cysteine content
I always look to see if a protein I am trying to purify contains cysteine. If not, then I can omit reducing agents such as dithiothreitol (DTT) from my buffers. If the protein is from E. coli and has cysteines, then I assume that there are no disulfides in the native protein since the environment in the cytoplasm is reducing making it unlikely that the protein is naturally in an oxidized condition unless it is located in the periplasm. In general when my protein has cysteines, I include DTT in my buffers to prevent unwanted intra- or intermolecular disulfide formation. It is harder to predict whether proteins from other sources and that contain multiple cysteines are likely to form disulfides.

总是要看看待纯化的目标蛋白中是否含有半胱氨酸。如果没有,纯化缓冲液中就可以省略DTT之类的还原剂。由于E. coli胞质(cytoplasm胞质:细胞中除细胞核以外的原生质,包括连续性水溶液即胞溶质(cytosol)和悬浮于中的细胞器及内涵体)内是还原型的环境,表达定位于此的天然蛋白不可能处于氧化状态,所以含有半胱氨酸的E. coli表达天然蛋白也就没有二硫键形成,除非表达定位于周质空间(periplasm细菌细胞壁和内膜之间的间隙)。纯化缓冲液中加DTT可以防止分子内或分子间二硫键的形成。对其他来源的蛋白,如果含有多个半胱氨酸,就很难预测是否会形成二硫键。


没办法,基础不好,很难理解cytoplasm中的大肠杆菌蛋白都没有二硫键!直观的感觉就是cytoplasm中的那些参与大肠杆菌生命的酶都没有二硫键?放狗去搜了搜,确实,一般表述都是cytoplasm偏于还原环境,而periplasm偏于氧化环境。cytoplasm表达的前体蛋白透过信号肽转运至periplasm,再切除信号肽,完成二硫键的氧化。

绕得比较晕,再简述一下文章:
1、没有Cys,不加DTT;
2、胞质表达,不形成二硫键,要加DTT;
3、周质表达,可能有二硫键,不加DTT;
4、其他非E.coli,不能确定。

个人认为,对纯化操作来说,这些没有多大意义。首先,我们破菌时,是不可能单独破periplasm的。即使破菌缓冲液中没有DTT,菌破碎后是否还原环境难说;其次,不管蛋白的活性形式是否需要加DTT以保证还原环境,在破菌纯化过程中完全可以不加,纯化完了加又何妨?


查看积分策略说明
附件
2013-4-29 14:58
90833441.jpg (67.18 KB)
 
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
15
 
1.5. Secondary structure
There are several quite reasonable methods to predict regions of the protein that are likely to be in the form of alpha helical or beta strand secondary structures. However, this knowledge is rarely of use in designing a protein purification scheme

二级结构
预测蛋白二级结构中的阿尔法螺旋或贝塔折叠形式有不少可用的方法。然而这些信息很少用来设计蛋白质纯化流程。

是啊,这种信息对纯化来说目前还用不上。纯化所处理的还是比较宏观和大量的蛋白,也许比喻不是很恰当,但很像物理学中的几率。个体的形式多种多样,蛋白质的结构在溶液中也不是固定不动的,但在一定条件下其结构几率相对稳定。
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
16
 
1.6. Stability
It is possible, using ProtParam (see below) to estimate the in vivo half-life and the instability index of a protein from its sequence. The in vivo half-life is calculated based on the N-end rule (Varshavsky, 1997) and the N-terminal amino acid of the protein in question. Approximate half-life estimates are given for the protein expressed in mammalian cells, yeast and E. coli. The instability index provides an estimate of the stability of your protein in vitro and is based on the analysis of dipeptide occurrences in your protein compared to those of a set of test proteins that are known to be unstable or stable (Guruprasad et al., 1990). This information might be useful since a protein predicted to be unstable in vitro might warrant special care in maintaining low temperatures during purification and perhaps in the use of protease inhibitors.

稳定性
利用ProtParam,可以通过蛋白质的序列来估计其体内半衰期和稳定性。由蛋白质的N末端氨基酸通过N末端规则(Varshavsky, 1997)可计算出其体内半衰期。可以给出在哺乳动物细胞、酵母和大肠杆菌中表达蛋白的半衰期近似值。与一套已知稳定性或不稳定性的蛋白相比较,通过对测试蛋白质的脱多肽分析得到不稳定性参数,提供测试蛋白质在体内的稳定性估值(Guruprasad et al., 1990)。这一信息可能有用。若预测的蛋白质在体内不稳定,能够提醒我们在纯化过程中采用一些特别的措施,如保持低温,也许还要使用蛋白酶抑制剂。

没有做过这种稳定性的预测。一般都是在纯化过程中发现目标蛋白不稳定,才考虑采取措施。若纯化过程没有不稳定的现象,蛋白酶抑制剂还是不加的好。毕竟加入的又是一种杂质。低温一般任何时候对纯化来说都是提倡的,4度冷室最佳。可是往往会受到实际试验场所的限制,用层析冷柜的多一些。
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
17
 
.7. Hydrophobicity and membrane-spanning regions
It is possible to analyze sequence information to determine regions that are particularly hydrophobic or hydrophilic. One such method is that of Kyte and Doolittle (1982) that allows one to plot the hydropathy value along a sequence. This can allow one to recognize potential membrane-spanning regions and, for a protein of unknown function, predict that it is a membrane protein. A membrane-spanning region is usually a stretch of 23 hydrophobic amino acids that form an alpha helix. If you know that the protein of interest is a membrane protein, it will certainly affect how you design a purification scheme.

跨膜疏水区
分析序列信息可以找出蛋白质中特别的疏水或亲水区域。Kyte and Doolittle (1982)提出了一种方法,可以沿着序列绘制亲水性值的图。对一个功能未知的蛋白质来说,这一方法可以得到潜在的跨膜区,预测膜蛋白的可能性。跨膜区通常是一段形成阿尔法螺旋的23个疏水性氨基酸。如果知道目标蛋白是个膜蛋白,那么对设计纯化流程一定有影响。

惭愧,这部分内容虽然在分析软件上常常看到,但一直是稀里糊涂的,期望能够加强这方面的学习。
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
18
 
1.8. Sequence similarity suggests homology and possible cofactor affinity
If your protein is of unknown function, it is possible to do a search to determine if it is highly similar to other known proteins in the protein database. If the sequence similarity is great enough to infer homology and if your protein is related to other homologous family members that have been studied, then perhaps you know, for example, that it usually occurs as a. This will help in predicting its behavior on gel filtration column chromatography. This information might also be used to devise a suitable assay for your protein. Again, as above, sequence can identify if it belongs to a protein family all of which are known to bind to a particular cofactor or substrate. For example, if it is a member of the AAA ATPase family, it is likely that it will bind to an affinity column that has an immobilized ATP analog. Such an affinity purification step can aid greatly in a purification scheme (see Chapter 26).

序列相似意味着同源性和可能的辅助因子亲和性
如果目标蛋白功能未知,可以做一些搜索看看它是否与蛋白质数据库中的其它已知蛋白高度相似。如果序列相似性达到足以推断为同源,并且目标蛋白与其他已研究过的同源性家族蛋白相关,那么通常可以当着同(源)二聚体。这对凝胶过滤柱层析的行为预测很有帮助。这一信息也有可能用来设计一个针对目标蛋白的可行分析方法。如上所述,再次强调,特定的蛋白质家族都已知结合一种特殊的辅助因子或底物,序列分析可以验证目标蛋白是否属于这个蛋白质家族。举个例子,如果目标蛋白是AAA ATP酶家族的一员,很可能它就能吸附于ATP类似物配基的亲和层析柱。这样一种亲和纯化步骤对纯化流程来说帮助极大。

反复看了,同(源)二聚体homodimer这段看不懂。相似、同源可以理解,但与二聚体又有何干?二聚体当然与Gel Filtration有关,但同源扯不上吧?
亲和层析的设计这段不错。其实商品化的此类介质已经有很多了,如Blue,Heparin等。
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
19
 
1.9. Potential modification sites
It is now possible to identify in amino acid sequences, short amino acid stretches or ‘‘motifs’’ that are commonly sites of posttranslational modification. A few of these motifs are: glycosylation site (NXS or NXT); biotinylation site (AMKM); zinc finger (metal binding site) (F/YXCX2–4 CX3FX5LX2HX3–4HX5), heart muscle protein kinase recognition site (RRASV). This information can be highly useful. For example, if the protein is glycosylated, it might bind to a lectin affinity column (see Chapter 35). Many posttranslational modifications become handles by which a protein can be fractionated away from many other proteins. The problems are that one cannot predict if the site is on the surface of the protein of interest or if it is in fact modified and to what extent.

潜在修饰位点
现在我们可以找到氨基酸序列中的某些氨基酸片段或模块,它们可以用于转译后修饰的共同位点。这样一些模块包括:糖基化位点(NXS or NXT);生物素化位点(AMKM);锌指纹(金属结合)位点(F/YXCX2–4 CX3FX5LX2HX3–4HX5);心肌蛋白激酶识别位点(RRASV)。这种信息非常有用。例如,如果目标蛋白有糖基化,它就可能吸附于凝集素亲和层析柱。很多转译后修饰成为纯化靶点,通过它可以有效将目标蛋白与其他多数蛋白分开。存在的问题是,我们不能预测到目标蛋白的修饰靶点是否位于蛋白表面,也不知道实际上的修饰程度。

糖基化,生物素化修饰的蛋白目前都有商品化的纯化介质。但是,实际使用都不理想。对我们的纯化工作帮助不大。利用Con A(伴刀豆球蛋白)或Lectin(外源凝集素)来纯化糖蛋白,效率较低,吸附往往不佳。利用Streptavidin(链霉亲和素)来纯化生物素化的蛋白最大的问题在于洗脱条件太强烈,难以洗脱,或洗脱变性。
顶部
NBA[使用道具]
五级
Rank: 5Rank: 5


UID 75229
精华 6
积分 2497
帖子 4006
信誉分 114
可用分 20946
专家分 70
阅读权限 255
注册 2011-10-20
状态 离线
20
 
1.10. Solubility on overexpression in E. coli
Several studies have proposed that one can predict from the protein sequence the likelihood that a protein, if overproduced in E. coli will be soluble or form insoluble inclusion bodies (Idicula-Thomas and Balaji, 2005; Wilkinson and Harrison, 1991). Obviously, this is useful information, but is most easily obtained by simply overproducing a protein, breaking the cells, centrifuging the lysate to separate soluble from insoluble, and then analyzing the two resulting fractions by SDS–PAGE. The fact that the proportion of an overproduced protein that is soluble can be significantly altered by manipulating cell growth conditions suggests that solubility predictions based on sequence may be useful but have severe limitations.

大肠杆菌过表达的蛋白是可溶还是形成包涵体?有一些研究提出可以通过蛋白质的序列来预测其可能性。显然,这种信息很有用。但是,过表达一下蛋白、破菌、离心,然后分别对上清和沉淀做SDS-PAGE分析,这样也许更为简单实用。原因在于过表达蛋白中可溶性的比例受到细菌培养条件的极大影响。这也说明虽然通过序列来预测可溶性有些用处,但有严重的缺陷性。

不错,不错,又一个用实践战胜理论的例子。培养条件对可溶性的影响做过原核表达的应该都是深有体会。我们经常为了得到可溶性的蛋白不断对培养和诱导条件做优化,例如温度、摇床转速、诱导时菌体密度、诱导剂浓度、诱导时间等等。
文章没有指出的是,实际上不仅是培养条件,不同的宿主菌,不同的质粒等都有影响。还有一个非常重要的因素常常被大家所忽略,那就是破菌缓冲液和破菌条件。我们是通过电泳来检测是否可溶的,而电泳样品来源于破菌上清和破菌沉淀,这就与破菌缓冲和破菌方式肯定相关了。在一种破菌缓冲液,如PBS中,破菌电泳检测为不可溶的蛋白,在另一种破菌缓冲液,如pH8.0的Tris中,破菌检测很可能就是可溶的了。
顶部