蛋白质与蛋白组学 » 讨论区 » 经验共享 » 【求助】非模式生物label-free分析的蛋白质鉴定问题

采购询价

点击提交代表您同意 《用户服务协议》 《隐私政策》

 
需要登录并加入本群才可以回复和发新贴

标题:【求助】非模式生物label-free分析的蛋白质鉴定问题

uaubc[使用道具]
三级
Rank: 3Rank: 3


UID 107981
精华 0
积分 451
帖子 562
信誉分 100
可用分 3661
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
1
 

【求助】非模式生物label-free分析的蛋白质鉴定问题

前面一直做双向,第一次尝试做了一下label-free的分析,关于蛋白质鉴定的问题甚是不解。在此写下疑惑,望诸位高手不吝赐教,感激不尽!
我做的是水产动物,自然不是模式生物。LC-MS/MS的过程很顺利,数据库搜索后得到近3000个peptides,看起来不错的样子。问题来了,接下来由这些peptides组合成为protein的过程中,委托的公司提供给我了很多的protein group,每个protein group里面包含不同数量的peptides,有的peptides还包含在不同的protein group中。
对此我十分不解,请教一些有经验的战友:
1.由peptide组装为protein group是依赖什么原理,序列相似性吗?如何确定组装的可信度?既然peptide是由数据库搜索才鉴定出来的,那么protein group的注释是怎么完成的?根据各组成肽段的注释信息吗?【这是我最不明白的地方】
2.每一个protein group的注释都有很多冗余。这首先很大程度上是因为我数据库的原因(因为我做的物种没有现成的数据库可以用,所以使用了EST翻译成的氨基酸序列库,肯定有大量的冗余)。我想问的是,如果使用非冗余的数据库,这种注释的冗余会消失吗?因为我自己的单位没有条件进行EST的拼接工作,所以使用了冗余的数据库。如果拼接EST后可以消除prptein group冗余的情况,我想可以考虑花钱请公司帮忙拼接、去冗余;但是如果拼接后的数据库仍有冗余的话,就似乎没有必要再去消除EST的冗余了。
顶部
uaubc[使用道具]
三级
Rank: 3Rank: 3


UID 107981
精华 0
积分 451
帖子 562
信誉分 100
可用分 3661
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
2
 

我在华大做的,你是自己做质谱数据分析吗?你们课题组有mascot等软件吗?我们没有买所以啥也干不成
顶部
jkobn[使用道具]
三级
Rank: 3Rank: 3


UID 75366
精华 0
积分 468
帖子 574
信誉分 101
可用分 3711
专家分 10
阅读权限 255
注册 2011-10-22
状态 离线
3
 

"既然peptide是由数据库搜索才鉴定出来的,那么protein group的注释是怎么完成的?根据各组成肽段的注释信息吗?"
在由peptide合成protein group 的过程中,是会选择你所用的数据库的。因为蛋白信息也就有了。原来我生成protein group的时候是可以选择》2个peptide能匹配到一个protein上时,才认为可信。

问题:我有一个问题,我也做的是非模式生物,蛋白质库不全。我看有文献是用的EST的数据库,但是我不知道该如何翻译蛋白库。你说你的数据库是翻译过来的氨基酸数据库。我想请教一下是怎么翻译的。急!
顶部
DDD[使用道具]
四级
Rank: 4


UID 73222
精华 1
积分 587
帖子 790
信誉分 102
可用分 4768
专家分 10
阅读权限 255
注册 2011-9-20
状态 离线
4
 

用mascot直接可以导入EST库 它会自动帮你翻译成蛋白序列信息进行搜库的
group多这个问题一般很难解决,非标记定量的话会受到比较大的影响,不过如果unique的pep也比较多的话可以只用那些肽段来进行强度定量
顶部
pulala[使用道具]
三级
Rank: 3Rank: 3


UID 107976
精华 0
积分 288
帖子 315
信誉分 100
可用分 2326
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
5
 
相关疾病:
头痛
1.由peptide组装为protein group是依赖什么原理,序列相似性吗?如何确定组装的可信度?既然peptide是由数据库搜索才鉴定出来的,那么protein group的注释是怎么完成的?根据各组成肽段的注释信息吗?【这是我最不明白的地方】

两条肽匹配上同一个蛋白质算是可靠鉴定了这个蛋白质。
但是同时因为很多蛋白的同源性很高,所以两条肽可能同时匹配上很多个蛋白质,比如ACT1 ACT2 等等,此为一个group

所以我们现在说鉴定到一个蛋白质,需要有这个蛋白质的unique peptide 被鉴定到了才算。关于unique peptide ,即这个蛋白特有的肽段

2.每一个protein group的注释都有很多冗余。这首先很大程度上是因为我数据库的原因(因为我做的物种没有现成的数据库可以用,所以使用了EST翻译成的氨基酸序列库,肯定有大量的冗余)。我想问的是,如果使用非冗余的数据库,这种注释的冗余会消失吗?因为我自己的单位没有条件进行EST的拼接工作,所以使用了冗余的数据库。如果拼接EST后可以消除prptein group冗余的情况,我想可以考虑花钱请公司帮忙拼接、去冗余;但是如果拼接后的数据库仍有冗余的话,就似乎没有必要再去消除EST的冗余了。

EST 很头疼,暂时木思路。
顶部
uaubc[使用道具]
三级
Rank: 3Rank: 3


UID 107981
精华 0
积分 451
帖子 562
信誉分 100
可用分 3661
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
6
 
"既然peptide是由数据库搜索才鉴定出来的,那么protein group的注释是怎么完成的?根据各组成肽段的注释信息吗?"
在由peptide合成protein group 的过程中,是会选择你所用的数据库的。因为蛋白信息也就有了。原来我生成protein group的时候是可以选择》2个peptide能匹配到一个protein上时,才认为可信。

==============================================================================================================

问题:我有一个问题,我也做的是非模式生物,蛋白质库不全。我看有文献是用的EST的数据库,但是我不知道该如何翻译蛋白库。你说你的数据库是翻译过来的氨基酸数据库。我想请教一下是怎么翻译的。急!
谢谢!
抱歉数日未关注帖子。翻译数据库我们使用的是EMBOSS package的GETORF,详细信息见:Rice P, Longden I, Bleasby A. EMBOSS: the European Molecular Biology Open Software Suite. Trends Genet. 2000;16:276.
希望能对您有帮助。
顶部
uaubc[使用道具]
三级
Rank: 3Rank: 3


UID 107981
精华 0
积分 451
帖子 562
信誉分 100
可用分 3661
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
7
 
相关疾病:
头痛


=============================================================================================================

1.由peptide组装为protein group是依赖什么原理,序列相似性吗?如何确定组装的可信度?既然peptide是由数据库搜索才鉴定出来的,那么protein group的注释是怎么完成的?根据各组成肽段的注释信息吗?【这是我最不明白的地方】

两条肽匹配上同一个蛋白质算是可靠鉴定了这个蛋白质。
但是同时因为很多蛋白的同源性很高,所以两条肽可能同时匹配上很多个蛋白质,比如ACT1 ACT2 等等,此为一个group

所以我们现在说鉴定到一个蛋白质,需要有这个蛋白质的unique peptide 被鉴定到了才算。关于unique peptide ,即这个蛋白特有的肽段

2.每一个protein group的注释都有很多冗余。这首先很大程度上是因为我数据库的原因(因为我做的物种没有现成的数据库可以用,所以使用了EST翻译成的氨基酸序列库,肯定有大量的冗余)。我想问的是,如果使用非冗余的数据库,这种注释的冗余会消失吗?因为我自己的单位没有条件进行EST的拼接工作,所以使用了冗余的数据库。如果拼接EST后可以消除prptein group冗余的情况,我想可以考虑花钱请公司帮忙拼接、去冗余;但是如果拼接后的数据库仍有冗余的话,就似乎没有必要再去消除EST的冗余了。

EST 很头疼,暂时木思路。

=============================================================================================================

开始几天总也没有人回复,有一段时间没来了,还以为帖子沉了呢呵呵。
再请问战友:由peptide组装protein group时,使用的是什么软件?还是mascot提供此功能?(没见过stand-alone mascot软件的山人问)

另汇报一下最新进展,请公司重新将质谱数据比对了一下经过拼接的EST数据,比对结果已经拿到,看起来冗余问题解决了相当一部分,因为annotation还未做完,确定的结果我会后面发上来。

我第一次做label-free的实验,感觉数据的后续处理过程中还有很多问题,主要指差异分析过程,包括其中应该采取的统计方法、阈值设定等等。我的想法是把现在的工作当成一个案例拿出来供各位战友讨论,大家互相学习提高(当然另外也可以帮助我完成项目,这也很重要),大家认可的话,可以常来看看,讨论一下。

热烈期盼更多的人参与!
顶部
chenshuanhe[使用道具]
三级
Rank: 3Rank: 3


UID 107984
精华 0
积分 204
帖子 148
信誉分 100
可用分 1493
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
8
 


QUOTE:
原帖由 uaubc 于 2013-10-25 22:01 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')
相关疾病:
头痛

=============================================================================================================

1.由peptide组装为protein group是依赖什么原理,序列相似性吗?如何确定组装的可信 ...

组装protein group是Mascot的功能,一些新的软件也有一些其他算法来计算group蛋白的肽段分配的问题。但是目前来说并没有什么很好的办法。可能一个解决办法是用2DPAGE,这样分子量可能更好对应,另一个就是1D SDS-LCMS,也是可以得到大致的分子量,这样能够用分子量区分一部分group 蛋白
顶部
uaubc[使用道具]
三级
Rank: 3Rank: 3


UID 107981
精华 0
积分 451
帖子 562
信誉分 100
可用分 3661
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
9
 


QUOTE:
原帖由 chenshuanhe 于 2013-10-25 22:01 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')


组装protein group是Mascot的功能,一些新的软件也有一些其他算法来计算group蛋白的肽段分配的问题。但是目前来说并没有什么很好的办法。可能一个解决办法是用2DPAGE,这样分子量可能更好对应,另一个就是1D SDS-LCMS,也 ...

非常感谢!
最近有别的项目要做,脱不开身,我会尽快吧最新结果发上来供大家讨论。
顶部
uaubc[使用道具]
三级
Rank: 3Rank: 3


UID 107981
精华 0
积分 451
帖子 562
信誉分 100
可用分 3661
专家分 0
阅读权限 255
注册 2013-4-27
状态 离线
10
 
忙活了一个多月,终于有时间再继续这个蛋白组的项目了。废话不多说,向各位介绍一下最新的进展情况:
经过与拼接后的EST数据比对,两个样品你各拿到了1000多个蛋白点,通过与公司沟通,他们搜索的条件及设定的阈值是这样的:
1.只考虑大于6个氨基酸的肽段,取p<0.05(Mascot给出的概率)的肽段为可信的匹配;
2.蛋白(组)的鉴定结果中,需至少有一个unique peptide才被保留,无unique peptide的蛋白(组)被过滤掉;
3.肽段搜索的时候搜索了decoy数据库,而没有搜索污染数据库
4.每个run的FDR值都在2%以下。
我从文献中看到,很多文献都规定至少匹配到两个肽段的蛋白才可信,我手动将只匹配到1个肽段的蛋白去除后,两个样品各能匹配到约300个蛋白,而且这些蛋白间重复比较少。
请各位高手评价一下,这样的阈值设定怎么样?有没有需要再提高严谨度的地方?
另外,1.需不需要搜索污染数据库(我个人觉得好像应该搜索一下);
2.如果不需要增加其它的条件的话,蛋白鉴定的工作是不是到此为止了,有没有其它需要做的工作?
请各位不吝赐教,谢谢!
顶部