蛋白质与蛋白组学 » 讨论区 » 经验共享 » 【求助】如何找MASCOT score等MS数据?

采购询价

点击提交代表您同意 《用户服务协议》 《隐私政策》

 
需要登录并加入本群才可以回复和发新贴

标题:【求助】如何找MASCOT score等MS数据?

xingyi08[使用道具]
三级
Rank: 3Rank: 3


UID 76899
精华 0
积分 496
帖子 671
信誉分 100
可用分 4201
专家分 0
阅读权限 255
注册 2011-11-10
状态 离线
1
 

【求助】如何找MASCOT score等MS数据?

各位老师
我的课题做的是比较蛋白质组学的,但是是交给我们医院的蛋白质组学实验室做的,自己没有参与。做完后他们给了我质谱的数据,只有两个excel的表,如图示。
投稿后,杂志社要求我补充MASCOT score, The number of matching peptides, The percentage sequence table.
请问上述数据我改如何去寻找?


查看积分策略说明
附件
2014-2-3 11:59
13797753.gif (28.12 KB)
 
顶部
xingyi08[使用道具]
三级
Rank: 3Rank: 3


UID 76899
精华 0
积分 496
帖子 671
信誉分 100
可用分 4201
专家分 0
阅读权限 255
注册 2011-11-10
状态 离线
2
 

续,另外一个excel的内容


查看积分策略说明
附件
2014-2-3 11:59
46924926.gif (6.01 KB)
 
顶部
leifengta[使用道具]
四级
Rank: 4


UID 77488
精华 0
积分 514
帖子 748
信誉分 100
可用分 4517
专家分 0
阅读权限 255
注册 2011-11-17
状态 离线
3
 

首先当然是要求测试单位提供原始检索结果(最好有原始数据,这些本来就是应该提供的),一般MASCOT原始检索结果都是网页格式,上面就有肽段/蛋白得分、匹配肽段数目、覆盖率等信息。Mascot也可根据需要提供含有各种信息的xml格式文件,一目了然。有些仪器(如Bruker公司质谱)还可提供更直观的pdf报告,输出这些报告只是点一下键的问题,你要求他们一下肯定会给你的。
如果他们不提供,就只能要了原始数据自己去Mascot网站(cuturl('http://www.matrixscience.com'))检索了。估计你做的是MALDI数据,此网站一天只能免费使用300个检索,估计你还是够用的。
顶部
leifengta[使用道具]
四级
Rank: 4


UID 77488
精华 0
积分 514
帖子 748
信誉分 100
可用分 4517
专家分 0
阅读权限 255
注册 2011-11-17
状态 离线
4
 
看了你提供的结果,原来是ABI4700。
目前在excel里的那个protein score就是你要的Mascot Score,Pep. Count里的17并不是多肽匹配数目,里面有些重复的,你手动将重复的多肽数目去掉就是number of matching peptides,至于cover percentage,貌似这表里没有。你也可以手动算算,找到这蛋白全序列,看看一共多少个氨基酸,然后看看你的多肽列表里一共占了多少个氨基酸,一除就是coverage了。
如果蛋白数量很多,还是找测试单位按你要求输出的快。
顶部
xingyi08[使用道具]
三级
Rank: 3Rank: 3


UID 76899
精华 0
积分 496
帖子 671
信誉分 100
可用分 4201
专家分 0
阅读权限 255
注册 2011-11-10
状态 离线
5
 
看了您的回复,就知道是这方面的行家,谢谢您!
我现在清楚的是:protein score=Mascot Score。
隔行隔山,我最这个表的意义比较陌生。还是不很明白number of matching peptides和cover percentage怎麽找,如果方便的话,能不能麻烦您画图说明?
谢谢....
顶部
leifengta[使用道具]
四级
Rank: 4


UID 77488
精华 0
积分 514
帖子 748
信誉分 100
可用分 4517
专家分 0
阅读权限 255
注册 2011-11-17
状态 离线
6
 

你的贴图我看不太清。
你看看下面peptide information里,第2个和第3个肽段序列是一样的,所以这两个结果实际指向同一段肽,只能算一个;同理,第7和第8两个也是一样的。所以你就把这样相同的结果去掉,剩下多少个肽段结果,就是number of matching peptides。
至于cover percentage,就是找出这个蛋白质的全序列,看看一共多少氨基酸(N1),然后算算上面的matching peptides里肽段一共有多少氨基酸(N2),然后N2/N1*100%,就是cover percentage了。
顶部
xingyi08[使用道具]
三级
Rank: 3Rank: 3


UID 76899
精华 0
积分 496
帖子 671
信誉分 100
可用分 4201
专家分 0
阅读权限 255
注册 2011-11-10
状态 离线
7
 
我再附上该质朴清晰一点的图。
由此,我按照你的方法算了一下,似乎excel图里面的Pep. Count=17正是number of matching peptides,不知是否可以直接读取?
MASCOT=248?
17个肽段共找出146个不重复的氨基酸,总长483个,cover percentage=146/483=30.23% ?
两外,excel表中的Protein MW和Protein PI是指实际(Experimental)还是指理论(Theoretical)的?他们当初给我的时候说是Theoretical的,但今天一查ExPASy,里面的好像和他们给我的excel表里的MD又不一样哦!


查看积分策略说明
附件
2014-2-3 12:45
31251449.snap.jpg (50.6 KB)
 
顶部
leifengta[使用道具]
四级
Rank: 4


UID 77488
精华 0
积分 514
帖子 748
信誉分 100
可用分 4517
专家分 0
阅读权限 255
注册 2011-11-17
状态 离线
8
 

1. 匹配多肽数是17。估计软件已经扣掉重复的了,可以直接读取。
2. 给出的Protein MW和pI是通过数据库里序列计算得到的理论值。
数据库中序列常常是没有切掉信号肽的,所以和实际实验结果会有差距。
另外,检索结果中常常会碰到protein group情况,即多个蛋白质序列拥有相同的匹配序列(通常是点突变序列或剪切片段等),这种情况下软件会输出一个ID,而把其他作为其subset而不显示。因此你在expasy中搜索时一定要查找同一个序列,否则序列长度或局部可能不一样。
顶部
xingyi08[使用道具]
三级
Rank: 3Rank: 3


UID 76899
精华 0
积分 496
帖子 671
信誉分 100
可用分 4201
专家分 0
阅读权限 255
注册 2011-11-10
状态 离线
9
 
谢谢您!
每次读你的回帖多有醍醐灌顶的感觉,豁然开朗!
这几天我也在探索这些质朴的数据分析,现在已经有点头绪。
谢谢您的热心帮助,如果有疑问,我还会继续跟帖请教您!
顶部