分析测试百科

标题: 【讨论帖】蛋白质组数据的生物信息学处理 [打印本页]

作者: 草木叉 时间: 2013-10-10 17:39 标题: 【讨论帖】蛋白质组数据的生物信息学处理

在蛋白质组学研究中,如果使用高通量方法会得到大量蛋白质数据, 这就需要采用生物信息学的方法进行处理. 这里介绍一篇文章,希望能起到抛砖引玉的作用, 让大家讨论一下还可以用那些方法进行生物信息学处理.
在这篇论文中，应用了合并2种检索，非标记定量，相对量比较（normalized and non normalized），GO term 比较， 3种算法的蛋白定位预测比较，通路分析，蛋白修饰(包括氨基酸修饰，和蛋白降解修饰)。另外在结果表格中还列出信号肽，跨膜区，以及是否血清蛋白分析。文章连接：
Characterization of the Vitreous Proteome in Diabetes without Diabetic Retinopathy and Diabetes with Proliferative Diabetic Retinopathy
J. Proteome Res., ASAP Article, 10.1021/pr800112g
cuturl('http://pubs.acs.org/cgi-bin/abstract.cgi/jprobs/asap/abs/pr800112g.html')
因为版权所以不能贴在这里，无法下载的可以发消息给我。

Figure 1. Proteomic analysis process and the number of proteins identified. A. Schematic of gel-LC-MS/MS analysis and data processing. B. Venn diagram of proteins identified using X!Tandem and SEQUEST algorithms. The number of proteins identified from 17 independent vitreous samples and percent of total number of proteins identified by each algorithm are shown.

图片附件: 62865217.snap.jpg (2013-10-10 17:39, 50.71 KB) / 该附件被下载次数 29
http://bbs.antpedia.com/attachment.php?aid=19209

作者: 草木叉 时间: 2013-10-10 17:40

This table contains the total list of IPI, protein name, gene symbol, sequence coverage, unique peptides, spectral count of NDM, noDR, and PDR group (Mean ± SEM), p value, search engine, GO term (biological process, cellular component, molecular function), and protein subcellular localization prediction for the 252 proteins identified in this study.

图片附件: 54760647.snap.jpg (2013-10-10 17:40, 38.45 KB) / 该附件被下载次数 15
http://bbs.antpedia.com/attachment.php?aid=19210

作者: 草木叉 时间: 2013-10-10 17:41

表格继续........

图片附件: 15759040.snap.jpg (2013-10-10 17:41, 49.71 KB) / 该附件被下载次数 17
http://bbs.antpedia.com/attachment.php?aid=19211

作者: 草木叉 时间: 2013-10-10 17:41

相对含量分析：
Figure 2. Fractional distribution of the most abundant proteins in human vitreous. A. Chart showing a summary of the relative amounts of highly abundant proteins in PDR vitreous. B. Table showing the mean percent of number of total peptides for the 15 most abundant proteins identified in NDM, noDR, and PDR samples relative to the number of total peptides detected from respective samples.

图片附件: 72649213.snap.jpg (2013-10-10 17:41, 69.6 KB) / 该附件被下载次数 18
http://bbs.antpedia.com/attachment.php?aid=19212

作者: 草木叉 时间: 2013-10-10 17:41

Figure 3. Comparison of proteins abundance in noDR or PDR vitreous relative to NDM vitreous. Ratio of the mean total peptides detected in noDR or PDR groups relative to the NDM group. The absence of protein detection in a group is indicated by > 20 fold.

图片附件: 53715041.snap.jpg (2013-10-10 17:41, 82.58 KB) / 该附件被下载次数 15
http://bbs.antpedia.com/attachment.php?aid=19213

作者: 草木叉 时间: 2013-10-10 17:42

GO term, 蛋白质定位预测比较：
Figure 4. A. Frequency of Gene Ontology terms in human vitreous proteome annotation. Predicted protein subcellular localization by MultiLoc(, TargetP(C) and SubLoc(D).

图片附件: 10589614.snap.jpg (2013-10-10 17:42, 73.36 KB) / 该附件被下载次数 18
http://bbs.antpedia.com/attachment.php?aid=19214

作者: 草木叉 时间: 2013-10-10 17:42

Ingenuity分析。论文中以表代替图。
Proteins related to complement and coagulation cascades differently changed in human vitreous proteome in patients with NDM or PDR。(red: increase, blue: decrease)

图片附件: 38158743.snap.jpg (2013-10-10 17:42, 48.54 KB) / 该附件被下载次数 20
http://bbs.antpedia.com/attachment.php?aid=19215

作者: 草木叉 时间: 2013-10-10 17:43

蛋白修饰分析：
Figure 5. Identification of protein fragments in the vitreous. A. Schematic of peptide coverage for proteins with a low than predicted molecular weight. The location of peptides identified is indicated. B & C. The spectral count for cadherin-2 and vitronectin on SDS-PAGE at different molecular weight from gel slices.

图片附件: 38618330.snap.jpg (2013-10-10 17:43, 37.66 KB) / 该附件被下载次数 23
http://bbs.antpedia.com/attachment.php?aid=19216

作者: 草木叉 时间: 2013-10-10 17:43

蛋白修饰分析，各组比较（没在论文中）
A. Frequency of protein modification in human vitreous proteome.
B. Comparison of protein modification among NDM, noDR and PDR groups.

图片附件: 28885520.snap.jpg (2013-10-10 17:43, 60.17 KB) / 该附件被下载次数 15
http://bbs.antpedia.com/attachment.php?aid=19217

作者: ukonptp 时间: 2013-10-10 17:44

感觉该JPR的工作是去年Nature Medicine的副产物,将数据进行了扩大和大规模的分析,确实是蛋白质组数据的生物信息学处理的典范. 也许Vitreous 中的蛋白质含量少,不然扩大数据集同时提高数据的精确度, 也许可以象Mattias Mann发在Genome biology上的很多工作,发更好的杂志.

有几个问题想请教:
1. 对你的蛋白降解修饰很感兴趣, 好象没在其他文章上看过相关分析,也许是你定量分析方法的一个优势所在. 请问对绝大部分的1-D PAGE上的蛋白质, 蛋白质在不同bands中的相对定量是否有一定规律? 是否呈现正态分布? 象你文章中的vitronectin蛋白好象就没有任何规律?

2. 我感觉对数据集的生物信息学分析, 意义有限. 其他领域的科研人员能够从中间得到的信息比较有限. 其意义和出口还是要从中选择一些有意义的东西往后深入(就象你们Nature Medicine的工作), 风险很大,需要很强的背景知识. 也许这就是所谓的系统生物学研究的一部分. 不知道Dr. Gao怎么理解? 谢谢.
3. 还有对与于亚细胞器的蛋白质组数据集, 进行生物信息学分析, 该如何开展? 例如细胞膜, 进行蛋白质相互作用和pathway分析好象都受到了限制, 如纯度问题的影响.

再次感谢.

作者: 草木叉 时间: 2013-10-10 17:44

谢谢。
这个项目是我们第一个从2D Gel 转到 1D PAGE + LC/MS/MS的研究，当时方法并不很成熟，病人样品有限，所以监测到的蛋白总数不是太多，现在我们使用1D GEL + 1D LC/MS/MS可以最多检测到1800个蛋白。

基于1D GEL + 1D-LC/MS/MS的蛋白组研究比较2D Gel based和2D-LC/MS/MS （Shotgun）有一些比较显著的优点。 1D GEL + 1D-LC/MS/MS 比2D Gel based 方法主要是减少很大工作量，可以容易得到整个样品的蛋白质，而不是数个差异点，而且不论使用标记和非标记方法得到的定量结果都理论上比2D准确。因为在2D胶上每个点通常很多蛋白，一个蛋白通常分布在几个点。1D GEL + 1D-LC/MS/MS 比2D-LC/MS/MS （Shotgun）的比较也有如下优点：一是可以得到蛋白的实际分子量，可以应用在蛋白酶切修饰的研究。如果蛋白被修饰而出现多种分子量形式可以显示在1D gel上。另外的一个优点是因为蛋白被分离，所以用以低丰度的蛋白更容易被发现。但这个优点我不敢肯定，因为我们没有直接比较这两种方法。如果有使用2D-LC/MS/MS 的实验室可以讨论一下Shotgun方法的检测灵敏度。现在我们使用1D GEL + 1D-LC/MS/MS （LTQ）可以检测到1ng左右(基于发现2个唯一多肽)。
1D GEL + 1D-LC/MS/MS的缺点是须使用nano-LC spray source而不能用MALIDI source, 2D Gel based就没有这种限制。比shotgun 方法工作量大，LC/MS/MS时间也长很多，我们现在的protocol需要60小时的LC/MS/MS完成一个样品的检测。

蛋白酶切修饰没有找到规律，我们只发现几个蛋白有这种现象。但是对于一种蛋白来讲，每个样品都是一样的。我们使用这种方法在另外的一个研究中发现一个很有意义的酶切现象，结果还没有发表。

作者: 草木叉 时间: 2013-10-10 17:44

继续。

生物信息学分析是对结果分析，归纳，理解的一个方法。蛋白质组和基因组方法都是一样的，当我们发现数十种数百种有差异蛋白时，只有从这种方法入手，对富集的每个分类，每个pathway的单个蛋白进行更进一步查阅，找出有可能有生物学意义的蛋白进一步研究。所以，生物信息学分析是一个筛选过程。
选择哪个蛋白进行深入研究是有很多风险，但部分是靠运气的。就我们的这个研究项目，我们选择了几种蛋白进行了研究，集中在3个蛋白上，只有CA1得到比较好的结果，另外2个都失败了。其中一个同事对一个蛋白进行了3年的研究，最后空手而归。

我不是很明白你的最后一个问题。细胞器定位分析是根据GO annotation，另外结合计算预测。大概80-90%的蛋白有GO注释，有细胞定位的注释的就更少，所以需要对没有GO注释的要用计算预测的方法进行定位 (图4 B C D)。我看过也试过不少预测工具，对分泌蛋白和细胞膜蛋白定位比较可信。我喜欢使用CBS Prediction Servers的预测工具，特别是signalP, TargetP, TMHMM (表中). 这些工具能批量输入，而且最近新添加的SOAP功能可以很容易整合到自己的软件工具中。
我也试过很多pathway和GO分析工具。感觉ingenuity和DAVID比较好， ingenuity是商业软件，价格很高，可以做定量比较，显示蛋白表达的高低。 DAVID是免费的，只是对蛋白或基因进行富集分析。但对蛋白质组研究够用了。
我用的GO Slim分析是一个嵌在我的蛋白质组结果软件包的一个模块，图4 A和表中的结果是用它分析的。

作者: ukonptp 时间: 2013-10-10 17:45

谢谢，很受用．

还是接上面的问题．

１．请问如果蛋白被修饰而出现多种分子量形式可以显示在1D gel上，多大范围以内，您认为它不是co-migration, 而是修饰，还有怎么进一步筛选修饰形式?

２．我的上面最后一个问题是想问，对于亚细胞器的蛋白质组数据集，该如何开展有针对性的生物信息学分析，定位肯定是最基本的，没问题．也许可以发现在生理或病理状态下，蛋白质定位方面的改变．但是象分析ppi和pathway时就有问题，因为不知道鉴定的蛋白质是否是该亚细胞器真正定位的蛋白质？除了实验样品的纯度提高以外，生物信息学是否能够做点什么？　

谢谢．　

作者: 草木叉 时间: 2013-10-11 10:41

１．请问如果蛋白被修饰而出现多种分子量形式可以显示在1D gel上，多大范围以内，您认为它不是co-migration, 而是修饰，还有怎么进一步筛选修饰形式?

不考虑范围，看蛋白分布是不是出现2个或多个峰。

2。生物信息分析不能帮助分析病理改变引起的蛋白定位改变。

作者: zsxan1990 时间: 2013-10-11 10:41

你好：楼主。
我是生物信息学的初学者，原来是学计算机的，现在硕士专业是生物，想做“用生物信息学方法分析蛋白方面”的课题，请问要从哪方面着手啊，非常感谢！

作者: 草木叉 时间: 2013-10-11 10:42

蛋白质研究很多都需要生物信息处理，比如：
蛋白结构分析：蛋白质序列分析，像motif, pattern识别，蛋白定位，跨膜结构，序列同源性分析等，二级三级结构预测。
蛋白功能分析：蛋白功能，pathway分析，相互作用分析，数据库建立等。
蛋白质质谱分析相关：质谱信号预处理，标记和非标记算法，蛋白质组结果处理。

其实每个功能都有很多论文和软件可以查阅和使用，但并不代表你不能去接着做。我有个体会，计算机科班出身做出的生物信息软件有时不会考虑到如何方便做基础研究人员的应用，网上可以使用的GO分类的软件有数十种，但就是找不出一个可以按照基础研究人员思维使用的软件，所以做生物信息软件一定要和作基础的合作。我做的软件是关于蛋白质非标记定量分析，蛋白质组结果处理，蛋白功能分类。如果你做与这些相关可以交流，别的蛋白分析我不懂。

作者: yes4 时间: 2013-10-11 10:43

多谢楼主您给予的指导和建议，对我很有用。
我想做的也是和你的差不多，对蛋白功能和蛋白质组结果处理比较感兴趣，具体的现在还没定下来，正在寻找方向。
可能以后的学习过程中，还要请教您！
再次感谢您！

作者: yes4 时间: 2013-10-11 10:44

楼主对iTRAQ的数据分析有何意见和建议？

作者: 草木叉 时间: 2013-10-11 10:44

我们的质谱仪不能做iTRAQ试验, 所以没有这方面的经验. 在刚出现这个技术时, 感觉理论上很好, 所以看了一些介绍.这个方法结合shotgun方法应该是很好的.

现在有不少配套的iTRAQ定量分析软件, 如果要自己写程序处理, 应该比lable free和iCAT简单,原因:
1. 定量分析是在MS2水平的.
2.不需要打开含有MS1数据的文件 (提交检索的数据都还有MS2 ion intensity 数据)
3.在114-117 (或114-121 8plex)这个范围, 数据干扰应该少
4.如果丰度高蛋白,会检测多个多肽, 这样会有很多比值, 容易定量准确.

分析流程图:

图片附件: 11630110.snap.jpg (2013-10-11 10:44, 102.93 KB) / 该附件被下载次数 6
http://bbs.antpedia.com/attachment.php?aid=19221

作者: jkobn 时间: 2013-10-11 10:45

想问一哈，对于比较蛋白质组学结果的生物信息学处理，有时在不同的数据库会有不同的结果，这怎样选择和判断啊？

作者: 草木叉 时间: 2013-10-11 10:46

检索时最好用同一数据库, 如果不同数据库, 比较多肽序列, 绝大多数情况是一样的蛋白, 不一样的名称, ID.
也可以用gene name去统一, 不同数据库, 不同isoform的蛋白通常是一个gene name.
如果比较不同论文中的数据可以用IPI数据库中(cuturl('ftp://ftp.ebi.ac.uk/pub/databases/IPI/current/')) xrefs 交互关联表查询.

作者: mysmdbl 时间: 2013-10-11 10:46

请教楼主
你所用的批量GO ANNOTATION 是什么软件啊？
请问BINGO 这个软件是否好用，好像也用来进行信号通路分析
请问ingenuity Ingenuity Pathways Analysis 软件试用版是否好用？
还有其它类似软件吗？

能不能谈谈在蛋白质组实验后得到了大量差异蛋白点的数据
可以做哪些分析，该用到什么软件啊?
个人对蛋白组的感觉是花架子，所以做着没有动力啊。

作者: 草木叉 时间: 2013-10-11 10:47

我所用的GO ANNOTATION软件是我自己写的, 我没有找到一个合适的软件处理我的数据, 因为我要比较GO 分类在不同组的差异.

我没有用过BINGGO, 通路分析软件做的最好的是Ingenuity和GeneGO, 两者功能有差别, 各有侧重, 我们使用的都是正式版本, 我估计试用版功能和正式版功能一样,只不过是有时间限制而已.

得到差异蛋白我就是用上面提到的那些方法, GO分析和Pathway分析, 根据分析选定几个感兴趣的蛋白深入功能研究.

作者: lxh031 时间: 2013-10-11 10:47

我还想问问
KOBAS 分析系统是否好用？

作者: 草木叉 时间: 2013-10-11 10:48

我以前没有用过KOBAS，Google后才知道是北大做的，既然是免费的，而且有server可以运行，你可以试试看。

作者: duoduo 时间: 2013-10-11 10:48

感觉该JPR的工作是去年Nature Medicine的副产物,将数据进行了扩大和大规模的分析,确实是蛋白质组数据的生物信息学处理的典范. 也许Vitreous 中的蛋白质含量少,不然扩大数据集同时提高数据的精确度, 也许可以象Mattias Mann发在Genome biology上的很多工作,发更好的杂志.

有几个问题想请教:
1. 对你的蛋白降解修饰很感兴趣, 好象没在其他文章上看过相关分析,也许是你定量分析方法的一个优势所在. 请问对绝大部分的1-D PAGE上的蛋白质, 蛋白质在不同bands中的相对定量是否有一定规律? 是否呈现正态分布? 象你文章中的vitronectin蛋白好象就没有任何规律?

2. 我感觉对数据集的生物信息学分析, 意义有限. 其他领域的科研人员能够从中间得到的信息比较有限. 其意义和出口还是要从中选择一些有意义的东西往后深入(就象你们Nature Medicine的工作), 风险很大,需要很强的背景知识. 也许这就是所谓的系统生物学研究的一部分. 不知道Dr. Gao怎么理解? 谢谢.
3. 还有对与于亚细胞器的蛋白质组数据集, 进行生物信息学分析, 该如何开展? 例如细胞膜, 进行蛋白质相互作用和pathway分析好象都受到了限制, 如纯度问题的影响.

再次感谢.

======================================================

请问是哪篇Nature Medicine的文章，可否给出文章题目或者链接，想看看。

作者: 草木叉 时间: 2013-10-11 10:49

QUOTE:

原帖由 duoduo 于 2013-10-11 10:48 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')
感觉该JPR的工作是去年Nature Medicine的副产物,将数据进行了扩大和大规模的分析,确实是蛋白质组数据的生物信息学处理的典范. 也许Vitreous 中的蛋白质含量少,不然扩大数据集同时提高数据的精确度, 也许可以象Mattia ...

http://www.dxy.cn/bbs/actions/archive/post/8312904_1.html?tpg=1

作者: duoduo 时间: 2013-10-11 10:50

生物信息学分析是对结果分析，归纳，理解的一个方法。蛋白质组和基因组方法都是一样的，当我们发现数十种数百种有差异蛋白时，只有从这种方法入手，对富集的每个分类，每个pathway的单个蛋白进行更进一步查阅，找出有可能有生物学意义的蛋白进一步研究。所以，生物信息学分析是一个筛选过程。

===========================================================================================================

我做的是2－D，找出差异后做质谱。质谱得出的蛋白点应该怎么分析呢？是不是应该先得看看每个差异点大概都是什么？如果要用生物信息学方法进行分析，如对相关的蛋白质做通路分析，应该用什么方法或者软件呢？因为后续的研究可能对蛋白质功能等方面比较感兴趣。我是初学者，能否请楼主对这一问题做一简要总结。不甚感激。

作者: 草木叉 时间: 2013-10-11 10:51

QUOTE:

原帖由 duoduo 于 2013-10-11 10:50 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')
生物信息学分析是对结果分析，归纳，理解的一个方法。蛋白质组和基因组方法都是一样的，当我们发现数十种数百种有差异蛋白时，只有从这种方法入手，对富集的每个分类，每个pathway的单个蛋白进行更进一步查阅，找出有可能有生物学 ...

如果用2-D找差异,然后质谱鉴定, 通常得到的差异蛋白不会很多, 如果差异蛋白少于20个, 基本不需要生物信息方法进行分析, 手工检索每个差异蛋白和你所做模型,疾病的联系, 然后综合考虑更有实际意义.根据检索结果, 挑选有潜在意义的蛋白进行验证, 然后根据课题选择其他方法, 像在细胞试验用knock-down, transfection,动物用knockout, transgenic等技术研究其生物学功能.
生物信息处理是当数据量很大, 无法用手工方法处理时采用的方法, 是手工检索前的筛选过程.

作者: utt0989 时间: 2013-10-11 10:52

如何利用GO数据来进行差异基因的统计分析
大家都知道Gene Ontology数据库把所有有基因进行了归类，形成一个网状的复杂结果。

那么如何将从基因芯片得出的大量差异表达基因与GO进行关联分析呢？最大限度的利用GO数据库资源来为芯片结果带来帮助呢？

笔者综合自己的数据分析经验，总结了一些分析项目，供大家参考：

首先是最简单的，就是把差异的基因mapping到相应的GO term上（Gene Ontology中最基本的概念是term。GO里面的每一个entry都有一个唯一的数字标记，形如GO:nnnnnnn，还有一个term名，比如"cell"），这里面有一个问题，就是GO数据库有很多节点，一级二级三级。。。。。那么定位到哪一级比较合理呢，经过很多文献的研究，笔者认为定位在前面三级应该是比较合理的。

第二步就是如何确定哪些GO term是跟我们的芯片结果具有相关性。这就需要做一下统计分析，常规的分析一般是FIsher精确检验。相关公式可以上网查查。最后根据P值，可以确定哪些GO term跟我们的实验在统计上具有显著性。

在两者的基础上，我们还可以做很多的扩展分析，笔者就见过将不同的分组的样本，加上差异的基因和GO的分析结果进行综合分析，将不同的样本分组情况跟GO的结果结合起来，得到了很不错的结果，具体可以参见文章“Integration of GO annotations in Correspondence Analysis:
facilitating the interpretation of microarray data”

其实类似的想法还有很多，相信很多的朋友会有类似的想法或建议，不防拿出来晒晒，好东西要大家一起分享

作者: duoduo 时间: 2013-10-11 10:52

如果用2-D找差异,然后质谱鉴定, 通常得到的差异蛋白不会很多, 如果差异蛋白少于20个, 基本不需要生物信息方法进行分析, 手工检索每个差异蛋白和你所做模型,疾病的联系, 然后综合考虑更有实际意义.根据检索结果, 挑选有潜在意义的蛋白进行验证, 然后根据课题选择其他方法, 像在细胞试验用knock-down, transfection,动物用knockout, transgenic等技术研究其生物学功能.
生物信息处理是当数据量很大, 无法用手工方法处理时采用的方法, 是手工检索前的筛选过程.

======================================================================================

我的差异点经质朴鉴定，有40多个，开始一个一个手工看，发现有点要昏死了，还是想寻求下有没有什么快捷的方法？

作者: qianqin1977 时间: 2013-10-11 10:53

前辈:我在做尿液中蛋白质的1D SDS和LC-MS/MS/MS(LTQ),样本丰富,实验条件还可以,因为是新手,希望能在较短的时间做出来,你有宝贵经验可以赐教吗?

作者: 草木叉 时间: 2013-10-11 10:54

我的差异点经质朴鉴定，有40多个，开始一个一个手工看，发现有点要昏死了，还是想寻求下有没有什么快捷的方法？

===========================================

40个差异点可以先用DAVID分类然后还是手工分类补充。

作者: 草木叉 时间: 2013-10-11 10:54

前辈:我在做尿液中蛋白质的1D SDS和LC-MS/MS/MS(LTQ),样本丰富,实验条件还可以,因为是新手,希望能在较短的时间做出来,你有宝贵经验可以赐教吗?

=====================================================

1。蛋白量多少决定了你可以发现多少蛋白。上样量在200-400 ug之间。
2。用12CM X 12 CM的胶，
3。如果有条件， 4-12 % 或 4-20的梯度胶最好，否则 10%的也可以。
4。胶条大概在40个左右，效果比较好。
5。1D SDS质量一定要高，没有拖尾，条带清晰。
6。如果比较每个样品，定量一定要准确。

作者: qianqin1977 时间: 2013-10-11 10:54

本人原意肾脏疾病患者尿液蛋白质的1D SDS和LC-MS/MS/MS(LTQ),寻找特异性蛋白，但一位仁兄尽然觉得为尽量减少蛋白丢失，提取完蛋白后直接酶解，然后作质谱分析，我惊愕，该仁兄去年做了一些尿蛋白组学的试验，经验比偶多，蛋白组学经典技术路线是：样品---二维电泳---蛋白分离---染色---蛋白质点切割---酶切消化----脱盐/浓缩---点样---质谱分析----鉴定蛋白，按那位仁兄的方法能行吗？能帮我拿个主意吗？
小辈叩谢！

作者: 草木叉 时间: 2013-10-11 10:55

现在MS-based蛋白质组研究技术线路有3种, 2D + MALDI或LC/MS/MS, 1D + LC/MS/MS, 和蛋白酶解后2D(or multi-D)-LC/MS/MS的shotgun方法. 如果有LTQ肯定不用2D胶. 如果有2D-LC/MS/MS 技术成熟, 尿液蛋白质组最好用这种方法, 因为尿液中有很多降解蛋白或多肽, 或许有生物学意义的就在这一部分中. 1D Gel最多分离到5-10KD的蛋白, 小分子的蛋白都看不到.

作者: loli 时间: 2013-10-11 10:55

请教楼主一些细节问题,我现在用的是LTQ进行LC-MS鉴定蛋白。用的是75um*10cm的反向柱，有机相试过甲醇+0.1%甲酸，也试过乙腈+0.2%冰醋酸。梯度十几分钟。你觉得做LC-MS时，用甲醇还是乙腈更合适；拉梯度有从几分钟到几十个小时，应该如何抉择？我总感觉梯度时间长可能含量低的肽段会检不出来。谢谢！

作者: 草木叉 时间: 2013-10-11 10:56

我们用: 0.1% formic acid (v/v)in acetonitrile.
梯度: 如果是大量样品, 用90 min, 如果是检测磷酸化为点用3小时, 3 个小时似乎是效率最高, 如果时间在长并不能增加发现的多肽数.

作者: 89tongzijun 时间: 2013-10-11 10:56

Nice work!

Have a number of questions.

(1) You have a system called MS Result manager in your lab, could you recommend similar systems that freely available?

(2) What do you think of the system described in cuturl('http://www.biomedcentral.com/1471-2105/9/302') ?

(3) I got from some one a lot of results from Mascot. Do you know any tools that extract the useful information? I don't want to write a parser for that.

PS: Did you do your PhD in H & W lab? If yes, we are old friends.

作者: 草木叉 时间: 2013-10-11 10:57 标题: 回复 #39 89tongzijun 的帖子

There are several free software package available for proteomics data analysis. To my knowledge, there are no good free software packages can handle 1D Gel based proteomics data. I haven't published my software, so my software is free or open source now.

That software you mentioned is focused on 2D gel data. I don't know what kind of data you are dealing with.

There are mascot parser available, which you can get it after Google search.
I have written a parser for mascot data long time ago, my software package definitely can handle mascot data. As long as the output file is XML format, or even ASCII format, the results from different search engines could be easily input in my system.
If your data from 1D gel based proteomics or shotgun proteomics, we maybe cooperate to analysis these data. The software can also output label-free quantification result. See the link for detail: cuturl('http://www.dxy.cn/bbs/post/view?bid=65&id=12463538&sty=1')

作者: jrwyyplt 时间: 2013-10-11 10:57

基于1D GEL + 1D-LC/MS/MS的蛋白组研究比较2D Gel based和2D-LC/MS/MS （Shotgun）有一些比较显著的优点。 1D GEL + 1D-LC/MS/MS 比2D Gel based 方法主要是减少很大工作量，可以容易得到整个样品的蛋白质，而不是数个差异点，而且不论使用标记和非标记方法得到的定量结果都理论上比2D准确。因为在2D胶上每个点通常很多蛋白，一个蛋白通常分布在几个点。

想请教楼主以下问题: 尽管在2D胶上每个点可能会有很多蛋白,但与1Dgel相比，蛋白的分离效果应该更好吧。此外，对于1DGEL中有多个蛋白的条带酶解后，混合蛋白是如何分别被鉴定出来的？它的原理是什么？也是基于一种算法吗？对于未测序的物种是否可以用1D GEL + 1D-LC/MS/MS的蛋白组研究方法？此外，想问下定量的具体方法？因为对1D GEL + 1D-LC/MS/MS的方法不了解，希望多多指教！谢谢！

作者: 草木叉 时间: 2013-10-11 10:59

早期的质谱是使用多肽指纹的方法鉴定蛋白的, 样品需要含有尽可能少的蛋白,所以2D Gel 分离方法是比较理想的方法. 现在的质谱都可以MS2鉴定,可以根据MS2结果鉴定蛋白, 所以蛋白混合物也可以鉴定出来. 但是质谱做MS2的速度是有限的, 丰度低的多肽就不会发现, 我们实验室目前可以用一次质谱从蛋白复合物种发现120种蛋白. 这就出现2种主要分离技术线路, 蛋白水平和多肽水平. 蛋白水平就是根据分子量或等电点分离, 就是用1D SDS, IEF分离, 或其他方法, 多肽水平就是用LC, 2D LC, 多维LC的方法分离. LC的方法是最基本的就是 LC-MS/MS.

关于1D SDS分离蛋白还是2D LC和多维LC分离多肽的方法更好些, 可以参考这篇最近的文章.
cuturl('http://www.mcponline.org/cgi/content/abstract/M800190-MCP200v1')
从这篇文章可以看出, 1D SDS可以发现更多的多肽和蛋白. 我们更倾向用1D SDS分离蛋白, 因为这样可以得到分子量信息, 可以发现酶切或降解蛋白. 可以和western对照比较.但缺点是费时, 数据处理繁琐.

定量方法有标记和非标记方法,可以找篇综述了解一下, 我们用非标记方法, 可以看:
非标记定量蛋白质组学研究方法
cuturl('http://www.dxy.cn/bbs/post/view?bid=65&id=12463538&sty=1')

作者: 7437654 时间: 2013-10-11 11:00

学习了最近正在分析2d数据同时也做了1d的page 也发现2d的数据不好分析，我们的实验是在1d 上有很大的差异但在2d上就不明显了，现在想问楼主，可否有把2d的胶图还原到1d 上的软件，我想比较同样的样品在1d 转2d上蛋白是否发生了变化？我觉得应该还原还是有可能的吧，等待答复

作者: xyw5 时间: 2013-10-11 11:00

请教高博士一个问题：有没有针对高分辨率FT-LTQ的比较好的Label-free定量的open source软件呢？谢谢！

作者: yychen 时间: 2013-10-11 11:01

天然激素和重组激素就差一个末端氨基酸不同，生活活性基本相同，三维结构是否相同？譬如牛生长激素。如何知道二者三维结构的有无差异？

作者: yjf1026 时间: 2013-10-11 11:01

相关疾病：
头痛
楼主您好，我想问一个具体的生物信息技术问题

我是初入蛋白质组学的，对生物信息方法不是很了解，现在遇到了一个比较头疼的问题。关于蛋白质的亚细胞器定位，经过LC-MS/MS鉴定后会有一批IPI的数据，大概是1000以上，而那些蛋白定位预测的软件需要的都是蛋白质的序列，EBI的IPI数据库每次只能查询14个IPI号左右，我有1000个左右的IPI，我想问一下用那个数据库可以将这么多IPI的编号批量转换成对应的蛋白质序列。

另外一点就是，如果我想使用GO的注释进行蛋白的亚细胞器分类该怎么办？

这两个问题困扰了我很久，如果蛋白少的话还可以一个一个的做，上千个实在是不知道如何是好，我生物信息的知识很薄弱，希望Dr. Gao可以说得详细一些，谢谢

作者: 草木叉 时间: 2013-10-11 11:02

QUOTE:

原帖由 yjf1026 于 2013-10-11 11:01 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')

相关疾病：
头痛
楼主您好，我想问一个具体的生物信息技术问题

我是初入蛋白质组学的，对生物信息方法不是很了解，现在遇到了一个比较头疼的问题。关于蛋白质的亚细胞器定位，经过LC-MS/MS鉴定后会有一批IPI的数据，大概是100 ...

相关疾病：
头痛
我是写了一段程序处理大量IPI转换成蛋白序列的,然后提交到cuturl('http://www.cbs.dtu.dk/')网站查询, 由于这个网站的程序有限制, 比如targetP 是:
At most 2,000 sequences and 200,000 amino acids per submission; each sequence not more than 4,000 amino acids.
程序里限定以下这些条件就可以. 会写程序的人解决这个问题不难.

GO annotation 细胞定位我也是自己写程序处理的, 你可以使用DAVID (cuturl('http://david.abcc.ncifcrf.gov/home.jsp'))这个网站去分类, 他们做的很好. 使用 GO annotation只能得到部分蛋白定位信息，其他的蛋白定位还是需要计算预测，　Mouse IPI数据库有６４％有annotation, 但是如果使用程序进行处理，对多个IPI对应一个序列进行挑选, 可以提高到94%的注释率. 但这一部对你可能困难些.

我还有一批类似的数据处理, 如果我有时间的话, 可以帮你转换一下.

作者: yjf1026 时间: 2013-10-11 11:02 标题: 回复 #47 草木叉的帖子

后来我又读了一些IPI库的使用说明，发现有个窗口也已一次性的提交70个左右的IPI号码，我想我1000左右的蛋白做几十次搜索也可以得到全部的序列，这种重复次数我还可以忍受，后续的条件限定估计得找一得懂编程的帮忙了。当年学的VB差不多都忘光了，Linux命令还在学习中。

总的说楼主还是推荐使用软件定位，但实验室的师兄以前做过，有的软件预测的偏差还是比较大的，在这里还想问一下，是不是预测某种亚细胞器定位需要RUN两个以上的定位预测软件，还是在signal P和targetP之间选一个就行？

谢谢

作者: 草木叉 时间: 2013-10-11 11:03

QUOTE:

原帖由 yjf1026 于 2013-10-11 11:02 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')
后来我又读了一些IPI库的使用说明，发现有个窗口也已一次性的提交70个左右的IPI号码，我想我1000左右的蛋白做几十次搜索也可以得到全部的序列，这种重复次数我还可以忍受，后续的条件限定估计得找一得懂编程的帮忙了。当年学 ...

因为定位软件还是不那么准确，所以结合多种算法可以增加可信度，编辑审稿时也会觉得你做的严谨。

作者: dog002 时间: 2013-10-11 11:04

请问怎样预测蛋白质的N末端和C末端呢？

作者: yes4 时间: 2013-10-11 11:04

我所用的GO ANNOTATION软件是我自己写的, 我没有找到一个合适的软件处理我的数据, 因为我要比较GO 分类在不同组的差异.

我没有用过BINGGO, 通路分析软件做的最好的是Ingenuity和GeneGO, 两者功能有差别, 各有侧重, 我们使用的都是正式版本, 我估计试用版功能和正式版功能一样,只不过是有时间限制而已.

得到差异蛋白我就是用上面提到的那些方法, GO分析和Pathway分析, 根据分析选定几个感兴趣的蛋白深入功能研究.

================================================================================================

得到的差异蛋白是数据库里已有的蛋白，功能什么都有了，怎么还做功能研究。还有数据库里没有的差异蛋白怎么做深入功能研究？

作者: yes4 时间: 2013-10-11 11:05

40个差异点可以先用DAVID分类然后还是手工分类补充。

======================

DAVID分类在哪可以下到？

欢迎光临分析测试百科 (http://bbs.antpedia.com/)