蛋白质与蛋白组学 » 讨论区 » 经验共享 » 【讨论帖】蛋白质组数据的生物信息学处理

采购询价

点击提交代表您同意 《用户服务协议》 《隐私政策》

 
需要登录并加入本群才可以回复和发新贴

标题:【讨论帖】蛋白质组数据的生物信息学处理

草木叉[使用道具]
三级
Rank: 3Rank: 3


UID 114480
精华 2
积分 304
帖子 239
信誉分 104
可用分 1962
专家分 20
阅读权限 255
注册 2013-9-25
状态 离线
21
 

检索时最好用同一数据库, 如果不同数据库, 比较多肽序列, 绝大多数情况是一样的蛋白, 不一样的名称, ID.
也可以用gene name去统一, 不同数据库, 不同isoform的蛋白通常是一个gene name.
如果比较不同论文中的数据可以用IPI数据库中(cuturl('ftp://ftp.ebi.ac.uk/pub/databases/IPI/current/')) xrefs 交互关联表查询.
顶部
mysmdbl[使用道具]
三级
Rank: 3Rank: 3


UID 77053
精华 0
积分 314
帖子 327
信誉分 100
可用分 2446
专家分 0
阅读权限 255
注册 2011-11-12
状态 离线
22
 

请教楼主
你所用的批量GO ANNOTATION 是什么软件啊?
请问BINGO 这个软件是否好用,好像也用来进行信号通路分析
请问ingenuity Ingenuity Pathways Analysis 软件试用版是否好用?
还有其它类似软件吗?

能不能谈谈在蛋白质组实验后得到了大量差异蛋白点的数据
可以做哪些分析,该用到什么软件啊?
个人对蛋白组的感觉是花架子,所以做着没有动力啊。
顶部
草木叉[使用道具]
三级
Rank: 3Rank: 3


UID 114480
精华 2
积分 304
帖子 239
信誉分 104
可用分 1962
专家分 20
阅读权限 255
注册 2013-9-25
状态 离线
23
 

我所用的GO ANNOTATION软件是我自己写的, 我没有找到一个合适的软件处理我的数据, 因为我要比较GO 分类在不同组的差异.

我没有用过BINGGO, 通路分析软件做的最好的是Ingenuity和GeneGO, 两者功能有差别, 各有侧重, 我们使用的都是正式版本, 我估计试用版功能和正式版功能一样,只不过是有时间限制而已.

得到差异蛋白我就是用上面提到的那些方法, GO分析和Pathway分析, 根据分析选定几个感兴趣的蛋白深入功能研究.
顶部
lxh031[使用道具]
三级
Rank: 3Rank: 3


UID 76425
精华 0
积分 335
帖子 389
信誉分 100
可用分 2726
专家分 0
阅读权限 255
注册 2011-11-5
状态 离线
24
 
我还想问问
KOBAS 分析系统是否好用?
顶部
草木叉[使用道具]
三级
Rank: 3Rank: 3


UID 114480
精华 2
积分 304
帖子 239
信誉分 104
可用分 1962
专家分 20
阅读权限 255
注册 2013-9-25
状态 离线
25
 

我以前没有用过KOBAS,Google后才知道是北大做的,既然是免费的, 而且有server可以运行, 你可以试试看。
顶部
duoduo[使用道具]
四级
Rank: 4


UID 74511
精华 0
积分 705
帖子 1009
信誉分 100
可用分 5926
专家分 0
阅读权限 255
注册 2011-10-11
状态 离线
26
 
感觉该JPR的工作是去年Nature Medicine的副产物,将数据进行了扩大和大规模的分析,确实是蛋白质组数据的生物信息学处理的典范. 也许Vitreous 中的蛋白质含量少,不然扩大数据集同时提高数据的精确度, 也许可以象Mattias Mann发在Genome biology上的很多工作,发更好的杂志.

有几个问题想请教:
1. 对你的蛋白降解修饰很感兴趣, 好象没在其他文章上看过相关分析,也许是你定量分析方法的一个优势所在. 请问对绝大部分的1-D PAGE上的蛋白质, 蛋白质在不同bands中的相对定量是否有一定规律? 是否呈现正态分布? 象你文章中的vitronectin蛋白好象就没有任何规律?

2. 我感觉对数据集的生物信息学分析, 意义有限. 其他领域的科研人员能够从中间得到的信息比较有限. 其意义和出口还是要从中选择一些有意义的东西往后深入(就象你们Nature Medicine的工作), 风险很大,需要很强的背景知识. 也许这就是所谓的系统生物学研究的一部分. 不知道Dr. Gao怎么理解? 谢谢.
3. 还有对与于亚细胞器的蛋白质组数据集, 进行生物信息学分析, 该如何开展? 例如细胞膜, 进行蛋白质相互作用和pathway分析好象都受到了限制, 如纯度问题的影响.

再次感谢.

======================================================

请问是哪篇Nature Medicine的文章,可否给出文章题目或者链接,想看看。
顶部
草木叉[使用道具]
三级
Rank: 3Rank: 3


UID 114480
精华 2
积分 304
帖子 239
信誉分 104
可用分 1962
专家分 20
阅读权限 255
注册 2013-9-25
状态 离线
27
 


QUOTE:
原帖由 duoduo 于 2013-10-11 10:48 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')
感觉该JPR的工作是去年Nature Medicine的副产物,将数据进行了扩大和大规模的分析,确实是蛋白质组数据的生物信息学处理的典范. 也许Vitreous 中的蛋白质含量少,不然扩大数据集同时提高数据的精确度, 也许可以象Mattia ...

http://www.dxy.cn/bbs/actions/archive/post/8312904_1.html?tpg=1
顶部
duoduo[使用道具]
四级
Rank: 4


UID 74511
精华 0
积分 705
帖子 1009
信誉分 100
可用分 5926
专家分 0
阅读权限 255
注册 2011-10-11
状态 离线
28
 
生物信息学分析是对结果分析,归纳,理解的一个方法。蛋白质组和基因组方法都是一样的,当我们发现数十种数百种有差异蛋白时,只有从这种方法入手,对富集的每个分类,每个pathway的单个蛋白进行更进一步查阅, 找出有可能有生物学意义的蛋白进一步研究。所以,生物信息学分析是一个筛选过程。

===========================================================================================================

我做的是2-D,找出差异后做质谱。质谱得出的蛋白点应该怎么分析呢?是不是应该先得看看每个差异点大概都是什么?如果要用生物信息学方法进行分析,如对相关的蛋白质做通路分析,应该用什么方法或者软件呢?因为后续的研究可能对蛋白质功能等方面比较感兴趣。我是初学者,能否请楼主对这一问题做一简要总结。不甚感激。
顶部
草木叉[使用道具]
三级
Rank: 3Rank: 3


UID 114480
精华 2
积分 304
帖子 239
信誉分 104
可用分 1962
专家分 20
阅读权限 255
注册 2013-9-25
状态 离线
29
 


QUOTE:
原帖由 duoduo 于 2013-10-11 10:50 发表 bbcodeurl('http://bbs.antpedia.com/images/common/back.gif', '%s')
生物信息学分析是对结果分析,归纳,理解的一个方法。蛋白质组和基因组方法都是一样的,当我们发现数十种数百种有差异蛋白时,只有从这种方法入手,对富集的每个分类,每个pathway的单个蛋白进行更进一步查阅, 找出有可能有生物学 ...

如果用2-D找差异,然后质谱鉴定, 通常得到的差异蛋白不会很多, 如果差异蛋白少于20个, 基本不需要生物信息方法进行分析, 手工检索每个差异蛋白和你所做模型,疾病的联系, 然后综合考虑更有实际意义.根据检索结果, 挑选有潜在意义的蛋白进行验证, 然后根据课题选择其他方法, 像在细胞试验用knock-down, transfection,动物用knockout, transgenic等技术研究其生物学功能.
生物信息处理是当数据量很大, 无法用手工方法处理时采用的方法, 是手工检索前的筛选过程.
顶部
utt0989[使用道具]
四级
Rank: 4


UID 78340
精华 1
积分 660
帖子 975
信誉分 102
可用分 5663
专家分 10
阅读权限 255
注册 2011-11-28
状态 离线
30
 

如何利用GO数据来进行差异基因的统计分析
大家都知道Gene Ontology数据库把所有有基因进行了归类,形成一个网状的复杂结果。

那么如何将从基因芯片得出的大量差异表达基因与GO进行关联分析呢?最大限度的利用GO数据库资源来为芯片结果带来帮助呢?

笔者综合自己的数据分析经验,总结了一些分析项目,供大家参考:

首先是最简单的,就是把差异的基因mapping到相应的GO term上(Gene Ontology中最基本的概念是term。GO里面的每一个entry都有一个唯一的数字标记,形如GO:nnnnnnn,还有一个term名,比如"cell"),这里面有一个问题,就是GO数据库有很多节点,一级二级三级。。。。。那么定位到哪一级比较合理呢,经过很多文献的研究,笔者认为定位在前面三级应该是比较合理的。

第二步就是如何确定哪些GO term是跟我们的芯片结果具有相关性。这就需要做一下统计分析,常规的分析一般是FIsher精确检验。相关公式可以上网查查。最后根据P值,可以确定哪些GO term跟我们的实验在统计上具有显著性。

在两者的基础上,我们还可以做很多的扩展分析,笔者就见过将不同的分组的样本,加上差异的基因和GO的分析结果进行综合分析,将不同的样本分组情况跟GO的结果结合起来,得到了很不错的结果,具体可以参见文章“Integration of GO annotations in Correspondence Analysis:
facilitating the interpretation of microarray data”

其实类似的想法还有很多,相信很多的朋友会有类似的想法或建议,不防拿出来晒晒,好东西要大家一起分享
顶部