小中大【求助】关于蛋白质组学检测结果分析求助
组织样品送到检测公司检测出来了,并做了相关的生物信息学分析,但是我自己拿到数据后仍然感觉无从下手,故向大神们求助~
有一个问题困扰了我好久~在GO以及KEGG分析过程中,检测公司的流程是先把筛选出来的差异蛋白在数据库中进行基因定位,找到相对应的基因,然后在把这些基因在GO以及KEGG数据库中进行检索。因此得到的结果就是这些差异蛋白定位到的基因的功能注释信息。那么问题来了,通过这种方式会在基因定位环节过滤掉了所有无法在数据库中找到其相对应的基因的蛋白(比如说某个对比一共有440种差异蛋白,但是能在数据库中定位到相对应基因的也就200种左右),这样的话很有可能我需要找的差异蛋白在GO以及KEGG功能注释中因为被过滤掉而没有注释。比如说我某个对比一共有400多种差异蛋白,但是在GO分析每个过程也就映射出不到20来种基因,一共不到10个term,每个TERM都只映射到三到五个基因,这种情况正常吗?我看文献一般蛋白质组分析功能注释时GO以及KEGG不是都是用差异蛋白直接跟数据库比对吗?我咨询检测公司技术人员他给我的答复原话是“不排除有可能可以直接用蛋白分析,但是我就知道用基因分析这种方法”。所以我想请教各位大神们,这算不算是数据分析上的漏洞呢?