小中大(4) 氨基酸组分分析. 1977年首次作为鉴定蛋白质的一种工具,是一种独特的“脚印”技术. 利用蛋白质异质性的氨基酸组分特征,成为一种独立于序列的属性,不同于肽质量或序列标签. Latter首次表明氨基酸组分的数据能用于从2-DE凝胶上鉴定蛋白质[33]. 通过放射标记的氨基酸来测定蛋白质的组分,或者将蛋白质印迹到PVDF膜上,在155℃进行酸性水解1 h,通过这一简单步骤的氨基酸的提取,每一样品的氨基酸在40min内自动衍生并由色谱分离,常规分析为100个蛋白质/周[3]. 依据代表两组分间数目差异的分数,对数据库中的蛋白质进行排榜,“冠军”蛋白质具有与未知蛋白质最相近的组分,考虑冠亚军蛋白质分数之间的差异,仅处于冠军的蛋白质的可信度大. Internet上存在多个程序可用于氨基酸组分分析,如AACompIdent,ASA,FINDER,AAC-PI,PROP-SEARCH等,其中,在PROP-SEARCH中,组分、序列和氨基酸的位置被用来检索同源蛋白质[2]. 但仍存在一些缺点,如由于不足的酸性水解或者部分降解会产生氨基酸的变异. 故应联合其他的蛋白质属性进行鉴定.
4 蛋白质组研究的百科全书 数据库(database)
蛋白质组数据库(proteome database)被认为是蛋白质组知识的储存库,包含所有鉴定的蛋白质信息,如蛋白质的顺序、核苷酸顺序、2-D PAGE、3-D结构、翻译后的修饰、基因组及代谢数据库等. 例如,SWISS-2DPAGE数据库包括人类,细菌,细胞等物种的信息[34]. 其中,E.coli SWISS-2DPAGE数据库是EXPASY分子生物学服务器的一部分,通过www的URL网址cuturl('http://www.expasy.ch/ch2d/ch2d-top.html')[35]可以查询.
当前的计算机和网络技术,让我们将所有的数据库连在一起,并允许我们从一个数据库中的一条信息遨游到其他的数据库;将一个研究对象的数据与其他各种蛋白质组中的相关数据或图谱相连. 分析型软件工具被称为蛋白质组分析机器人、数据分析软件包. 在既定的状态下,定量研究蛋白质的表达水平,或者计算机辅助数据库系统建立可将实验推进一步.因此,蛋白质组分析技术联合蛋白质数据库,计算机网络和其他软件包合在一起称为蛋白质组的机控百科全书(Cyber-encyclopaedia of the proteome)[18].
蛋白质组和基因组共同分析可以产生大量的数据. 当评估每一个数据库的价值时,难免要考虑两个条件:1)数据库是否在任一时刻保持最新;2)何时能够相互连接,且以整体状态评估. 目前的发展趋势:1)信息量呈指数增长;2)蛋白质组计划的实施会产生新的数据库;3)致力于模拟细胞内蛋白质的相互作用的新型数据库;4)建立高级、智慧型的咨询工具是必需的[18].
5 蛋白质组技术的规模 高流通量筛选(HTS)
HTS(High throughput screening)至今在蛋白质组研究中已成为现实. 在最近的一年内,由于制药工业对此的需求,样品输入自动化得以进展. 目前,正在设计的机器人可自动处理2-DE后电转至PVDF膜. 原形机器人加工、传输蛋白质至质谱或以液相色谱为基础的分析仪,如进行斑点切割,操纵、控制多种PMF、氨基酸组分分析所需的化学反应,使每天最小的流通量达1000个蛋白. 此外,必须选择适用的软件包,如应用第二代COMBINED来处理输出的数据,自动咨询本地或网上的数据库而进行系列的评估. 大量的数据分析表明HTS是刻不容缓的. 目前,对质谱已设想一个三级方案来处理大规模的蛋白质组:1)MALDI-TOF-MS以每天大于1000个蛋白的速率分析;2)通过ESI-MS/MS或SEQUEST,以每天每台机器分析几打蛋白质的速率进行序列标签;3)对由串联质谱所得的新蛋白或有意义蛋白进行全长肽段的测序,从而提供足够的信息通过核酸探针或简并PCR引物获得有意义的基因[2,36].
综上所述,高分辨率、高敏感性和高流通性的分离和分离后鉴定技术,结合准确、全面的数据库技术, 使蛋白质组技术用于生物研究卓有成效. 但仅鉴定蛋白质是不够的,蛋白质组世界的挑战是完善蛋白质质和量的分析,设想细胞活性、功能的全体性概念. 在此基础上,蛋白质组分析将会促进未来生命科学的整体发展.