蛋白质与蛋白组学 » 讨论区 » 经验共享 » 生物信息学概述

采购询价

点击提交代表您同意 《用户服务协议》 《隐私政策》

 
需要登录并加入本群才可以回复和发新贴

标题:生物信息学概述

Neo[使用道具]
四级
Rank: 4


UID 97
精华 15
积分 827
帖子 278
信誉分 132
可用分 1587
专家分 143
阅读权限 255
注册 2007-8-15
状态 离线
1
 

生物信息学概述

什么是生物信息学

    生物信息学(bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科:以核酸、蛋白质等生物大分子数据库为主要对象,以数学、信息学、计算机科学为主要手段,以计算机硬件、软件和计算机网络为主要工具,对浩如烟海的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。并通过对生物信息的查询、搜索、比较、分析,从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等理性知识。在大量信息和知识的基础上,探索生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡等生命科学中重大问题,搞清它们的基本规律和时空联系,建立" 生物学周期表"。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。

    其研究重点主要体现在基因组学(Genomics)和蛋白组学(Proteomics)两方面,具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构与功能的生物信息。目前基因组学的研究出现了几个重心的转移:一是将已知基因的序列与功能联系在一起的功能基因组学研究;二是从作图为基础的基因分离转向以序列为基础的基因分离;三是从研究疾病的起因转向探索发病机理;四是从疾病诊断转向疾病易感性研究。生物芯片(Biochip)的应用将为上述研究提供最基本和必要的信息及依据,将成为基因组信息学研究的主要技术支撑。生物信息学的发展为生命科学的进一步突破及药物研制过程革命性的变革提供了契机。就人类基因组来说,得到序列仅仅是第一步,后一步的工作是所谓后基因组时代 (post-genome era) 的任务,即收集、整理、检索和分析序列中表达的蛋白质结构与功能的信息,找出规律。

与生物信息学关系密切的领域
数学领域:
1. 统计学,包括多元统计学,是生物信息学的数学基础之一;

2. 概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;

3. 运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用;

4. 拓扑学(几何拓扑),在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应用;

5. 函数论,如傅里叶变换和小波变换等都是生物信息学中的常规工具;

6. 信息论,在分子进化、蛋白质结构预测、序列比对中有重要应用,而人工神经网络方法则用途极为广泛;

7. 计算数学,如常微分方程数值解法是分子动力学的基本工具;

8. 群论,在研究遗传密码和DNA序列的对称性方面有重要应用;

9. 组合数学,在分子进化和基因组序列研究中十分有用。

    原则上讲,各种数学理论或多或少或直接或间接都应该在生物学研究中有各种各样的应用,其中包括生物信息学,这种情况正像过去的一、两个世纪,数学应用于物理学一样。而且,生物信息学的发展,又为数学的发展提供了一个新的机遇,可能会产生一些新的分支科学。

计算机科学技术:
   首先是网络技术和数据库(特别是关系型数据库)管理技术,包括极为重要的实验室数据信息管理系统(LIMS)。其它诸如数据整合和可视化、数据挖掘(Data Mining)、基于Unix操作系统的各种软件包以及人工智能,和一些重要算法的复杂性研究。
顶部
Neo[使用道具]
四级
Rank: 4


UID 97
精华 15
积分 827
帖子 278
信誉分 132
可用分 1587
专家分 143
阅读权限 255
注册 2007-8-15
状态 离线
2
 

生物信息学的研究方法及主要内容

生物信息学研究的基本方法

1. 建立生物数据库:核苷酸顺序数据库(GENBANK)、Protein Data Bank(PDB)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库(YEASTS)、美国种质保藏中心(ATCC)、美国专利局数据库(USPO)等;

2. 数据库检索:如Blast等;

3. 序列分析:序列对位排列、同源比较、进化分析等;

4. 统计模型:如隐马尔可夫模型(hidden Markov model, HMM)――基因识别、药物设计;最大似然模型(maximun likelihood model, ML)、 最大简约法(Maximun Parsimony, MP)――分子进化分析等;

5. 算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经网络(artificial neural network)等。

生物信息学研究的主要内容:

    生物信息学的研究内容是伴随着基因组研究而发展的。广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、存储、分配、分析和解释。这个定义的含义是双重的:一是对海量数据的收集、整理与服务,即管理好这些数据;二是从中发现新的规律,也就是利用好这些数据。具体地说,生物信息学是把基因组DNA(脱氧核糖核酸)序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA(核糖核酸)基因的编码区。同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律。在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。

    其研究范围十分广泛,大体包括以下方面:基因组序列分析和解释、药物设计、基因多态性分析、基因表达调控、疾病相关基因鉴定、基因产物结构与功能预报、基因进化、基于遗传的流行病学等:

序列分析

    在基因组测序的原始数据发表后,仍有许多信息研究需要开展,比如注释、同源性分析、基因分类、基因结构分析等,这方面的研究需要建立较优化的数理统计模型,大规模的数据库检索,模式识别和可视化等。

基因进化

    根据多种生物的基因组数据及对垂直进化和平行演化的研究,可以对生命至关重要的基因结构及它的调控进行研究,对此需要建立较完整的生物进化模型,用基因组的数据来鉴别出环境因素对其进化的影响。这些研究成果将对生态环境、环境卫生提出指导性的建议,对研究生命的起源也有重要的科学意义。

药物设计

    生物信息学所提供的数据资料,可以指导对药物作用靶位的选定和药物分子的设计。这种方法有快速高效的特点,它的研究包括大分子结构功能的模拟和预报,药物分子与大分子结合的模拟,关键性基因的致病机制,及生物分子同源性的分析,生物分子在指定细胞的分布和位点等。

基因多态性分析

    即使一个基因的序列已经确定,它只是有代表性的序列之一。在群体的分布中,仍存在有基因的多态性。由于多态性的存在,生物表型及对环境、外源物和药物的反应即不同。研究基因多态性可以对群体的基因共性及其中的基因个性( SNPs)都有明确的认识。

基于遗传的流行病学研究

    流行病学研究是医学信息学的重要课题之一。将流行病学的遗传和非遗传性的研究与分子基因信息结合起来,会导致对疾病的机理、个体对某种疾病的易感性和疾病在群体中的分布有更明确的认识,对疾病的预防和治疗有极大的指导意义。

关键性基因签定

    通过基因与生物表型、致病机制和其它生命现象之间的关联,可以发现一些至关重要的基因,结合定向的生物实验,可以确认新的关键性基因。

基因产物功能预报

    在确认了基因的基础上,通过与已知的基因产物的结构和功能、代谢途径和其它生物功能对照,可以实现新基因产物功能的预报,结合定向的生物实验,可以证实预报的功能。

完整基因组的比较基因组学

   在后基因组时代,生物信息学家不仅有大量的序列和基因而且有越来越多的完整基因组。有了这些资料人们就能对若干重大生物学问题进行分析。有的科学家估计不同人种间基因组的差别仅为 0.1%;人猿间差别约为1%。但他们表型间的差异十分显著。因此其表型差异不仅应从基因、DNA 序列找原因,也应考虑到整个基因组、考虑染色体组织上的差异。
顶部
Neo[使用道具]
四级
Rank: 4


UID 97
精华 15
积分 827
帖子 278
信誉分 132
可用分 1587
专家分 143
阅读权限 255
注册 2007-8-15
状态 离线
3
 

生物信息学参考书籍(入门级)

主要参考书籍:(希望大家补充)

1、David W.Mount 《Bioinformatics :sequence and genome analysis》影印本,科学出版社,2002

2、Durbin R,Eddy S,Krogh A,et al.生物序列分析,蛋白质和核酸的概率论模型[M].北京:清华大学出版社,2002& h3

3、帕夫纳,计算分子生物学: 算法逼近,化学工业出版社,2004

4、(巴西) J.塞图宝,J.梅丹尼斯著,朱浩 等译,计算分子生物学导论 ,科学出版社,2003;

5、Masatoshi Nei(根井正利) Sudhir Kumar. 译者:吕宝忠,钟扬,高莉萍,高等教育出版社,2002

6、[美][巴森文尼斯]Andreas D.Baxevanis,[美]B.F.Francis Ouellette著;李衍达,孙之荣等译,生物信息学:基因和蛋白质分析的实用指南,,清华大学出版社, 2000

7、鲍尔迪,DNA芯片和基因表达:从实验到数据分析与模建,科学出版社,20036

8、(美)利布莱尔,蛋白质组学导论:生物学的新工具,科学出版社,2005

9、张亮,M.谢纳[美] ,生物芯片分析,科学出版社,2004

10、卢因,基因VⅢ,科学出版社,2005

11、(英)D.R.韦斯特海德(D.R. Westhead)等著;王明怡等译, 生物信息学,科学出版社 2004

12、(法)皮埃尔·巴尔迪(Pierre Baldi),(丹)索恩·布鲁纳克(Soren Brunak)著;张东晖等译,生物信息学:机器学习方法,中信出版社,2003

13、(美)Cyntbia Gibas,Per Jambecks著;孙超等译 《生物信息学中的计算机技术》中国电力出版社,2002

14、(美) Dan E. Krane, Michael L. Raymer著, 孙啸,陆祖宏,谢建明 等译,生物信息学概论, 清华大学出版社2004

15、(加)S.米塞诺, (美)S.A.克拉维茨著;欧阳红生, 阮承迈, 李慎涛等译,生物信息学方法指南,科学出版社, 2005

16、孙之荣 主译 探索基因组学、蛋白质组学和生物信息学(中译版) , 科学出版社, 2004年8月出版

17、哈特尔,遗传学:基因与基因组分析,科学出版社,20022

18、生物信息学若干前沿问题的探讨:中国科协第81次青年科学家论坛论文集/黄德双等主编, 中国科学技术大学出版社 2004

19、胡松年 , 薛庆中 主编,《基因组数据分析手册》浙江大学出版社, 2003

20、胡松年 ,基因表达序列标签(EST)数据分析手册,浙江大学出版社, 2005;


21、李敏强,寇纪淞,林丹,李书全,遗传算法的基本理论与应用. 科学出版社. 2002年4月/

22、孙啸, 陆祖宏, 谢建明编著,生物信息学基础, 清华大学出版社2005

23、李霞 主编,《现代生物信息学理论与实践》,科学出版社,2005年11月出版"

24、袁建刚等主译 《基因组》 科学出版社,20027

25、黄韧等 《生物信息学网络资源与应用》中山大学出版社,2003

26、郝柏林等编 《生物信息学手册》第2版,上海科学技术出版社,2002

27、蒋彦等编 《基础生物信息学及应用》清华大学出版社,科学出版社,2003

28、张继仁 (译)蛋白质组学导论:生物学的新工具,科学出版社,2004年12月出版,

29、夏其昌,白质化学与蛋白质组学,科学出版社,2004年6月

30、蒋华良、钟扬、陈国强、罗小民 等译 药物基因组学——寻找个性化治疗,科学出版社,2005年7月出版

31、David W.Mount 著 钟扬,王莉,张亮 主译,生物信息学,高等教育出版社,2003

32、张阳德编,《生物信息学》科学出版社,2004

33、沈世镒著,生物序列突变与比对的结构分析,科学出版社 2004

34、赵国屏等编《生物信息学》科学出版社,2002

35、郑珩 王非,药物生物信息学, 化学工业出版社,2004

36、Minoru Kanehisa著;孙之荣等译,后基因组信息学, 清华大学出版社, 2002

37、赵雨杰 主编,医学生物信息学,人民军医出版社,2002

38、李桂源,钱骏主编,基于WWW的生物信息学应用指南,中南大学出版社 2004

39、李巍主编,生物信息学导论,郑州大学出版社,2004

40、钱小红、贺福初等译蛋白质组学:从序列到功能. 科学出版社,2002年9月6

41、钱小红,贺福初主编.蛋白质组学:理论与方法,科学出版社,2003

42、张阳德,纳米生物技术学,科学出版社,2005

43、李越中 闫章才 高培基 ,基因组研究与生物信息学,山东大学出版社,2003
顶部