学习生物信息学需要数学和计算机达到什么程度?
一、生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(Bioinformatics is a new subject of genetic data collection,analysis and dissemination to the research community)。(林华安,Dr. Hwa A. Lim,1987)。
二、生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持(Bioinformatics refers to database-like activities,involving persistent sets of data that are maintained in a consistent state over essentially indefinite periods of time)。(林华安,Dr. Hwa A. Lim,1994)。
三、生物信息学是在大分子方面的概念型的生物学,并且使用了信息学的技术,这包括了从应用数学、计算机科学以及统计学等学科衍生而来各种方法,并以此在大尺度上来理解和组织与生物大分子相关的信息。(Luscombe,2001)。
具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:⑴新算法和统计学方法研究;⑵各类数据的分析和解释;⑶研制有效利用和管理数据新工具。
生物信息学是一门利用计算机技术研究生物系统之规律的学科。
生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。
数学方面:
1. 离散数学,主要应用是mapping和assemblying的图论算法
2. 概率论和统计,主要研究包括error correction以及一些k mer based的算法。但是很多paper都会搞一些概率模型在里面,更多的是统计系做生物统计的人做的,暂时认为生物信息不包括生物统计。
3. 矩阵运算,包括线性代数的一般运算,这应用在计算机图形学的算法中,还有比如模式识别算法等需要矩阵的微分和积分运算。这就牵扯出下面的:
4. 微积分, 很多人都觉得生物信息包括计算机算法很少运用到微积分模型,但是由于生物里面有个什么理论说所有的进化啊蛋白质折叠都遵循能量最小,就搞出来个信息熵的概念,以及很多地方的minimum likelihood算法对概率计算的要求,微积分的应用也有很多。我上面提到的这些只是泛泛说了下,并举了几个研究方向的例子,如果详细说可能要说很多很多,不是数学专业的,对数学的整体架构和分类理解都不深。