生物信息学简介

上传人:无*** 文档编号:140304631 上传时间:2022-08-23 格式:PPT 页数:43 大小:177.02KB
收藏 版权申诉 举报 下载
生物信息学简介_第1页
第1页 / 共43页
生物信息学简介_第2页
第2页 / 共43页
生物信息学简介_第3页
第3页 / 共43页
资源描述:

《生物信息学简介》由会员分享,可在线阅读,更多相关《生物信息学简介(43页珍藏版)》请在装配图网上搜索。

1、揭开生命奥秘的新兴交叉学科揭开生命奥秘的新兴交叉学科第七章第七章 生物信息学生物信息学内内 容容n生物信息学概念 n生物信息学的内容n生物信息学的研究方法和技术n生物信息学软件和数据库一、生物信息学的概念(p199)生物信息学是用生物信息学是用数理数理和信息科学和信息科学的观点、理的观点、理论和方法,以论和方法,以计算机计算机为为工具对工具对生物信息生物信息进行收进行收集、加工、储存、传播、集、加工、储存、传播、检索和分析的科学。检索和分析的科学。研究材料和结果是各研究材料和结果是各种各样的生物学数据种各样的生物学数据n人基因组海量信息n23对=46条染色体n30亿碱基对(base pairs

2、)n35万个基因基因组学n3万种以上蛋白质 蛋白质组学n基因表达、作用、调控网络已经或即将完成的生物全基因组n几百种原核生物n酵母菌n拟南芥(1-2亿bp)n水稻n人类(32亿bp)n小鼠n大鼠n猪n鸡.等生物信息学的概念生物信息学的概念n后基因组时代的到来后基因组时代的到来n人类首次了解了自身的基因序列,了解人类首次了解了自身的基因序列,了解了很多远亲生物的基因序列了很多远亲生物的基因序列n正在面对指数扩增的基因序列和各种数正在面对指数扩增的基因序列和各种数据库据库n面临如何将基因序列资料转变为有用的面临如何将基因序列资料转变为有用的知识,进而服务于人类,造福人类健康知识,进而服务于人类,造

3、福人类健康的挑战的挑战n人类功能基因组学必须多学科协作人类功能基因组学必须多学科协作n生物信息学技术生物信息学技术n生物芯片技术生物芯片技术n蛋白质组学技术蛋白质组学技术n高通量细胞筛选技术等高通量细胞筛选技术等n生物信息学是人类功能基因组学研生物信息学是人类功能基因组学研究的必要工具究的必要工具实验实验生物学生物学计算计算生物学生物学理论理论生物学生物学生物信息的开发和应用生物信息的开发和应用n以核酸蛋白质等生物大分子为主要研究对象n以信息、数理、计算机科学为主要研究手段n以计算机网络为主要研究环境n以计算机软件为主要研究工具n对序列数据进行存储、管理、注释、加工n对各种数据库进行查询、搜索

4、、比较、分析n构建各种类型的专用数据库信息系统n研究开发面向生物学家的新一代计算机软件生物信息学的概念生物信息学的概念 计算机学、计算机网络医学生物学、分子生物学生物信息学数学、统计学生物信息学和其它学科的关系生物信息学和其它学科的关系生物信息学是一门生物信息学是一门边缘学科,它位于边缘学科,它位于生物、医学、计算生物、医学、计算机、数学等多个领机、数学等多个领域的交叉点上域的交叉点上生物信息学的概念生物信息学的概念计算机辅助药物筛选高通量虚拟筛选方法分子数据库,组合化学化合物库,靶标生物大分子的功能分析.蛋白质蛋白质相互作用识别,信号传导系统、代谢途径的分子模拟.图像处理、聚类分析、表达谱和

5、调控网络分析.计算机辅助先导化合物设计、药物设计二、生物信息学的内容(二、生物信息学的内容(p200)1.1.基因与基因组分析基因与基因组分析 可读框预测和可读框预测和基因标注基因标注序列拼接序列拼接与组装与组装结果上传到数结果上传到数据库据库碱基读取载体标识与去除载体标识与去除测序仪中原始数测序仪中原始数据的采样与分析据的采样与分析大规模基因序列测定大规模基因序列测定生物信息学的内容生物信息学的内容基因预测基因预测DNADNA序列中编码区的鉴定序列中编码区的鉴定 预测方法的依据预测方法的依据:编码统计学:编码区序列同非编码区序列相比,有编码统计学:编码区序列同非编码区序列相比,有不同的特点,

6、存在一些非随机的特点不同的特点,存在一些非随机的特点 GC GC 含量含量 密码子偏倚性密码子偏倚性 (CODON FREQUENCY)(CODON FREQUENCY)第三个碱基组成第三个碱基组成 基因结构基因结构/统计学方法统计学方法 比较比较/同源性同源性生物信息学的内容生物信息学的内容原核生物基因结构原核生物基因结构编码区启动子转录起始位点非翻译区转录区起始密码子终止密码子53转录终止位点RBS生物信息学的内容生物信息学的内容5启动子转录起始位点非翻译区转录区起始密码子 终止密码子3转录终止位点外显子 切除和拼接位点GTAG内含子生物信息学的内容生物信息学的内容lHMM?lHMM 描述

7、了模型中各隐含状态的转换概率基因组序列基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCGIntronsExon隐含状态隐含状态用于基因预测的隐马尔可夫模型HiddenMarkovModels,HMMATGCGTGCAGTCACCAGCAGTCAGTCG基因组序列基因组序列生物信息学的内容生物信息学的内容特定状态碱基对的概率取决于它前面碱基对的状态 向另一种状态的转换概率取决于转换信号的出现(剪切位点)和/或 在特定隐藏状态的碱基对平均数量(即内含子或外显子大小).IntronsExonP=0.5P=0.8基因组序列基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCG用

8、于基因预测的隐马尔可夫模型用于基因预测的隐马尔可夫模型生物信息学的内容生物信息学的内容n研究主要集中在核苷酸序列的存储、分类、检索和分析等方面n新基因的发现n非蛋白编码区生物学意义的分析n基因组整体功能及其调节网络的系统把握n基因组演化与物种演化基因组分析基因组分析生物信息学的内容生物信息学的内容n蛋白质结构蛋白质结构n新蛋白的完整、精确和动新蛋白的完整、精确和动态的三维结构态的三维结构n计算机辅助结构模拟计算机辅助结构模拟n理解蛋白质的氨基酸序列理解蛋白质的氨基酸序列和三维结构之间的关系和三维结构之间的关系n蛋白质序列及特性分析蛋白质序列及特性分析n蛋白质组学蛋白质组学2.2.蛋白质与蛋白质

9、组分析蛋白质与蛋白质组分析生物信息学的内容生物信息学的内容相当数量的蛋白质、核酸、多糖的三维结构获得精确测定,基于生物大分子结构知识的药物设计成为热点;根据靶标分子与药物分子相结合的活性部位的几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。3 3 新药设计新药设计三、生物信息学的研究方法和技术 n数学统计方法n在分析DNA语言中的语义、分析密码子使用频率、利用马尔可夫模型进行基因识别n动态规划(Dynamic Programming)方法n一种通用的优化方法:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。nDNA序列或者蛋白质序列

10、的两两对比排列n模式识别技术n两种方法n根据统计特征进行识别n根据对象的结构特征进行识别,常用句法识别。nDNA序列上功能位点和特征信号的识别n数据库技术n生物分子信息的存储、管理、查询等功能建立在数据库管理系统之上n人工神经网络技术n在功能上、结构上模拟大脑神经网络n神经网络计算速度快,更具有分析智能n应用:神经网络计算在优化和模式识别方面具有非常强的能力n基因识别、蛋白质结构预测上神经网络都取得了比其它方法更为准确的结果n分子模型化技术n利用计算机分析分子结构。通过交互操作平移、旋转和缩放分子的三维结构,从不同的角度观察分子构象和形状n分子力学和量子力学计算n主要基于半经验势函数的分子力学

11、方法研究生物大分子的构象n量子力学在确定势函数的参数和研究局部性质n分子动力学模拟n研究蛋白质的构象及动力学,是计算机模拟实验的基础n遗传学运算规则nOptimisers/EvolversnDNA computingEvolutionary Computation(Metaphors from DNA to Selection)生物信息学的研究方法和技术生物信息学的研究方法和技术“HalfdayontheWeb,savesyouhalfmonthinthelab”n专家系统n将有关专家的知识和经验以一定的知识表示形式(如产生式规则、语义网络等)存放在计算中以智能的方式帮助提供参考性决策。如用于

12、基因识别nInternet技术n交流:通过Internet网交流生物分子数据n查阅:从Internet网上查生物分子数据,如原始的序列、结构数据,加工处理的数据n服务:将所要处理的数据直接送到相应的网络服务器上,服务器接受你的处理请求,并将处理结果返回给你生物信息学的研究方法和技术生物信息学的研究方法和技术 国外一直非常重视生物信息学的发展,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增n1979年,美国洛斯阿拉莫斯国家实验室建立起GenBank数据库;n1982年,欧洲分子生物学实验室提供核酸序列数据库EMBL的服务;n1984年,日本

13、着手建立国家级的核酸序列数据库DDBJ并于1987年开始提供服务四、常用的分子生物学软件和数据库(p210)国内对生物信息学领域也越来越重视n1997年3月,北京大学于成立了生物信息学中心;n2000年3月,中科院上海生命科学研究院成立n其他,北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在DNA序列的几何学分析方面等等软件和数据库软件和数据库n基因图谱数据库n核酸序列数据库n蛋白质序列数据库n大分子结构数据库等n国际著名的生物信息中心nNCBI National Center for Biot

14、echnology Information(US)nEBI European Bioinformatics Institute(EU)nHGMP Human Genome Mapping Project Resource Centre(UK)nExPASy Expert of Protein Analysis System(Switzerland)nCMBI Centre of Molecular and Biomolecule(The Netherlands)nANGIS National Genome Information Service(Australia)nNIG National

15、Institute of Genetics(Japan)nBIC National Bioinformatics Centre(Singapore)1.数据库n国内部分生物信息学和生物医学信息服务器n北京大学生物信息中心http:/n中国生物信息http:/www.biosino.org/n北京大学物理化学研究所http:/n北京医科大学生物医学信息http:/n中国科学院微生物研究所http:/n天津大学生物信息中心http:/n中科院计算所智能信息处理重点实验室生物信息学研究组http:/ data synchronization软件和数据库软件和数据库GenBank的增长图片来自http

16、:/www.ncbi.nlm.nih.gov/Genbank/genbankstats.html软件和数据库软件和数据库资料来自:http:/www.ddbj.nig.ac.jp/images/ddbjnew/DBGrowth-e.gif2005年6月发行的第84版EMBL数据库中,总计超过4525万条、491亿碱基数量的数据库软件和数据库软件和数据库PublicfreeAvailableviaInternet三大基因数据库之间的关系NucleotideSequenceDatabase(entry)2005.6.15完整序列软件和数据库软件和数据库蛋白质信息资源数据库(PIR)n主要提供按同源

17、性和分类学组织的综合性、非冗余数主要提供按同源性和分类学组织的综合性、非冗余数据库据库nPIRPIR由美国华盛顿的国家医学研究基金会支持,德国由美国华盛顿的国家医学研究基金会支持,德国马普学会的慕尼黑蛋白质序列信息中心马普学会的慕尼黑蛋白质序列信息中心(MIPS)(MIPS)和日本和日本国际蛋白质序列数据库国际蛋白质序列数据库(JIPID)(JIPID)共同维护。共同维护。nPIRPIR通过提供蛋白质序列数据库、衍生的相关数据库通过提供蛋白质序列数据库、衍生的相关数据库及相应的软件而支持有关分子进化、功能基因组学和及相应的软件而支持有关分子进化、功能基因组学和计算生物学方面的研究,计算生物学方

18、面的研究,软件和数据库软件和数据库蛋白质结构数据库(PDB)n由美国自然科学基金会、能源部和国立卫生研究院共同投资建立n主要由X-射线晶体衍射和核磁共振(NMR)测得的生物大分子三维结构组成n用户可直接查询、调用和观察库中所收录的任何大分子三维结构软件和数据库软件和数据库PBD数据的增长软件和数据库软件和数据库2.软件n序列对比和数据库搜索软件BLAST,FASTA,BLITZ等n生物大分子可视化软件有Rasmol,Mage,Raster3d,Grasp等n与蛋白质结构有关的程序有Procheck,WHATIF,DSSP等n大型分子生物学软件包如GCG.n在基因识别著名软件GRAIL、Gene

19、ID、GeneMark等n蛋白质二级结构预测程序PHD 软件和数据库软件和数据库序列分析软件DNAMANhttp:/ BioSoft公司开发的高度集成化的分子生物学应用软件,几乎可完成所有日常核酸和蛋白质序列分析工作,包括多重序列对齐、PCR引物设计、限制性酶切分析、蛋白质序列分析、质粒绘图等。具有面向Windows和Macintosh两个版本。软件和数据库软件和数据库综合序列分析软件BioEdithttp:/www.mbio.ncsu.edu/BioEdit/bioedit.html软件和数据库软件和数据库序列分析与管理软件Omigahttp:/ NTIhttp:/ NTI软件管理序列和进行

20、片段重叠群分析 n用Vector NTI软件分析蛋白质序列的跨膜区及显示蛋白质的三维结构软件和数据库软件和数据库RasMol软件显示分子结构示意图蛋白质三维分子结构显示软件RasMol软件和数据库软件和数据库综合生物信息学资源生物软件网http:/www.bio-n生物信息学研究是利用数理统计、模式生物信息学研究是利用数理统计、模式识别、动态规划、密码解读、语意解析、识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及隐信令传递、神经网络、遗传算法以及隐马氏模型等各种方法马氏模型等各种方法n对序列、结构数据进行对序列、结构数据进行定性和定量分析定性和定量分析,从中获取基因编码、基因调控、序列从中获取基因编码、基因调控、序列-结结构构-功能关系等理性知识功能关系等理性知识n阐明细胞、器官和个体的发生、发育、阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和病变、衰亡的基本规律和时空联系时空联系n探索生命起源、生物进化、生命本质等探索生命起源、生物进化、生命本质等重大理论问题,最终建立重大理论问题,最终建立“生物学周期生物学周期表表”小结小结n生命科学生命科学+信息科学信息科学n运筹于帷幄运筹于帷幄(计算计算)之中之中n从实验中来,到实验中去从实验中来,到实验中去 n游戏规则:索取与奉献游戏规则:索取与奉献思考题:什么是生物信息学?思考题:什么是生物信息学?

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!