生物信息学导论ppt

上传人:无*** 文档编号:217084188 上传时间:2023-06-10 格式:PPT 页数:67 大小:1.39MB
收藏 版权申诉 举报 下载
生物信息学导论ppt_第1页
第1页 / 共67页
生物信息学导论ppt_第2页
第2页 / 共67页
生物信息学导论ppt_第3页
第3页 / 共67页
资源描述:

《生物信息学导论ppt》由会员分享,可在线阅读,更多相关《生物信息学导论ppt(67页珍藏版)》请在装配图网上搜索。

1、生物信息学导论生物信息学导论Introduction to Bioinformatics力学与工程科学系力学与工程科学系湍流与复杂系统国家重点实验室湍流与复杂系统国家重点实验室理论生物学中心理论生物学中心Tel:62767261(Office)62759647(Lab)E-mail:1课程安排课程安排1、时间:每周二晚、时间:每周二晚1112节(节(19:1021:00)教室:一教教室:一教208教室教室 学时:每周学时:每周2学时(总计学时(总计16 2=32学时学时)2、学分:、学分:2学分学分3、成绩考核方式(无笔试):、成绩考核方式(无笔试):1次调研报告(分次调研报告(分2次在课堂讨

2、论),占总成绩次在课堂讨论),占总成绩50 1次学习研究论文(期末完成),占总成绩次学习研究论文(期末完成),占总成绩40 其它占总成绩其它占总成绩104、E-mail:Tel:6276 7261(office)(办公室地址:力学系力学楼(办公室地址:力学系力学楼503503室)室)5、课程大纲和讲义可在、课程大纲和讲义可在北大理论生物学中心北大理论生物学中心网站下载。网站下载。()()2参考资料参考资料参考资料参考资料1.Westhead et al.,Bioinformatics(英文原版),科学出版社,(英文原版),科学出版社,2003年年2.Pevzner,Computational

3、Molecular Biology,MIT Press,20003.Salzberg,et al.,Computational Methods in Molecular Biology,Elsevier Science,19984.Waterman,Introduction to Computational Biology,Chapman&Hall,19955.Durbin等等,Biological sequence analysis(英文原版)(英文原版),清华大学出版社,清华大学出版社,20026.Brown著,袁建刚等译,著,袁建刚等译,基因组基因组,科学出版社,科学出版社,2002年年

4、7.Campbell等著,孙之荣等译,等著,孙之荣等译,探索基因组学、蛋白质组学和生物信息学探索基因组学、蛋白质组学和生物信息学,科学出版社,科学出版社,2004年年8.郝柏林、张淑誉,郝柏林、张淑誉,生物信息学手册生物信息学手册(第二版),上海科学技术出版社,(第二版),上海科学技术出版社,2002年年9.Attwood等著,罗静初等译,等著,罗静初等译,生物信息学概论生物信息学概论,北京大学出版社,北京大学出版社,2002年年10.Mount,BioinformaticsSequence and Genome Analysis,科学出版社,科学出版社,2002年(中文版由钟杨等译、高等教育

5、出版社年(中文版由钟杨等译、高等教育出版社2003年出版)年出版)3第一章第一章前前前前 言言言言41.1 从人类基因组计划(从人类基因组计划(HGP)说起)说起5曼哈顿原子弹计划曼哈顿原子弹计划(1942-46)阿波罗登月计划阿波罗登月计划(1961-69)人类基因组计划人类基因组计划(1990-2003)61961年,美国总统年,美国总统Kennedy提出两个科学计划:提出两个科学计划:登月计划登月计划攻克肿瘤计划攻克肿瘤计划 人类遗传信息的复杂性人类遗传信息的复杂性人类基因组计划人类基因组计划(HGP,Human Genome Project)目标:整体上破解人类遗传信息的奥秘目标:整体

6、上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的奥秘1 1、曼哈顿原子弹计划遗留问题的产物、曼哈顿原子弹计划遗留问题的产物、曼哈顿原子弹计划遗留问题的产物、曼哈顿原子弹计划遗留问题的产物2、对生命科学和医学的科学影响、对生命科学和医学的科学影响“我们选择登月我们选择登月我们选择登月我们选择登月”(1962(1962年年年年KennedyKennedy在在在在RiceRice大学演讲大学演讲大学演讲大学演讲)为什么提出为什么提出HGP?7 DNA:遗传物质遗传物质(遗传信息的载体遗传信息的载体)双螺旋结构双螺旋结构 A,C,G,T四种基本字符的复杂文本四种

7、基本字符的复杂文本 基因基因(Gene):具有遗传效应的具有遗传效应的DNA分子片段分子片段DNA、基因、基因组、基因、基因组891984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义1985 Dulbecco在Science撰文“肿瘤研究的转折点:人 类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任1990.10 经美国国会批准,人类基因组计划正式启动James WatsonWal

8、ter GilbertHGP历史回顾历史回顾10尽管比之于人类登月,尽管比之于人类登月,HGP的投入资金的投入资金要少得多,但要少得多,但HGP对人类生活的影响要对人类生活的影响要更为深远更为深远。因为随着这个计划的完成,。因为随着这个计划的完成,DNA分子中编码的分子中编码的遗传信息将对人类存遗传信息将对人类存在的化学基础作出最终的回答在的化学基础作出最终的回答。这将不。这将不仅帮助我们理解我们是如何作为健康的仅帮助我们理解我们是如何作为健康的人发挥正常功能的,而且也将在化学水人发挥正常功能的,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、平上解释遗传因子在各种疾病,如癌症、早老痴呆症

9、、精神分裂症等一些严重危早老痴呆症、精神分裂症等一些严重危害人类健康的疾病中的作用。毕竟害人类健康的疾病中的作用。毕竟对人对人类自身更深入的了解是人类活动中最重类自身更深入的了解是人类活动中最重要的一个部分。要的一个部分。Watson,1990,Science11HGP的最初目标的最初目标通过国际合作,用15年时间(19902005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:遗传图 物理图 序列图 基因图HGP的终极目标的终极目标阐明人类基因组全部DNA序列;识别基因;建立储存这些信息的数据库;开

10、发数据分析工具;研究HGP实施所带来的伦理、法律和社会问题。121995 第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划H.Inf 全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫131997 大肠杆菌(E.coli)全基因组测序完成1998 完成人类基因组计划的物理作图 开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其

11、全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划142000 Celera公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组拟南芥全基 因组的测序工作2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图2001.2.15 Nature刊文发表国际公共领域结果2001.2.16 Science刊文发表Celera公司及其合作者结果Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥152001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面16At the W

12、hite House on June 26,Francis Collins(r),Director of the National Human Genome Research Institute,President Clinton,and J.Craig Venter,President of Celara Genomics,lauded the thousands of scientists who contributed to the genome sequence.17182001年年8月月26日日 人类基因组人类基因组“中国卷中国卷”的绘制工作宣告完成。的绘制工作宣告完成。2002年年

13、 水稻、小鼠、疟原虫等基因组测序完成水稻、小鼠、疟原虫等基因组测序完成2003年年4月月14日日 中、美、日、德、法、英等中、美、日、德、法、英等6国科学家宣布人类基因国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。组序列图绘制成功,人类基因组计划的所有目标全部实现。2003年年10月,月,2004年年10月人类基因组完成图公布。月人类基因组完成图公布。192021(,(,2006年年2月)月)已完成测序的已完成测序的3,000个基因组个基因组221、大协作研究大协作研究:以学科为中心以问题为中心,多学科合作2、研究的计划性和有序性研究的计划性和有序性:正反双方共同参与

14、,制定更科学、更全面的研究计划4、政府与国家的作用政府与国家的作用:美:领导与推动 英:始于1989年2月,贡献为1/3左右 法:始于1990年6月,贡献为3左右 日:始于1990年,贡献为7左右 德:始于1995年,贡献为7左右 中:始于1999年9月,贡献为1左右3、商业竞争促进基础研究商业竞争促进基础研究:1998年Celera公司的加入HGPHGP的研究特色的研究特色的研究特色的研究特色235、可持续性可持续性:太空观测和基因组计划都是科学上出色的计划,每一个都是科太空观测和基因组计划都是科学上出色的计划,每一个都是科学上迈出的一大步。但是两者之间存在着一个刺眼的差别:开学上迈出的一大

15、步。但是两者之间存在着一个刺眼的差别:开支方面有四十倍的差别。开支的差别是至关重要的,因为这意支方面有四十倍的差别。开支的差别是至关重要的,因为这意味着可持续性。味着可持续性。当一个计划足够便宜到成为一条可以无限向未当一个计划足够便宜到成为一条可以无限向未来延伸的系列的第一个时,它是可持续的。来延伸的系列的第一个时,它是可持续的。而当一个计划太昂而当一个计划太昂贵,以至不经过重大的政治斗争就无法重复时,它就是不可持贵,以至不经过重大的政治斗争就无法重复时,它就是不可持续的。可持续计划带来新计划的开始,不可持续计划则标志着续的。可持续计划带来新计划的开始,不可持续计划则标志着老时代的结束老时代的

16、结束。The Sun,the Genome,and the InternetTools of Scientific RevolutionFreeman Dyson 24各学科参与、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学HGP带来的科学挑战带来的科学挑战HGP:Pandoras Box 25 首要科学问题首要科学问题 如何找到记载在基因组DNA一维结构上控制生命时间、空间的调控信息的编码方式和调节规律。应用数学、复杂系统理论、信息论、非线性科学 催生生物信息学生物信息学、计算生物学、系统生物学计算生物学、系统生物学 DNA芯片技术芯片技术 交叉性技术领域

17、:物理学、微电子信息技术、生化技术、信息技术 结构生物学结构生物学 前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及X射线晶体衍射技术、核磁共振技术261.2计算生物学和生物信息学计算生物学和生物信息学后基因组时代的呼唤后基因组时代的呼唤27物理科学发展对生命科学的启示物理科学发展对生命科学的启示28面对堆积如山的生物学数据面对堆积如山的生物学数据29新的生物学研究模式的出发点应该是理论的。科学家将从理新的生物学研究模式的出发点应该是理论的。科学家将从理论推测出发,然后再返回到实验中去,追踪或验证这些理论假设。论推测出发,然后再返回到实验中去,追踪或验证这些理论假设。生物学家不仅

18、必须成为计算机学者,而且也要改变他们研究生物学家不仅必须成为计算机学者,而且也要改变他们研究生命现象的途径。生命现象的途径。W.Gilbert,Towards A Paradigm Shift in Biology,Nature,349(1991)9930传统生物学:传统生物学:实验科学实验科学现代生物学的发展:现代生物学的发展:1、高通量数据获取日益实现自动化、半工业化高通量数据获取日益实现自动化、半工业化 从数据库中实现数据挖掘、知识发现2、海量数据海量数据 难以完全依赖实验手段对新数据进行分析,必须借助计算机实现分析和筛选3、更复杂层次的生物学问题更复杂层次的生物学问题 复杂的基因调控网

19、络、代谢网络;细胞间信号转导过程;生物个体全部基因表达变化分析、筛选大量新数据分析、筛选大量新数据生物中的复杂网络、复杂过生物中的复杂网络、复杂过程、复杂现象程、复杂现象理论生物学理论生物学计算生物学计算生物学3121212121世纪生命科学世纪生命科学世纪生命科学世纪生命科学理理理理论论论论计计计计算算算算实实实实验验验验数学与物理科学数学与物理科学数学与物理科学数学与物理科学计算生物学计算生物学计算生物学计算生物学计算生物学计算生物学/理论生物学与传统生物学的关系理论生物学与传统生物学的关系理论生物学与传统生物学的关系理论生物学与传统生物学的关系理论生物学与传统生物学的关系理论生物学与传统

20、生物学的关系 实验永远起着决定作用实验永远起着决定作用 计算计算/理论生物学的发展离不理论生物学的发展离不开实验生物学的贡献开实验生物学的贡献 实验生物学日益依赖计算实验生物学日益依赖计算/理理论生物学的指导论生物学的指导32美国国家卫生研究院(美国国家卫生研究院(NIH)的定义:)的定义:Bioinformatics Bioinformatics(Research,development,or application of computational tools and approaches for expanding the use of biological,medical,behavi

21、oral or health data,including those to acquire,store,organize,archive,analyze,or visualize such data.)为拓展生物学、医学、行为学和卫生学数据的用途,而进行有关计为拓展生物学、医学、行为学和卫生学数据的用途,而进行有关计算机方法手段的研究、开发与应用,包括此类数据的采集、存贮、整理、算机方法手段的研究、开发与应用,包括此类数据的采集、存贮、整理、归档、分析与可视化。归档、分析与可视化。Computational Biology Computational Biology(The developm

22、ent and application of data-analytical and theoretical methods,mathematical modeling and computational simulation techniques to the study of biological,behavioral,and social systems.)开发和应用数据分析、理论方法、数学模型和计算机仿真技术,用开发和应用数据分析、理论方法、数学模型和计算机仿真技术,用于生物学、行为学和社会群体系统的研究。于生物学、行为学和社会群体系统的研究。BioinformaticsComputa

23、tional BiologyWhat is Bioinformatics/Computational Biology?33 生物信息学生物信息学(Bioinformatics)的来源Dr.Hwa A.Lim(林华安)(林华安)1987年提出年提出“Bio-informatique”“Bioinformatics”1955年出生于马来西亚。联合国年出生于马来西亚。联合国Bioinformatics专家,专家,University of Texas at Dallas分子与细胞生物学分子与细胞生物学Adjunct Professor、中国科学院基因遗传研究所客座、中国科学院基因遗传研究所客座教授。

24、教授。1981年英国伦敦大学帝国学院年英国伦敦大学帝国学院(Imperial College,London University)毕业,毕业,1986年获得美国年获得美国Rochester University生化物理学博士学位,生化物理学博士学位,30岁取岁取得佛罗里达州立大学终生教授。得佛罗里达州立大学终生教授。1992年受聘担任美年受聘担任美国国家癌症中心及美国国家科学基金会审核委员。国国家癌症中心及美国国家科学基金会审核委员。1995年后,历任多家生物科技公司生化信息执行长、年后,历任多家生物科技公司生化信息执行长、副总裁等高层管理职位。副总裁等高层管理职位。1997年,创立结合软件与

25、年,创立结合软件与数据分析的专业顾问公司数据分析的专业顾问公司D Trends,服务生物技术、,服务生物技术、制药及卫生保健等机构。制药及卫生保健等机构。林华安最近又将林华安最近又将Biothechnology、Information结合纳结合纳米科技(米科技(Nano),提出),提出 Binformatics(生纳信息学)。(生纳信息学)。生物信息学之父生物信息学之父林华安林华安34以基因组以基因组DNA序列信息为源头,识别基因组序列中代表蛋白质序列信息为源头,识别基因组序列中代表蛋白质和和RNA基因的编码区,阐明非编码区的信息特征,破译隐藏在基因的编码区,阐明非编码区的信息特征,破译隐藏在

26、DNA序列中的遗传语言规律;序列中的遗传语言规律;同时,归纳、整理与基因组遗传语言信息释放及其调控相关的同时,归纳、整理与基因组遗传语言信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。的规律。生物信息学生物信息学/计算生物学计算生物学揭示基因组蛋白质组信息结构的复杂性、遗传语言的根本规律揭示基因组蛋白质组信息结构的复杂性、遗传语言的根本规律生物学信息的计算机处理生物学信息的计算机处理计算生物学计算生物学/理论生物学理论生物学35前基因组时代的前基因组时代的“钓鱼钓鱼”和后基因组时代的和后基因组时代的“捞鱼

27、捞鱼”36 When I give talks to young scientists seeking advice about areas of future intense scientific excitement,computational biology is my number one recommendation.Francis CollinsFrancis Collins,Director of HGP at NIH The next step in the project is the“interpretation phase”.That is really the fun

28、part of the whole project because then we finally have the complete order of all layers of genetic codes and we have to discover what it all means.J.Craig VenterJ.Craig Venter,Head of Celera Genomics Inc.37生物学家生物学家生物学家生物学家(生物学问题生物学问题生物学问题生物学问题)数学物理学家数学物理学家数学物理学家数学物理学家计算机科学家计算机科学家计算机科学家计算机科学家(基础理论问题基

29、础理论问题基础理论问题基础理论问题)工程师工程师工程师工程师(技术应用)(技术应用)(技术应用)(技术应用)计算生物学计算生物学/生物信息学:生物信息学:三种科学文化的融合三种科学文化的融合381.3生物信息学主要研究内容和方法生物信息学主要研究内容和方法39 生物学数据的收集、存储、管理与提供生物学数据的收集、存储、管理与提供 基因组序列信息的提取和分析基因组序列信息的提取和分析 功能基因组相关信息分析功能基因组相关信息分析 生物大分子结构模拟和药物设计生物大分子结构模拟和药物设计 生物信息分析的技术与方法研究生物信息分析的技术与方法研究 应用与发展研究应用与发展研究生物信息学的主要研究内容

30、生物信息学的主要研究内容40基于数据挖掘(知识发现)的方法基于数据挖掘(知识发现)的方法(Data-mining,Knowledge Discovery)Extracts the hidden patterns from huge quantities of experimental data,and forms hypotheses as a result.基于模拟分析的方法基于模拟分析的方法(Simulation-based Analysis)Tests hypotheses with in silico experiments,providing predictions to be te

31、sted by in vitro and in vivo studies.计算生物学计算生物学计算生物学计算生物学/生物信息学的主要理论方法生物信息学的主要理论方法生物信息学的主要理论方法生物信息学的主要理论方法41DNA序列序列RNA序列序列蛋白质蛋白质由重复的核苷酸或氨基酸单元组成的线性高分子,具由重复的核苷酸或氨基酸单元组成的线性高分子,具有高度有序并能完成特定生物学功能的三维结构有高度有序并能完成特定生物学功能的三维结构目的目的揭示序列蕴含的更高级的结构和功能信息揭示序列蕴含的更高级的结构和功能信息主要思想主要思想具有相似序列的分子,可能具有相似的三维结构和生物学具有相似序列的分子,可

32、能具有相似的三维结构和生物学功能。功能。首要任务:提取反映结构、功能性质的序列特征首要任务:提取反映结构、功能性质的序列特征主要方法主要方法基于数据挖掘或知识发现(基于数据挖掘或知识发现(data-mining,knowledge discovery)的方法:)的方法:统计方法统计方法、机器学习机器学习、神经网络神经网络等等1.3.1 核酸和蛋白质序列分析研究核酸和蛋白质序列分析研究42搜集数据搜集数据(采样、实验设计采样、实验设计)从事物的外在数量上的表现去推断事物可能的规律性从事物的外在数量上的表现去推断事物可能的规律性分析数据分析数据(建模、知识发现建模、知识发现)推理推理(预测、分类预

33、测、分类)回归分析回归分析聚类分析聚类分析探索性分析探索性分析判别分析判别分析多元回归、自回归多元回归、自回归线性判别分析、非线性判别分析线性判别分析、非线性判别分析系统聚类分析、动态聚类分析系统聚类分析、动态聚类分析主元分析、相关性分析主元分析、相关性分析统计方法统计方法统计方法统计方法43学习:系统通过执行某种过程而改进它的性能学习:系统通过执行某种过程而改进它的性能规则归纳规则归纳范例推理范例推理遗传算法遗传算法决策树决策树AQ算法算法直接使用过去的经验或解法来求解给定的问题直接使用过去的经验或解法来求解给定的问题环境环境学习单元学习单元知识库知识库执行单元执行单元反馈反馈机器学习方法机

34、器学习方法机器学习方法机器学习方法44模仿人脑神经网络的结构和某些工作机制,利用大量的神经元连模仿人脑神经网络的结构和某些工作机制,利用大量的神经元连成网络来实现大规模并行计算。通过学习,改变神经元之间的连成网络来实现大规模并行计算。通过学习,改变神经元之间的连接强度。接强度。McCulloch-Pitts模型模型反传网络模型反传网络模型多层感知器模型多层感知器模型人工神经网络方法人工神经网络方法人工神经网络方法人工神经网络方法45生命科学中的问题生命科学中的问题数理问题数理问题/算法算法相似性搜寻相似性搜寻两两序列比对两两序列比对相似序列的数据库搜寻相似序列的数据库搜寻多序列比对多序列比对系

35、统发育树重建系统发育树重建蛋白质三维结构比对蛋白质三维结构比对寻优算法寻优算法动态规划算法动态规划算法模拟退火算法模拟退火算法遗传算法遗传算法人工神经网络方法人工神经网络方法序列分析中的主要算法序列分析中的主要算法序列分析中的主要算法序列分析中的主要算法46生命科学中的问题生命科学中的问题数理问题数理问题/算法算法结构结构/功能的功能的从头预测从头预测RNA二级结构预测二级结构预测RNA三级结构预测三级结构预测蛋白质三级结构预测蛋白质三级结构预测寻优算法寻优算法动态规划算法动态规划算法模拟退火算法模拟退火算法遗传算法遗传算法人工神经网络方法人工神经网络方法47生命科学中的问题生命科学中的问题数

36、理问题数理问题/算法算法结构结构/功能的功能的基于知识预测基于知识预测Motif提取提取功能部位预测功能部位预测细胞定位预测细胞定位预测编码区预测(基因结构预测)编码区预测(基因结构预测)跨膜片段预测跨膜片段预测蛋白质二级结构预测蛋白质二级结构预测蛋白质三维结构预测蛋白质三维结构预测模式识别、学习算法模式识别、学习算法判别分析方法判别分析方法人工神经网络算法人工神经网络算法随机过程方法随机过程方法(HMM)语言学语言学(形式语法形式语法)演化、遗传算法演化、遗传算法48生命科学中的问题生命科学中的问题数理问题数理问题/算法算法生物大分子分生物大分子分类类超家族分类超家族分类基因的分组基因的分组

37、蛋白质三维折叠结构的分类蛋白质三维折叠结构的分类聚类算法聚类算法层次聚类算法层次聚类算法模糊聚类算法模糊聚类算法快速动态聚类算法快速动态聚类算法神经网络方法神经网络方法49单个分子层次单个分子层次的遗传信息表达的遗传信息表达DNARNA蛋白质蛋白质序列序列结构结构功能功能分子网络层次分子网络层次的遗传信息表达的遗传信息表达分子及分子间分子及分子间的相互作用的相互作用分子相互作用网络分子相互作用网络功能功能生物复杂系统生物复杂系统1.3.2 1.3.2 生物分子相互作用的复杂系统模拟生物分子相互作用的复杂系统模拟生物分子相互作用的复杂系统模拟生物分子相互作用的复杂系统模拟50主要思想主要思想主要

38、途径主要途径1、静态研究:路径计算、二元关系和演绎、静态研究:路径计算、二元关系和演绎(离散数学方法)(离散数学方法)2、动态研究:微分方程组、动态研究:微分方程组、Petri网模型网模型(网络的时间依赖演化)(网络的时间依赖演化)主要目标主要目标复杂网络系统分析复杂网络系统分析Predict the dynamics of systems so that the validity of the underlying assumptions can be tested.系统水平的生物信息学方法系统水平的生物信息学方法系统水平的生物信息学方法系统水平的生物信息学方法51计算生物学方法计算生物学方

39、法(Computation)复杂系统理论与方法复杂系统理论与方法(System Analysis)生物技术生物技术(New Biotechnologies)生物学数据生物学数据(Experimental Data)系统生物学系统生物学(Systems Biology)52SystemNodesEdges蛋白质三维结构生物体脑(人脑)生态系统社会文明原子分子细胞生物体人原子相互作用分子相互作用细胞相互作用生物体相互作用人相互作用复杂系统的生物学范畴复杂系统的生物学范畴复杂系统的生物学范畴复杂系统的生物学范畴531.4二十一世纪生命科学展望二十一世纪生命科学展望54系统生物学系统生物学(Syste

40、ms Biology):由分析为主走向分析与综合并举的系统方法由分析为主走向分析与综合并举的系统方法 微观微观还原论还原论 整体整体系统论系统论统一生物学统一生物学(General Biology):探索生命活动本质,产生统一的生命观和统一的生物学探索生命活动本质,产生统一的生命观和统一的生物学实验、理论、计算生物学实验、理论、计算生物学:(Experimental,Theoretical,Computational Biology)生命科学与数、理、化、计算机等学科的大综合、大交叉生命科学与数、理、化、计算机等学科的大综合、大交叉生物技术的产业化生物技术的产业化(Biotechnology)

41、:基础研究转化为生产力基础研究转化为生产力 生物工程技术生物工程技术农、林、医药农、林、医药现代生命科学发展趋势现代生命科学发展趋势现代生命科学发展趋势现代生命科学发展趋势55生物大分子的结构与功能研究生物大分子的结构与功能研究基因组与细胞的研究基因组与细胞的研究基因组比较研究基因组比较研究关于遗传、发育、分化、进化的综合理论研究关于遗传、发育、分化、进化的综合理论研究脑科学和神经科学研究脑科学和神经科学研究行为科学研究行为科学研究生态学研究生态学研究人体功能研究人体功能研究研究手段:实验、理论、计算相结合研究手段:实验、理论、计算相结合现代生命科学发展热点现代生命科学发展热点现代生命科学发展

42、热点现代生命科学发展热点56以生命科学为核心的大科学以生命科学为核心的大科学Like it or not,big biology is here to stay.575859国家中长期科学和技术发展规划纲要国家中长期科学和技术发展规划纲要(20062020年)年)中华人民共和国国务院中华人民共和国国务院重点领域及其优先主题重点领域及其优先主题能源能源 水和矿产资源水和矿产资源 环境环境 农业农业 制造业制造业 交通运输业交通运输业 信息产业信息产业及现代服务业及现代服务业 人口与健康人口与健康 城镇化与城市发展城镇化与城市发展 公共安全公共安全 国国防防重大专项重大专项核心电子器件、高端通用芯

43、片及基础软件,极大规模集成电路制造技术及成核心电子器件、高端通用芯片及基础软件,极大规模集成电路制造技术及成套工艺,新一代宽带无线移动通信,高档数控机床与基础制造技术,大套工艺,新一代宽带无线移动通信,高档数控机床与基础制造技术,大型油气田及煤层气开发,大型先进压水堆及高温气冷堆核电站,水体污型油气田及煤层气开发,大型先进压水堆及高温气冷堆核电站,水体污染控制与治理,染控制与治理,转基因生物新品种培育转基因生物新品种培育,重大新药创制重大新药创制,艾滋病和病毒艾滋病和病毒性肝炎等重大传染病防治,性肝炎等重大传染病防治,大型飞机,高分辨率对地观测系统,载人航大型飞机,高分辨率对地观测系统,载人航

44、天与探月工程天与探月工程前沿技术前沿技术生物技术生物技术 信息技术信息技术 新材料技术新材料技术 先进制造技术先进制造技术 先进能源技术先进能源技术 海洋技术海洋技术 激光技术激光技术 空天技术空天技术60基础研究基础研究科学前沿问题:科学前沿问题:生命过程的定量研究和系统整合生命过程的定量研究和系统整合 凝聚态物质与新效应凝聚态物质与新效应 物质深物质深层次结构和宇宙大尺度物理学规律层次结构和宇宙大尺度物理学规律 核心数学及其在交叉领核心数学及其在交叉领域的应用域的应用 地球系统过程与资源、环境和灾害效应地球系统过程与资源、环境和灾害效应 新物质创新物质创造与转化的化学过程造与转化的化学过程

45、 脑科学与认知科学脑科学与认知科学 科学实验与观测方科学实验与观测方法、技术和设备的创新法、技术和设备的创新面向国家重大战略需求的基础研究:面向国家重大战略需求的基础研究:人类健康与疾病的生物学基础人类健康与疾病的生物学基础 农业生物遗传改良和农业可持续农业生物遗传改良和农业可持续发展中的科学问题发展中的科学问题 人类活动对地球系统的影响机制人类活动对地球系统的影响机制 全球变全球变化与区域响应化与区域响应 复杂系统、灾变形成及其预测控制复杂系统、灾变形成及其预测控制 能源可持能源可持续发展中的关键科学问题续发展中的关键科学问题 材料设计与制备的新原理与新方材料设计与制备的新原理与新方法法 极

46、端环境条件下制造的科学基础极端环境条件下制造的科学基础 航空航天重大力学问题航空航天重大力学问题 支撑信息技术发展的科学基支撑信息技术发展的科学基重大科学研究计划:重大科学研究计划:蛋白质研究蛋白质研究 量子调控研究量子调控研究 纳米研究纳米研究 发育与生殖研究发育与生殖研究61科学前沿问题:科学前沿问题:生命过程的定量研究和系统整合生命过程的定量研究和系统整合 主要研究方向:主要研究方向:基因语言及调控基因语言及调控功能基因组学功能基因组学模式生物学模式生物学表观遗传学及非编码核糖核酸表观遗传学及非编码核糖核酸生命体结构功能及其调控网络生命体结构功能及其调控网络生命体重构生命体重构生物信息学

47、生物信息学计算生物学计算生物学系统生物学系统生物学极端环境中的生命特征极端环境中的生命特征生命起源和演化生命起源和演化系统发育与进化生物学系统发育与进化生物学等。等。62重大科学研究计划:重大科学研究计划:蛋白质研究蛋白质研究 蛋白质是最主要的生命活动载体和功能执行者。蛋白质是最主要的生命活动载体和功能执行者。对蛋白质复杂多样的结构功能、相互作用和动态变化的深入对蛋白质复杂多样的结构功能、相互作用和动态变化的深入研究,将在分子、细胞和生物体等多个层次上全面揭示生命研究,将在分子、细胞和生物体等多个层次上全面揭示生命现象的本质,是后基因组时代的主要任务。同时,蛋白质科现象的本质,是后基因组时代的

48、主要任务。同时,蛋白质科学研究成果将催生一系列新的生物技术,带动医药、农业和学研究成果将催生一系列新的生物技术,带动医药、农业和绿色产业的发展,引领未来生物经济。因此,蛋白质科学是绿色产业的发展,引领未来生物经济。因此,蛋白质科学是目前发达国家激烈争夺的生命科学制高点。目前发达国家激烈争夺的生命科学制高点。重点研究重点研究重要生物体系的转录组学、蛋白质组学、代谢组重要生物体系的转录组学、蛋白质组学、代谢组学、结构生物学、蛋白质生物学功能及其相互作用、学、结构生物学、蛋白质生物学功能及其相互作用、蛋白质蛋白质相关的计算生物学与系统生物学相关的计算生物学与系统生物学,蛋白质研究的方法学,相,蛋白质

49、研究的方法学,相关应用基础研究等关应用基础研究等。63课程提纲课程提纲第一讲第一讲 绪论绪论1生物信息学的诞生生物信息学的诞生从人类基因组计划说起从人类基因组计划说起2生物信息学:主要研究内容和方法生物信息学:主要研究内容和方法第二讲第二讲 分子生物学基础分子生物学基础1“What is life?”从薛定锷的思考到从薛定锷的思考到“双螺旋双螺旋”的发现的发现2生命的演化和分类生命的演化和分类3生命的分子组成生命的分子组成4遗传的分子基础遗传的分子基础5基因组与基因结构基因组与基因结构第三讲第三讲 生物信息数据库和生物信息学主要问题生物信息数据库和生物信息学主要问题1生物信息学概述与历史回顾生

50、物信息学概述与历史回顾2基因组序列数据的获取基因组序列数据的获取3生物信息数据库简介(一级数据库、二级数据库简介)生物信息数据库简介(一级数据库、二级数据库简介)4生物信息学主要问题(序列比对、核酸和蛋白质结构与功能预测、基因生物信息学主要问题(序列比对、核酸和蛋白质结构与功能预测、基因组序列分析与蛋白质序列分析、功能基因组相关信息分析)组序列分析与蛋白质序列分析、功能基因组相关信息分析)64第四讲第四讲 生物信息学研究方法简介生物信息学研究方法简介1统计分析方法统计分析方法(统计学基础、回归分析方法及其应用、判别分析方法及其应用、聚类分析(统计学基础、回归分析方法及其应用、判别分析方法及其应

51、用、聚类分析方法及其应用)方法及其应用)2机器学习方法机器学习方法(概率论基础、(概率论基础、Markov过程的基本概念、隐过程的基本概念、隐Markov模型(模型(HMM)的基本)的基本原理、人工神经网络(原理、人工神经网络(ANN)方法简介)方法简介)第五讲第五讲 生物序列比对生物序列比对1序列比对的定义和意义序列比对的定义和意义2序列比对方法概述序列比对方法概述3序列比对的动态规划方法序列比对的动态规划方法第六讲第六讲 基因预测基因预测1基因预测的概念及其在基因组研究中的应用基因预测的概念及其在基因组研究中的应用2微生物基因预测方法简介微生物基因预测方法简介3真核生物基因预测方法简介真核

52、生物基因预测方法简介4基因预测方法的评价基因预测方法的评价65第七讲第七讲 基因组进化及分子进化研究简介基因组进化及分子进化研究简介1引言(基因组进化的复杂性与系统发育分析、分子进化与进化树)引言(基因组进化的复杂性与系统发育分析、分子进化与进化树)2构建系统发育树方法简介(距离法、最大简约法、最大似然法)构建系统发育树方法简介(距离法、最大简约法、最大似然法)第八讲第八讲 蛋白质序列分析与结构预测蛋白质序列分析与结构预测1.蛋白质序列与结构的基本知识蛋白质序列与结构的基本知识2.蛋白质序列分析与信号预测蛋白质序列分析与信号预测3蛋白质结构与蛋白质结构预测蛋白质结构与蛋白质结构预测4蛋白质结构预测方法简介(基于蛋白质序列的结构预测方法、蛋白质二蛋白质结构预测方法简介(基于蛋白质序列的结构预测方法、蛋白质二级结构预测、三级结构预测)级结构预测、三级结构预测)课堂讨论课堂讨论2次,共次,共2学时学时6667

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!