生物信息学软件及使用概述

上传人:无*** 文档编号:214522133 上传时间:2023-05-29 格式:PPT 页数:51 大小:1.06MB
收藏 版权申诉 举报 下载
生物信息学软件及使用概述_第1页
第1页 / 共51页
生物信息学软件及使用概述_第2页
第2页 / 共51页
生物信息学软件及使用概述_第3页
第3页 / 共51页
资源描述:

《生物信息学软件及使用概述》由会员分享,可在线阅读,更多相关《生物信息学软件及使用概述(51页珍藏版)》请在装配图网上搜索。

1、生物信息学软件及使用概述1生物信息学的概念:生物信息学的概念:生生物物信信息息学学是是一一门门新新兴兴的的交交叉叉学学科科,它它将将数数学学和和计计算算机机知知识识应应用用于于生生物物学学,以以获获取取、加加工工、存存储储、分分类类、检检索索与与分分析析生生物物大大分分子子的的信信息息,从从而而理解这些信息的生物学意义。理解这些信息的生物学意义。2生物信息学软件主要功能生物信息学软件主要功能1.分分析析和和处处理理实实验验数数据据和和公公共共数数据据,加快研究进度,缩短科研时间加快研究进度,缩短科研时间2.提提示示、指指导导、替替代代实实验验操操作作,利利用用对对实实验验数数据据的的分分析析所

2、所得得的的结结论论设设计计下一阶段的实验下一阶段的实验3.实验数据的自动化管理实验数据的自动化管理4.寻找、预测新基因及其结构、功能寻找、预测新基因及其结构、功能5.蛋蛋白白质质高高级级结结构构及及功功能能预预测测(三三维维建模,目前研究的焦点和难点)建模,目前研究的焦点和难点)3功能功能1.分析和处理实验数据和公共数据,分析和处理实验数据和公共数据,加快研究进度,缩短科研时间加快研究进度,缩短科研时间核核酸酸:序序列列同同源源性性比比较较,分分子子进进化化树树构构建建,结结构构信信息息分分析析,包包括括基基元元(Motif)、酶酶切切点点、重重复复片片断断、碱碱基基组组成成和和分分布布、开开

3、放放阅阅读读框框(ORF),蛋蛋白白编编码码区区(CDS)及及外外显显子子预预测测、RNA二二级级结构预测、结构预测、DNA片段的拼接;片段的拼接;蛋蛋白白:序序列列同同源源性性比比较较,结结构构信信息息分分析析(包包括括Motif,限限制制酶酶切切点点,内内部部重重复复序序列列的的查查找找,氨氨基基酸酸残残基基组组成成及及其其亲亲水水性性及及疏疏水水性性分分析析),等等电电点及二级结构预测等等;点及二级结构预测等等;本地序列与公共序列的联接,成果扩大。本地序列与公共序列的联接,成果扩大。4Antheprot 5.0 Dot Plot 点阵图点阵图Dot plot 点阵图能够揭示多个局部相似性

4、的复杂关系5Peptool Lite-Dot Plot 点阵图点阵图6DNASIS 2.5 RNA 二级结构预测二级结构预测7DNASIS 2.5 tRNA 二级结构预测二级结构预测8RNAStructure 3.5 RNA 二结构预测二结构预测9Omiga 2.0 ORF Map10DNAStar 之之 Protean 对对氨氨基基酸酸的的亲亲疏疏水水性性分析:分析:helical wheel 图图不同颜色代表不同的AA11功功能能2.提提示示、指指导导、替替代代实实验验操操作作,利利用用对对实实验数据的分析所得的结论设计下一阶段的实验验数据的分析所得的结论设计下一阶段的实验1.用软件设计用

5、软件设计PCR引物,测序引物或杂交探引物,测序引物或杂交探针;针;2.设计克隆策略,构建载体;设计克隆策略,构建载体;3.做模拟电泳实验,即模拟核酸内切酶或内做模拟电泳实验,即模拟核酸内切酶或内肽酶对相应的底物分子切割后的电泳行为;肽酶对相应的底物分子切割后的电泳行为;4.蛋白跨膜区域分析,信号肽潜在断裂点预蛋白跨膜区域分析,信号肽潜在断裂点预测。测。12Winplas 2.6 质粒构建质粒构建13Atheprot 5.0 预测蛋白跨膜区域预测蛋白跨膜区域14Antheprot 5.0 预测信号肽断裂点预测信号肽断裂点15功能功能3.用计算机管理实验室数据及文献资料用计算机管理实验室数据及文献

6、资料1.实验室结果的储存、管理和申报工作;实验室结果的储存、管理和申报工作;2.从从 网网 络络 数数 据据 库库 获获 得得 的的 序序 列列 文文 件件(由由ENTREZ集集成成检检索索系系统统所所得得的的数数据据文文件件可可以以进进入入EndNote 或或者者Reference Manager 储存管理)或资料文献的管理;储存管理)或资料文献的管理;3.软件软件:EndNote,Reference Manager。16Reference Manager 9 界面界面17功能功能4.用计算机预测新基因及其结构和功能用计算机预测新基因及其结构和功能对对CDS(Coding Sequence)

7、蛋蛋白白编编码码区区的的预预测测准准确率已达到确率已达到90%以上以上对整个基因结构的预测存在一定难度对整个基因结构的预测存在一定难度vPWM(位置权重矩阵)算法(位置权重矩阵)算法由由物物化化原原理理技技术术开开发发,侧侧重重于于找找基基因因表表达达系系统统和和核核酸酸相相互互作作用用的的位位点点。给给信信号号序序列列各各个个位位置置每每种种可可能能出出现现的的核核苷苷酸酸分分配配一一个个分分数数,将将各各位位置置分分数数相相加加后后得出该序列作为潜在作用位点的分数。得出该序列作为潜在作用位点的分数。18DNASIS 2.5 对对 蛋蛋 白白 编编 码码 区区 的的 预预 测测A.(Codo

8、n Bias)19DNASIS2.5 对蛋白编码区的预测对蛋白编码区的预测B.(Rare Codon)20DNASIS 2.5 对对 蛋蛋 白白 编编 码码 区区 的的 预预 测测C.(ORF List)21DNASTAR 之之 GeneQuest 预测预测CDS22功能功能5.蛋白质高级结构预测蛋白质高级结构预测该该项项技技术术算算法法十十分分复复杂杂,尚尚未未成成熟熟。PDB及及MMDB数数据据库库目目前前仍仍然然禁禁止止收收录录软软件件预预测测出出来来的蛋白高级结构模型。的蛋白高级结构模型。X射射线线晶晶体体学学技技术术和和多多维维核核磁磁共共振振技技术术是是当当前前人人们们认认识识蛋蛋

9、白白高高级级结结构构的的主主要要手手段段,但但两两种种技技术术都都有有不不足足之之处处。前前者者要要求求必必需需得得到到高高标标准准的的蛋蛋白白晶晶体体,后后者者对对分分子子量量大大于于3万万的的大大蛋蛋白白不不能能测测定定。因因此此理理论论模模拟拟和和结结构构预预测测显显得得十十分分重重要。要。序序列列与与结结构构关关系系的的根根源源在在于于“蛋蛋白白质质折折叠叠的的问问题题”,这是近期研究关注的焦点。,这是近期研究关注的焦点。23DNASIS 2.5 蛋白二级结构预测蛋白二级结构预测24目前应用的蛋白质结构预测的算法目前应用的蛋白质结构预测的算法1.同源预测同源预测(一级结构决定高级结构一

10、级结构决定高级结构)2.结构与结构相对比(结构与结构相对比(DALI算法)算法)3.当前最先进的结构预测方法:当前最先进的结构预测方法:结构类识别(结构类识别(fold recognition)先先建建立立一一个个已已知知的的结结构构类类数数据据库库(fold library),将将待待测测序序列列“穿穿过过”该该数数据据库库构构成成的的坐坐标标,并并根根据据事事先先确确定定的的物物理理限限制制,逐逐个个位位置置移移动动(threading,sequence-structure alignment),由由一一个个函函数数(sequence-structure fitness alignment

11、)判判断断序序列列与与结结构构类类的的符符合合程程度度,找找出出未未知知序序列列在在目目标标结结构构上上的的能能量量最最优优和和构构象象最最稳稳固固的的比比对对位位置置。对对计计算算机机要要求求很很高高。25Cn3D 2.5 显示显示 1EQF A链三维结构链三维结构26RasMol 2.7 显示显示1EQF A链三维结构链三维结构27二二.常见的部分生物学软件功能介绍常见的部分生物学软件功能介绍PCR PCR 引物设计引物设计DNADNA、蛋白质序列同源分析及进化树构建蛋白质序列同源分析及进化树构建ContigContig Express-DNA Express-DNA 序列片断拼接序列片断

12、拼接DNA DNA 模拟电泳模拟电泳重要生物数据库简介重要生物数据库简介28PCR 引物设计引物设计引物设计的原则引物设计的原则1.引物要跟模板紧密结合;引物要跟模板紧密结合;2.引引物物与与引引物物之之间间不不能能有有稳稳定定的的二二聚聚体体或或发夹结构存在;发夹结构存在;3.引引物物不不能能在在别别的的非非目目的的位位点点引引起起高高效效DNA聚合反应聚合反应(即错配即错配)。29如:如:引物长度(引物长度(primer length),),产物长度(产物长度(product length),),序列序列Tm值值(melting temperature),G值值(internal stab

13、ility),引引物物二二聚聚体体及及发发夹夹结结构构(duplex formation and hairpin),),错误引发位点(错误引发位点(false priming site),),引引物物及及产产物物GC含含量量(composition),有有时时还还要要对对引引物物进进行行修修饰饰,如如增增加加限限制制酶酶切切点点,引引进突变等。进突变等。引物设计需要考虑的因素需要考虑的因素30引物设计要点引物设计要点一一般般引引物物的的长长度度为为16-23bp,常常用用的的长长度度为为18-21bp,过长或过短都不合适。,过长或过短都不合适。引引物物3端端的的碱碱基基一一般般不不用用A,因因

14、为为A在在错错误误引引发发位位点点的的引引发发效效率率相相对对比比较较高高,而而其其它它三三种种碱碱基基的错误引发效率相对小一些。的错误引发效率相对小一些。引引物物的的GC含含量量一一般般为为45-55%,过过高高或或过过低低都都不不利利于于引引发发反反应应。上上下下游游引引物物的的GC含含量量不不能能相差太大。相差太大。引引物物所所对对应应模模板板序序列列的的Tm值值最最好好在在72左左右右,当当然然由由于于模模板板序序列列本本身身的的组组成成决决定定其其Tm值值可可能偏低或偏高,可根据具体情况灵活运用。能偏低或偏高,可根据具体情况灵活运用。31引物设计要点引物设计要点G值值反反映映了了引引

15、物物与与模模板板结结合合的的强强弱弱程程度度,也也是是一一个重要的引物评价指标。个重要的引物评价指标。一一般般情情况况下下,在在Oligo 5.0软软件件的的G值值窗窗口口中中,引引物物的的G值值最最好好呈呈正正弦弦曲曲线线形形状状,即即5端端和和中中间间部部分分G值值较较高高,而而3端端G值值相相对对较较低低,且且不不要要超超过过9(G值值为为负负值值,这这里里取取绝绝对对值值),如如此此则则有有利利于于正确引发反应而可防止错误引发。正确引发反应而可防止错误引发。其其原原理理,引引物物与与模模板板应应具具有有较较高高的的结结合合能能量量,这这样样有有利利于于引引物物与与模模板板序序列列的的整

16、整合合,因因此此5端端与与中中间间段段的的G值值应应较较高高,而而3端端G值值影影响响DNA聚聚合合酶酶对对模模板板DNA的解链,过高则不利于这一步骤。的解链,过高则不利于这一步骤。32引物设计要点引物设计要点可可能能的的错错误误引引发发位位点点决决定定于于引引物物序序列列组组成成与与模模板板序序列列组组成成的的相相似似性性,相相似似性性高高则则错错误误引引发发率率高高,错错误误引引发发的的引引发发率率一一般般不不要要高高过过100,最最好好没没有有错错误误引引发发位位点点,如如此此可可以以保保证证不不出出非非目目的的产物的假带。产物的假带。引引物物二二聚聚体体及及发发夹夹结结构构的的能能量量

17、一一般般不不要要超超过过4.5,否否则则容容易易产产生生引引物物二二聚聚体体带带,且且会会降降低低引引物物浓度从而导致浓度从而导致PCR正常反应不能进行。正常反应不能进行。对对引引物物的的修修饰饰一一般般是是增增加加酶酶切切位位点点,应应参参考考载载体体的的限限制制酶酶识识别别序序列列确确定定,常常常常对对上上下下游游引引物物修修饰饰的的序序列列选选用用不不同同限限制制酶酶的的识识别别序序列列,以以有有利于以后的工作。利于以后的工作。33关于引物的自动搜索和评价分析关于引物的自动搜索和评价分析推荐使用自动搜索软件:推荐使用自动搜索软件:Primer Premier 5.0 推荐使用引物评价软件

18、:推荐使用引物评价软件:Oligo 5/634OLIGO 5.0 PCR 引物设计引物设计35DNA、蛋蛋白白质质序序列列同同源源分分析析及及进化树构建进化树构建36相似性与同源性相似性与同源性相相似似性性是是指指一一种种很很直直接接的的数数量量关关系系,比比如如部部分分相相同同或或相相似似的的百百分分比比或或其其它它一一些些合合适适的的度度量量。可进行自身局部比较。可进行自身局部比较。如如 Dot Plot(点阵序列比较点阵序列比较)同同源源性性指指从从一一些些数数据据中中推推断断出出的的两两个个基基因因或或蛋蛋白质序列具而共同祖先的结论,属于质的判断。白质序列具而共同祖先的结论,属于质的判

19、断。如如 Alignment(同源性分析同源性分析)37推荐软件推荐软件相似性分析 Peptool Lite同源性分析Vector NTI 6-AlignXContig Express-DNA 序列片断拼接38Vector NTI Suit 同源比较同源比较主窗口主窗口39Vector NTI Suit 同源比较同源比较进化树进化树Nosema granulosisNosema furnacalisVairimorpha imperfectaNosema tyriaeMG5Nosema bombycisNosema bombycisNosema bombycisNosema sp.Vairim

20、orpha sp.Mh8535MG4Mh7521N.BNosema cernanae Vairimorpha necatrixNosema necatrixNosema oulemaeC.SNosema sp.P.RMG2Vairimorpha sp.Nosema sp.Nosema portugalMicrosporidium sp.Nosema vespulaVairimorpha lymantriaeVairimorpha sp.Nosema apisNosema apis40DNA 模拟电泳模拟电泳TipsDNA模拟电泳具有一定实验预示功能,模拟电泳具有一定实验预示功能,模拟电泳不能作

21、为实验结果或依据模拟电泳不能作为实验结果或依据41Vector NTI Suit 5.5 模拟电泳42Gene Construction Kit 2.0 模拟电泳模拟电泳43重要的生物数据库重要的生物数据库三大数据库三大数据库NCBI(美国美国)DDBJ(日本日本)EBI(欧洲欧洲)44其他重要数据库其他重要数据库酵母基因组数据库(酵母基因组数据库(SGD)酵母蛋白质数据库(酵母蛋白质数据库(YPD)拟南芥数据库(拟南芥数据库(AtDB)医学数据库(医学数据库(OMIM)线虫数据库(线虫数据库(ACEDB)45网上数据库的运用网上数据库的运用 IRACE(基因拉长功能)基因拉长功能)BLAST

22、同源序列检索同源序列检索ENTREZ SYSTEM(集集成成信息检索系统信息检索系统)46ENTREZ 集成检索示意图集成检索示意图Entrez是由NCBI开发和维护的一个集成检索数据系统,允许对pubmed,核苷酸和蛋白质的序列数据库,三维结构信息和图谱信息进行集成访问。47四四.生物信息学主要服务内容生物信息学主要服务内容1.PCRPCR引物、测序引物及杂交探针的设引物、测序引物及杂交探针的设计及评价计及评价2.2.DNADNA,蛋白质序列同源分析及进化树蛋白质序列同源分析及进化树构建构建3.3.生物大分子二级结构模拟显示及基本生物大分子二级结构模拟显示及基本序列分析序列分析484.有有关

23、关蛋蛋白白质质亲亲疏疏水水性性,等等电电点点,抗抗原原性性,跨跨膜膜蛋蛋白白,信信号号肽肽等等分分析析以以及及Dot Plot服务服务5.质粒载体构建及克隆策略质粒载体构建及克隆策略6.小小型型数数据据库库建建设设及及协协助助实实验验室室进进行行数数据据管理维护管理维护 四四.生物信息学主要服务内容生物信息学主要服务内容497.医医学学相相关关的的图图像像、病病例例统统计计、分分析析及及小小型数据库建设型数据库建设8.网网上上数数据据库库应应用用辅辅助助:包包括括序序列列拉拉长长(扩扩大大实实验验成成果果),Blastn/Blastp,NCBI Entrez查查询询(多多维维查查询询),新新序序列列、snip等申报等申报9.蛋蛋白白质质三三维维结结构构初初步步预预测测(此此为为生生物物信信息息学学目目前前研研发发的的焦焦点点,正正在在探探索索中中,结结果可能不十分准确或者不能出结果)果可能不十分准确或者不能出结果)四四.生物信息学主要服务内容生物信息学主要服务内容50结束结束The end!51

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!