蛋白质组学数据分析.ppt

上传人:za****8 文档编号:15494947 上传时间:2020-08-13 格式:PPT 页数:72 大小:5.72MB
收藏 版权申诉 举报 下载
蛋白质组学数据分析.ppt_第1页
第1页 / 共72页
蛋白质组学数据分析.ppt_第2页
第2页 / 共72页
蛋白质组学数据分析.ppt_第3页
第3页 / 共72页
资源描述:

《蛋白质组学数据分析.ppt》由会员分享,可在线阅读,更多相关《蛋白质组学数据分析.ppt(72页珍藏版)》请在装配图网上搜索。

1、实习5:蛋白质组学数据分析,系统生物学平台 浙江加州国际纳米技术研究院(ZCNI),张 婧 毛瑞芳 金呈朦 刘贯峰,1.蛋白质组学质谱分析背景介绍 2.蛋白质组学数据库检索软件GPM(X!tandem) 3.蛋白质组学数据统计分析软件TPP,课程内容:,蛋白质组学质谱分析背景介绍,Tandem MS,蛋白质组学质谱分析背景介绍,m/z:质量电荷比,蛋白质组学质谱分析背景介绍,http:/www.expasy.ch/tools/peptidecutter/,粘贴蛋白序列:PGYRNNVVNTMRLWSAKAPNDFNLKDFNVG,选择“Only the following selection

2、of enzymes and chemicals”,并选择胰酶Trypsin酶切,点击Perform,蛋白质组学质谱分析背景介绍,APNDFNLK,肽段离子碎片示意图,蛋白质组学质谱分析背景介绍,具体数值,对应后页中离子质量,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,?面对如此多的质谱谱图和理论图谱我们将如何进行比对,目前人类已知蛋白大约有6万8千种,平均每种蛋白长度为500个氨基酸,平均每种蛋白可以胰切成50个肽段,平均每个肽段有10种可能打碎情况,每一种可能情况产生1张理论图谱,平均一次质谱实验有3000次扫描,每一次扫描产生1张质谱图,蛋白质组学

3、数据库检索软件 GPM(X!tandem),蛋白质组学数据库检索软件,X!Tandem 优点: 运算速度快 免费,并行集群计算成本低 开源可自行修改代码 缺点: 应用范围尚不广泛 后期统计软件接口尚未成熟,蛋白质组学数据库检索软件,硬件要求: 当前主流电脑配置即可胜任小规模数据检索,Download GPM Cyclone XE: ftp:/ftp.thegpm.org/projects/gpm/gpm-xe-installer/,蛋白质组学数据库检索软件,蛋白质组学数据库检索软件,数据库、结果 程序等核心内容,运行程序,质谱原始数据,解压缩:,蛋白质组学数据库检索软件,输出结果目录,数据库,

4、参数,工作流程: 将 *.raw 文件转变为 *.mzXML 文件 (练习文件为肝癌蛋白质组学数据) 2. 编辑参数 3. 运行 GPM中的X!Tandem 4. 查看结果 5. 使用自己的数据库,蛋白质组学数据库检索软件,1. 将 *.raw 文件转变为 *.mzXML 文件,开始运行输入“cmd” 开启命令行窗口,Download:,2. 编辑参数,双击打开,选择程序X!Tandem,选择需要搜索的质谱数据 DTA, PKL, MGF, mzData, mzXML or Tandem BIOML,选择数据库,数据检索输出阈值,二级谱中片段离子理论与实际差异最大允许值,一级谱中片段离子理论与

5、实际差异最大允许值,搜索的离子为b离子与y离子,(|0|/M0)X10(ppm)为离子质量的实测值; 为离子质量的理论值;,氨基酸残基的修饰,完全修饰,潜在的修饰 氧化,磷酸化等等,快速搜索可能的修饰,3.运行程序,点击运行,运行界面,4. 查看结果,查看检索参数,可保存为excel,将结果保存为excel,5.替换数据库,下载蛋白数据库存放到本文件夹 (所使用fasta数据库为所研究种属的蛋白数据库,可从ftp:/ftp.ebi.ac.uk/pub/databases/IPI/current/下载得到),用记事本打开,编辑文件,在GPM界面,数据库的下拉菜单中添加一个名为mydatabase

6、的选项,将新数据库的newdatabase.fasta.pro添加到GPM中, 保存文件,重新选择数据库运行程序。,参考文献:,http:/thegpm.org/ http:/thegpm.org/GPM/gpm_install_faq.html,蛋白质组学数据统计分析软件Trans-Proteomics Pipeline (TPP),Trans-Proteomic Pipeline (TPP)是用于LC/MS/MS蛋白质组学数据分析的软件. TPP包含一系列蛋白质鉴定和定量分析的模块, 能够对经Sequest数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的.,蛋白质组学数

7、据统计分析软件,Trans-Proteomic Pipeline,蛋白质组学数据统计分析软件,蛋白质组学数据统计分析软件,sp|P02754|LACB_BOVIN BETA-LACTOGLOBULIN PRECURSOR (BETA-LG) (ALLERGEN BOS D 5) - Bos taurus (Bovine). MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDAQSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAEKTKIPAVFKIDALNENKLVLDTDYKKYLLFCMENSAEPEQSLACQCL

8、VRTPEVDDEALEKFDKALKALPMHIRLSFNPTQLEEQCHI,TPEVDDEALEK : p = 0.96,PTPEGDLEILLQK : p = 0.81,LSFNPTQLEEQCHI : p = 0.65,P = 1 (1-0.81)(1-0.96)(1-0.65) = 0.99,蛋白质组学数据统计分析软件,TPP的安装与配置,从http:/tools.proteomecenter.org/TPP.php上下载并安装windows版本TPP软件。TPP_Setup_v4_2_JETSTREAM_rev_0.exe。安装过程中选择附带安装Apache(安装TPP4.2要求

9、系统已安装ActivePerl-5.8.8.*以上版本,可从网站上下载)。安装完成后,将会生成TPP的图标,安装完后,桌面上生成了TPP图标,使用TPP,点击桌面上的 TPP Web Tools ,将会出现TPP的登陆界面.,UserName: guest Password: guest,TPP Web Interface的欢迎界面,样本数据分析,准备工作: 确保C盘至少1G的空闲的硬盘空间. 将数据文件ZCNI_No1(含.dta和.out文件)至ZCNI_No6和质谱RAW文件ZCNI_No1.RAW至ZCNI_No6.RAW,以及Sequest参数文件sequest.param放到目录:

10、 C:InetpubwwwrootISBdataZCNI_training下 3. 将数据库文件ipi.HUMAN.fasta放到目录: C: database中,操作流程,将质谱RAW文件转换成mzXML文件 ; 以Sequest结果文件和mzXML文件转换成xml文件; 运行PeptideProphet,得到pepXML文件; 以上步得到的pepXML文件运行ProteinProphet,得到最终结果;,1.将RAW转换成mzXML文件,点击mzXML Utils,选择mzXML,在Input File Format中选择 Thermo Raw,在Specify File to conve

11、rt to mzXML中添加RAW文件,选择目录ZCNI_training,选择所有的RAW文件,在Conversion Options中选择Centroid, 然后点击Convert to mzXML,程序运行界面,2.由.out文件整合成pepXML文件,点击“Analysis Pipeline”, 然后点击pepXML,出现如图所示的界面。,选择需要转换成pepXML的.out文件夹,提交sequest检索时所用参数文件,选择所有文件夹,选择sequest的参数文件,其他参数选择默认,点击Convert to PepXML,即可以将文件夹中的所有.out文件整合成pepXML文件,程序运

12、行界面,3.运行PeptideProphet,选择RUN PeptideProphet,其他参数为默认.,点击RUN Xinteract,即可作 PeptideProphet分析.,PeptideProphet分析,在IE中打开的PeptideProphet的结果,在pick columns选项中选中xcorr、deltcan、sprank三个sequest的参数,选择Update Page,4.运行ProteinProphet,点击Analysis Pipeline,选择Analyze Proteins,点击,添加文件,选择经PeptideProphet后生成的 Interact.pep.x

13、ml文件,其他为默认,点击Run ProteinProphet!,其它参数为默认,点击Run ProteinProphet,即可运行ProteinProphet程序,运行ProteinProphet完成后生 成的interact-prot.shtml 文件可由IE打开.,在IE中输入http:/localhost/ISB/data/ZCNI_training/interact.prot.shtml,看到经ProteinProphet后的结果为:,7.数据的过滤筛选和将结果保存成Excel文件,在min probability填上0.9,选择export To excel,然后点击Filter/Sort/Discard Checked entries,即可将结果过滤并生成Excel文件.,过滤筛选后生成的excel文件,肽段的氨基酸序列,过滤筛选后生成的excel文件,Thank You!,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!