生物信息学毕业论文

上传人:仙*** 文档编号:28874352 上传时间:2021-09-17 格式:DOC 页数:32 大小:592.02KB
收藏 版权申诉 举报 下载
生物信息学毕业论文_第1页
第1页 / 共32页
生物信息学毕业论文_第2页
第2页 / 共32页
生物信息学毕业论文_第3页
第3页 / 共32页
资源描述:

《生物信息学毕业论文》由会员分享,可在线阅读,更多相关《生物信息学毕业论文(32页珍藏版)》请在装配图网上搜索。

1、湖 南 科 技 大 学毕 业 设 计( 论 文 )题目绵羊MHC Class基因的生物信息学分析作者周丽萍学院生命科学学院专业生物科学学号0709010125指导教师金元昌二一一年 月 日湖 南 科 技 大 学毕业设计(论文)任务书 生命科学学院 院 生物工程 系(教研室)系(教研室)主任: (签名) 2011 年 1 月 18 日学生姓名: 周丽萍 学号: 07090101025 专业: 生物科学 1 设计(论文)题目及专题: 绵羊 MHC ClassII基因的生物信息学分析 2 学生设计(论文)时间:自2011年 1月18日开始至 2011 年 6 月 10 日止3 设计(论文)所用资源和

2、参考资料:3.1所用资源:万维网上的生物数据库;学校所购买的电子期刊;校图书馆;学院实验室网络;3.2 参考资料:张阳德编著.生物信息学M北京:科学出版社,2004.9.金伯泉.细胞和分子免疫学M.科学出版社,2006,281-305. 许忠能.生物信息学M. 清华大学出版社,2008,1-4. 杨晶,胡刚,王奎,沈世镒.生物计算生物序列的分析方法与应用M.科学出版社,2010,105-111.4 设计(论文)应完成的主要内容:4.1获取绵羊 MHC ClassII基因核酸与蛋白序列及与其同源的其它物种的序列,进行多序列比对,做出分子进化树,并分析; 4.2对绵羊 MHC ClassII分子的

3、疏水区、跨膜区、功能结构域和生物活性位点分析; 4.3预测绵羊 MHC ClassII分子的二级结构与三级结构。 5 提交设计(论文)形式(设计说明与图纸或论文等)及要求: 5.1严格按照的写作完成毕业论文,完成不少于8000字信息量的论文;格式正确,包括目录、论文中英文题目及摘要、前言、正文、参考文献、致谢词和附录; 5.2 在实验及论文写作过程中,对数据和结果等要求实事求是,并且要在老师的指导下独立完成。 6 发题时间: 2011 年 1 月 17 日指导教师: (签名)学 生: (签名)湖 南 科 技 大 学毕业设计(论文)指导人评语主要对学生毕业设计(论文)的工作态度,研究内容与方法,

4、工作量,文献应用,创新性,实用性,科学性,文本(图纸)规范程度,存在的不足等进行综合评价指导人: (签名)年 月 日 指导人评定成绩: 湖 南 科 技 大 学毕业设计(论文)评阅人评语主要对学生毕业设计(论文)的文本格式、图纸规范程度,工作量,研究内容与方法,实用性与科学性,结论和存在的不足等进行综合评价评阅人: (签名)年 月 日 评阅人评定成绩: 湖 南 科 技 大 学毕业设计(论文)答辩记录日期: 学生: 学号: 班级: 题目: 提交毕业设计(论文)答辩委员会下列材料:1 设计(论文)说明书共页2 设计(论文)图 纸共页3 指导人、评阅人评语共页毕业设计(论文)答辩委员会评语:主要对学生

5、毕业设计(论文)的研究思路,设计(论文)质量,文本图纸规范程度和对设计(论文)的介绍,回答问题情况等进行综合评价答辩委员会主任: (签名)委员: (签名)(签名)(签名)(签名) 答辩成绩: 总评成绩: 摘 要从NCBI中获取绵羊主要组织相容性复合体(Major Histocompatibility Complex,MHC)的核苷酸与氨基酸序列,应用生物信息学原理,对绵羊MHC分子疏水区、跨膜区、结构功能域和生物活性位点等几方面生物学特性进行了分析,预测出该基因的二级结构和三级结构,并将绵羊与其它动物的核苷酸和氨基酸序列进行多序列对比,做出分子进化树。结果表明,绵羊MHC分子有一个疏水区和跨膜

6、区;该分子有主要组织相容性复合物蛋白免疫球蛋白信号及N-糖基化位点、蛋白质激酶C磷酸化位点等多个生物活性位点。绵羊MHC class的氨基酸序列和核苷酸序列与成都麻羊的同源性最高,分别达66%和73%,其次与亚洲水牛和肩蜂牛的同源性也较高,与大黄鱼的同源性最低,分别为25%和51%。关键词:主要组织相容性复合体类;生物信息学;序列分析ABSTRACTExtract Ovis aries from NCBI of nucleotides and Major Histocompatibility Complex class II amino acid sequence, application b

7、ioinformatics principle, on Ovis aries MHC class II molecules succoth watershed and transmembrane area, the structure and function domain and biological activity sites aspects of biology characteristic was analyzed to predict the secondary structure and level 3 genetic structure, and the Ovis aries

8、and other animals will be more nucleotide sequence of amino acid sequence and contrast, make more sequence phylogenetic tree. Results show that, Ovis aries MHC class II molecules have a dredging watershed and transmembrane area, the molecules are major histocompatibility complex protein immunoglobul

9、in signal and N - glycosylation sites, protein kinase C phosphorylation sites such multiple bioactive loci sites, Ovis aries MHC class II the sequence of amino acids and nucleotide sequences and the Capra hircus is highest homology of 66% and 73%. Secondly Bubalus bubalis and Bos indicus homology of

10、 higher, with the lowest, homology of Larimichthys crocea for 25% and 51% respectively.Keywords: Major Histocompatibility Complex class II molecules; Bioinformatics; Sequence analys 湖南科技大学本科生毕业设计(论文)目 录第一章 前言11.1 生物信息学简介11.2 MHC的相关简介1第二章 材料来源4第三章 分析方法53.1 蛋白质序列的获取53.1.1 绵羊MHC Class基因的核酸和蛋白质序列的获得53.1

11、.2 同源序列获得53.2 蛋白质的基本性质分析53.2.1 疏水性分析53.2.2 跨膜区分析53.2.3 功能结构域分析53.2.4 生物活性位点分析53.3 蛋白质结构预测53.3.1 蛋白质二级结构的预测53.3.2 蛋白质三级结构预测53.4 绵羊MHC Class系统进化树分析5第四章 结果与分析64.1 绵羊MHC Class基因的核酸和蛋白质序列64.2 绵羊MHC Class蛋白质的疏水性和跨膜区分析74.2.1绵羊MHC Class蛋白质的疏水性分析74.2.2绵羊MHC Class蛋白质的跨膜螺旋区分析84.3 绵羊MHC Class蛋白质的功能结构域分析94.4 绵羊M

12、HC Class蛋白质生物活性位点分析114.5 绵羊MHC Class蛋白质的二级结构预测124.6 绵羊MHC Class蛋白质的三级结构预测144.7 同源序列对比和系统发生分析15第五章 结论21参考文献22致谢23-第一章 前 言1.1 生物信息学简介生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性系统科学,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义1。它的研究内容包括生物信息的存储于获取、序列比对、测序与拼接、基因预测、生物进化与系统发育分析、蛋白质结构预测、RNA结构预测、分子设计与药物设计、代谢网络分析、基因芯片、DN

13、A计算等。它还是一门以信息知识为基础的学科,关键资源是知识,关键技术是信息处理。它为揭示人类及重要动植物种类的基因组信息,继而进行生物大分子结构模拟和药物设计,以及天然生物大分子的改造和基于受体结构的药物分子设计提供依据。生物信息学不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质具有重要意义,而且可为人类疾病的诊断和防治开辟全新的途径,并为动植物的物种改良提供了坚实的理论基础。此外通过对影响药物代谢或效应通路、相关基因编码序列的再测序,很可能揭示个体对药物差别的遗传学基础2。生物信息学作为生命科学研究所必需的研究工具,在生命科学实践中越来越显示出它的重要作用,特别是在实验设计、结构分析

14、上,离不开生物信息学的指导3。而生物数据库、相关软件是生物信息学研究与应用的重要资源。在生物信息学软件中,生物学研究人员用得最多的软件是搜索工具BLAST(Basic Local Alignment Search Tool)1。本文则是对绵羊MHC class II基因进行了生物信息学分析,也多次使用了BLAST软件。1.2 MHC的相关简介诱导强而迅速排斥反应的抗原称为主要组织相容性抗原或主要移植抗原, 编码这种抗原的基因群称为主要组织相容性复合体(Major Histocompatibility Complex, MHC)。 主要组织相容性复合体是存在于脊椎动物某一染色体上的一群紧密连锁的

15、基因群,编码主要组织相容性抗原,调控细胞间相互识别,并与免疫应答和免疫调节有关,呈高度多态性4。多态性是一个群体的概念,指MHC存在多个基因座位,染色体同一基因座有两种以上的基因型,即可能编码两种以上的产物。MHC的高度多态基因区,这些连锁的免疫应答基因控制着机体对抗原产生免疫应答的能力。MHC高度多态性赋於物种极大的应变能力造就了各式各样对抗原(病原体)入侵反应性和易感性不同的个体.使之能对付多变的环境条件及各种病原体的侵袭。在免疫应答的T-B、T-T、T-APC细胞的相互作用中,T细胞除识别抗原物质外,还必须同时识别与之作用细胞表面的MHC分子,这一现象称为MHC限制性。不同的物种,不同种

16、属动物都有自身的MHC:如人的MHC通常称HLA基因(hunan leukocyte antigen,HLA)或HLA基因复合体, 称其产物为HLA分子或HLA抗原;称小鼠MHC为H-2;称黑猩猩为ChLA;称狗为DLA;称猪为SLA;称牛为BoLA。根据主要组织相容性抗原分子结构、分布和功能不同分为、类分子。按所含基因的功能不同,一般可将MHC区域分为Class区、Class区和Class区。其编码基因也相应地分成三类。类和类分子是结构相似的细胞膜表面糖蛋白,除作为移植抗原外,还与抗原递呈及某些疾病相关。类分子包括C2、C4、B因子和肿瘤坏死因子等多种可溶性蛋白质。MHC类分子:所有有核细胞

17、及血小板、网织红细胞。图1.1 MHC分子结构图MHC-类分子是异源二聚体,它的分子的两条链均由MHC-类分子基因编码,由链和链以非共价键结合的多肽链构成(如图1.1所示),其中链分子量为3234kDa,有两个N连接寡糖;链为2730kDa,有一个N连接寡糖。两条链在整个结构上彼此相似,由于糖基化作用,链比链略大,链、链胞膜外区各有两个结构域1、2及1、2,每个结构域约含90个氨基酸残基。链和链均是跨膜蛋白,C端为胞浆区。除1结构域外,2、1和2每个结构域均含一个二硫键。胞膜外区(跨膜区和胞浆区)按功能进一步分为肽结合区和免疫球蛋白样区。MHC-类分子的两条链均由不同的MHC基因编码,呈多态性

18、。肽结合区MHC-类分子的1、1结构域与免疫球蛋白样区结构域无相似性,是类分子结合抗原肽部位和高度多态性所在。每个结构域都是有4条折叠和1个螺旋组成,1和1结构域的片层共同形成肽结合沟槽的底部,1和1结构域的螺旋共同形成肽结合沟槽的侧壁。2和2结构域属于免疫球蛋白超家族C1型结构,具非多态性,2和2结构域是MHC-类分子的非多态部分,也是与CD4分子相互作用的位点。2和2结构域C端侧各有一个短的连接区,分别连接2、2结构域与跨膜区。跨膜区约含25个氨基酸残基,形成螺旋将链和链固定在细胞膜上。胞浆区很短,有2530个氨基酸残基,可能与信号转导有关5。在MHC基因内,第一外显子编码先导顺序或信号顺

19、序,它将新生蛋白带向内质网。每个约由90个氨基酸组成的细胞外区残基各有一个大外显子跨膜区和胞浆区由几个小外显子编码。控制MHC基因转录的许多顺式调节顺序位于编码MHC分子外显子阅读框架的5端,这些核苷酸顺序是DNA-结合蛋白的分子靶位,这些DNA-结合蛋白事反式转录调节因子。MHC基因转录调节的一般原则与免疫球蛋白基因相似。MHC类基因启动子序列位于基因编码区5端上游,转录起始点上游200bp范围内。MHC类基因进侧基因启动子部分存在多态性,表现为顺式作用元件DQ,DP的多基因家族,是类分子多样性的分子基础,在免疫应答中起关键作用5。本文是对绵羊MHC class分子进行生物信息学分析,应用生

20、物信息学方法找出绵羊MHC class的核酸和蛋白质序列,对绵羊MHC class分子疏水区、跨膜区、结构功能域和生物活性位点等几方面生物学特性进行了分析,预测出该基因的二级结构和三级结构,并将绵羊与其它动物的核苷酸和氨基酸序列进行多序列对比和系统分子进化树分析,对绵羊MHC class的研究做一下基础性工作。第二章 材料来源绵羊MHC class基因及其同源的其它物种的核酸和氨基酸序列编码(表2.1)。 表2.1 不同物种MHC class基因的核酸和蛋白质序列种类(species)蛋白质编号(protein ID)核酸编号(nucleotide ID)绵羊NP-001116870NM-00

21、1123398褐家鼠CAD86939AJ554216原鸡AAR14674AY357254小家鼠NP-034508NM-010378非洲爪蟾蜍NP-001079971NM-001086502家猫ACK99138EU915361家马XP-001493225XM-001493175野驴ABM92287EF204945欧洲兔NP-001164589NM-001171118欧洲野兔ACN39186FJ225345大熊猫XP-002914414XM-002914368鹪鹩AAN87894AY169005成都麻羊AAR97716AAR97716亚洲水牛AAY40169DQ016629肩峰牛CAX17688F

22、M986339大猩猩AAU87999AY663403红毛猩猩ACL00582EU877227野猪ABA42968DQ159895大西洋鲱CAM34665AM492999三文鱼CAD27719AJ438965大黄鱼ABV48907EF681863人NP-002113NM-002122家犬CAH61722AJ630362第三章 分析方法3.1 蛋白质序列的获得3.1.1 绵羊MHC class基因的核酸和蛋白质序列的获得 在NCBI数据库上搜索绵羊MHC class基因的核酸和蛋白质序列。3.1.2 同源序列获得 利用NCBI上的BLAST程序对比直接获取与绵羊MHC class基因同源的核酸和蛋

23、白质序列。3.2 蛋白质的基本性质分析3.2.1 疏水性分析 用位于Expasyde的Protscale6(http:/www.expasy.org/cgi-bin/protscale.pl) 程序对其进行疏水性分析。3.2.2 跨膜区分析 联网至(http:/www.genome.cbs.dut.dk/services/TMHMM-2.0)使用服务器TMHMM-2.07 或联网至(http:/www.ch.embnet.org/software/TMPRED_form.html)进行跨膜区分析。3.2.3 功能结构域分析 联网至(http:/www.ebi.ac.uk/interpro/in

24、dex.html)用EBI开发的InterProScan7进行分析。3.2.4 生物活性位点分析 利用位于Expasy的Prosite6(http:/www.expasy.org/prosite/)对绵羊MHC class蛋白质进行活性位点分析。3.3 蛋白质结构预测3.3.1 蛋白质二级结构的预测 联网至(http:/www. Predictprotein.org/)用PHD8对绵羊MHC class进行分析或联网至PSIPRED8的网址(http:/bioinf.cs.ucl.ac.uk/psipred)。3.3.2 蛋白质三级结构的预测 利用位于SWISS-MODEL5的Automate

25、d Mode服务器返回到邮件的结果,观察蛋白质的三级结构。3.4 绵羊MHC class系统进化树分析联网至(http:/www.ebi.ac.uk/clustalw/)6对所获得的同源蛋白质序列进行比对分析并构建系统进化树。第四章 结果与分析4.1 绵羊MHC class基因的核酸和蛋白质序列在NCBI上获取绵羊的蛋白质序列(序列号:NP-001116870): 1MKKALILRALALAAMMSLCGGEDIVADHVGTYGTNVYQTYGASGQFTFEFDGDELFYVDL61RKKETVWRLPEFNNITMFEIQSALRNIVMSKRNLDILMKNSNFTPATNDIPEV

26、AVFPKSS121VILGIPNTLICQVDNIFPPVINITWFYNGQFVAEGVAETTFYPKSDHSFLKFSYLTFVPA181SEDFYDCRVEHWGLEEPLVKHWEPKIPTPTSELTETVVCALGLPMGLMGIVVGTVLILRV241RCSGAASRRRRAMSHGLKDGKERKVFISVFAAASGAQDHQPHAAWCFR该蛋白质序列由288个氨基酸残基组成。在NCBI上获取绵羊的核酸序列(序列号:NM-001123398): 1CATGGGCTGCTCCAACATGATTTCTCCAGCAGTTCTCTTTAGACCACCTTCCTGGTGAGG6

27、1CACCACTTGGAACAGCCACTCCTGAGGAAACCCTTGGAGGAGGAGGAGGATGAAGAAAGC121TCTGATTCTGAGGGCTCTCGCTCTGGCCGCCATGATGAGCCTGTGTGGAGGTGAAGACAT181CGTGGCGGACCACGTGGGCACTTACGGCACAAATGTCTACCAGACGTACGGCGCCTCTGG241CCAGTTCACGTTTGAATTTGATGGAGACGAGCTCTTCTACGTGGACCTGAGGAAAAAAGA301GACTGTCTGGAGGCTGCCCGAGTTTAACAATATCACCATGTTTGAAA

28、TTCAGAGTGCCCT361GAGAAACATTGTTATGTCAAAAAGAAATTTGGACATCTTGATGAAAAATTCCAACTTTAC421ACCTGCCACCAATGACATCCCTGAAGTGGCTGTGTTTCCCAAATCCTCCGTGATCCTGGG481GATTCCCAACACCCTCATCTGTCAGGTGGACAACATCTTTCCTCCTGTGATCAACATCAC541TTGGTTTTACAATGGACAGTTTGTTGCAGAAGGTGTCGCTGAGACCACCTTCTACCCCAA601GAGTGACCACTCCTTCCTCAAGTTCAGTTACC

29、TCACCTTTGTTCCCGCCAGTGAAGACTT661CTATGACTGCAGAGTGGAGCACTGGGGCCTGGAAGAGCCCCTCGTCAAGCACTGGGAGCC721CAAGATTCCAACCCCTACATCAGAGCTGACAGAGACTGTGGTCTGTGCCCTGGGGCTGCC781CATGGGCCTCATGGGCATCGTGGTGGGCACTGTCCTCATCCTCCGAGTCCGGTGCTCAGG841TGCTGCCTCCAGACGTCGAAGGGCCATGAGTCATGGCCTGAAAGATGGGAAGGAGAGGAA901AGTCTTCATTTCTGTTT

30、TCGCTGCAGCATCGGGAGCACAGGACCATCAGCCTCATGCTGC961CTGGTGTTTCAGGTGATCAGTCTTTACAAGAAAAGAAAGGCATGGTTCAGGCTCCAGTTC1021CCCATCTTGACCTTGACTGAGACGTGCTCCTTGGTCCATTTCATCACAGAGCTCCTTCCA1081CGCCCTCCTGCTCTCCCTGCTGGGGCAGACTTTATGGAGGAATTTTCCTTCGAAGATCAC1141TGACCCTCACGAATTCTCCCAACTTAGTCTTTGATTCATTGCCTACCTGTCACAGAGACC12

31、01TGGATTGTTCCACC 该核酸序列由1214个碱基组成。4.2 绵羊MHC class蛋白质的疏水性和跨膜区分析4.2.1 绵羊MHC class蛋白质的疏水性分析疏水性是每个氨基酸所固有的特性,即每个氨基酸远离周围水分子,将自己包埋进蛋白质核心的相对趋势。疏水性氨基酸在蛋白质内部,由于其疏水性的相互作用,在保持蛋白质三级结构的形成和稳定中起着重要作用。疏水性预测的方法依赖于疏水性的衡量尺度,每个氨基酸根据其一系列的物理特性(例如溶解性、跨越水-汽相时产生的自由能等),被赋予一个数值以代表其疏水性。组成蛋白质的20种氨基酸各自带有不同极性的侧链基团,氨基酸侧链的疏水性,用从各氨基酸的

32、疏水性减去甘氨酸疏水性之值来表示。具有较高正值的氨基酸具有较强的疏水性;而具有较低负值的氨基酸则具有较强的轻水性6。利用位于Expasy的Protscale进行疏水性分析,当Window size设置为9时,当氨基酸残基的疏水性值大于2.34时,为明显的疏水区。单个氨基酸疏水性值:Ala: 1.800 Arg: -4.500 Asn: -3.500 Asp: -3.500 Cys: 2.500 Gln: -3.500 Glu: -3.500 Gly: -0.400 His: -3.200 Ile: 4.500 Leu: 3.800 Lys: -3.900 Met: 1.900 Phe: 2.8

33、00 Pro: -1.600 Ser: -0.800 Thr: -0.700 Trp: -0.900 Tyr: -1.300 Val: 4.200 : -3.500 : -3.500 : -0.490 MIN: -2.244MAX: 3.122图4.1 用Protscale对绵羊MHC class蛋白质进行疏水性分析结果从上图返回的结果我们得知在第234位氨基酸处有最大值3.122,在第258位氨基酸处有最小值-2.244,在第位231至236位氨基酸的值分别为2.503,2.829,2.941,3.122,2.912,2.601这一区段氨基酸疏水性值大于2.34,所以我们得出结论:该蛋白质序

34、列在位于231236位残基之间具有明显的疏水性,从而说明该序列有一个疏水区。4.2.2 绵羊MHC class蛋白质的跨膜螺旋区分析膜蛋白是一类结构独特的蛋白质,执行着重要的细胞生物学功能。蛋白质序列含有跨膜区,提示它可能作为膜受体起作用,也可能是定位在膜上的锚定蛋白或离子通道蛋白,所以含有跨膜区蛋白往往和细胞的功能状态密切相关,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用9。通常使用单一的预测软件分析的准确性都不太高,综合不同的软件预测结果并结合疏水性图,可获得较好的预测结果。使用两种在线网络工具分析结果分别是:(1)利用TMHMM软件分析结果如下:# Sequence Length:

35、288# Sequence Number of predicted TMHs: 1# Sequence Exp number of AAs in TMHs: 21.83121# Sequence Exp number, first 60 AAs: 0.52936# Sequence Total prob of N-in: 0.06765SequenceTMHMM2.0outside 1 217SequenceTMHMM2.0TMhelix 218 240SequenceTMHMM2.0inside 241 288图4.2 用TMHMM对绵羊MHC class蛋白质的跨膜区分析结果根据以上数据和

36、图表显示我们可以得出这样的结论:在位于位于218240位氨基酸之间存在一个跨膜区。(2)利用Tmpred软件分析结果如下:possible models considered, only significant TM-segments used- STRONGLY prefered model: N-terminus outside 3 strong transmembrane helices, total score : 3329 # from to length score orientation 1 4 25 (22) 742 o-i 2 121 143 (23) 542 i-o 3 2

37、17 240 (24) 2045 o-i- alternative model 3 strong transmembrane helices, total score : 2867 # from to length score orientation 1 6 24 (19) 899 i-o 2 114 133 (20) 505 o-i3 216 238 (23) 1463 i-o 图4.3 用Tmpred对绵羊MHC class蛋白质的跨膜区分析结果由分析结果和图像显示,可得出这样的结论:绵羊MHC class蛋白质的跨膜区有两种可能,它有三个明显的跨膜区。一种可能为它的跨膜区一个位于 425

38、 位氨基酸之间,一个位于121143位氨基酸之间,另一个位于217240位氨基酸之间。另一种可能为它的跨膜区一个位于624位氨基酸之间,一个位于114133位氨基酸之间,另一个位于216238位氨基酸之间。总体来看,Tmpred软件预测出三个跨膜区,TMHMM预测出一个跨膜区,显然,对于同一蛋白,两种不同的的方法给出了不同的预测结果,但部分预测结果大致相同。然而在多数情况下,Tmpred的预测结果比实际情况会稍微长一些或偏一些,基于综上考虑,认为该蛋白仅存在一个跨膜区,位于218240位氨基酸残基之间,这与疏水性的分析也基本吻合。4.3 绵羊MHC class蛋白质的功能结构域分析结构域(St

39、ructuralDomain)是生物大分子中具有特异结构和独立功能的区域,特别指蛋白质中这样的区域,是介于二级和三级结构之间的另一种结构层次。所谓结构域是指蛋白质亚基结构中明显分开的紧密球状结构区域,又称为辖区。在球形蛋白中,结构域具有自己特定的四级结构,其功能部依赖于蛋白质分子中的其余部分,但是同一种蛋白质中不同结构域间常可通过不具二级结构的短序列连接起来。蛋白质分子中不同的结构域常由基因的不同外显子所编码。有些球形蛋白的一条肽链,或以共价键相连的两条或多条肽链在空间结构上可以区分为若干个球状的子结构,其中的每一个球状子结构就被称为一个结构域。图4.4 用InterProScan对绵羊MHC

40、 class蛋白质的功能结构域分析结合Prosite数据库分析: hits by profiles: 1 hit (by 1 profile) on 1 sequenceHits by PS50835 IG_LIKE Ig-like domain profile :USERSEQ1(288 aa)111 - 191:score = 11.134PEVAVFP-KSSVILGIPNTLICQVDNiFPPVINITWFYNG-QFVAEGVAETTFYpKSDHSFLKFSYltFVPASEDFYDCRVEH-Predicted feature:DISULFID131187By similari

41、tycondition: C-x*-Chits by patterns: 1 hit (by 1 pattern) on 1 sequenceHits by PS00290 IG_MHC Immunoglobulins and major histocompatibility complex proteins signature :USERSEQ1(288 aa)185 - 191:YDCRVEH 图4.5 用PROSIT对绵羊MHC class蛋白质的功能结构域分析通过两种不同的数据库发现该蛋白质存在主要组织相容性复合物蛋白免疫球蛋白信号、免疫球蛋白c1位点、免疫球蛋白样结构域、主要组织相容

42、性复合体类样识别抗原、主要组织相容性复合体类样识别抗原蛋白、免疫球蛋白样折叠以及未整合区段。通过Prosite数据库我们发现在111191位氨基酸之间存在一个免疫球蛋白样结构域,其期望值是11.134。其中131187位氨基酸之间存在二硫化物,起着重要的生理作用。在185191位氨基酸之间存在一个主要组织相容性复合物蛋白免疫球蛋白信号。在InterProScan数据库中发现于126197位氨基酸段为免疫球蛋白c1位点,27104 位氨基酸段为主要组织相容性复合体类样识别抗原,105221位氨基酸段为免疫球蛋白样折叠。4.4 绵羊MHC class蛋白质生物活性位点分析Pattern-ID: A

43、SN_GLYCOSYLATION PS00001 PDOC00001Pattern-DE: N-glycosylation sitePattern: NPSTP 74 NITM 142 NITWPattern-ID: CAMP_PHOSPHO_SITE PS00004 PDOC00004Pattern-DE: cAMP- and cGMP-dependent protein kinase phosphorylation sitePattern: RK2.ST 62 KKETPattern-ID: PKC_PHOSPHO_SITE PS00005 PDOC00005Pattern-DE: Pro

44、tein kinase C phosphorylation sitePattern: ST.RK 90 SKR 247 SRRPattern-ID: CK2_PHOSPHO_SITE PS00006 PDOC00006Pattern-DE: Casein kinase II phosphorylation sitePattern: ST.2DE 76 TMFEPattern-ID: MYRISTYL PS00008 PDOC00008Pattern-DE: N-myristoylation sitePattern: GEDRKHPFYW.2STAGCNP 30 GTYGTN 124 GIPNT

45、L 149 GQFVAE 155 GVAETT 222 GLPMGL 229 GIVVGT 256 GLKDGKPattern-ID: IG_MHC PS00290 PDOC00262Pattern-DE: Immunoglobulins and major histocompatibility complex proteins signaturePattern: FYLCPGADVALCH185 YDCRVEH结果表明,该蛋白质序列含有:2个N-糖基化位点,位于7477和142145位氨基酸段;1个A激酶位点,位于6265为氨基酸段;2个蛋白质激酶C磷酸化位点,分别位于9092和247249

46、位氨基酸段;1个酪蛋白激酶II磷酸化位点,分别位于7679位氨基酸段;7个N-肉豆蔻酰化作用位点,分别位于3035、124129、149154、155160、222227、229234、256261位氨基酸段;1个主要组织相容性复合物蛋白免疫球蛋白信号,位于185191位氨基酸段。4.5 绵羊MHC class蛋白质的二级结构预测蛋白质的二级结构预测是联系其一级结构和三级结构的桥梁和纽带,并为蛋白质三级结构和功能提供了大量信息,有助于蛋白质突变体的设计,有助于确定蛋白质空间结构与功能。用PHD预测蛋白质的二级结构,如图4.6。在该蛋白质序列中,螺旋结构(H)占总序列的18.06% ,折叠结构(

47、E)占总序列的28.47% ,卷曲结构(L)占总序列的53.47%。由此可见该蛋白质卷曲程度较高。表4.1 蛋白质二级结构预测组成结构类型 螺旋(H) 折叠(E) 卷曲(L)所占比列(%) 18.06 28.47 53.47用PHD方法预测如下:图4.6 蛋白质二级结构预测的PROF结果图中缩词说明:AA:氨基酸序列OBS _sec:观察到的二级结构(H=螺旋,E=折叠,L=环) PROF _sec: PROF预测的二级结构Rel _sec: PROF的可靠性(0=低,9=高)SUB _sec: PROF预测的结果(“.”意味着对应残基未给出预测结果,因为其可靠性低于5%)O_3 _acc:所

48、观察到的具有相对溶解性的两种情况:b=0-9% ,i=9-36% ,e=36-100%P_3 _acc: PROF预测相对溶解性的三种情况:b=0-9%,i=9-36%,e=36-100%Rel _acc:PROF预测的可靠性(0=低,9=高)SUB _acc: PROF预测的子集,所有残基期望的平均相关性0.694.6 绵羊MHC class蛋白质的三级结构预测利用SWISS-MODEL对绵羊MHC class蛋白质的模建结果如下:Model information: Modelled residue range: 23 to 202 Based on template: 1es0A (2.

49、60 ) Sequence Identity %:67.222 Evalue:5.45e-72 图4.7 模建质量评价分析图4.8 模建的蛋白质三级结构图(SWISS-MODEL)由以上分析结果和图像可得出:绵羊MHC class II蛋白质三级结构是基于1es0的A链模建的,两者序列一致性达到67.222%。该模建的蛋白质三级结构是由第23202位氨基酸参与的,其空间结构见图4.8。图4.7中绿色区域表示合适的空间结构,红色区域表示不合适的空间结构。4.7 同源序列比对和系统发生分析利用BLAST程序得出绵羊MHC class II与其它物种的同源性比较,然后利用CLUASTAL2.1软件进

50、行物种之间的多序列对比作出进化树并做出分析。表4.2 绵羊MHC class与其它物种的同源性比较动物种类核苷酸相差数目同源性氨基酸相差数目同源性绵羊/褐家鼠28867.014447.0绵羊/人29566.014845.0绵羊/原鸡32457.016238.0绵羊/小家鼠27968.014048.0绵羊/非洲爪蟾蜍30666.015842.0绵羊/家猫25577.011357.0绵羊/家马16580.08263.0绵羊/野猪16182.08064.0绵羊/大西洋鯡40056.019226.0绵羊/三文鱼39264.017731.0绵羊/大黄鱼41051.020125.0绵羊/野驴19279.0

51、9160.0绵羊/欧洲兔27670.013850.0绵羊/欧洲野兔27769.013750.0绵羊/大熊猫22276.011657.0绵羊/鹪鹩36059.018030.0绵羊/亚洲水牛14483.07365.0绵羊/肩蜂牛14083.07565.0.绵羊/大猩猩30264.015644.0绵羊/红毛猩猩30063.015444.0绵羊/成都麻羊12286.06067.0绵羊/家犬24374.012056.0从以上对比我们可以看出绵羊MHC class的核苷酸序列和氨基酸序列同成都麻羊的同源性最高,核苷酸的同源性为86%,氨基酸的同源性为67%,与大黄鱼的同源性最低,核苷酸的同源性51%,氨基

52、酸的同源性为25%。CLUSTAL 2.1 multiple sequence alignment(用CLUSTAL 2.1软件进行得多序列比对结果如下):家猫 VLGFCIMALLMGPQESLA-IKEEHVIIQAEFYLKPDSS-GEFMFDFDGDEIFHVDM 54家犬 VLGFFIMAFLMGPQESWA-VKEEHVIIQAEFYLTPDPS-GEFMFDFDGDEIFHVDM 54红毛猩猩 MLGVFIIAVLMSAQESRA-IKEEHVIIQAEFYLNPDQS-GEFMFDFDGDEIFHVDM 54欧洲野兔 VLGFFIIAILMSPQKSWA-IKEEHVIIQA

53、EYFLSPDDL-GEFMFDFDGDEIFHVDM 54亚洲水牛 ILGLFIT-VLISLQESWA-IKEDHVIIQAEFYLKPEES-AEFMFDFDGDEIFHVDM 54肩峰牛 ILGLFIT-VLIGLQESWA-IKENHVIIQAEFYLKPEES-AEFMFDFDGDEIFHVDM 54褐家鼠 VIRFFFMAVLMSPQKSWA-IREEHTIIQAEFYLSPDQN-GEFMFDFDGDEIFHVDI 54人 LLGALALTTVMSPCGGED-IVADHVASCGVNLYQFYGPS-GQYTHEFDGDEQFYVDL 55大猩猩 LLGALALTTVMSPC

54、GGED-IVADHVASCGVNLYQSYGPS-GQFTHEFDGDEQFYVDL 55成都麻羊 ILGALALTTVMSPSGSED-IVADHIAAYGINVYHSYGPS-GHYTHEFDGDEEFYVDL 55野猪 MWGAVALTTVMSACGGED-IAADHVASYGLNVYQSYGPS-GYFTHEFDGDEEFYVDL 55欧洲野兔 -DEQFYVDL 8小家鼠 ILGVLALTTMLSLCGGEDDIEADHVGTYGISVYQSPGDI-GQYTFEFDGDELFYVDL 56鹪鹩 IWGILALATTLSPCGGEDDIKADHVGIYGMTMYQSHKPN-GQYIFEFDGDELFYVDS 56绵羊 ILRALALAAMMSLCGGED-IVADHVGTYGTNVYQTYGAS-GQFTFEFDGDELFYV

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!