基因组测序技术和基因识别ppt课件

上传人:仙*** 文档编号:173618720 上传时间:2022-12-12 格式:PPT 页数:55 大小:1.62MB
收藏 版权申诉 举报 下载
基因组测序技术和基因识别ppt课件_第1页
第1页 / 共55页
基因组测序技术和基因识别ppt课件_第2页
第2页 / 共55页
基因组测序技术和基因识别ppt课件_第3页
第3页 / 共55页
资源描述:

《基因组测序技术和基因识别ppt课件》由会员分享,可在线阅读,更多相关《基因组测序技术和基因识别ppt课件(55页珍藏版)》请在装配图网上搜索。

1、基因组测序技术和基因识别主要内容 一、基因组测序技术 二、基因识别一、基因组测序技术 大规模DNA测序技术使全基因组的测序成为可能。现有测序仪所能测得的序列长度有限,一般500-1000bp。而基因组序列长度远大于此,必须经过下列过程才能测得:打碎测序拼接鸟枪法杂交测序法1、鸟枪法 鸟枪法(shotgun method),也称霰弹法。将DNA分子打碎,得到长度在500-1000bp之间的小片段,对这些片段测序,然后根据他们之间的关系进行拼接,得到最终目标序列。序列片段覆盖待测序列序列片段覆盖待测序列序列片段之间也存在着相互覆盖或者重叠。序列片段之间也存在着相互覆盖或者重叠。目标序列目标序列序列

2、碎片序列碎片拼接过程 以每个片段为顶点,在每个顶点之间画有向边,有向边的权值代表交叠的字符d 得到三发送个数,方向由交叠序列前片段指向后片段。AGGTCCTAAAAGGTCCTAAAAGGTCCTAAAAGGTCCTAAA1341113拼接过程 查找能顺箭头方向依次经过各顶点的所有通路中权值之和最大的,即为拼接后的序列。1 adbc,权值82 bcad,权值73 badc,权值54 cadb,权值105 dbca,权值8拼接结果:AGGTCCTAAA最大权的哈密顿路径问题(Hamilton tour problem)AGGTCCTAAAAGGTCCTAAA1341113abcd2、杂交测序法

3、杂交测序法(sequencing by hybridization,SBH)基本原理是:构建基因微阵列(microarray,也称基因芯片,gene chip),让待测序列与其反应,然后由反应获得的信息确定待测序列的局部序列,最后根据这些局部序列重构目标序列。基因微阵列(microarray,也称基因芯片,gene chip),将高密度DNA片段阵列以一定的排列方式使其附着在基片上而形成。AA AT AG AC TA TT TG TC GA GT GG GC CA CT CG CCAAATAGACTATTTGTCGAGTGGGCCACTCGCCGCACCTGAACTGCACT目标序列:CGTG

4、ACT 互补序列:GCACTGA 由测出的局部序列:GCAC、ACTG、CTGA、CACT,可以重构目标序列的互补序列GCACTGA,从而得到目标序列 CGTGACT。可用求最大权值的哈密顿路径的方法求解。也可用欧拉路径的方法求解,该算法较省时。3、拼接软件 Phred、Phrap、Consed http:/www.phrap.org Sequencher ContigExpress1aggtcc2taaa3agg4tcctaaa二、基因识别二、基因识别 基因组(基因组(genome)是指一个生物体、细胞或病毒)是指一个生物体、细胞或病毒的整套基因。的整套基因。基因组学(基因组学(genomi

5、cs)以基因组分析为手段,研)以基因组分析为手段,研究基因组的构成、时序表达模式和功能,并提供有究基因组的构成、时序表达模式和功能,并提供有关生物物种及其细胞功能的进化信息。关生物物种及其细胞功能的进化信息。功能基因组学研究基因和非编码序列生物学功能。功能基因组学研究基因和非编码序列生物学功能。比较基因组学通过生物物种基因组之间的比较,研比较基因组学通过生物物种基因组之间的比较,研究基因的功能。究基因的功能。基因识别是识别基因识别是识别DNA序列上的具有生物学特序列上的具有生物学特征的片段,是基因组研究的基础。征的片段,是基因组研究的基础。基因识别是生物信息学领域里的一个重要研基因识别是生物信

6、息学领域里的一个重要研究内容究内容 基因识别问题,在近几年受到广泛的重视基因识别问题,在近几年受到广泛的重视 当人类基因组研究进入一个系统测序阶段时,急需当人类基因组研究进入一个系统测序阶段时,急需可靠自动的基因组序列翻译解释技术,以处理大量可靠自动的基因组序列翻译解释技术,以处理大量已测定的但未知功能或未经注释的已测定的但未知功能或未经注释的DNA序列序列 1、原核基因识别、原核基因识别 原核基因特点:基因密度高、简单(绝大多数不含内含子)。原核基因特点:基因密度高、简单(绝大多数不含内含子)。其重点在于识别编码区域其重点在于识别编码区域非翻译区域(非翻译区域(untranslated re

7、gions,UTR)编码区域两端的编码区域两端的DNA,有一部分被转录,但是不被翻译,有一部分被转录,但是不被翻译,这一部分称为非翻译区域这一部分称为非翻译区域 5UTR-基因上游区域的非翻译区域基因上游区域的非翻译区域 3UTR-基因下游区域的非翻译区域基因下游区域的非翻译区域 对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。例如,序列ATTCGATCGCAA 这三种阅读顺序称为阅读框(reading frames)CAA A ATTCGATCGATTCGATCGCAAATTCGATCGCA(1)(3)(2)一个开放阅读框(一个开放阅读框(OR

8、F,open reading frame)是一个没有)是一个没有终止编码的密码子序列。终止编码的密码子序列。原核基因识别任务的重点是识别开放阅读框,或者说识别长原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。的编码区域。基于基因密码子特性的识别方法基于基因密码子特性的识别方法 辨别编码区域与非编码区域的一种方法辨别编码区域与非编码区域的一种方法是检查终止密码子的出现频率是检查终止密码子的出现频率 终止密码子出现的期望次数为:终止密码子出现的期望次数为:每每21个(个(64/3)密码子出现一次终止密码子)密码子出现一次终止密码子 基本思想:基本思想:如果能够找到一个比较长的序列,

9、其相应的密码子序列不含如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。终止密码子,则这段序列可能就是编码区域。基本算法:基本算法:扫描给定的扫描给定的DNA序列,在三个不同的阅读框中寻找较长的序列,在三个不同的阅读框中寻找较长的ORF。遇到终止密码子以后,回头寻找起始密码子。遇到终止密码子以后,回头寻找起始密码子。这种算法过于简单,不适合于处理短的这种算法过于简单,不适合于处理短的ORF或者交叠的或者交叠的ORF。识别编码区域的另一种方法是分析各种密码子出现识别编码区域的另一种方法是分析各种密码子出现的频率的频率 将一个随机均匀分布的将一个随机均匀分

10、布的DNA序列翻译成氨基酸序列翻译成氨基酸序列,则在氨基酸序列中上述序列,则在氨基酸序列中上述3种氨基酸出现的种氨基酸出现的比例应该为比例应该为6:4:1例如,亮氨酸、丙氨酸、色氨酸分别有例如,亮氨酸、丙氨酸、色氨酸分别有6个、个、4个和个和1个密码子个密码子但是在真实的氨基酸序列中,上述比例并不但是在真实的氨基酸序列中,上述比例并不正确正确这说明这说明DNA的编码区域并非随机的编码区域并非随机 假设在一条假设在一条DNA序列中已经找到所有的序列中已经找到所有的ORF,那么可以利用密码子频率进一步区分编码那么可以利用密码子频率进一步区分编码ORF和和非编码非编码ORF 利用这种方法,可以计算一

11、个利用这种方法,可以计算一个ORF成为编码区域成为编码区域的可能性。的可能性。基于编码区域碱基组成特征的识别方法基于编码区域碱基组成特征的识别方法 编码序列与非编码序列在碱基组成上有区别编码序列与非编码序列在碱基组成上有区别单个碱基的组成比例单个碱基的组成比例多个碱基的组成多个碱基的组成 通过统计分析识别编码序列通过统计分析识别编码序列2 2、真核基因识别问题、真核基因识别问题 真核基因远比原核基因复杂:真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。域被分割为若干个小片段。另一方面,真核基因具有更加丰富

12、的基因调控信息,另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。这些信息主要分布在基因上游区域。基因识别基本思路基因识别基本思路 找出基因两端的功能区域找出基因两端的功能区域:转录启动区转录启动区 终止区终止区 在启动区下游位置寻找翻译起始密码子在启动区下游位置寻找翻译起始密码子 识别转录剪切位点识别转录剪切位点剪切给体位点剪切给体位点剪切接受体位点剪切接受体位点 各种不同的方法有不同的适应面,而不同的方法有各种不同的方法有不同的适应面,而不同的方法有时可以结合起来以提高基因识别的准确率。时可以结合起来以提高基因识别的准确率。关键问题是如何提高一个识别算法的敏感性

13、关键问题是如何提高一个识别算法的敏感性(sensitivity,Sn)和特异性()和特异性(specificity,Sp)。)。3 3、基因识别的主要方法、基因识别的主要方法两大类识别方法:两大类识别方法:从头算方法(或基于统计的方法)从头算方法(或基于统计的方法)根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分外显子、内含子及基因间区域外显子、内含子及基因间区域 基于同源序列比较的方法基于同源序列比较的方法利用数据库中现有与基因有关的信息(如利用数据库中现有与基因有关的信息(如EST序列、蛋白质序列),序列、蛋白质序列),通

14、过同源比较,帮助发现新基因。通过同源比较,帮助发现新基因。最理想的方法是综合两大类方法的优点,开发混合最理想的方法是综合两大类方法的优点,开发混合算法。算法。基因识别方法有基因识别方法有:(1)基于规则的系统)基于规则的系统(2)语义学方法语义学方法(3)线性辨别分析(线性辨别分析(LDA)(4)决策树决策树 (5)动态规划动态规划 (6)隐马尔柯夫模型隐马尔柯夫模型 (7)剪切对比排列剪切对比排列 (spliced alignment)4、基因识别程序介绍表表5.7 基因识别程序及访问地址基因识别程序及访问地址(HP主页;主页;ESE-mail服务器;服务器;WSweb服务器;服务器;CL客

15、户客户/服务器协议;服务器协议;EX有可执行代码;有可执行代码;SC有源代码)有源代码)表表5.8 各程序的性能比较(敏感性各程序的性能比较(敏感性(1)被预测出的真实编码核酸的被预测出的真实编码核酸的%;敏感性敏感性(2)被正确识别出的编码外显子的被正确识别出的编码外显子的%;特异性特异性(1)预测出的编码核酸为真实编码核酸的预测出的编码核酸为真实编码核酸的%;特异性特异性(2)预测出外显子为真实外显子的预测出外显子为真实外显子的%)Genscan访问:http:/genes.mit.edu/GENSCAN.html以核酸序列SEQ5作综合分析为例SEQ5SEQ5seq51 gaattcca

16、gg ttggaggggc ggcaacctcc tgccagcctt caggccactc tcctgtgcct 61 gccagaagag acagagcttg aggagagctt gaggagagca ggaaaggtgg aacattgctg 121 ctgctgctca ctcagttcca caggtgggag gaacagcagg gcttagagtg ggggtcattg 181 tgcagatggg aaaacaaagg cccagagagg ggaagaaatg cctaggagct accgagggca 241 ggcgacctca accacagccc agtgctg

17、gag ctgtgagtgg atgtagagca gcggaatatc 301 cattcagcca gctcagggga aggacagggg ccctgaagcc aggggatgga gctgcaggga 361 agggagctca gagagaaggg gaggggagtc tgagctcagt ttcccgctgc ctgaaaggag 421 ggtggtacct actcccttca cagggtaact gaatgagaga ctgcctggag gaaagctctt 481 caagtgtggc ccaccccacc ccagtgacac cagcccctga cacgg

18、gggag ggagggcagc 541 atcaggaggg gctttctggg cacacccagt acccgtctct gagctttcct tgaactgttg 601 cattttaatc ctcacagcag ctcaacaagg tacataccgt caccatcccc attttacaga 661 tagggaaatt gaggctcgga gcggttaaac aactcacctg aggcctcaca gccagtaagt 721 gggttccctg gtctgaatgt gtgtgctgga ggatcctgtg ggtcactcgc ctggtagagc 781

19、 cccaaggtgg aggcataaat gggactggtg aatgacagaa ggggcaaaaa tgcactcatc 841 cattcactct gcaagtatct acggcacgta cgccagctcc caagcaggtt tgcgggttgc 901 acagcggagc gatgcaatct gatttaggct tttaaaggat tgcaatcaag tgggacccac 961 tagcctcaac cctgtacctc ccctcccctc cacccccagc agtctccaaa ggcctccaac 1021 aaccccagag tgggggc

20、cat gtatccaaag aaactccaag ctgtatacgg atcacactgg 1081 ttttccagga gcaaaaacag aaacagcctg aggctggtca aaattgaacc tcctcctgct 1141 ctgagcagcc tagggggcag actaagcaga gggctgtgca gacccacata aagagcctac 1201 tgtgtgccag gcacttcacc cgaggcactt cacaagcatg cttgggaatg aaacttccaa 1261 ctctttggga tgcaggtgaa acagttcctg g

21、ttcagagag gtgaagcggc ctgcctgagg 1321 cagcacagct cttctttaca gatgtgcttc cccacctcta ccctgtctca cggcccccca 1381 tgccagcctg acggttgtgt ctgcctcagt catgctccat ttttccatcg ggaccatcaa 1441 gagggtgttt gtgtctaagg ctgactgggt aactttggat gagcggtctc tccgctccga 1501 gcctgtttcc tcatctgtca aacgggctct aacccactct gatctc

22、ccag ggcggcagta 1561 agtcttcagc atcaggcatt ttggggtgac tcagtaaatg gtagatcttg ctaccagtgg 1621 aacagccact aaggattctg cagtgagagc agagggccag ctaagtggta ctctcccaga 1681 gactgtctga ctcacgccac cccctccacc ttggacacag gacgctgtgg tttctgagcc 1741 aggtacaatg actcctttcg gtaagtgcag tggaagctgt acactgccca ggcaaagcgt

23、1801 ccgggcagcg taggcgggcg actcagatcc cagccagtgg acttagcccc tgtttgctcc 1861 tccgataact ggggtgacct tggttaatat tcaccagcag cctcccccgt tgcccctctg 1921 gatccactgc ttaaatacgg acgaggacag ggccctgtct cctcagcttc aggcaccacc 1981 actgacctgg gacagtgaat cgtaagtatg cctttcactg cgaggggttc tggagaggct 2041 tccgagctcc

24、ccatggccca ggcaggcagc aggtctgggg caggaggggg gttgtggagt 2101 gggtatccgc ctgctgaggt gcagggcaga tggagaggct gcagctgagc tcctattttc 2161 ataataacag cagccatgag ggttgtgtcc tgtttcccag tcctgcccgg tcccccctcg 2221 gtacctcctg gtggatacac tggttcctgt aagcagaagt ggatgagggt gtctaggtct 2281 gcagtcctgg caccccagga tgggg

25、gacac cagccaagat acagcaacag caacaaagcg 2341 cagccatttc tttctgtttg cacagctcct ctgtctgtcg ggggctcctg tctgttgtct 2401 cctataagcc tcaccacctc tcctactgct tgggcatgca tctttctccc cttctataga 2461 tgaggaggtt aaggttcaga gaggggtggg gaggaacgcc ggctcacatt ctccatcccc 2521 tccagatatg accaggaaca gacctgtgcc agcctcagcc

26、 ttacatcaaa atgggcctcc 2581 ccatgcaccg tggacctctg ggccctcctg tcccagtgga ggacaggaag ctgtgagggg 2641 cactgtcacc cagggctcaa gctggcattc ctgaataatc gctctgcacc aggccacggc 2701 taagctcagt gcgtgattaa gcctcataac cctccaaggc agttactagt gtgattccca 2761 ttttacagat gaggaagatg gggacagaga ggtgaataac tggccccaaa tcac

27、acacca 2821 tccataattc gggctcaggc acctggctcc agtccccaaa ctcttgaacc tggccctagt 2881 gtcactgttt ctcttgggtc tcaggcgctg gatggggaac aggaaacctg ggctgaactt 2941 gaggcctctc tgatgctcgg tgacttcaga cagttgctca acctctctgt tctcttgggc 3001 aaaacatgat aacctttgac ttctgtcccc tcccctcacc ccacccgacc ttgatctctg 3061 aagt

28、gttgga aggatttaat ttttcctgca ctgagttttg gagacaggtc aaaaagatga 3121 ccaaggccaa ggtggccagt ttcctataga acgcctctaa aagacctgca gcaatagcag 3181 caagaactgg tattctcgag aacttgctgc gcagcaggca cttcttggca ttttatgtgt 3241 atttaatttc acaatagctc tatgacaaag tccacctttc tcatctccag gaaactgagg 3301 ttcagagagg ttaagtaac

29、t tgtccaaggt cacacagcta atagcaagtt gacgtggagc 3361 aatctggcct cagagccttt aattttagcc acagactgat gctcccctct tcatttagcc 3421 aggctgcctc tgaagttttc tgattcaaga cttctggctt cagctttgta cacagagatg 3481 attcaatgtc aggttttgga gcgaaatctg tttaatccca gacaaaacat ttaggattac 3541 atctcagttt tgtaagcaag tagctctgtg att

30、tttagtg agttatttaa tgctctttgg 3601 ggctcaattt ttctatctat aaaatagggc taataatttg caccttatag ggtaagcttt 3661 gaggacagat tagatgatac ggtgcctgta aaacaccagg tgttagtaag tgtggcaatg 3721 atggtgacgc tgaggctgtg tttgcttagc atagggttag gcagctggca ggcagtaaac 3781 agttggataa tttaatggaa aatttgccaa actcagatgc tgttcact

31、gc tgagcaggag 3841 ccccttcctg ctgaaatggt cctggggagt gcagcaggct ctccgggaag aaatctacca 3901 tctctcgggc aggagctcaa cctgtgtgca ggtacaggga gggcttcctc acctggtgcc 3961 cactcatgca ttacgtcagt tattcctcat ccctgtccaa aggattcttt tctccattgt 4021 acagctatga agctagtgct caaagaagtg aagtcattta ccccaggccc cctgccagta 40

32、81 agtgacaggg cctggtcaca cttgggttta tttattgccc agttcaacag gttgtttgac 4141 cataggcgag attctcttcc ctgcaccctg ccgggttgct cttggtccct tattttatgc 4201 tcctgggtag aaatggtgcg agattaggca gggagtggac gcttccctgt ccctggcccc 4261 gcaaagagtg ctcccacctg ccccgatccc agaaatgtca ccatgaagcc ttcattcttt 4321 tggtttaaag ct

33、tggcctca gtgtccgtac accatggggt ccttggccag atggcgactt 4381 tctcctctcc agtcgccctc ccaggcacta gcttttagga gtgcagggtg ctgcctctga 4441 tagaagggcc aggagagagc aggttttgga gacctgatgt tataaggaac agcttgggag 4501 gcataatgaa cccaacatga tgcttgagac caatgtcaca gcccaattct gacattcatc 4561 atctgagatc tgaggacaca gctgtct

34、cag ttcatgatct gagtgctggg aaagccaaga 4621 cttgttccag ctttgtcact gacttgctgt atagcctcaa caaggccctg accctctctg 4681 ggcttcaaac tcttcactgt gaaaggagga aaccagagta ggtgatgtga caccaggaaa 4741 gatggatggg tgtgggggaa tgtgctcctc ccagctgtca ccccctcgcc accctccctg 4801 caccagcctc tccacctcct ttgagcccag aattcccctg t

35、ctaggaggg cacctgtctc 4861 gtgcctagcc atgggaattc tccatctgtt ttgctacatt gaacccagat gccattctaa 4921 ccaagaatcc tggctgggtg caggggctct cgcctgtaac cccagcactt tgggaggcca 4981 aggcaggcgg atcaagaggt caggagttca agacctgcct ggccaacacg gtgaaacctc 5041 agctctacta aaaatacaaa aattagccag gcgtggtggc acacgcctgt aatccc

36、agct 5101 atttgggaag ctgagacaga agaatttctt gaacccggga ggtggaggtt tcagtgagcc 5161 gagatcacgc cactgcactc caccctggcg gataaagcga gactctgtct caaaaaaaac 5221 ccaaaaacct atgttagtgt acagagggcc ccagtgaagt cttctcccag ccccactttg 5281 cacaactggg gagagtgagg ccccaggacc agaggattct tgctaaaggc caagtggata 5341 gtgatg

37、gccc tgccaggcta gaagccacaa cctctggccc tgaggccact cagcatattt 5401 agtgtcccca ccctgcagag gcccaactcc ctcctgacca ctgagccctg taatgatggg 5461 ggaatttcca taagccatga aggactgcac aaagttcagt tgggagtgaa agagaaatta 5521 aagggagatg gaaatataca gcactaattt tagcaccgtc ttcagttcta acaacactag 5581 ctagctgaag aaaatacaaa

38、catgtattat gtaatgtgtg gtctgttcca tttggattac 5641 ttagaggcac gagggccaag gagaaaggtg gtggagagaa accagctttg cacttcattt 5701 gttgctttat tggaaggaaa cttttaaaag tccaaggggg ttgaagaatc tcaatatttg 5761 ttatttccag ctttttttct ccagtttttc atttcccaaa ttcaaggaca cctttttctt 5821 tgtattttgt taagatgatg gttttggttt tgtga

39、ctagt agttaacaat gtggctgccg 5881 ggcatattct cctcagctag gacctcagtt ttcccatctg tgaagacggc aggttctacc 5941 tagggggctg caggcaggtg gtccgaagcc tgggcatatc tggagtagaa ggatcactgt 6001 ggggcagggc aggttctgtg ttgctgtgga tgacgttgac tttgaccatt gctcggcaga 6061 gcctgctctc gctggttcag ccacaggccc caccactccc tattgtctca

40、 gccccgggta 6121 tgaaacatgt attcctcact ggcctatcac ctgaagcctt tgaatttgca acacctgcca 6181 acccctccct caaaagagtt gccctctcta gatccttttg atgtaaggtt tggtgttgag 6241 acttatttca ctaaattctc atacataaac atcactttat gtatgaggca aaatgaggac 6301 cagggagatg aatgacttgt cctggctcat acacctggaa agtgacagag tcagattaga 6361

41、 tcctaggtct atctgaagtt aaaagaggtg tcttttcact tcccacctcc tccatctact 6421 ttaaagcagc acaaacccct gctttcaagg agagatgagc gtctctaaag cccctgacag 6481 caagagccca gaactgggac accattagtg acccagacgg caggtaagct gactgcagga 6541 gcatcagcct attcttgtgt ctgggaccac agagcattgt ggggacagcc ccgtctcttg 6601 ggaaaaaaac ccta

42、agggct gaggatcctt gtgagtgttg ggtgggaaca gctcccagga 6661 ggtttaatca cagcccctcc atgctctcta gctgttgcca ttgtgcaaga tgcatttccc 6721 ttctgtgcag cagtttccct ggccactaaa tagtgggatt agatagaagc cctccaaggg 6781 ctccagcttg acatgattct tgattctgat ctgacccgat tctgataatc gtgggcaggc 6841 ccattcctct tcttgtgcct cattttctt

43、c ttttgtaaaa caatggctgt accatttgca 6901 tcttagggtc attgcagatg aaagtgttgc tgtccagagc ctgggtgcag gacctagatg 6961 taggattctg gttctgctac ttcctcagtg acattgaata gctgacctaa tctctctggc 7021 tttggtttct tcatctgtaa aagaaggata ttagcattag cacctcacgg gattgttaca 7081 agaaagcaat gaattaacac atgtgagcac ggagaacagt gct

44、tggcata tggtaagcac 7141 tacgtacatt ttgctattct tctgattctt tcagtgttac tgatgtcggc aagtacttgg 7201 cacaggctgg tttaataatc cctaggcact ttcacgtggt gtcaatccct gatcactggg 7261 agtcatcatg tgccttgact cgggcctggc ccccccatct ctgtcttgca ggacaatgcc 7321 gtcttctgtc tcgtggggca tcctcctgct ggcaggcctg tgctgcctgg tccctgtc

45、tc 7381 cctggctgag gatccccagg gagatgctgc ccagaagaca gatacatccc accatgatca 7441 ggatcaccca accttcaaca agatcacccc caacctggct gagttcgcct tcagcctata 7501 ccgccagctg gcacaccagt ccaacagcac caatatcttc ttctccccag tgagcatcgc 7561 tacagccttt gcaatgctct ccctggggac caaggctgac actcacgatg aaatcctgga 7621 gggcctga

46、at ttcaacctca cggagattcc ggaggctcag atccatgaag gcttccagga 7681 actcctccgt accctcaacc agccagacag ccagctccag ctgaccaccg gcaatggcct 7741 gttcctcagc gagggcctga agctagtgga taagtttttg gaggatgtta aaaagttgta 7801 ccactcagaa gccttcactg tcaacttcgg ggacaccgaa gaggccaaga aacagatcaa 7861 cgattacgtg gagaagggta ct

47、caagggaa aattgtggat ttggtcaagg agcttgacag 7921 agacacagtt tttgctctgg tgaattacat cttctttaaa ggtaaggttg ctcaaccagc 7981 ctgagctgtt tcccatagaa acaagcaaaa atatttctca aaccatcagt tcttgaactc 8041 tccttggcaa tgcattatgg gccatagcaa tgcttttcag cgtggattct tcagttttct 8101 acacacaaac actaaaatgt tttccatcat tgagtaa

48、ttt gaggaaataa tagattaaac 8161 tgtcaaaact actgacgctc tgcagaactt ttcagagcct ttaatgtcct tgtgtatact 8221 gtatatgtag aatatataat gcttagaact atagaacaaa ttgtaataca ctgcataaag 8281 ggatagtttc atggaacata ctttacacga ctctagtgtc ccagaatcag tatcagtttt 8341 gcaatctgaa agacctgggt tcaaatcctg cctctaacac aattagcttt t

49、gacaaaaac 8401 aatgcattct acctctttga ggtgctaatt tctcatctta gcatggacaa aataccattc 8461 ttgctgtcag gtttttttag gattaaacaa atgacaaaga ctgtggggat ggtgtgtggc 8521 atacagcagg tgatggactc ttctgtatct caggctgcct tcctgcccct gaggggttaa 8581 aatgccaggg tcctgggggc cccagggcat tctaagccag ctcccactgt cccaggaaaa 8641 c

50、agcataggg gaggggaggt gggaggcaag gccaggggct gcttcctcca ctctgaggct 8701 cccttgctct tgaggcaaag gagggcagtg gaggcaagcc aggctgcagt cagcacagct 8761 aaagtcctgg ctctgctgtg gccttagtgg gggcccaggt ccctctccag ccccagtctc 8821 ctccttctgt ccaatgagaa agctgggatc aggggtccct gaggcccctg tccactctgc 8881 atgcctcgat ggtgaa

51、gctc tgttggtatg gcagagggga ggctgctcag gcatctgcat 8941 ttcccctgcc aatctagagg atgaggaaag ctctcaggaa tagtaagcag aatgtttgcc 9001 ctggatgaat aactgagctg ccaattaaca aggggcaggg agccttagac agaaggtacc 9061 aaatatgcct gatgctccaa cattttattt gtaatatcca agacaccctc aaataaacat 9121 atgattccaa taaaaatgca cagccacgat

52、ggcatctctt agcctgacat cgccacgatg 9181 tagaaattct gcatcttcct ctagttttga attatcccca cacaatcttt ttcggcagct 9241 tggatggtca gtttcagcac cttttacaga tgatgaagct gagcctcgag ggatgtgtgt 9301 cgtcaagggg gctcagggct tctcagggag gggactcatg gtttcttatt ctgctacact 9361 cttccaaacc ttcactcacc cctggtgatg cccaccttcc cctct

53、ctcca ggcaaatggg 9421 agagaccctt tgaagtcaag gacaccgagg aagaggactt ccacgtggac caggtgacca 9481 ccgtgaaggt gcctatgatg aagcgtttag gcatgtttaa catccagcac tgtaagaagc 9541 tgtccagctg ggtgctgctg atgaaatacc tgggcaatgc caccgccatc ttcttcctgc 9601 ctgatgaggg gaaactacag cacctggtaa atgaactcac ccacgatatc atcaccaagt

54、 9661 tcctggaaaa tgaagacaga aggtgattcc ccaacctgag ggtgaccaag aagctgccca 9721 cacctcttag ccatgttggg actgaggccc atcaggactg gccagagggc tgaggagggt 9781 gaaccccaca tccctgggtc actgctactc tgtataaact tggcttccag aatgaggcca 9841 ccactgagtt caggcagcgc cgtccatgct ccatgaggag aacagtaccc agggtgagga 9901 ggtaaaggtc

55、 tcgtccctgg gaacttccca ctccagtgtg gacactgtcc cttcccaata 9961 tccagtgccc aaggcaggga cagcagcacc accacacgtt ctggcagaac caaaaaggaa 10021 cagatgggct tcctggcaaa ggcagcagtg gagtgtggag ttcaagggta gaatgtccct 10081 ggggggacgg gggaagagcc tgtgtggcaa ggcccagaaa agcaaggttc ggaattggaa 10141 cagccaggcc atgttcgcag a

56、aggcttgcg tttctctgtc actttatcgg tgctgttaga 10201 ttgggtgtcc tgtagtaagt gatacttaaa catgagccac acattagtgt atgtgtgtgc 10261 attcgtgatt atgcccatgc cctgctgatc tagttcgttt tgtacactgt aaaaccaaga 10321 tgaaaataca aaaggtgtcg ggttcataat aggaatcgag gctggaattt ctctgttcca 10381 tgccagcacc tcctgaggtc tctgctccag gg

57、gttgagaa agaacaaaga ggctgagagg 10441 gtaacggatc agagagccca gagccagctg ccgctcacac cagaccctgc tcagggtggc 10501 attgtctccc catggaaaac cagagaggag cactcagcct ggtgtggtca ctcttctctt 10561 atccactaaa cggttgtcac tgggcactgc caccagcccc gtgtttctct gggtgtaggg 10621 ccctggggat gttacaggct gggggccagg tgacccaaca cta

58、cagggca agatgagaca 10681 ggcttccagg acacctagaa tatcagagga ggtggcattt caagcttttg tgattcattc 10741 gatgttaaca ttctttgact caatgtagaa gagctaaaag tagaacaaac caaagccgag 10801 ttcccatctt agtgtgggtg gaggacacag gagtaagtgg cagaaataat cagaaaagaa 10861 aacacttgca ctgtggtggg tcccagaaga acaagaggaa tgctgtgcca tgcc

59、ttgaat 10921 ttcttttctg cacgacaggt ctgccagctt acatttaccc aaactgtcca ttactggaac 10981 ctatgatctg aagagcgtcc tgggtcaact gggcatcact aaggtcttca gcaatggggc 11041 tgacctctcc ggggtcacag aggaggcacc cctgaagctc tccaaggtga gatcaccctg 11101 acgaccttgt tgcaccatgg tatctgtagg gaagaatgtg tgggggctgc agcactgtcc 11161

60、 tgaggctgag gaaggggccg agggaaacaa atgaagaccc aggctgagct cctgaagatg 11221 cccgtgattc actgacacgg gacggtgggc aaacagcaaa gccaggcagg ggctgctgtg 11281 cagctggcac tttcggggcc tcccttgagg ttgtgtcact gaccctgaat ttcaactttg 11341 cccaagacct tctagacatt gggccttgat ttatccatac tgacacagaa aggtttgggc 11401 taagttgttt

61、caaaggaatt tctgactcct tcgatctgtg agatttggtg tctgaattaa 11461 tgaatgattt cagctaaagt gacacttatt ttggaaaact aaaggcgacc aatgaacaac 11521 ctgcagttcc atgaatggct gcattatctt ggggtctggg cactgtgaag gtcactgcca 11581 gggtccgtgt cctcaaggag cttcaagccg tgtactagaa aggagagagc cctggaggca 11641 gacgtggagt gacgatgctc t

62、tccctgttc tgagttgtgg gtgcacctga gcagggggag 11701 aggcgcttgt caggaagatg gacagagggg agccagcccc atcagccaaa gccttgagga 11761 ggagcaaggc ctatgtgaca gggagggaga ggatgtgcag ggccagggcc gtccaggggg 11821 agtgagcgct tcctgggagg tgtccacgtg agccttgctc gaggcctggg atcagcctta 11881 caacgtgtct ctgcttctct cccctccagg cc

63、gtgcataa ggctgtgctg accatcgacg 11941 agaaagggac tgaagctgct ggggccatgt ttttagaggc catacccatg tctatccccc 12001 ccgaggtcaa gttcaacaaa ccctttgtct tcttaatgat tgaacaaaat accaagtctc 12061 ccctcttcat gggaaaagtg gtgaatccca cccaaaaata actgcctctc gctcctcaac 12121 ccctcccctc catccctggc cccctccctg gatgacatta aag

64、aagggtt gagctggtcc 12181 ctgcctgcat gtgatctgta aatccctggg atgttttctc tg GeneBuilder访问:http:/r.it/webgene/genebuilder.html从http:/r.it/sun/webgene/进入GeneBuilder对核酸序列SEQ5作综合分析Gene ModelCoding Potential复习思考题1、为什么基因测序要用到拼接?2、基因测序技术有哪两种?其原理各是什么?3、什么是基因组和基因组学?功能基因组学和比较基因组学有什么异同?4、什么是基因识别?5、什么是开放阅读框?6、GENSCAN软件基因识别的结果中,type、s是什么意思?7、基因组测序中获得以下四条打散的序列,请用求最大权的哈密顿路径的方法求出拼接后的原序列,要求画出具体过程:AGGTCC、TAAA、AGG、TCCTAAA此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!