序列比对构建进化树

上传人:daj****de 文档编号:125736194 上传时间:2022-07-27 格式:DOCX 页数:15 大小:568.86KB
收藏 版权申诉 举报 下载
序列比对构建进化树_第1页
第1页 / 共15页
序列比对构建进化树_第2页
第2页 / 共15页
序列比对构建进化树_第3页
第3页 / 共15页
资源描述:

《序列比对构建进化树》由会员分享,可在线阅读,更多相关《序列比对构建进化树(15页珍藏版)》请在装配图网上搜索。

1、1从NCBI上下载某个基因在其他物种的序列比如,下载caveolin基因在其他物种的序列NCBI 地址:http:/www.ncbi.nlm.nih.gov/C NCBINational Library of MedicineNational Institutes of HealthPubMedAll DatabasesBLASTOMIMBooksTaxBrowserStructureSearch Nucleotide-for caveolinGoAll Databases NCBI Web SiteSITE M/AlphabetiResourceioes NCBI do?Hot SpotsA

2、bout NAn introdiNCBIGenBarPubMed Protein Nucleotide ESTGSS StructureGenome Booksed in 1988 as a national resource for biology information, NCBI creates tabases, conducts research in :ional biology, develops software analyzing genome data, and ates biomedical information - all for undftmtandinn of mn

3、lftcular卜 Clusters of orthologous groups# Coffee Break,Genes &. Disease, NCBI Handbook在search 一栏的下拉列表中选择Nucleotide,for后面的一栏中输入自己要查询的基因。完毕,2 NCB【All DatabasesPubMedNucleotideProteinOenomeSearch Nucleotide-for caveolinGo Clear Savf Nucleotide匚 h_A. i TCuGG CpG f- !juiA nLCjGLYyyy、LimitsPr已切已刖I nd exHi

4、story1Clipbo 日 rdDtmisItems 1 - 20 of 531Page 1of 27 NextThis search in Gene shows 357 results, including:(Homo Sapiens, caveolin 3cad (Danio rer/o): caveolin1Cavl (Rattus noivegicvs. caveolin 1, c刖eolae protein 1: NNt 001079932 ReportsLinksMus muscuius tripartite motiScontaining 72 (Trim72), mRNA g

5、i|142370482|ref|NN_001079932.2|142370482匚 2: NNt Q21297ReportsLinksMus muscuius toll-like receptor 4 (Tlr4)n niRNA gi|118130391|ref|NN_021297.2|l 18130391匚 3: NNt 001024071 ReportsLinksHomo sapiens GTP cyclohydrolase 1 (GCH1), transcript variant 4, niRNA gi|66932971|ref|NM_001024071.1|66932971匚 4: N

6、Nt 001024070 ReportsLinksFTctnc samens GTP rvrlcihvdrolasR 1 fGCFTR transnrint irariant 3每一条记录分别是某个物种的caveolin的序列,以第10条记录为例,10: JSEM 001753 ReportsOrder cDNA clone, LinksHomo sapiens caveolin 1, caveolae protein, 22kDa (CAV1)? mBNA gi|15451855|ref|SM_001753.3|15451855NM 001753称为GenBank登录号。Homo頌pi沁为拉

7、丁文的人类的字母,表示物种,caveolm 1表示基因名称(caveolin基因家族共有3个主要基因,分别称为1,2,3)mBITA表示此序列为cDNA,不含内含子。F图中的NEXT表示翻页,查看剩余的记录。DisplaySummary- Show20Sort By-Eend to -Items 1 - 20 of 531Page 1 f 27 Net打 开 第 10 条 记 录 可 看 到 下 图Format: GenBank FASTA Grwhics More FormatsTNCBI Reference Sequence: NM_001753.3Homo sapiens caveoli

8、n 1, caveolae protein, 22kDa (CAV1), mRNACcimiTiEnt Fe 日 tures SeciiiEncELOCUS DEFINITION ACCESSION VERSION KEYWORDS SOUKCEORGANISMMM_0017532704 bpmRNAlinearPRI 12-APR-2009Homo sapiens caveolin 1 caveolae protein 22kDa (CAV1)f mRWA. NM_001753Nm2001753.3 GI:15451855Homo sapiens (human)Homo sapiensEuk

9、aryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Manmalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae; Homo.REFERENCEAUTHORS1 (bases 1 to 2704)LuzQ.f Zhang,J.r Allison,R.f GayH.f YangW.X.f Bhomnick,N.A.r FrelixG.f ShappellS. and ChenY.H.TITLEI den t.i f i

10、c at.i on of extracellular delt.a-cat.enin accuiLLUlatiun fur pro state CizLticer de tec t.i unJOURNALPUBMEDREMARKProstate 69 (4), 411-418 (2009)19116988GeneRIF: In prostate cmcer cells in culture.r delta-catenin was co-lucalized with caveulin-1 s口吐 CD59 suggesting its putent.ial exctet-ion int-u ex

11、t-tace 1 lular milieu t-hrough exusuiue/prost-asuiue as s uc i at.e d p at-hiijays REFERENCEAUTHORS2 (bases 1 to 2704)SotgiaF.f Del GaldoF.r CasimiroC.r BonuccelliG.r Mercier,I.fSTSSTSSTSSTS/ gene _synonym=r rB S C L 3; CAV;CG-L3; MSTP085;VIP21rr/standard_naiae=rrREN66698rr/db xref=;UniST5:391498,r2

12、247.2520/gene=,rCAVl,r/gene_synonym=rrBSCL3; CAV;CG-L3;MSTP085;VIP21r,/standard_naiae=rrREN66697rr /db x ref=rrUniSTS: 391497rr 2378.2533/gene=r,CAVlr,/gene_synonym=rrBSCL3; CAV;CG-L3;MSTP085;VIP21r,/standard_name=rrD752756rr/db xref=rrUniSTS:80929rr2378.2523/gene=rrCAVlrr/gene_synonym=rrBSCL3; CAV;

13、CG-L3;MSTP085;VIP21r,/ s tandar d_naiae=rrRH91504,r/db xref=;UniSTS:92545rr2510.2688/gene=rrCAVlrr/gene_synonym=rrB5CL3; CAV;CG-L3;MSTP085;VIP21,r/ s tandar d_naiae=rrRHl 1008rr/db509792685.2690/gene=,rCAVl,r/gene_synonym=rrBSCL3; CAV;CG-L3;MSTP085;VIP21r,2704/gene=rrCAVlrr/gene_synonym=rrBSCL3; CAV

14、;CG-L3;MSTP085;VIP21r,/gene=rrCAVlr,/expe riment=rrexperimental evidence, no additional details recordedORIGIN161121181241301361421481gggagaaacg gaacctt-ggg caaaccrttg tt.tttccccc gaaacctcct actcggaggg acaacaaggc agategacct ttgaagatgtttctcactcg gatgt-gccta gcgggcggcc catacaatac cacag-ttttc acatctcta

15、c catgg-cagac ggtcaaccgc gattg-cagaactctctgct-c gacccggcgc aggaggctcc aagatcttcc atccagccac accgttccca gagetgageg gaccctaaac ccagaagggagctgcgggcg agcacacgtc ctcccag-cca ttcctcagtt gggccag-cat tccgggaaca agaagcaagt acctcaacga cacacag-tttctccccgccc cgggccaacc ccgcccccct cccttaaagc gtctgggggc gggcaacat

16、c gtacgacgcg t-gaegt-ggte tgacggcatttctgctgcca gcgagcagaa ccagcgcctt acagcccagg aaataegtag tacaagccca cacaccaagg aagartgact tggaaggccaORIGIN161121181241301361421481541601661721781841901961 1021 1081 1141 1201 1261 1321 1381 1441 1501 1561 1621 1681 1741 1801 1861 1921 1981 2041 2101 2161 2221 2281 2

17、341 2401gggagaaacg gaaccttggg caaacctttg tttttccccc gaaacctcct actcggaggg acaacaaggc agategacct ttgaagatgt gcttcaccac gcatcccgat gggcagttgt attccatcta gcaatgtccg cctgattttt agcaacaatt tcataagtat aacccattta tggetgagat ggaaaaaaaa attttatgtt attttcagca ataatccagt tgatccaact atatttgtta aaatagggtc gaatat

18、ccat agctcacttc gcccaatgaa tggaagccag cgtttatttt tttagtggct gtaaaatgga taaagcactt ttggacctaa aaagattgaa tcacctgtaa tcctgctcat tttttcatac ttaattacca tatagtttta ttctcactcg gatgtgccta gcgggcggcc catacaatac cacagttttc acatctctac catggcagac ggtcaaccgc gattgeagaa cttcactgtg ggcactcatc accatgcatt cgtccacac

19、c catcaacttg tttcctttta tatgaattga tatgtetett aatttttttc atgaacatat aaaaaagaaa aagggaagaa aactcttttc aggatccagt aatgccttac tgtagataac taactcagca gacctagttt tgggcttcat atgaattaaa ctttccctgc caagaataat caacattgtg ggccattgtg gcaaccgtct tccaagcatc gtattttgct acctgagtcg attgtgattc aettattgga acctgttacc c

20、ttttaaact ctctctgctc gacccggcgc aggaggctcc aagatcttcc atccagccac accgttccca gagetgageg gaccctaaac ccagaaggga acgaaatact tggggcattt aagagcttcc gtctgtgacc cagaaagaaa attttcctgg attatettgg etgagetatt cttacctttt tgttgaaagg agaaccaaca ttccagggta ccactgttta gatccttaca tettettgaa aagacctcag actcgcttta tcca

21、tgcgtg ctggcaacat gtggaccaat ctctcatcaa cacgctttcc ttcccatttc tgagcctatc gttatgctgt cctttgccca ggaataagtt tacagaaagc tgcctttggg actctgcttg tactttgact gtgtacataa gctgcgggcg agcacacgtc ctcccagcca ttcctcagtt gggccagcat tccgggaaca agaagcaagt acctcaacga cacacagttt ggttttaccg acttcgccat tgattgagat cactctt

22、tga tataaatgac tgccaatttc ttgaaaataa teatetattt tatttgcatg taatttgaga acctcaactg tggccatgga aggagttagt agttagaaaa attttaacct tgccttcctg ggtcagcagc tttctgactc ctttatccgt agggetgage etgaatgagg tgaatccaaa agctgatcag agagttgctg gacacatggc gaaagaagat caaattcttc tgcctggtat gacttttctt atttttgcct ttttgcattt

23、 etgaaaatgt ctccccgccc cgggccaacc ccgcccccct cccttaaagc gtctgggggc gggcaacatc gtacgacgcg tgacgtggtc tgacggcatt ettgetgtet tctctctttc teagtgeate agctgttggg atttcaagga aagttccaag aaagatcact ttggcagtct tggatcaacc gaaatatgaa cctactccaa gtgtacaagt ggattactgc cataatcttc atgatatttt tttttcacat ctccctgaag tg

24、agctacag agtgggtatg tctctgtggg tcagcatgtc ctaatccatc tgggcctcca caaacctgac ccctccccct gggggaggag tgaactcaaa atccaaaagc aaaccttcag cttccagtct aaaacagaca getataetge tctgctgcca gcgagcagaa ccagcgcctt acagcccagg aaataegtag tacaagccca cacaccaagg aagattgact tggaaggcca gccctctttg ctgcacatct ageegtgtet aaaat

25、attca tagaagtata ttgctaatac ttctcagttt gaatttttaa ategetttat gaaetgagga aatgttggtc atgtgggcag cattcacttc tgccttctca ctgtgcctga tttccttttc accaaaatta agtctggtga gttgacacta ctggcagtcc tattcagctt accggggtgg aggaggggct ccctgctcag gccaggagct gcagtaataa etgaggaatt tttttattcc ttatgatttt tcctgacact ctggcatg

26、ga atacttttta现在你需要保存下来得就是上面的这一串(碱基)核酸序列。复制黏贴(包括上面表示顺序 的数字)到TXT文本中备用。出现下图打开 DNAMAN 软件,左上角点击 file-new可以把先前从NCBI下载的序列(保存到TXT文本中得)复制到箭头指示处,得到:并按照上图左上角file-save as(注意此文件得保存名称为保存的此物中得名称),已上是 DNAMAN软件中seq序列格式的保存方法。2序列编辑和比对(DNAMAN软件)你们实验PCR得到的序列只是某个基因上的一部分,所以为了进行不同物种间的比对, 要把下载下来的其他物种的某个基因的序列进行删减,以使两段基因是大约相同

27、长度的片段 进行比对。以人类 caveolinl 基因为例说明一下。按照 1,2 ,3 得顺序依次打开,得到下图:点击上图中的1,你会得到下图,点击2是清楚所有刚才选进比对的序列(为了重新选择序 列),3是有选择的删除某个序列。当然,把你的所有准备的序列保存好以后,从查找范围这个下拉列表中寻找你要比对的序列。可以按住Ctrl点击你要比对的几个序列(同时选中)选完点击打开。再点下图中得确定键。OptionsOutputldentity= 11.95%290300310320330360370380CTGGGGGCAAATACGTAGACTCGGAGGGACATCTCTACACCGTTCCCATC

28、CGGGAMultiple AlignmentACAGGGCAACATCTACAAGCCCAACAACA-ACAGGGCAACATCTACAAGCCCAACAACA-GAGCTGGAGCTGATGGCAGAATGGCAGA3 cav 已口 J.in 1f cavl目的段Consensusac agggc aac at c t acaagc c c aac aacaa c atggcaga gagctga cga aagrrr找好这两个物种重合的那个核苷酸的序号(前后两段都是),然后打开你保存的seq格式的序列,数出刚才比对重合部分的后端的碱基数,把这个碱基后面的序列删掉,再用此方法把 比对重合

29、部分前段得序列删掉,保存。注:此处比对得两个序列一个是你实验得到的基因序 列,另一个是从NCBI下载的其他物种的序列,一般情况下你试验得到的测序序列会短于下 载的其他物种的序列,所以要在这里进行下载的序列的编辑。把你已经编辑好的序列按照上述比对方法(用你的实验得到的序列和同基因在其他物种 的序列(并且是你已经掐头去尾编辑过的)两两比对,可以得出某个基因在两两物种之间的 同 源 性) 女口 下 图:椭圆中的数字就是某基因在两个物种间的同源性。另一种获得两物种某基因之间同源性 的 方 法 是:打 开NCBI网 站http:/www.ncbi.nlm.nih.gov/U NCBINational L

30、ibrary of MedicineMTNational Institutes ofPubMedAll DatabasesElLZ3OMIMBooksTaxBrowserSearch All Databases- forGoHotSITE MAP Alphabetical List Resource Guide What does NCBI do?Established in 1988 as a national resource for * Clustermolecular biology information, NCBI creates ortholo9头 指 示 的 blast , 得

31、 到Basic BLASTChoose a BLASTSearch a micleoTide database using a nucleotide queryAigorithms: blastn, megablast, discontiguous megablastSearch protein database using a protein queryAigorithms: blastp, psi-blast, phi-blast点击箭头指示处在1空白处黏贴上你的测序序列,2处选中,点击下面的blastFilterLow complexity regions Mask Species-sp

32、ecific repeats for: HumanMask for lookup table only 越 xfask lower case Ie廿Erw BLAiTjSearch database nr using Megablast (Optimize fiShow results in a new window你将得到一个你测序序列与多个物种间某个基因的同源性。如下图:Legend for links to other resources: d UniGene S GEO E Gene S Structure (Zl Map ViewerSequences producing signi

33、ficant alignments:iI:dick h已曰丘已匸日 七口 已口匸七 匚口丄umnEi)丄AccessionMshTotalQueryEMawscorescorecoveragevalueibtentLinksXM002192346.1AB170494.1XM001101323.1XM001101417.1XM001101509.1AB489179,1Chicken caveolin mRNAPR.EDICTED: Taenio口ycii日 口uttata similar t口 caveolin 1 JLOCl00220:; Macaca fascicularis brain c

34、DNA clone: QmoA-11145! similar to hum.PREDICTED: Macaca mulatta similar to Caveolin-1, transcript variarPREDICTED: Macaca mulatta similar to Caveolin-1, transcript variar PREDICTED: Macaca mulatta similar to Caveolin-1, transcript variar C .familiaris qene for VIP21Canis familiaris caveolirvl mRNA,

35、complete cdsPREDICTED: Macaca mulatta similar to Caveolin-1! transcript variar Synthetic construct DNA( clone: pF!KE0218, Homo sapiens CAV1 qe4 7- 5 5 5 5 4 4 -y- O6 -Z 2 2 2 2 2 2 2 -ZE Lr- 4 斗 4 斗 4 4 斗 4100%le-15794%ms 34%2e-14697%100%6e-11687%100%6e-11687%GE100%6e-11687%EE100%6e-11687%GE99%E已-11

36、587%99%2e-11587%99%7e-11587%GE100%3e-11487%1为物种名称及描述,2为同源性为了进行比对,要把序列格式转化成 FASTA格式。转化方法:新建TXT格式文档,文件(巳編辑(或格式 查看(刃帮助(也anas第一排开始先写一个大于号(),紧接着是写上物种名称。如上图。另起一行,把该物种的某基因的序列拷贝上。注:这里的要拷贝过来的序列是经过上一步的 掐头去尾的序列,得到:文件(日编辑格式回查看帮助anasACAGGGCAACATCTACAAGCCCAACAACAAGATI TCAACGACGACGTGGTCAAGATTGATTTTGAAGI TGGTTTTATC

37、GTTTACTGTCAGCAATCTTTGGCI CTACCTGATTGAGATCCAGTGCA然后保存。方法:文件-另存为-保存类型选所有文件-文件名:物种名称.Fasta3序列比对与进化树构建,(可拷贝到你的论文中的图片)打开Clustaxl软件,单击在左上角的文件,载入序列,就可载入一条fasta格式的序列了。载入完一条之后再点 击添加序列就可载入第二条序列,后面要载入更多的序列也是点击添加序列。载入完你要比对的序列后点击编辑下的选定全部序列,接着点击比对-进行完全比对。 Clustal-RaindyfltJS文件(日编龊厂晞树颜色质戟聖切序列粘贴序列(日多重比1234选定全部爾血 选定

38、轮廓1(1)选定轮廓2(2)添加轮廓2到轮廓1中(日涪除序列选定(少洁除排列选定(或搜索字串(3移除所有空位( 移除空位仅列(啞al-RaindyltJ編辑(日比濒树(D 颜色( 质量(辺帮助(出;对模式V重新对齐选定的序列(3 重新对齐选定的残基排列(或 对芥轮廓2到轮廓1(2) 战商耳樹中对喜轮臨进行完全比对f只生成向导树( 从向导树进行比对(或得到:点击对齐1是进化树文件的保存路径和名称,2是序列比对文件的路径和名称。保存完这两个文件,可以用MEGA软件分别打开它们。下图为序列比对文件打开后的界面:1为选定的格式,2为文件保存的名称和路径。用MEGA软件打开此文件。得到这样一个界面:M4

39、: Text File Editor and Format ConverterFile Edit Search Display UtilitiesQ ffl同墨坯G 口 E綽艰C: D ocuments and S ettingsAdministrator.7E20C7E DOCE F4CM臬面jiaocheng.alngallus1anasCLTJSTAL -Raindy汉比版霑重序歹斜榷口Ac|kGGGCAACATCTACAAGCCCAACAACAAAACGATGGCAGATGAGCTGAACGAAAAGGC ACAGGGCAACATCTACAAGCCCAATAACAAGATGATGGCA

40、GACGAGCTGAGCGAGAAGGCAC AGGGC AAC ATC TAC AAGC C C AAC AAC AAGATGATGGC AGAC GAGC TGAGC GAGAAGGC 、电卞卞卞卞卞卞卞古古古古古古古古古古古古古古古 古古古古古 古 古古古古古古古古古 古古古古書古古 古古古 古書古古古pegionGGTGCACGACGTGCACACCAAAGAGATCGACCTGGTCAACCGAGACCCTAAGCACCTCAAga11usGGTGCACGACGTCGACACCAAGGAGATCGACCTGGTCAACCGCGACCCCAAGCACCTCAAanasGGTGCACGA

41、CGTGCACACCAAGGAGATCGACCTGGTCAACCGGGACCCCAAGCACCTCAA古古古古古古古古古古古古 古古古古古古古 古古古古古古古古古古古古古古古古古古古古 古古古古古 古古古古古古古古古古古1是指物种名称,2处的星号是指物种间同源的序列部分,星号空缺的地方是指不一样的碱 基。把全部序列比对的界面一次截屏黏贴到你论文中。下面打开的是进化树的文件,界面如下E M4: TreeEKplorer (匚:Documents and SettingsAdniinistrator-7E20C7ED0CEF4匸桌戸eFilIm 日口已 Subtree View Comput 已

42、CaEition Helpanaspegiongallus gallus0.005-A 一SBL = 0.070046190.005Load Taxon Ima口已名 rr om a Folder5.3ve as Enhanced Met.file (EMFiSave as TIFF file可 以通过截图把下面这个图拷贝到你论文上pegionanas也可通过E M4: TreeEwplorer (C:Documents and SettingsAdminiFile:e View Compute 匚 aption Help齬 Copy to ClipboardC trl+C2症-1nnnF1点击1, 2,两个下拉菜单,把改图拷贝到你的画图(系统工具,在程序-附件-画图,打开画图之后点击编辑黏贴,就可把改图拷 贝到你的画图上,在把改图拷贝到你的论文中)上。终于完事了

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!