[农学]分子生物学第3章基因与基因组的结构

上传人:仙*** 文档编号:172382502 上传时间:2022-12-03 格式:PPT 页数:73 大小:5.61MB
收藏 版权申诉 举报 下载
[农学]分子生物学第3章基因与基因组的结构_第1页
第1页 / 共73页
[农学]分子生物学第3章基因与基因组的结构_第2页
第2页 / 共73页
[农学]分子生物学第3章基因与基因组的结构_第3页
第3页 / 共73页
资源描述:

《[农学]分子生物学第3章基因与基因组的结构》由会员分享,可在线阅读,更多相关《[农学]分子生物学第3章基因与基因组的结构(73页珍藏版)》请在装配图网上搜索。

1、2022-12-31第第3章章 基因与基因组的结构基因与基因组的结构Chapter 3 Structure of gene and genome 2022-12-32(T.H.Morgan 1926)一、基因和基因组一、基因和基因组 基因(基因(GeneGene)是是DNADNA分子上的一分子上的一段段序列,一个基因包括一个蛋白质或序列,一个基因包括一个蛋白质或RNARNA的全部编码序列和编码区之外对编码区的全部编码序列和编码区之外对编码区转录功能所必要的非编码的调控区转录功能所必要的非编码的调控区结构基因;工具基因结构基因;工具基因1、基因(、基因(Gene)2022-12-33 结构基因结

2、构基因编码蛋白质的基因编码蛋白质的基因;可被转录生成可被转录生成mRNA,进而翻译成蛋白质,进而翻译成蛋白质,表表现出相应性状。现出相应性状。2022-12-34 工具基因工具基因只转录成只转录成RNA,不再翻译成蛋白质;,不再翻译成蛋白质;为蛋白质合成提供必要的工具。为蛋白质合成提供必要的工具。如如rDNA、tDNA基因基因2022-12-352、基因组(、基因组(Genome)基因组基因组是一种生物染色体内全部遗传物质的是一种生物染色体内全部遗传物质的总和,包括构成基因和基因之间区域的所有总和,包括构成基因和基因之间区域的所有DNA。不同生物基因组大小及复杂性不同。进化程度越不同生物基因组

3、大小及复杂性不同。进化程度越高,基因组越复杂。高,基因组越复杂。2022-12-36基因组大小基因组大小2022-12-37 原核生物的基因结构特点:原核生物的基因结构特点:基因组较小,编码区和非编码区组成,非编码基因组较小,编码区和非编码区组成,非编码DNA比例较少,无内含子;比例较少,无内含子;有操纵子结构,有操纵子结构,且为多顺反子;且为多顺反子;结构基因多为单拷贝,结构基因多为单拷贝,rRNA基因多拷贝;基因多拷贝;有些基因之间可以形成有些基因之间可以形成重叠基因重叠基因;二、原核生物基因组二、原核生物基因组环状或线状的双链环状或线状的双链DNA分子所含有的全部基因,有分子所含有的全部

4、基因,有的还包括染色体外的的还包括染色体外的质粒质粒基因组。基因组。2022-12-38大肠杆菌基因组(大肠杆菌基因组(4,639,221bp)闭合环状闭合环状4288个基因个基因类核类核操纵子结构操纵子结构基因多为单拷贝基因多为单拷贝非编码非编码DNA较少较少2022-12-392022-12-310类核的结构类核的结构2022-12-311Coding gene操纵子操纵子2022-12-312 莲人在绿杨津莲人在绿杨津采采 一一 玉漱声歌新阕玉漱声歌新阕采莲人在绿杨津,采莲人在绿杨津,在绿杨津一阕新;在绿杨津一阕新;一阕新歌声漱玉,一阕新歌声漱玉,歌声漱玉采莲人。歌声漱玉采莲人。2022

5、-12-313共同使用同一共同使用同一DNA序列,但编码两种不同蛋白质的基因。序列,但编码两种不同蛋白质的基因。重叠基因(重叠基因(overlapping gene)5386Nt 11 基因,基因,3 mRNA X174含有的含有的5386Nt最多能编码最多能编码1795个氨基酸,若个氨基酸,若每个氨基酸的平均分子量为每个氨基酸的平均分子量为110,则总的蛋白质分子,则总的蛋白质分子量为量为197kDa,但实际蛋白质却为,但实际蛋白质却为262kDa。将全部将全部DNA顺序和蛋白质的氨基酸顺序进行比较,顺序和蛋白质的氨基酸顺序进行比较,证实了重叠基因证实了重叠基因X174 (F.Sanger,

6、1977)2022-12-314X174 (F.Sanger,1977)2022-12-315基因重叠方式基因重叠方式 Mis-reading for stop codon 400Nt 800Nt AUG-UGA-UAA UGA,UAG 易被漏读,易被漏读,错读错读 UAA 能严格终止能严格终止 14Kd Cp 97%38Kd Ip 3%2022-12-316 Alternate different reading frame -ATG-/-AATGCC-/-ATAACG-/-TAA-ABATGCCN-NNATAA2022-12-317质粒质粒(plasmid)2022-12-318n 基因组

7、基因组(genome)核基因组(核基因组(nucleic genome)核外基因组(核外基因组(extranucleic genome)线粒体基因组(线粒体基因组(mitochondrial genome)叶粒体基因组(叶粒体基因组(chloroplast genome)三、真核生物基因组三、真核生物基因组2022-12-3191、核基因组、核基因组真核生物单倍体染色体所含的一整套基因。真核生物单倍体染色体所含的一整套基因。3.1.1 基因组的特点:基因组的特点:u 基因组较基因组较大大,结构复杂,大部分位于细胞核中,结构复杂,大部分位于细胞核中,为为双链线状双链线状,并与蛋白质结合形成染色质

8、,而且,并与蛋白质结合形成染色质,而且染色染色体数目体数目往往不是一条,而是往往不是一条,而是多条多条;2022-12-320即一即一mRNA只能翻译只能翻译成一种蛋白质。成一种蛋白质。2022-12-3212022-12-322 真核生物基因组真核生物基因组低等真核低等真核生物生物高等真核高等真核生物生物2022-12-323 真核生物基因组真核生物基因组exon&intron2022-12-324 真核生物基因组真核生物基因组“城市化城市化”与与“荒漠化荒漠化”2022-12-325The total amount of DNA in the genome of haploid is a

9、characteristic of each living species known as its Maximum C value (单倍体基因组总单倍体基因组总DNA 的含量的含量)最大最大C值值(Maximum C value)The total amount of DNA for encoding the genes information is termed its Minimum c value(编码基因(编码基因信息的总信息的总DNA含量)含量)最小最小C值值 (Minimum c value)3.1.2 C值矛盾(值矛盾(C-value paradox)2022-12-326C

10、 value paradox of nucleotideC value paradox of nucleotide 霉菌藻类藻类G+细菌细菌G-细菌细菌显花植物显花植物鸟类鸟类哺乳类哺乳类爬行类爬行类两栖类两栖类硬骨鱼类硬骨鱼类软骨鱼类软骨鱼类赖皮类赖皮类甲壳类甲壳类昆虫类昆虫类软体动物软体动物蠕虫类蠕虫类真菌真菌枝原体枝原体A 生物体进化程度高低生物体进化程度高低 与大与大C值不成值不成明显明显 相关相关(非线性)(非线性)B 亲缘关系相近亲缘关系相近的生的生 物大物大C值相差较大值相差较大 C 一种生物内大一种生物内大C值与值与 小小c值相差极大值相差极大 (Euk.人体人体 c=C/10

11、)(Prok.x174 c C)2022-12-327真核生物真核生物 DNA 染色体数染色体数 (2C)(2N)两栖鲵两栖鲵 168.0 pg(10-12g)24肺鱼肺鱼 100 38蝾螈蝾螈 85.3 24警蛙警蛙 28.2 24牛牛 6.4 60人人 6.4 46绵羊绵羊 5.7 54果蝇果蝇 0.2 8贝母贝母 196.7 24豌豆豌豆 28 12玉米玉米 11 20原核生物原核生物 DNA (C)Salmonella Salmonella 0.0143 pgE.coliE.coli 0.0040T2 T2 0.00022 0.0000055174174 0.000005 无无 线线

12、性性 关关 系系?说说 明:明:C值大小与生物进化程值大小与生物进化程度并不完全呈相关关系度并不完全呈相关关系 基因组中存在许多不编基因组中存在许多不编码蛋白质的码蛋白质的DNA序列序列2022-12-328u 真核生物基因组真核生物基因组DNA的序列的序列 单拷贝序列单拷贝序列非重复序列,在基因组中仅有一个拷贝非重复序列,在基因组中仅有一个拷贝大多数结构基因大多数结构基因 轻度重复序列轻度重复序列2-10个拷贝,包括个拷贝,包括rRNA、tRNA和一些结和一些结构基因如构基因如组蛋白基因组蛋白基因2022-12-329中度重复序列中度重复序列十至数百个拷贝,分散于整个基因组中;十至数百个拷贝

13、,分散于整个基因组中;每种序列的重复次数不等,平均长度大约每种序列的重复次数不等,平均长度大约300bp一般为不编码序列,起基因调控作用一般为不编码序列,起基因调控作用如:真核生物的如:真核生物的 Alu familyAlu family300,000 copies 广泛分布于非重复序列间广泛分布于非重复序列间300bp300bp300bp6000bp6000bp6000bp6000bpAGCT2022-12-330 高度重复序列高度重复序列几百至几百万个拷贝;几百至几百万个拷贝;长度从几个、几十个到几长度从几个、几十个到几百万百万bp无选择压力,可保留在群体中无选择压力,可保留在群体中可分为

14、可分为3种:简单重复序列、小卫星种:简单重复序列、小卫星DNA和微卫和微卫星序列星序列2022-12-331 卫星卫星DNA(satellite DNA):分布于染色体上异染色区域,由长串联重复序列组成。分布于染色体上异染色区域,由长串联重复序列组成。小卫星小卫星DNA(minisatellite DNA):由中等大小的串联重复组成,主要分布于染色体末端由中等大小的串联重复组成,主要分布于染色体末端区域。区域。微卫星微卫星DNA(microsatellite DNA):由由2-6个个bp单位组成的串联重复序列,分散于整个核基单位组成的串联重复序列,分散于整个核基因组。如因组。如TGTGTG=(

15、TG)n 2022-12-332 5前导顺序,3拖尾顺序 非编码顺序 因突变而失去功能 基因和 (90%)假基因 基因相 加工假基因 关顺序 编码顺序 基因片断(丢失了5和3端顺序,不能表达的基因)(2030)(10%)短分散顺序(SINEs)如Alu 顺序人类基因组 分散的重复顺序(3109bp)中度/高度 (40%)长分散顺序(LINEs)基因以 重复顺序 卫星DNA(长1005000kb)外非编 (2030)成簇的重复顺序 小卫星DNA(长100bp20kb,VNTRs)码顺序 (60%)微卫星DNA(4bp,CA 重复)(70-80%)单一/低度 重复顺序 (7080)图1037(b)

16、人类基因组的序列 2022-12-333u 基因家族(基因家族(Gene family)真核生物基因组中功能相似、结构具有同源性的真核生物基因组中功能相似、结构具有同源性的一组基因。一组基因。编码编码RNA,如,如rRNA,tRNA和和snRNA等等;编码蛋白质的基因家族编码蛋白质的基因家族.位于同一染色体上位于同一染色体上,串联排列串联排列,如如rRNA、组蛋白家族、组蛋白家族;位于不同染色体上,个成员的位于不同染色体上,个成员的DNA并不完全相同,并不完全相同,如珠蛋白如珠蛋白2022-12-3342022-12-3352022-12-3362022-12-3372022-12-338 核

17、苷酸序列与编码某一蛋白质的基因相似,但核苷酸序列与编码某一蛋白质的基因相似,但不具功能,不能转录形成成熟不具功能,不能转录形成成熟mRNA或不能翻译或不能翻译出功能蛋白质。出功能蛋白质。重复的假基因重复的假基因 已有基因在结构上发生较大变化而失去功能后形成已有基因在结构上发生较大变化而失去功能后形成假基因(假基因(pseudogene)加工的假基因加工的假基因2022-12-339 加工的假基因加工的假基因 没有启动子和内含子,在没有启动子和内含子,在3端有一段延伸的短端有一段延伸的短A-T碱基对序列,似碱基对序列,似poly(A)尾巴尾巴。2022-12-340加工基因的形成加工基因的形成

18、l DNA pre-RNA RNA cDNA DNAstaggerU3 pseudo geneprocessed gene2022-12-341 加工基因的形成加工基因的形成 lDNA pre-RNA RNA RNA/DNA DNA3TnAnDRSecond nick ligation to RNAprocessed RNA2022-12-342移动基因(移动基因(movable gene)转座子(转座子(transposonable elements,TEs)(transposon)从基因组上的一个位置转移到从基因组上的一个位置转移到同一条染色体或另一条染色体同一条染色体或另一条染色体的另一

19、个位置,引起相应控制的另一个位置,引起相应控制性状的改变。性状的改变。跳跃基因(跳跃基因(jumping gene)2022-12-343转座子的发现转座子的发现认为:一种控制基因在玉米基因组中移动的认为:一种控制基因在玉米基因组中移动的结果结果(McClintock B,Cold Harboring Lab)1950年,年,发现发现玉米粒的颜色经常发生变化玉米粒的颜色经常发生变化2022-12-344 控制基因插入到玉米染色体上编码色素的基因中,控制基因插入到玉米染色体上编码色素的基因中,改变基因表达活性,使玉米粒颜色发生变化。改变基因表达活性,使玉米粒颜色发生变化。基因的插入位置不断发生变

20、化,沿着染色体移动,基因的插入位置不断发生变化,沿着染色体移动,造成玉米粒的颜色成斑驳状。造成玉米粒的颜色成斑驳状。2022-12-3452022-12-346转座子的结构特征转座子的结构特征转座后转座后,转座子两侧形转座子两侧形成靶位点的正向重复成靶位点的正向重复转座子两端为转座子两端为反向重复反向重复转座子转座子2022-12-347转座机制:转座机制:内切酶识别靶序列,并内切酶识别靶序列,并产生交错切口;产生交错切口;转座子插入到切口之间转座子插入到切口之间,两端反向重复与靶序列两端反向重复与靶序列突出的单链末端连接;突出的单链末端连接;DNA聚合酶填补单链区聚合酶填补单链区域缺口,域缺

21、口,DNA连接酶封连接酶封闭缺口闭缺口ATGCAATGCATACGTATGCATACGT靶位点靶位点2022-12-348外显子(外显子(exon):):编码编码的的DNA序列,即被表达的序列,即被表达的DNA区段区段内含子(内含子(intron):):不编码不编码的的DNA序列序列Gilbert(1978年)提出内含子、外显子概念年)提出内含子、外显子概念断裂基因(断裂基因(split gene)2022-12-349不连续基因不连续基因(discontinuous gene)在基因编码蛋白质的序列中插入与蛋白质编码在基因编码蛋白质的序列中插入与蛋白质编码无关的无关的DNA间隔区,使一个基因

22、分隔成不连续间隔区,使一个基因分隔成不连续的若干区段。的若干区段。2022-12-350内含子的发现内含子的发现2022-12-351DNA和和mRNA之间形成特殊的之间形成特殊的RNA-DNA异源双链异源双链分子结构分子结构 断裂基因断裂基因 Split Genes2022-12-352内含子存在的证明内含子存在的证明电子显微镜观察分析电子显微镜观察分析断裂基因的结构断裂基因的结构成熟成熟mRNAmRNA或或cDNAcDNA与对应单链与对应单链DNADNA杂交杂交2022-12-353用用S1核酶处理异源双链分子核酶处理异源双链分子 核酸酶能专一降解未配核酸酶能专一降解未配对的单链核苷酸,在

23、对的单链核苷酸,在RNA-DNA异源双链分子中,外异源双链分子中,外显子形成双链而保留,内显子形成双链而保留,内含子仍为单链被降解含子仍为单链被降解.2022-12-354外显子与内含子连接区特征外显子与内含子连接区特征内含子两端序列之间没有广泛的同源性和互补性;内含子两端序列之间没有广泛的同源性和互补性;连接区高度保守,几乎每个内含子连接区高度保守,几乎每个内含子5端起始两个端起始两个碱基为碱基为GT,3 端最后两个碱基为端最后两个碱基为AG,即,即5GT.AG 3 2022-12-355选择性剪接选择性剪接同一区段同一区段DNA序列可以加工生成两条或两条以上的链序列可以加工生成两条或两条以

24、上的链。2022-12-356-选择性剪接选择性剪接(Alternative splicing)-Alternative splicing in Drosophila maintains the female state.2022-12-357内含子的功能内含子的功能影响基因的表达调控影响基因的表达调控调控调控RNA的剪接,增加的剪接,增加DNA储存信息量储存信息量有助于变异和进化有助于变异和进化编码特定的蛋白质编码特定的蛋白质增加重组几率增加重组几率内含子并非内含子并非“含而不露含而不露”外显子并非外显子并非“表里如一表里如一”2022-12-358u核外遗传系统核外遗传系统 线粒体线粒体D

25、NA(Mitochondrial DNA,mt-DNA)存在线粒体内,分布于细胞质中,多聚集在需能部位。存在线粒体内,分布于细胞质中,多聚集在需能部位。2022-12-359 线粒体线粒体DNA基因组特征基因组特征 分子结构简单:分子结构简单:共价闭合的环状双链共价闭合的环状双链DNA;结构基因排列紧密,除调控区外无内含子和转座子;结构基因排列紧密,除调控区外无内含子和转座子;编码区含有编码区含有37个基因,个基因,调控区(置换环或调控区(置换环或D-环)环)2022-12-360 mt-DNA的相对分子量低的相对分子量低大小一般在大小一般在14-42kb 之间,大多数动物在之间,大多数动物在

26、16-19之间;之间;与核与核DNA相比,相比,mt-DNA所占质量比很小,不足所占质量比很小,不足1。进化速度快(进化速度快(mt-DNA 结构基因结构基因)mt-DNA聚合酶不具备校对修复能力;聚合酶不具备校对修复能力;碱基不配对频率高,复制易发生错误。碱基不配对频率高,复制易发生错误。无组织特异性无组织特异性 正常个体不同细胞的正常个体不同细胞的mt-DNA具有高度均一性具有高度均一性 核苷酸组成不均一核苷酸组成不均一 4种碱基组成偏离随机组成;种碱基组成偏离随机组成;G+C的摩尔分数在的摩尔分数在15-50间变化。间变化。2022-12-361 线粒体线粒体DNA的变异的变异mtDNA

27、的变化随年龄增加而增加,因此认为的变化随年龄增加而增加,因此认为mtDNA的的突变与衰老有关。突变与衰老有关。mtDNA的突变率比细胞核的突变率比细胞核DNA高高510倍。倍。原因:原因:mtDNA缺少组蛋白的保护;缺少组蛋白的保护;线粒体中无修复线粒体中无修复DNA的操作能力;的操作能力;线粒体进行大量氧化过程,产生随自由基可能损伤线粒体进行大量氧化过程,产生随自由基可能损伤mtDNA。这些变异都可以这些变异都可以母系遗传母系遗传的方式传递到子代。的方式传递到子代。2022-12-362公驴与母马的后代,为马骡公驴与母马的后代,为马骡,与马像与马像母驴与公马的后代,母驴与公马的后代,为驴骡为

28、驴骡线粒体的母系遗传线粒体的母系遗传2022-12-363 遗传密码通用性不完全适合遗传密码通用性不完全适合mtDNA2022-12-364寻找祖先寻找祖先2022-12-365“三合一三合一”胚胎胚胎 三个爹娘一个娃三个爹娘一个娃2022-12-366喝碳酸饮料直毁细胞代谢喝碳酸饮料直毁细胞代谢2022-12-367四、基因的命名及表示方法四、基因的命名及表示方法基因的命名基因的命名一般来说,基因的名称用斜体表示,而蛋白质的名一般来说,基因的名称用斜体表示,而蛋白质的名称用正体表示。如核糖体蛋白称用正体表示。如核糖体蛋白6基因(基因(ribosome protein L6):):RPL6,蛋

29、白为,蛋白为RPL62022-12-368最常使用的命名方法:最常使用的命名方法:l 用三个小写英文斜体表示基因的名字,加一个斜体大写字用三个小写英文斜体表示基因的名字,加一个斜体大写字母表示不同的基因座。如母表示不同的基因座。如lac操纵子的基因座:操纵子的基因座:lacZ,lacY;其;其表达产物为表达产物为lacZ,lacY。l 酵母:一般用三个大写斜体表示基因功能,后面的数字表酵母:一般用三个大写斜体表示基因功能,后面的数字表示不同的基因座。如啤酒酵母基因示不同的基因座。如啤酒酵母基因GAL4,其蛋白为,其蛋白为GAL4。l 线虫:三个小写斜体表示突变型,如存在多个基因座,则线虫:三个

30、小写斜体表示突变型,如存在多个基因座,则在连字符后加数字。如基因在连字符后加数字。如基因unc-86,蛋白,蛋白UNC-86。l 脊椎动物:小写字母加数字。脊椎动物:小写字母加数字。l 人:大写字母加数字。基因人:大写字母加数字。基因MYC,蛋白,蛋白MYC。2022-12-369基因的大小及表示方法基因的大小及表示方法 基因的大小基因的大小外显子大小、数目与基因大小没必然联系;外显子大小、数目与基因大小没必然联系;基因大小主要决定于内含子的长度和数目;基因大小主要决定于内含子的长度和数目;一般地,生物越高等,基因结构越复杂,基因就越大一般地,生物越高等,基因结构越复杂,基因就越大。2022-

31、12-370相对分子质量相对分子质量用分子量来表示,用分子量来表示,4种核苷酸的平均相对分子质量近似为种核苷酸的平均相对分子质量近似为3402022-12-371碱基对数目碱基对数目碱基对(碱基对(base pairs,bp)千碱基对(千碱基对(kilobase pairs,kb)百万碱基对(百万碱基对(megabase pairs,mb)1bp=6801kb=333(个)氨基酸(个)氨基酸 (相对分子量为(相对分子量为120)1kb=4 104 道尔顿道尔顿2022-12-372摩尔单位摩尔单位基因分子数目基因分子数目1mol=1 106=1.47 kb(1106/680)质量单位质量单位提纯冻干的基因或核苷酸称量,用质量单位来表示。提纯冻干的基因或核苷酸称量,用质量单位来表示。微克(微克(ug)纳克(纳克(ng)皮克(皮克(pg)2022-12-373光密度单位光密度单位核酸溶液在紫外波长为核酸溶液在紫外波长为260nm时,表现为最高吸收峰。时,表现为最高吸收峰。根据分子消光度,根据分子消光度,1个光密度单位(个光密度单位(O.D260)的核酸溶)的核酸溶液其质量浓度分别为:液其质量浓度分别为:双链双链DNA 50 mg/L 单链单链DNA 33 mg/L RNA 40 mg/L

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!