第二讲基因的现代概念

上传人:daj****de 文档编号:160271290 上传时间:2022-10-10 格式:DOCX 页数:48 大小:45.21KB
收藏 版权申诉 举报 下载
第二讲基因的现代概念_第1页
第1页 / 共48页
第二讲基因的现代概念_第2页
第2页 / 共48页
第二讲基因的现代概念_第3页
第3页 / 共48页
资源描述:

《第二讲基因的现代概念》由会员分享,可在线阅读,更多相关《第二讲基因的现代概念(48页珍藏版)》请在装配图网上搜索。

1、第二讲基因的现代概念1=吴乃虎中国科学院遗传与发育生物学研究所2019年8月目 录一、移动基因1. 概述2. 插入序列插入序列的发现(2) 原核生物转位因子的类型(3) 插入序列3. 转位子(1) 转位子概念(2) 转位子类别4转位作用机理(1) 转位作用概念(2) 转位作用类型(3) 转位作用分子机理*1.复制型转位*2.非复制型转位*3.保存型转位二、断裂基因1. 断裂基因概念(1) 定义(2) 表达程序若干概念2. 间隔子位置的测定实验步骤(2)异源双链体分子定义3. mRNA初级转录本的剪辑(1)两步机理mRNA差异剪辑三、重叠基因1. 重叠基因定义2. 重叠基因的发现3. 原核生物重

2、叠基因类型(1) 第一种类型(2) 第二种类型(3) 第三种类型4. 真核生物重叠基因的类型(1) 间隔子式重叠基因(2) 嵌套基因5. 重叠基因的分布6. 重叠基因的意义四、假基因1. 假基因的定义2. 假基因的拷贝数3. 假基因的类型重复的假基因(2) 加工的假基因(3) 加工的假基因的起源问题五、重复序列与重复基因基因家族与基因簇的概念(差异)(1) 基因家族(2) 基因簇2. 重复序列(基因)3. 重复基因的特点4. 基因拷贝数与其表达量之间的关系基因的现代概念一、移动基因1. 概述*1.移动基因(movable genes),又叫做转位因子(transposable element)

3、。它可以在染色体基因组上移动,甚至在不同染色体 分子之间跃迁,所以有时也称之为跳跃基因(jumping genes)。*2.移动基因最早是由美国冷春港(Cold Spring Habor Laboratory) 的女科学家诺贝尔奖金获得者B. McClintock于上一 世纪40年代,其母校康奈尔大学遗传学系在研究玉米时发现 的,当时叫做“控制因子” (controlling elements),或称为激活 -解离因子(Activator- Dissociation element,简称 Ac/Ds 因子。*3.玉米中移动基因功能:a.这些控制因子可以插入到玉米染色体的靶子位点上, 并抑制与之

4、邻近的其它染色体基因的表达活性;b控制因子在染色体上没有固定的位置,似乎可以沿着 染色体分子移动;c.控制因子在插入染色体之后的适当时间内又可以重新 被删除焉,此时原先潜伏基因(dormant gene)的功能也 往往得到恢复;d.由于控制因子本身不稳定,因此与之相关的基因也呈 现出不稳定状态与高突变率的特性;*4.McClintock工作初期遭遇,与1983年荣获Nobel生物医学奖, 获奖后的心态等简介。获Nobel奖后她在给冷春港定量生物学 室实验室主任的信中说:请不要打扰我,仍然给我做我想做的 工作。2. 插入序列(1) 插入序列的发现在60年代末期,J. A. Shapiro在研究大

5、肠杆菌高效突变一一即 可影响一系列功能的突变一一时发现,这是由于一种大片段 DNA的插入作用造成的,并称这种 DNA片段为插入序列 (insertion sequences, IS)。随后的研究发现,除了 E.col之外,在其它的格兰氏阴性和格 兰氏阳性细菌中也都广泛地存在着转位因子。(2) 原核生物转位因子的类型:8插入序列(insertion sequence, IS)原核生物的转位因子,其分子量小于2000bp的一般叫做插入 序列。b转位子(transposon, Tn)第6页有时又叫做转座子(中文译名的差别),系指分子量大于2000bp的转位子。c噬菌体型转位子例如Mu和D108等噬菌

6、体,均属于第三种类型的转位子。移动基因 Movable genes转位因子 Transposible elements跳跃基因Jumping genes控制因子 Controlling elements激活-解离因子 Activator-Dissociation elements插入序列(IS) Insertion sequence转位子(Tn) Transposon(3)插入序列插入序列又叫IS因子,它是在细菌中首先发现的最简单的一类转位因子。其共同特征是:图2-1转位子的形体图(a) 简单的转位子,也叫做插入序列,它具有一个控制转位作用的转位 酶基因,并往往被反向重复序列,即所谓的IR序列

7、所包围。(b)复合的转位子Tn 1681,它具有两个插入序列(IS1)和一个热稳定的大 肠杆菌素1编码基因。 在它们的末端具有一段反向重复序列(但其长度不一定相 等,例如IS10转位因子的左边IR序列是17bp,右边是 22bp); 当IS因子插入到靶位点之后,便会在其两端的外侧产生 一段短的同向重复序列; IS因子一般只编码一种参与转位子作用的转位酶 (transposase),它能够识别反向重复序列,并催化转位因 子发生删除作用,从染色体上游离出来。图2-2 IS因子转位作用形成同向重复序列的原理具有IS因子插入靶子位点的一段DNA分子;(b) 在靶子位点形成交错的缺口;(c) IS因子同

8、缺口位置的单链末端连接;(d) 在靶子位点出现的裂口被补齐并封闭,形成短小 的同向重复序列序列。 IS因子能够四处活动,几乎可以插入到大肠杆菌染色体的 各个位置上;也可以插入到质粒和某些噬菌体基因组上; 甚至可以插入到同一个基因的不同位点上; IS因子的插入作用可以正向也可以反向整合到基因组上。 我们特称IS因子的这种移动方式为转位作用 (transposition)。转位作用表2-1若干种大肠杆菌IS因子的基本参数名称分子大小(bp)反向重复序列(bp)靶子位点的同向重复序列(bp)靶子位点选择IS1768239随机IS21327415热点IS414281811 或 12AAAN20TTTI

9、S51195164热点IS10R1329229NGCTNGCNIS50R153199热点IS9031057189未知3.转位子(transposon)(1)转位子概念转位子又叫转位因子(transposable element)或转座子,其英文定义:A segment of DNA that can move from one position in the genome to another.Transposon is a DNA sequence able to replicate and insert one copy at a new location in the genome.转位

10、子(transposon)是在许多细菌中发现的另一类移动单元,它 是由几个基因组成的特定的DNA片段,而且往往带有抗菌素 抗性基因。例如氨苄青霉素转位子就是其中一例。(2)转位子类别根据结构特征,转位子可以分为复合系和Tn3系两种不同的类 别:a. 复合转位子(C omplex transposone)复合转位子是由2个同样的IS因子连接在抗菌素抗性片段 的两侧构成的。复合转位子很容易携带着抗菌素抗性基因从细菌染色体转 移到质粒或噬菌体基因组上。当发生这种情况时,转位子 就会迅速地传播到其它细菌中去,这类转位作用是自然界 中发生细菌抗药性的主要原因。b. Tn3转位子Tn3转位子结构比较复杂,

11、长度约为5000bp,末端有一对 38bp的IR序列,但不含有IS因子序列,每个Tn3均由3 个基因组成:I AmpR基因编码内酰氨酶,提供氨苄青霉素的 抗性。TnpA基因编码1种长度为1015氨基酸的转位 酶:它作用于转位子末端产生双键切割,使转位 子从给体分子上删除下来;并在靶子位点作交错切割,使转位子插入进去。TnpR基因编码一种185个氨基酸的蛋白质。其 功能有二:抑制TnpA基因合成活性;促进中间 分解区又称中央解离位点res (resolution site)发 生位点特异的切割;表2-2若干种大肠杆菌复合转位子的基本参数名称分子大小(bp)遗传记号末端组件组件取向组件关系Tn90

12、33100KanRIS903反向同样Tn92500CanRIS1同向可能同样Tn109300TeiRIS10RIS10L反向2.5%差异Tn55700KanRIS50RIS50L反向1bp差异4转位作用机理(1) 转位作用概念*1.转位作用定义:The movement of a gene or set of genes from one site in the genome to another.移动基因的分子本质是一段能够插入到寄主基因组新位点 的特异的DNA序列结构。*2.转位作用特点:a. 是一种与recA基因无关的新的重组类型, 其唯一结果是转位因子的转动;recA甘励=重组作用基因

13、b. 转位因子插入位点是一段与之没有同源 关系的核昔酸序列;c. 转位过程涉及到DNA复制;*3.转位作用步骤:第一步,在靶DNA上造成交错的断裂;第二步,转位子连接到靶DNA的突出的(延伸的)单链末 端;第三步,连接留下的缺口 (gap)的补齐与封闭(2) 转位作用类型科学工作者对转位作用的机理认识经历了由肯定一一否定 再肯定的反复过程,由表入深的过程,逐步深化的过程:*早期的研究工作认为转位子可以从一个位点转移或移位到另 一个位点,故将此过程称为转位作用。*随后发现这种命名是错误的,因为在转位过程中,转位因子 的一个拷贝仍留在原来的位点上,同时在新的位点出现 第二个拷贝。因此转位与重组不同

14、,转位过程必须进行 DNA复制。进一步说,这种重组的唯一可能的后果是转 位因子的移动。*最近(B. Lewin, 1994)根据最新研究进展表明,事实上转位作用 有如下三种不同的类型:a. 保存型转位(Conservative transposition)b. 复制型转位(Replicative transposition)c. 非复制型转位(Nonreplicative transposition)有些转位子仅能按照其中的一种机理发生转位,而有 些转位子则可按照两种机现进行转位,例如IS1和IS903 就可按复制型和非复制型两种机理转位,而噬菌体Mu 则可按任何一种机理转位。图2-3由交错切

15、割形成的正向重复的靶DNA序列包翼在转位 子的两侧,其延伸的末端同转位子连接。(A)在靶子位点发生交 错切割;(B)转位子同单链末端连接;(C)补齐和封闭靶子位点 的裂口。(From. B. Lewin P.1006)(3) 转位作用的分子机理A复制型转位在复制型转位过程中,转位子发生复制,因此被转移的实体是一份原本的转位子。其中一份拷贝仍保留在原来的位置,而另一份拷贝则插入到 基因组的新位点。因此,这种类型的转位作用是通过增加转 位子的拷贝数得以实现的。Tn3转位子的转位作用便属于此 种类型。*1.复制型转位的酶催活性复制型转位过程中涉及两种酶催活性,下面以Tn3转位 子为例予以说明。图2-

16、4复制型转位产生的一个转位子拷贝插入到一个受体位 点上。给体位点保持不变。因此,复制转位的结果是给体与受 体各具有一个转位子拷贝。图2-5非复制型转位中,转位子以一个物理实体从给体位点转移 并插入到一个受体位点。这样转移的结果使给体位点断裂,若不 被修复,就将基因组造成致死效应。a. Tn3转位子编码的转位酶(Transposase)作用于转位子的末端,产生双链切割,使转位子从给体分子上 删除下去;并在靶子位点作交错切割,使转位子插入 进去。转位酶由tnpA基因编码b. Tn3转位子编码的另一种酶是解离酶(Resolvase)此种酶具有如下两重功能:作为阻抑物,抑制TnpA基因表达。第14页解

17、离酶功能,促使共合体结构中两个以同向重 复形式存在的转位子之间发生位点特异的重 组。解离酶由tnpR基因编码cointegrate 共同体图2-6 TnA转位子具有一对末端反向重复序列(IR),个中央位 置的res位点和3个基因。Res:site of resolution,即解离位点。tnpA基因编码产物是一种转位酶,它同长度为38bp的末 端反向重复序列中的一段约25bp的序列结合。 我们相信转位酶可识别转位子的末端,而且同 样能够在供转位子插入的靶DNA位点造成 (形成)交错的具5bp延伸序列的断裂。tnpR基因编码产物是一种具有双功能的蛋白质。它一方面 可以起到阻抑物的作用,抑制tnp

18、A基因和自身 基因(tnpR)的表达活性;另一方面又可起到解离 酶的功能作用(resolvase,解离酶)。*解离酶的功用是促进中央分解区发生位点特异 的切割作用。DNA-protein复合物的foot printing试验证明, TnpR解离酶是结合在res分解区,如图2-6所 示,解离酶在分解区(res)中有3个各长30-40bp 的结合位点,它们是彼此独立地同解离酶发生结 合作用。这3个结合位点共有一段二重对称 (dyad symmetry)的同源保守序列。所谓二重对称:系指旋转180后产生相同结构 的对称体,它是用来描述双螺旋 DNA分子中含有回文对称的区 域。这种区域旋转180。后得

19、到 相同的碱基序列。tnpR基因的突变导致转位频率上升,其原因是 TnpR蛋白质抑制了 tnpA和tnpR两个基因的转 录活性。因此,TnpR蛋白质的失活作用就会使 TnpA蛋白质的合成活性上升,从而最终导致转 位频率的增加。这意味着:TnpA转位酶是转位 作用的一种限制因子。这一点无疑是很有用处 的。res分解区(或叫解离位点)的功能鉴定:应用顺式作用缺失(cis-acting deletion)法,证明当res区缺失时,转位作用便被完全阻断了,并 导致共合体的累积。在res缺失的情况下,解离反应可以被以RecA介导的一般重组所取代,但其效果必定的低效 的。*2.复制型转位反应阶段:复制型转

20、位过程(图2-7)包括如下两个阶段:a.第一阶段,含有转位子的一个复制子(replicon) 同没有转位子的另一个复制子融合起来,这种由 复制子融合而成的结构叫做共合体 (cointegrate )。在这样形成的共合体中含有两份 相同的转位子的拷贝,它们按同向重复的方式排 列并彼此结合成一体。何谓复制子(Replicon):所谓复制子乃是含有一个复制起始位点的基因 组中的 DNA 复制单位(Replicon is a unit of the genome in which DNA is replicated; contains an origin for initiation of repli

21、cation.)例如细菌染 色体、病毒基因组、质粒基因组等,其DNA能 够进行自主复制的遗传单元,均称为复制子,每 一个复制子都含有一个启动复制的起点。真核细 胞、染色体内的“复制子”称为复制单位。0第二阶段,两个拷贝的转位子之间发生同源重 组,能够再生(regenerate)出原来的给体复制子,并释放出一个靶复制子(target replican)。此种靶复制子已经获得了一个转位子,其两侧由 寄主靶序列的短同向重复序列包围。解离:这种通过两个拷贝的转位子之间的重组形成一个 原给体复制子和一个靶复制子的反应叫做解离 (resolution),它是由解离酶催化的。解离反应释放出两个各含有1份同样

22、转位子拷 贝的复制子个体(图2-7)。*3.共合体结构的形成我们以Mu噬菌体为例说明共合体结构(cointegrate structure)形成的过程:图2-7转位作用能把一个给体复制子与一个受体复制子融合 成一个共合体。解离作用释放出两个复制子,它们各含有一份 转位子拷贝。Mu转位酶(transposase),是一种能够识别末端 的位点特异的核酸酶,它从转位子两端单链切 割给体分子;同时转位酶在受体分子的靶位点作交错的单 链切割形成5个碱基的单链延伸末端。第18页给体分子与受体分子在缺口部位连接:转位子序列的每一端都与靶子位点上的一 条单链延伸末端连接,形成一种交叉结构 (crossover

23、、七皿建)它含有一对转位子。图2-8 Mu噬菌体的转位作用产生出一种交叉结构,它经过复 制转变成一个共合体。(A)缺口形成。单链切割在转位子和靶位 点形成交错末端。(B)交叉结构形成。转位子缺口末端与靶位点 缺口末端连接。(C)共合体。一个分子的共合体具有两个拷贝的 转位子。(D)共合体分子拉长,表明转位子是位于复制子间的接 合部。交叉结构在每一个交错末端(staggered ends)都 具有一个单链区。这些单链区是一种假复制叉 (pseudoreplication forks),供作 DNA 合成的模 板。(使用这种延伸末端作引物进行复制,意味 着必定会发生链的极性断裂在此位点产生一 个3

24、-OH末端)。如果从两个复制叉继续进行复制,就将会通过 转位子按两链分开形式进行复制,并终止在该 链的末端o (From Lewin P.1011)(此种复制可能 是由寄主编码的功能完成的),此时,交叉结构 便变成为一种共合体(cointegrate)在其上的两个复制子之间的交接处有两个同向重复 排列的转位子。何谓共合体(cointegrate)?共合体是指由一个具一个转位子的复制子同另一个不 具转位子的复制子融合而成的结构,在共合体的两个 复制子结合部位具一对同向复制排列的转位子拷贝。B非复制型转位在非复制转位(nonreplicative transposition)中,转位子 是以一种物

25、理实体(physical entity)直接从基因组的一个位点转移到另一个位点,并因此得以保存。非复制转位按两种不同的机理进行。*1.以Mu噬菌体为例,它的非复制转位是通过给体 DNA与靶DNA之间的连接作用实现的。IS因子、复合转位子Tn10和Tn5均按此种机 理转位(见图1-3),它涉及转位子在转移过程从 给体DNA删除下来。此种转位机理仅涉及转位酶非复制型转位过程中删除下来的转位子,插入到 靶子位点上,而在给体位点(donor site)留下空 位。那么在非复制转位之后,给体分子将会发生 什么变化呢?有两种可能性: 一种可能性是此种给体DNA因此被破坏 掉。由于细菌染色体具有一个以上的拷

26、 贝(多拷贝),因此它是能够忍受此种破坏 的。 另一种可能性是,寄主的修复体系能够识别这种双链断裂,并予以修复(repairsestems)。*2.非复制转位的另一种机理特称为保存型转位 (Conservative transposition)(见下节)C保存型转位正如上节我们已经提到的,保存型转位是属于另一种类 型的非复制型转位。Tn10转位子就是按此种机理进行 转位的。当发生保存型转位时,在转位子编码的转位酶作用下, 转位子的末端发生双链切割后便从给体DNA分子上删 除下来,而后也是在转位酶的作用下,靶子位点发生交 错的切割,以使转位子插入进去(图2-9)。图2-9保存型转位。与 噬菌体的

27、整合与删除作用相比,在按 保存型机理进行的转位子转位过程中不丧失任何核昔酸键。在保存型转位过程所涉及到的一系列事件中,每一个核昔酸键(nucleotide bond)都被保存下来。这个过程同人噬 菌体的整合过程(integration)的机理是十分类似的。就 连所涉及的转位酶也与人整合酶(integrase)有亲缘关系。表2-3复制型转位与非复制型转位的比较复制型转位非复制型转位发生复制不发生复制形成共合体不形成共合体给体中保留转位子给体中不留转位子形成交叉结构形成交叉结构二、断裂基因1. 断裂基因概念(1) 定义真核蛋白质编码基因的序列结构分析发现,在它们的核昔酸序 列中间插入有与氨基酸编码

28、无关的DNA间隔区,使一个基因 分隔成不连续的若干区段。我们称这种编码序列不连续的间 断基因为断裂基因(split gene)。(2) 表达程序断裂基因DNA转录,帽的形成polyA尾巴的加入(tailing)初级转录物核内不均一 RNA(hn RNA),即前体 mRNA“发生删除与拚接成熟的mRNA“从细胞核进入细胞质蛋白质多肽链(3)若干概念*1.间隔子在mRNA成熟加工过程中,其转录物被剪除掉的DNA部分 叫间隔序列(intervening sequence)。或间隔子(introns)间 隔子*2.表达子被保留下来的DNA部分叫编码序列(coding sequence)或表 达子(ex

29、ons)表达子*3.RNA剪辑这种间隔子的删除和表达子的连接形成最后成熟mRNA的过程叫做RNA剪辑(心人splicing) RNA剪辑2. 间隔子位置的测定应用S1核酸酶作图法,可以测出在断裂基因中的间隔子的位置。(1)实验步骤提取细胞总RNA同含有一个间隔子的克隆的DNA片段进行 核酸杂交形成异源双链体分子(hetroduplex)基因的间隔子序列由于没有相应的转录序 列,而无法同mRNA分子杂交,因此形成 单链的环状结构(DNA-RNA杂种分子)。用S1核酸酶处理,使单链的DNA环状结 构被降解成单核昔酸,于是DNA片段被分 解成两个片段。凝胶电泳,测定这两个片段的分子量大小。间隔子位置

30、推算(参见基因工程原理第3 章有关内容)(2)异源双链体分子定义同一条双链DNA分子中的两条链分别来自两种不同的个体, 如一种是野生型的一种是突变型的,因此在这样的双链DNA 分子结构中,有一些甚至是大量的碱基是不能配对的,而形成 单链的环状结构。3. mRNA初级转录本的剪辑(1)两步机理(two-stop mechanism)剪辑法绝大多数真核生物基因的mRNA前体(pre-mRNA),有时也 叫做核内不均一 RNA(hn RNA)(heterogeneons nuclear RNA), 都含有许多间隔子,它们需要在mRNA穿过核膜进入细胞质 进行转译之前,通过一种叫做两步机理的剪辑作用而

31、被删除 掉。*1.剪辑体(spliceosome):这是发生mRNA剪辑作用的一种特 殊的高分子量的颗粒。它含有:I pre-mRNA高密度的核内小核糖核蛋白(small nuclear ribonucleoprotein, snRNP)颗粒各种剪辑因子第一步,在剪辑位点(splice site)发生切割反应第25页第二步,涉及3,剪辑位点的切割及表达子的连接。*2.剪辑位点真核细胞mRNA的5,及3,的剪辑位点的保守序列。几乎所 有的间隔子序列都是以G-U开始,用A-G结束的。根据 对许多表达子间隔子边界序列的分析,已经得出了 5,末端 和3,末端的优选的保守的核昔酸序列,除了 A-G之外,

32、紧 挨3,剪辑位点上游序列的其它核昔酸,对于进行精确的剪 辑作用,同样也是十分重要的。在间隔子的两端总是具有5GU和3AG的二核昔酸结构。这种特异性的二核昔酸连同围绕它们的25-30个核昔酸一 起构成了表达子间隔子剪辑位点。剪辑位点也叫做剪辑点(splice junction),它是启始RNA剪 辑作用的一段特定的核昔酸序列。*3.套索RNA套索RNA(lariat RNA):因剪辑作用而被删除下来的间隔 子形成的一种分支状中间体,称为套索RNA。(2)mRNA 的差异剪辑(differential splicing)*1.定义有些基因的初级转录本,在不同的细胞类型中或是在发育的 不同阶段,可

33、以按不同的途径剪辑形成不同的RNA分子, 编码不同的蛋白质,我们称这种现象为mRNA的差异剪辑(differential splicing)或可变剪辑(alternative splicing)可变剪辑同一种蛋白质的mRNA前体,经过可变剪辑之后,往往会 产生出不同形式的蛋白质,即蛋白质的异型体,以满足生物 体的不同发育阶段或不同细胞类型的特殊需要,因此剪辑在 发育过程中起到一种开关的作用。有关可变剪辑的机理,目前尚不知道。已经提出一种模型认 为存在特殊的剪辑因子(splicing factor)来指导优先使用一 组特殊的表达子组合。图2-10在两种不同器官中发生的可变剪辑途径在两种不同的器官

34、中发生的可变剪辑,结果从同一种初级转录本产生出两种不同的转译产物,一种是降钙素肽,另一种是降钙素基因相关肽(CGRP=calcitonin-gene-related peptide),降钙素肽和降钙素基因相关肽是两种相关的激素。CT=降钙素(calcitonin) o三、重叠基因(Overlapping genes)1. 定义:核昔酸编码序列彼此重叠的、编不同蛋白质的两个或数个基因, 称为重叠基因,又叫做嵌套基因(nested genes)。它最早是在大肠杆菌噬菌体中发现的,后来在真核细胞中也发现有此类基因。2.重!基因的发现:已知大肠杆菌细胞中的框174噬菌体单链DNA=5386个核昔酸。*

35、1.5386/3=1795个氨基酸。因此它最多只能编码总数1795个氨基酸*2.氨基酸平均分子量MW=1101795X110=197000*3.实际测得的8X174噬菌体编码的十一种蛋白质的分子量共 为 266000根据上述分析,F, Sanger在测定了8X174 DNA的核昔酸序列 之后发现,它的同一部分DNA能够编码两种不同的蛋白 质,从而发现了重叠基因。3.原核生物重叠基因类型:(1) 第一种类型:一个基因的核昔酸序列完全包含在另一个基因的核昔酸序列当中,只是由于读码结构不同,因此 编码着不同的蛋白质产物。(2) 第二种类型:两个基因核昔酸序列的末端密码子相互重叠。例如A基因的终止密码

36、子的3个核昔酸TGA与C基因的起始密码子ATG重叠了二个核昔酸:A基因终止密码子 广人ATGA】C基因起始密码子第三种类型:在G4噬菌体中发现此类重叠基因重叠的核昔酸 区段(由4个或5个核昔酸组成)同时为3个不同的编码K、A、B三个基因:基因B -苯丙氨酸一终止密码子 f /基因A -丝氨酸一天冬氨酸一谷氨酸, 、, 、(T T C T G A T G A A A G4 DN 序列 ; k基因K 一甲硫氨酸一赖氨酸(起始密码子)4. 真核生物重叠基因类型现在已经知道不仅在原核生物中存在着重叠基因,而且在真核生 物中也发现有重叠基因。(1)间隔子式重叠基因:一个基因的编码序列完全寓居于别个基因

37、的间隔子序列当中。例如在果蝇的GART基因(这是一种编码嘌吟生物合成的重要 酶蛋白的基因)的一个间隔子序列中,寓居着一个与之无关的编 第29页码蛹角质膜蛋白的基因,但两者转录方向相反。(2) 嵌套基因:这是在高等真核生物中发现的另一类重叠基因,其特征是以基因的相反链编码。例如从人类基因组中克隆的一种编码819个氨基酸蛋白质的基因cDNA片段,其相反链(opposite strand)上还编码一个类固醇 21-羟化酶基因。5. 重叠基因的分布*1.目前已经在X174噬菌体、G40噬菌体、SV40病毒以及少数的真核基因中,发现了重叠基因的存在。然而重叠基因在生物 界中是否普遍存在?目前尚无法肯定。

38、*2.但是我们相信,随着研究工作的不断深入,尤其是有关间隔子序列的测序和功能鉴定的深入,人们完全有可能发现另外的新 型的重叠基因,也就是有关重叠基因的数量以及类型,都将会 有不断定发展。6. 意义:XT,三U重叠基因的发现,修正了关于基因间核昔酸序列互不重叠的概念!四、假基因目前已经在大多数真核生物中,都找到了其核昔酸序列同相应的(正常的)功能基因相比,大部分都是同源的,但却是无活性的不能转第30页录的基因,即假基因(Pseudogenes)。1. 假基因的定义:一类同野生型基因序列大部分同源,但由于突变而失去活性的畸 变的核昔酸序列。假基因可能是一种活性基因在进化过程中保留 下来的遗迹,它虽

39、不能表达,但却是基因组的稳定成份。2. 假基因的拷贝数(1) 已知小分子量的poim和 polll RNA基因,通常有数百个假基 因。(a) 例如 U1 snRNA(small nuclear RNA)大约有 50 100 个功能 基因,但却有5001000个范围的假基因,后者为前者的 10倍;(b) 再如,哺乳动物的7SLRNA基因族,只有4个活性基因, 却拥有数百个的假基因,超过前者的数十倍乃至百多倍。(2) 在蛋白质的编码基因中,假基因的拷贝数的数量则是比较低的, 通常不会超过20个。3. 假基因的类型(1)重复的假基因*许多假基因都是同“亲本基因”(parental gene)连锁的,

40、而且同其编码区及侧翼序列的DNA具有很高的同源性。*鉴于产生此类假基因拷贝的一种可能的机理是,由含有“亲 本基因”染色体区段串联重复形成,故称之为重复的假基因 (Repeat pseudogene)。*一般认为在起初这种重复的基因是有功能的,但在进化的过 程中,其中某一个基因发生独立的突变而丧失了功能,出现 了进货的盲端,最终形成了假基因。*例如a-珠蛋白座位具有5个基因中,有两个是假基因,这两个 假基因虽然没有功能活性,但却能稳定遗传:E1胚胎珠蛋白基因A1和A2成体珠蛋白基因WE1和wA1假基因图2-11位于16号染色体上的人a-珠蛋白基因座在上图所示的这5个基因中,WA1显然是A1基因的

41、重复或者 说是复制品(duplication),两者之间有73%的同源性,都含有 间隔子及保守的5,控制元件,而且它们在5,及3,侧翼DNA之 间都具很高的同源性。但由于WA1基因中发生了许多突变而失去功能活性,故成假基 因,该基因(wA1)很可能是在45百万年以前由野生型基因突变形成的。加工的假基因*1.概念研究发现在真核生物染色体基因组中,除了重复的假基因之 外,还存在着另外一类“加工的假基因w (processed pseudogene)。由于这类假基因没有与“亲本基因”连锁, 而且其结构是同转录本而非“亲本基因”类似。例如:a. 没有启动子结构,b. 没有间隔子序列,c. 在基因的3,

42、-末端都有一段延伸的腺嘌吟短序列, 恰似mRNA分子3,-末端的poly(A)尾巴。这些特征表明,此类假基因很可能是来自加工的RNA之 DNA拷贝,因此,称之为加工的假基因。图2-12人金属硫蛋白功能基因Mt- IIA与无功能的加工的假基因Mt-IIB的结构比较*2.加工假基因的结构特点人金属硫蛋白基因Mt-IIA的无功能复本Mt-IIB,是一种 典型的加工的假基因。从图2-12可以看到,这个假基因显 然是功能基因Mt- IIA mRNA的准确复本(或称Copy),其结构特点是:它准确地从帽位点开始, 失去了间隔子, 终止在poly(A)位点。正是根据这些结构特征, 我们有理由相信Mt-IIB

43、是来自金属硫蛋白 基因Mt- IIA之加工的mRNA的DNA拷贝。 所以说它是一种典型的加工的假基因。*3.金属硫蛋白加工的假基因Mt-IIB失活的原因分析:a. 可能是因为它失去了转录控制信号,因此没法进行正常 的转录,亦即是失去了转录活性;b. 可能是由于在编码区出现了一个终止密码子,因而使该 基因失活。所以即便在5端加上一个功能的启动子(即转 录控制信号),具此类似结构的加工假基因也仍然是没有 活性的。(3) 加工的假基因的起源问题一一细胞质mRNA反转录作用无间隔子假基因形成的分子机理:*1.如上所述,第二类假基因的许多特征表明,它们是来自加工 的mRNA之DNA拷贝,因此被称之为加工

44、的假基因。*2.此外,加工的假基因的两侧,通常还包翼着530bp的短同向重复序列(directly repeated sequence),而且这些重复序列第34页DNA同其亲本基因完全没有关系。*3.加工假基因的形成,很可能是同反转录酶有关,这种酶可以RNA为模板形成DNA拷贝,然后以双链DNA形式插入到 基因组。*4.这涉及到形成一种起始的靶子断裂,这种断裂在插入过程中 被修复产生出一种短同向重复序列(如同在加工基因中所见 到的短同向重复序列)。*5.事实上加工基因是反转录酶产生的,而且表面上这种加工基 因可以随机地插入到染色体的各个部位,因此被叫做逆转位 子(retroposons)。如此

45、插入的结果便产生出无间隔子的假基因(图 2-13)。*6.在真核生物基因组中,假基因的现象可能是相当普遍的,有 人估计在真核基因组(例如人类)可能有1/4是没有活性的假 基因。图2-13细胞质mRNA反转录作用形成无间隔子的假基因在高等生物的染色体中存在着一系列的假基因,这个事实使人 们猜想这些剪辑的DNA(spliced DNA)拷贝可能是由 胞质 mRNA反转录产生的。而这种反转录作用大概是发生在一种流 产的反转录病毒感染期间。随后,剪辑的基因通过一种目前尚 不了解的机理而重新插入到染色体DNA上。五、重复序列与重复基因1. 基因家族与基因簇的概念(差异)(1) 基因家族(gene fam

46、ily)(结构、产物、功能三相似)系指同一种生物中,从同一祖先基因经过复制、突变而来的一 组具有相似结构、相似产物及相似功能的基因群体。从广义上 讲,同一个基因家族的各个成员也可以看作是重复基因,但它 们的序列差异毕竟比较大,也就是说同源性还是较低的。(2) 基因簇(gene cluster)(不同基因间的一种特殊的组合排列方式)cwm.y系指真核生物基因组中,由不同基因组成的一个特殊的组合排 列方式。同一基因簇的各个基因在遗传上往往是紧密连锁的, 它们可以是属于同一个操纵子的不同结构基因,也可以是属于 不同操纵子的不同结构基因;它们可以是来自同一基因家族的 不同成员,也可以是来自不同基因家族

47、的不同成员。2. 重复序列(基因)*研究表明,在几乎所有的真核生物(低等真核生物酵母除外)的基因组DNA中,都存在有重复序列(Repeated sequence)。常见的重复序列或说是重复基因有:a.组蛋白基因,b. rRNA基因c. tRNA基因等*在真核生物基因组中有4种不同类型的DNA序列(排列方式):第36页(i)不重复的唯一序列(只有一个拷贝的基因序列,由于通常研究的细胞是二倍体,所谓不重复的唯一序列,实际上存在着两 个拷贝)。(ii)低度重复序列(110拷贝)(iii)中度重复序列(10数百个拷贝)(iv)高度重复序列(数百个拷贝以上,多的可达数千上万个拷贝, 甚至百万份以上)3.

48、 重复基因的特点(注意与基因家族间的差异)下面介绍串联重复基因的特点*1.各成员之间具有高度的序列一致性,甚至完全相同,不像 基因家族中各成员差异较大;*2.拷贝数常有几十个甚至数百个,其数量远远超过基因家族 的成员数;*3.非转录的间隔子区短而一致,不像基因家族各成员之间的 非转录间隔区长短不一;4. 基因拷贝数与其表达量之间的关系*1.生物体以rRNA基因和组蛋白基因这种多拷贝数形式来增加基 因的剂量,提高蛋白质的合成速率,可能是一种特例,而非普遍的模式。*2.因为许多重要的蛋白质,都是由单拷贝基因编码的,例如丝心 蛋白基因是单拷贝的,但它可合成104个mRNA分子,而每个 mRNA分子又可合成105个蛋白质多肽。因此4天之内,一个 单拷贝的丝心蛋白基因便可合成出总数为104X105=109个蛋白 质分子,其数量足以满足生命需求。104mRNA分子乂 105蛋白质分子109蛋白质分子

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!