2013基因组学试题

上传人:bei****lei 文档编号:104898521 上传时间:2022-06-11 格式:DOCX 页数:6 大小:131.70KB
收藏 版权申诉 举报 下载
2013基因组学试题_第1页
第1页 / 共6页
2013基因组学试题_第2页
第2页 / 共6页
2013基因组学试题_第3页
第3页 / 共6页
资源描述:

《2013基因组学试题》由会员分享,可在线阅读,更多相关《2013基因组学试题(6页珍藏版)》请在装配图网上搜索。

1、2013基因组学试题1. 什么是基因组 (5分)?真核生物基因组有什么特点(15分)? 基因组是指一种微生物(包括细菌和病毒)或其它生物体细胞中的总 DNA或RNA(是指逆转录病毒),包括核DNA,细胞器DNA(动植物线粒体DNA和植物叶绿体DNA)和染色体外遗传成分(如细菌的质粒DNA)。结构:真核生物基因组结构特点:真核基因组远远大于原核生物的基因组。真核基因具有许多复制起点,每个复制子大小不一。每一种真核生物都有一定的染色体数目,除了配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。真核基因都出一个结构基因与相关的调控区组成,转录产物的单顺反子,即一分子mRNA只能翻译成一种蛋白

2、质。真核生物基因组中含有大量重复顺序。真核生物基因组内非编码的顺序(NCS)占90%以上。编码序列占5%。真核基因产断列基因,即编码序列被非编码序列分隔开来,基因与基因内非编码序列为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。真核生物基因组功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起成族的基因也是分别转录的。真核生物基因组中也存在一些可移动的遗传因素,这些DNA顺序并无明显生物学功能,似科为自己的目的而级织,故有自私DNA之称,其移动多被RNA介导,也有被DNA介导的。功能:(一)真核基因表达调控的环节更多基因表达是基因经过转录、

3、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。此外,真核细胞中还会发生基因扩增(gene amplification),基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。(二)真核基因的转录与染色质的结构变化相关真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:1.染色质结构影响基因

4、转录2.组蛋白的作用3.转录活跃区域对核酸酶作用敏感度增加4.DNA拓扑结构变化5.DNA碱基修饰变化(三)真核基因表达以正性调控为主真核RNA聚合酶对启动子的亲和力很低,要依赖多种激活蛋白的协同作用。真核基因调控中有负性调控元件,但并不普遍;真核基因转录表达的调控蛋白是以激活蛋白的作用为主。真核基因组蛋白质编码的基因绝大多数是不连续的,采取逐个基因调控表达的形式。真核基因表达调控的环节多,录后调控的方式也很多1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 2.真核细胞基因转录产物

5、为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。3.存在重复序列,重复次数可达百万次以上。 4.基因组中不编码的区域多于编码区域。 5.大部分基因含有内含子,因此,基因是不连续的。 6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。2. 转录组和蛋白质组有何异同之处(10分)? 转录组和基因组水平不同,转录组是高度动态的,当细胞受到侵犯时,甚至当细胞处于正常的生理活动如复制,分裂时,基因的转录情况也会变化很大,产生不同的转录组。mRNA是信使RNA,携带着从基因组转录下来的遗传信息,但并不是所有的基因都同时转录,是受转录因子控制的,而且并非所

6、有基因组序列都能转录。原核生物中非转录成分较少,基因组序列利用效率较高,真核生物染色体存在大量非转录成分,一个基因转录形成的mRNA稳定性较差,转录的RNA原始产物要经过切割、修剪、添加、修饰和异构化形成成熟mRNA,tRNA和rRNA,其中内含子在mRNA拼接时被切除掉。通过选择性拼接,一个基因可以编码多条多肽链。正常的mRNA拼接发生mRNA内部,而在一些低等生物中还存在着奇怪的反转录 (trans-splicng)现象,拼接发生在两条mRNA之间,即两条mRNA在剪接因子作用下,第一条剪接下来的外显子与另外一条剪接下来的外显子拼接在一起,编码一个新的多肽。转录组只研究mRNA转录组学研究

7、的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。 蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(genOME),或一个细胞、组织表达的所有蛋白质(PROTein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变. 在转录时,一个基因可以多种

8、mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目. 蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域. 转录组是RNA转录后的全部产物,而转录后的产物经过加工修饰(例如甲基化、拼接、加尾等)后才变成蛋白质。相同之处就是他们的大部分结构相同。不同之处就是一个有加工过程,一个没有。3. 简述遗传图谱的构建方法(5分),说明遗传图谱在基因组研究中的意义(10分)。答:遗传图谱:某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知

9、的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单位为厘摩(Centi-Morgan, cM), 每单位厘摩定义为1%交换率。遗传学图谱的解像度(分辨率)低,大约只能达到100万碱基对(1Mb)的水平。构建:采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单位为厘摩(Centi-Morgan, cM), 每单位厘摩定义

10、为1%交换率。作图群体的建立 、分子标记的选择 、结果统计与数据处理 、绘制图谱 通过遗传图谱,我们可以大致了解各个基因或DNA片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等。遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段。初步的连锁图谱是任何物种深入开展遗传学研究的基础,高密度连锁图谱可用于数量性状位点(quantitative trait loci, QTL) 的定位,分子标记辅助选择(marker assisted selection, MAS)和比较基因组作图。分子生物学方法帮助我们寻找DN

11、A编码信息,但我们首先要知道,在哪里才能找到与目的性状相关的那段DNA.基因具有多效性,有些表型可能很难直接寻找其相关的DNA序列,遗传分析给我们提供了一个独立的、确定与遗传性状相关联基因的位置的方法。当关于一个基因的功能还处于假设阶段时,或者当某一特定表型与DNA的关联还处于推断状态时,遗传分析是唯一的手段4. 什么是物理图谱(5分)?简述大片段文库的物理图谱如何构建(15分)? 物理图谱(physical map)物理图谱是指有关构成基因组的全部基因的排列和间距的信息.它是通过对构成基因组的DNA分子进行测定而绘制的.绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性

12、而系统地排列出来.DNA物理图谱是指DNA链的限制性酶切片段的排列顺序.即酶切片段在DNA链上的定位.DNA是很大的分子.由限制酶产生的用于测序反应的DNA片段只是其中的极小部分.这些片段在DNA链中所处的位置关系是应该首先解决的问题.故DNA物理图谱是顺序测定的基础.也可理解为指导DNA测序的蓝图.广义地说.DNA测序从物理图谱制作开始.它是测序工作的第一步.制作DNA物理图谱的方法有多种. 构建物理图谱有哪些方法?遗传图谱与物理图谱的异同点?(20分)物理图谱:确定染色体DNA上诸如限制性内切酶切识别位点或序列标志位点(STSs)等的位置图,图距是物理长度单位,如染色体的带区、核苷酸对的数

13、据等。物理图谱构建:1)提供排好的染色体DNA或全基因组DNA的顺序;2)提供一套密集的遗传标记和彼此间的精确距离。3)提供一套可以直接用于染色体DNA或基因组DNA测序的NDA样品。方法:原位杂交技术细胞遗传学图谱直接将基因或遗传标记或文库克隆通过FISH定位在染色体上限制性酶切方法限制图谱利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离碱基对(bp) 或千碱基(kb)或兆碱基(Mb)的图谱STS容量法序列标签位点图谱通过PCR或分子杂交将STS顺序定位在基因组的DNA区段中克隆的指纹连接法连续的文库图谱1)构建一个基因组库。2)按照这些片段在完整

14、的染色体中的顺序和位置来排列文库中的这些随机片段。 “指纹识别”:包括将原始的克隆切割成更小的片段,然后用电泳法对这些片段根据尺寸进行排列。寻找克隆间重叠的指纹片段,以判定克隆间是否能够连接起来最通常的物理图的构建方法是把限制酶切的DNA片段,按其次序排列连接起来。作图的技术路线基本上分两类:一类是由长到短作图,另一类则是由短到长作图。前者是将基因组DNA用切点很少的限制酶如NotI等完全田切,得到长约1001000kb的DNA长(大)片段,估计每条染色体平均130个片段,按照片段上的标记把片段按次序排列,然后再把每一长片段酶切成短片段,再把短片段排列成序。这是由长到短的作图,图比较完整但分辨

15、力低。后一类方法则是先将基因组DNA用限制酶作部份酶切,得到的短片段分别用酵母人工染色体(YAC)或粘粒(Cosmid)等作载体加以克隆,然后根据克隆片段两端共有的序列即重迭序列两两连接,逐渐延伸成长片段。这样作图的分辨力较高,但图不完整往往留有空缺。这是因为有些酶切产生的DNA片段太短,不易被克隆,以致在通过重迭序列把片段连接时出现中断。一组相互邻接的DNA片段的克隆称为邻接DNA片段组。这两个策略可以根据研究的需要选定。5. 第二代DNA测序的原理是什么(5分)?不同基因组需要不同的测序策略,简要说明两种策略的特点(15分)。都需要费用更低、通量更高、速度更快的测序技术,第二代测序技术(N

16、ext-generation sequencing)应运而生。第二代测序技术的核心思想是边合成边测序(Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454 FLX、Illumina/Solexa Genome Analyzer和Applied Biosystems SOLID system。这三个技术平台各有优点,454 FLX的测序片段比较长,高质量的读长(read)能达到400bp;Solexa测序性价比最高,不仅机器的售价比其他两种低,而且运行成本也低,在数据量相同的情况下,成本只有454测序的1/10

17、;SOLID测序的准确度高,原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前第二代测序技术中准确度最高的。虽然第二代测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会对后续的数据分析有很重要的作用,下文将以Illumina/Solexa Genome Analyzer 测序为例,简述第二代测序技术的基本原理、操作流程等方面。2.基本原理 Illumina/Solexa Genome Analyzer测序的基本原理是边合成变测序。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚

18、合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。3.操作流程1)测序文库的构建(Library Construction) 首先准备基因组DNA(虽然测序公司要求样品量要达到200ng,但是Gnome Analyzer系统所需的样品量可低至100ng,能应用在很多样品有限的实验中),然后将DNA随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)。如果是转录组测序,则文库的构建要相对麻烦些,RNA片段化之后需反转成cDNA,然后加上接头,或者先将RNA反转成cDNA,然后再片段化并加上

19、接头。片段的大小(Insert size)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的insert size,以便在组装(Assembly)的时候获得更多的信息。2)锚定桥接(Surface Attachment and Bridge Amplification) Solexa测序的反应在叫做flow cell的玻璃管中进行,flow cell又被细分成8个Lane,每个Lane的内表面有无数的被固定的单链接头。上述步骤得到的带接头的DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用。3)预扩增(Denaturation

20、 and Complete Amplification) 添加未标记的dNTP 和普通Taq 酶进行固相桥式PCR 扩增,单链桥型待测片段被扩增成为双链桥型片段。通过变性,释放出互补的单链,锚定到附近的固相表面。通过不断循环,将会在Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段。4)单碱基延伸测序(Single Base Extension and Sequencing) 在测序的flow cell中加入四种荧光标记的dNTP 、DNA 聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通

21、过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。从荧光信号获取待测片段的序列信息的过程叫做Base Calling,Illumina公司Base Calling所用的软件是Illuminas Genome Analyzer Sequencing Control Software and Pipeline Analysis Software。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。随着读长的增加,错误率也会随之上升。5)数据分析(Data Analyzing) 这一步严格来讲不能算作测序操作流程的一部分,但是只有通过这一步前面的工作才显得有意义。测序得到的原始数据是长度只有几十个碱基的序列,要通过生物信息学工具将这些短的序列组装成长的Contigs甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。6. 简要描述一种水生生物基因组的特点(需要自己查资料看文献,不要翻译摘要)(15分)要求:1.手写;2.独立完成,若有相同者亦不及格论处;3.无需写太多,抓关键要点;4.12月9日前交卷,过时不候。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!