查找启动子区PPT课件

上传人:y****3 文档编号:25096392 上传时间:2021-07-21 格式:PPTX 页数:47 大小:4.11MB
收藏 版权申诉 举报 下载
查找启动子区PPT课件_第1页
第1页 / 共47页
查找启动子区PPT课件_第2页
第2页 / 共47页
查找启动子区PPT课件_第3页
第3页 / 共47页
资源描述:

《查找启动子区PPT课件》由会员分享,可在线阅读,更多相关《查找启动子区PPT课件(47页珍藏版)》请在装配图网上搜索。

1、如 何 判 断 序 列 的 正 反 向 NCBI里 的 序 列 , mRNA, CDS序 列 等 等 , 都 标 注 的 很 清 楚 ,只 是 有 的 基 因 序 列 给 的 是 反 向 互 补 的 序 列 , 需 要 大 家 在primer5等 软 件 里 转 换 一 下 。 具 体 看 是 不 是 反 向 互 补 的 序 列 , 方 法 就 是 看 在 第 一 个 CDS区 的 前 三 个 碱 基 是 不 是 ATG, 如 果 是 ATG, 那 么 这 个 序 列 就是 你 要 的 了 , 如 果 不 是 , 那 八 成 就 是 你 要 得 序 列 的 反 向 互补 序 列 了 。 目 的

2、 : 寻 找 promoter区 域 预 测 核 心 启 动 子 区 寻 找 promoter区 域1. 用 NCBI: 2. 用 UCSC:3. 用 Ensembl:4. 用 公 司 信 息 只 包 含 公 司 拥 有 promoter clones的 信 息 : / *种 类 比 较 少 5. 用 SIB-EPD: (可 直 接 提 供 TSS, 但 是 库 容 较 小 , 很 多 基因 查 不 到 )6. 预 测 核 心 启 动 子 区 NCBI数 据 库 寻 找 promoter区 域 NCBI / 选 择 Gene, 输 入 ankh,点 击 search 选 择 第 一 项 , 以

3、 人 类 Homo sapiens的 ANKH为 例 ; Chromosome 5 location 14704909-14871887, complement(反 义 链 )即 -14871887 到 -14704909为 基 因 范 围 此 例 中 选 取 -14873887 到 -14871887 约 2000bp核 苷 酸 序 列 作 为 启 动 子 区 域 选 择 Ensembl或 者 HGNC_, 进 入 ensembl分 析寻 找 promoter区 域 寻 找 promoter区 域 图形显示 FASTA格 式显 示 的 核 苷酸 序 列输 入 序 列 可 以查 询 染 色 体

4、 位 置ANKH gene在反 义 链 上 , 所以 用 负 数 表 示 可 以 查 询 具 体核 苷 酸 序 列 Genomic context 点 击 Graphics-Tools-Sequece Text View 寻 找 promoter区 域 点 击 Go To Position, 输 入 -14873887, 点 击 Prev Page找 到 具 体 位 置 复 制 白 底 黑 色 区 域 即 为 promoter区 域 。 白 底 黑 字为 启 动 子 区 域紫 底 黑 字为 基 因 区域粉 底 黑 字 为 编码 区 , ATG为启 示 密 码 子 寻 找 promoter区 域

5、 在 前 两 张 幻 灯 片 中 选 择 FASTA 在 右 边 Change region shown输 入 14871887到 14873887 Display options选 择 Show reverse complement 可 以 直 接 得 到 FASTA格 式 的 promoter核 苷 酸 序 列 似 乎 有 一 个 bp的 差 距 , 可以 输 入 14871887到 14873886 可 以 选 择 展 示 反 向 互 补 序 列 1. 选 择 基 因 示 意 图 :1 .向 下 查 看 “Genomic regions, transcripts and products

6、2 . 将 鼠 标 放 在 Genes的 NR_ 示 意 图 上 ,3 . 在 弹 出 的 窗 口 中 点 击2. 点 击 FASTA View, 序 列 范 围 表 示 NR_的 位 置 。出 现 该 基 因 的 实 际 序 列 , 第 一 个 序 列 的 位 置 表 示 “起 始 位 置 3. 调 整 显 示 位 置 : 将 起 始 位 点 先 前 排 1000bp, 向 后 排 1000bp。更 改 后 的 位 置 认 为 是 启 动 子 区 。 UCSC数 据 库 寻 找 promoter区 域 UCSC 选 择 左 侧 边 栏 的 “Table Browser 在 clade选 择

7、Mammal, genome选 择 Human, assmebly选 择 最 新 的 数 据 库 , 在 position后 面 的 搜 索 框 内 写 入 待 查 的 基 因 名 称 , 如 actin。 点 击 get output。方 法 一 寻 找 promoter区 域 出 现 一 系 列 候 选 序 列 。 当 搜 索 用 词 不 特 异 的 时 候 会 出 来 太 多 的 结 果 , 只 显 示 500条 。 寻 找 promoter区 域 点 击 自 己 目 的 基 因 的 结 果 链 接 , 会 出 现 该 基 因 在 染 色 体 上 的 位 置 (有 时 候 会 直 接 跳

8、 到选 择 genome, protein, mRNA那 一 页 面 , 可 能 是 在 搜 索 词 比 较 特 异 的 情 况 写 ), 继 续 getout put 选 择 genome 寻 找 promoter区 域 选 择 Promoter/Upstream by 2000 bases Exons in upper case, everything else in lower case: 外 显 子 大 写 , 其 他 小 写 寻 找 promoter区 域小 写 字 母 为 promoter区 域 大 写 字 母 为 基 因 区 域 , 与 NCBI结 果 相同ATG为 CDS区 起

9、 始 密 码 子 寻 找 promoter区 域 promoter/upstream前 面 的 框 中 打 勾 , 一 般 的 启 动 子 长 度 大 约 为 2kb左 右 , 这 个 数 字 可以 修 改 。 为 便 于 观 察 , 可 继 续 修 改 下 面 的 几 个 选 项 。 这 里 选 择 CDS大 写 。 点 击 get sequence即 可 得 到 结 果 。 寻 找 promoter区 域 UTR和 upstream是 分 开 的 , CDS是 大 写 的 , 可 以 看 到 起 始 码 。 Copy ATG以 前 的 序 列 进 行启 动 子 分 析 。 PCR以 gen

10、ome为 模 板 。 寻 找 promoter区 域 UCSC , 点 击 左 侧 边 栏 的 “Genome Browser方 法 二 寻 找 promoter区 域 以 大 鼠 rattus orvegicus 的 结 缔 组 织 生 长 因 子 CTGF 为 例 , 在 Organism的 下 拉 菜 单 中 选 择 Rat, 在 assembly的 下 拉 菜 单 中 选 择 最 新 日 期 , 在position框 中 键 入 CTGF, image width选 择 默 认 即 可 , 如 以 下 图 所 示 : 点 击 Submit 寻 找 promoter区 域 结 果 显 示

11、 该 基 因 的 序 列 和 相 关 mRNA序 列 , 点 击 “ Known Gene 中 的 第 一 个 序 列 , 寻 找 promoter区 域 出 现 包 含 这 序 列 的 图 解 概 要 为 了 获 得 这 个 区 域 更 清 晰 的 图 像 , 可 以 点 击 紧 靠 zoom out的 按 钮 , 如 以 下 图 : 对 于 Known Genes 基 因 和 预 测 的 基 因 路 径 来 说 , 一 般 的 惯 例 是 以 一 个 高 的 垂 直 线或 块 状 表 示 每 个 编 码 外 显 子 , 以 短 的 垂 直 线 或 块 状 表 示 5端 和 3端 非 翻 译

12、 区 。 起 连 接 作用 的 内 含 子 以 非 常 细 的 线 条 表 示 。 翻 译 的 方 向 由 沿 着 细 线 的 箭 头 指 示 。 寻 找 promoter区 域 本 例 的 搜 寻 目 的 来 说 , 默 认 设 置 不 是 理 想 的 设 置 。 按 照 视 图 利 用 页 面 底 部 的 Track Controls按 钮 , 将 一 些 路 径 设 置 为 hide模 式 即 不 显示 , 其 他 设 置 为 dense模 式 所 有 资 料 密 集 在 一 条 直 线 上 ; 另 一 些 路 径 设 置 为 full模 式 每 个 特 征 有 一 个 分 开 的 线

13、条 , 最 多 达 300 。 寻 找 promoter区 域 Ensembl基 因 通 过 许 多 方 法 来 预 测 , 包 括 与 mRNA和 蛋 白 质 进 行 同 源 性 比 较 。 假 设 查 询启 动 子 区 域 , 我 们 需 要 将 Ensembl Genes选 择 为 dense 或 full模 式 , 点 击 Refresh, 即 刷新 , 出 现 以 下 图 : 图 中 多 出 了 Ensembl Genes的 预 测 路 径 , 我 们 在 红 框 中 圈 出 。 点 击 用 于 表 达 该 序 列 的任 何 方 块 出 现 以 下 页 面 : 寻 找 promote

14、r区 域 点 击 红 框 中 的 条 形 深 色 方 块 不 是 Ensembl Genes文 字 , 寻 找 promoter区 域 选 择 并 点 击 Link to sequence中 的 Genomic Sequence, 即 显 示 基 因 组 序 列 寻 找 promoter区 域 将 promoter改 为 2000bp, 具 体 多 少 bp适 宜 , 可 根 据 文 献 资 料 和 实 验 目 的 获 取 , 有 的 基因 可 能 在 其 上 游 戏 几 百 bp就 可 以 了 ,其 他 的 几 个 选 项 分 别 为 5 端 非 编 码 区 , 编 码 区 外显 子 , 3

15、 端 非 编 码 区 , 内 含 子 内 含 子 用 绿 框 圈 了 起 来 等 。 Sequence Formatting Options序 列 显 示 方 式 , 选 择 上 图 红 框 里 的 内 容 , 即 外 显 子 大 写, 其 余 的 小 写 , 也 就 是 说 mRNA的 外 显 子 大 写 , 其 余 上 下 游 非 编 码 区 以 及 内 含 子 均 为小 写 。 寻 找 promoter区 域第 一 个 大 写 字 母 以 后 就 是 mRNA序 列 , 之前 的 小 写 字 母 序 列 即 为 启 动 子 区 域 了 。 第 一 个 大 写 字 母 以 后 就 是 mR

16、NA序 列 , 但该 序 列 包 含 外 显 子 和 内 含 子 , 是 未 经 剪 切 修饰 的 mRNA, 图 中 两 段 大 写 字 母 中 间 的 小 写字 母 便 为 内 含 了 序 列 。寻 找 promoter区 域 Ensemble数 据 库 寻 找 promoter区 域 Ensembl: 选 择 human 输 入 ankh 选 择 Gene, 点 击 GeneID ENSG00000154122 点 击 左 边 的 Export data 方 法 一 寻 找 promoter区 域 5 Flanking sequence 输 入 2000 Options for FAST

17、A sequence中 Genomic选 5 Flanking sequence, deselect all 点 击 Next 不 管 正 反 此 法 都 适 用 寻 找 promoter区 域 得 到 2000 bases 的 核 苷 酸 序 列 寻 找 promoter区 域 Ensembl: 在 “Search Ensembl“标 题 下 search后 的 下 拉 框 中 选 中 物 种 名 homo sapiens 人 , for框 中 输 入 基 因 名 ankh, 点 击 Go方 法 二 寻 找 promoter区 域 找 到 所 需 要 的 gene, 点 击 出 来 2个 结

18、 果 。 本 例 中 貌 似 是 同 一 个 。 点 击 相 应 链 接 进 入 新 页 面 。 寻 找 promoter区 域 貌 似 有 2个 不 同 的 转 录 本 。 点 击 Exon Info。 寻 找 promoter区 域 新 页 面 中 即 可 看 到 5 upstream sequence。 可 以 在 Flanking sequence at either end of transcript后 面 的 框 中 修 改 期 望 显 示 的 序 列 长 度 。 一 般 启 动 子 最好 选 2kb。 然 后 copy所 显 示 的 上 游 序 列 进 行 分 析 。 Genec

19、opoeia公 司 寻 找 promoter区 域 点 击 search product, 选 择 promoter clones, 因 为 没 有 ANKH的 信 息 ,此 处 输 入 FIBRONECTIN 选 择 目 的 基 因 寻 找 promoter区 域 点 击 click here to view the promoter sequence 得 到 promoter信 息 EPD数 据 库 寻 找 promoter区 域 SIB-EPD 具 体 使 用 方 法 大 同 小 异 , 就 是 输 入 物 种 名 、 基 因 名 , 限 定 启 动 子 序 列区 域 预 测 核 心 启

20、 动 子 区 Transcript start site (TSS) 附 近 -60bp到 +40bp是 核 心 启 动 子 区 , 是 精 确 转 录必 须 的 最 小 单 元 。CpG岛 是 一 段 200 bp 或 更 长 的 DNA 序 列 ,核 苷 酸 G+C 的 含 量 较 高 ,并 且 CpG双核 苷 酸 的 出 现 频 率 占 G+ C 含 量 的 50%以 上 。 许 多 脊 椎 动 物 的 启 动 子 区 都 与CpG岛 的 位 置 重 合 。 常 见 的 在 线 预 测 工 具 有 :真 核 启 动 子 数 据 库 第 85版 The Eukaryotic Promote

21、r Database Current Release 85 , EPD, 转 录 起 始 位 点 数 据 库 : 该 数 据 库 主 要 包 括 人 , 小 鼠 等 常 见 生 物 的 基 因 转 录 起 始 位 点及 该 基 因 启 动 子 的 可 能 情 况 。Promoter scan ( ), Promoter2.0 Prediction Server ( ) 神 经 网 络 启 动 子 预 测 器 NNPP Soft Berry ( )Dragon Promoter Finder ( ) 好 似 不 能 用 了 ? FirstEF ( ) UROGENE ( ), 可 用 于 位 点

22、 甲 基 化 的 预 测CpGPlot/CpGReport/Isochore ()CpGProD ()CpG Island Searcher (; )CpG Prediction ()/ CpG岛 预 测 软 件 1、 获 取 目 的 基 因 的 mRNA序 列 , 并 且 在 NCBI的 数 据 库 中 查 获 转 录 起 始 点 ;2、 截 取 转 录 起 始 点 为 中 心 , 上 下 约 各 1000bp, 假 设 在 此 范 围 内 出 现 CDS, 可 到 翻 译起 始 点 终 止 ;3、 利 用 在 线 软 件 进 行 分 析 ;PromoterInspectorPromoter

23、ScanPromoter 2.0NNPPEMBOSS CpgplotCpG Islands Prediction本 人 是 采 取 多 种 软 件 结 合 的 方 法 , 由 于 proscan和 的 假 阳 性 率 较 高 , 仅 作 为 参 考 , 而promoter inspector的 特 异 性 较 高 , 结 果 比 较 可 信 。 同 时 , 利 用 CpG岛 预 测 , 作 为 辅助 参 考4、 最 后 , 可 以 找 到 小 鼠 的 同 源 区 , 进 行 同 源 性 比 较 , 启 动 子 区 域 一 定 是 高 保 守 区 !5、 到 此 , 可 以 初 步 预 测 启 动 子 区 域 的 范 围 了 。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!