生物信息学数据库资源
《生物信息学数据库资源》由会员分享,可在线阅读,更多相关《生物信息学数据库资源(102页珍藏版)》请在装配图网上搜索。
1、 提 纲 : n 模 式 生 物 测 序n 3大 核 酸 数 据 库n 蛋 白 质 数 据 库 提 纲 : n 模 式 生 物 测 序n 3大 核 酸 数 据 库n 蛋 白 质 数 据 库 human Arabidopsis Thermotoga maritimaEscherichia coliBuchnerasp. APS Rickettsia prowazekiiUreaplasma urealyticum Bacillus subtilis Drosophila melanogasterThermoplasma acidophilumPlasmodium falciparum Helic
2、obacter pylori mouse Caenorhabitis elegans rat Borrelia burgorferiBorrelia burgorferi Aquifex aeolicus Neisseria meningitidis Z2491 Mycobacterium tuberculosis 模 式 生 物 基 因 组 计 划 酵 母 、 线 虫 、 果 蝇 、 细 菌 、 拟 南 芥 等 共 约已 完 成 , 正 在 进 行 。 目 前 总 量 已 达 碱 基 对 ! virusesplasmids bacteriafungi plantsalgaeinsectsmo
3、llusksreptilesbirdsmammalsGenome sizes in nucleotide pairs (base-pairs) 104 108105 106 107 10111010109bony fishamphibians 不 具 有 细 胞 形 态 结 构 , 仅 由 核 酸 和 蛋 白 质 构 成 ; 如 : 人 艾 滋 病 毒 HIV、 SARS冠 状 病 毒 体 积 小 , 10 300nm; 严 格 的 专 性 细 胞 内 寄 生 ; 对 抗 生 素 不 敏 感 。 电 子 显 微 镜 下 的 SARS冠 状 病 毒100nm Escherichia coli大
4、肠 杆 菌大 肠 杆 菌 是 研 究 得 最 为 详 尽 的 一 个 模 式 生 物 。 这 种只 有 1.6微 米 长 的 、 可 以 迅 速 繁 殖 的 单 细 胞 原 核 生 物 ,已 经 成 为 实 验 室 和 基 因 工 程 的 重 要 工 具 。Escherichia coli O157:H7Escherichia coli K12 Saccharomyces cerevisiae酿 酒 酵 母真 菌 界 的 单 细 胞 真 核 生 物 , 它 的 全 基 因 组已 在 1996年 测 定 。 秀 丽 线 虫 Caenorhabditis elegans一 种 透 明 的 、 生
5、活 在 海 滩 泥 沙 中 的 小 虫 。 细 胞 数 目 一 定 : 成 虫 细 胞 数 目 只 有 959个 , 其 中 包 括 302个 神 经 元 ; 有 6条 染 色 体 , 全 基 因 组 于 1998年 测 定 , 长 9.7Mb Drosophila melanogaster果 蝇繁 殖 很 快 、 容 易 诱 发 变 异 的 小 昆 虫 。总 长 达 1.8亿 核 苷 酸 。 Arabidopsis thaliana拟 南 芥个 体 生 活 周 期 只 有 6周 的 十 字 花 科小 草 , 是 一 种 理 想 的 模 式 植 物 。 Oryza sativa水 稻单 子 叶
6、 植 物 模 式 植 物 , 390-430MB 1个 受 精 卵 在 24小 时 内 分 裂 到 各 种 器 官 初 具 雏 形 的 程 度 ; 身 体 透 明 的 小 鱼 , 生 活 周 期 约 3个 月 , 是 研 究 脊 椎 动 物 发 育过 程 的 良 好 对 象 。 基 因 组 大 小 与 人 类 相 近 , 约 30亿 个 核 苷 酸 对 ; 提 纲 : n 模 式 生 物 测 序n 3大 核 酸 数 据 库n 蛋 白 质 数 据 库 主 要 的 数 据 库 资 源 核 酸 序 列 数 据 库 主 要 有 GenBank, EMBL, DDBJ等 . 蛋 白 质 序 列 数 据
7、库 主 要 有 SWISS-PROT, PIR, TrEMBL等 , 蛋 白 结 构 数 据 库 有 PDB, MMDB等 , 与 基 因 组 有 关 的 数 据 库 还 有 dbEST, OMIM等 , 3大 核 酸 数 据 库 基 因 组 数 据 库 的 相 关 背 景 主 要 的 基 因 组 数 据 库 资 源 重 点 介 绍 GenBank ATTGACTAPrimary vs. Derivative DatabasesACGTGCTTGACA CGTGAATTGACTA TATAGCCGACGTGCACGTGCACGTGCTTGACA TTGACATTGACACGTGA CGTGAC
8、GTGA ATTGACTAATTGACTA ATTGACTATTGACTA TATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankA AGCCG T TAGCCGTATAG C TATAGCCG ATGA CATT GAGA ATTATT CC GAGA ATTCCGAGA ATTATT CC GAGA ATTCCSequencingCenters GAGA ATTCC GAGA ATTCC UniGeneRefSeqGenomeAssemblyLabs CuratorsAlgorithms TATAGCCGAGCTCCGATACCGATGACAA DNA序 列 数 据
9、 库 最 早 于 1982年 在 欧 洲 分 子 生 物 学 实验 室 诞 生 , 随 即 就 开 始 了 一 个 数 据 库 爆 炸 的 时 代 。 此 后 不 久 因 一 项 美 国 国 家 健 康 研 究 中 心 与 洛 斯 阿拉 莫 斯 国 家 实 验 室 的 合 同 而 诞 生 了 GenBank。 日 本 的 DNA数 据 库 ( DDBJ) , 在 几 年 后 加 入 了 数 据收 集 的 合 作 。基 因 组 数 据 库 的 发 展 历 史 基 因 组 数 据 库 的 发 展 历 史 1988年 一 次 三 方 会 议 之 后 ( 现 在 称 之 为 “ 国 际 DNA序 列
10、数 据 库 合 作 计 划 ” ) 达 成 协 议 , 对 数 据 库 的记 录 采 用 共 同 的 格 式 现 在 三 个 中 心 都 收 集 直 接 提 交 的 数 据 , 并 在 三 者之 间 发 布 。 三 大 基 因 数 据 库 GenbankGenbank库 包 含 了 所 有 已 知 的 核 酸 序 列 和 蛋 白 质 序 列 , 以 及 与它 们 相 关 的 文 献 著 作 和 生 物 学 注 释 。 它 是 由 美 国 国 立 生 物 技 术信 息 中 心 (The National Center for Biotechnology Information, NCBI)建 立
11、 和 维 护 的 。NCBI的 网 址 是 : http:/www.ncbi.nlm.nih.gov。 EMBL(The European Molecular Biology Laboratory )核 酸 序列 数 据 库由 欧 洲 生 物 信 息 学 研 究 所 (EBI)维 护 的 核 酸 序 列 数 据 构 成 , 查 询检 索 可 以 通 过 通 过 因 特 网 上 的 序 列 提 取 系 统 (SRS)服 务 完 成 。数 据 库 网 址 是 : http:/www.ebi.ac.uk/embl/。 DDBJ(DNA Data Bank of Japan)数 据 库日 本 DNA数
12、 据 仓 库 (DDBJ)也 是 一 个 全 面 的 核 酸 序 列 数 据 库 , 与Genbank和 EMBL核 酸 库 合 作 交 换 数 据 。 使 用 其 主 页 上 提 供 的 SRS工 具 进 行 数 据 检 索 和 序 列 分 析 。DDBJ的 网 址 是 : http:/www.ddbj.nig.ac.jp/。 GenBank PublicfreeAvailableviaInternetEMBL Data Library DDBJ (DNA Data Bank of Japan)三 大 基 因 数 据 库 之 间 的 关 系 http:/www.ncbi.nlm.nih.go
13、v/http:/www.ddbj.nig.ac.jp/searches-e.htmlhttp:/www.ebi.ac.uk/embl/ 美 国 的 核 酸 数 据 库 GenBank Banson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7 从1979年 开 始 建 设 , 1982年 正 式 运 行 。 欧 洲 分 子 生 物 学 实 验 室 的 EMBL数 据库 也 于 1982年 开 始 服 务 。 日 本 于 1984年 开 始 建 立 国 家 级 的 核 酸数 据 库 DDBJ, 并 于 1987年 正 式 服 务 。 提 纲 : n
14、模 式 生 物 测 序n 3大 核 酸 数 据 库n 蛋 白 质 数 据 库 主 要 的 数 据 库 资 源 核 酸 序 列 数 据 库 主 要 有 GenBank, EMBL, DDBJ等 . 蛋 白 质 序 列 数 据 库 主 要 有 SWISS-PROT, PIR, TrEMBL等 , 蛋 白 结 构 数 据 库 有 PDB, MMDB等 , 与 基 因 组 有 关 的 数 据 库 还 有 dbEST, OMIM等 , 1. 由 美 国 NCBI翻 译 自 GenBank的 DNA序 列 (1984年 ); 2. 在 EMBL和 GenBank数 据 库 上 均 建 立 了 镜 像 站
15、点 ; 3. 数 据 依 据 注 释 的 质 量 分 为 4类 。 网 址 : 分 类 名 称(Name) 说 明(Comment) 记 录 数(Number of entries)PIR1 已 分 类 、 已 注 释(Classified and annotated) 13572PIR2 已 注 释 (Annotated) 69368PIR3 未 核 实 (Unverified) 7508 PIR4 未 翻 译 (Unencoded or untranslated) 196 除 了 PIR外 , 另 一 个 重 要 的 蛋 白 质 序 列 数 据 库 则 是SwissProt。 该 数 据
16、库 由 瑞 士 日 内 瓦 大 学 于 1986年 创 建 , 目 前 由瑞 士 生 物 信 息 学 研 究 所 和 欧 洲 生 物 信 息 学 研 究 所 EBI共同 维 护 和 管 理 。 PIR和 SwissProt是 创 建 最 早 、 使 用 最 为 广 泛 的 两个 蛋 白 质 数 据 库 。 蛋 白 质 序 列 数 据 库 TrEMBL是 从 EMBL中 的 cDNA序 列 翻译 得 到 的 。 该 数 据 库 采 用 SwissProt数 据 库 格 式 , 包 含EMBL数 据 库 中 所 有 编 码 序 列 的 翻 译 。TrEMBL: http:/www.uniprot.
17、org/news/2004/03/02/full 主 要 的 数 据 库 资 源 核 酸 序 列 数 据 库 主 要 有 GenBank, EMBL, DDBJ等 . 蛋 白 质 序 列 数 据 库 主 要 有 SWISS-PROT, PIR, TrEMBL等 , 蛋 白 结 构 数 据 库 有 PDB, MMDB等 , 与 基 因 组 有 关 的 数 据 库 还 有 dbEST, OMIM等 , 1. 目 前 最 主 要 的 蛋 白 质 分 子 结 构 数 据 库 ; 2. 1970年 代 建 立 , 美 国 Brookhaven国 家 实 验 室 维 护 管理 ; 3. 1988年 , 由
18、 美 国 RCSB(research collaboratory for structural biology)管 理 ; 4. 以 文 本 格 式 存 放 数 据 , 包 括 原 子 坐 标 、 物 种 来 源 、测 定 方 法 、 提 交 者 信 息 、 一 级 结 构 、 二 级 结 构 等 ; PDB的 网 址 : http:/www.rcsb.org/pdb(美 国 ) 如 何 Access PDB记 录 ? 如 何 Access PDB记 录 ? 如 何 Access PDB记 录 ? 如 何 Access PDB记 录 ?DownloadPDB file ViewPDB file
19、 Structure viewoptions 如 何 Access PDB记 录 ? 如 何 Access PDB记 录 ? Questions:下 列 数 据 库 分 别 是 什 么 类 型 的 数 据 库 ? GenBank, PIR, DDBJ, SWISS-PROT, PDB, EMBL, TrEMBL, PubMed的 特 点 收 录 的 文 献 多 !大 部 分 与 生 命 科 学 相 关 自 动 词 语 匹 配 链 接 点 多 , 部 分 在 网 上 免 费 获 得 全 文 也 可 以 直 接 定 购 原 文 二 、 检 索 规 则 二 、 检 索 规 则 复 杂 检 索 限 制
20、 字 段 类 别 常 用 的 有 : Author: Bao YMau Title: stressti Tilte/Abstract: stresstitle/abstract Date: 1999:2009dp 复 杂 检 索 布 尔 逻 辑 运 算 :AND、 OR、 NOT必 须 大 写 。逻 辑 符 的 运 算 次 序 是 从 左 至 右 , 括 号 内 的 检 索 式 可 作 为 一 个单 元 , 优 先 运 行 。布 尔 逻 辑 检 索 允 许 在 检 索 词 后 面 附 加 字 段 标 识例 如 : riceti AND Bao YMau AND 2008:2009dp Ques
21、tion1:如 何 查 找 由 Zhu J实 验 室 于 2005以 后 发 表 的 , 题 目 中 显 示 关 于水 稻 的 文 献 ? Question 2:如 : 我 要 查 找 BaoYM在 Nature或 Science上 发 表 的 论 文1 Bao YMau AND (NatureJournal OR ScienceJournal) 2 Bao YMau AND Nature OR ScienceJournal 3 Bao YMau AND NatureJournal OR ScienceJournal4 Bao YMau AND (Nature OR Science)Journ
22、al哪 一 个 检 索 语 言 是 正 确 的 ? 在 PubMed页 面 上 选 择 Advanced Search: 在 PubMed页 面 上 选 择 Advanced Search: 在 PubMed页 面 上 选 择 Limits: 在 PubMed页 面 上 选 择 Limits: 如 何 获 取 GenBank中 的 序 列 ? 同 样 存 在 限 制 字 段 :常 用 的 有 : Author: Xing JYau title: BMAL1ti organism: pigorganism或 者 直 接 输 入 : Accession: HQ657211Accession Gen
23、e Name: BMAL1Gene Name Protein Name: BMAL1 Protein Name如 : Xing JYau AND BMAL1ti AND pigorganism如 果 没 有 限 定 , 就 是 任 意 字 段 。如 何 获 取 GenBank中 的 序 列 ? Question:查 找 Xing JY发 布 的 DNA序 列 . 查 找 蛋 白 质 序 列 : 查 找 EST序 列 : 查 找 Structure: 查 找 Structure: 查 找 Unigene UniGene is an experimental system for automati
24、cally partitioning GenBank sequences into a non-redundant set of gene-oriented clusters. Each UniGene cluster contains sequences that represent a unique gene, as well as related information such as the tissue types in which the gene has been expressed and map location. UniGene 是 非 冗 余 的 某 个 基 因 的 集 合 ,包 含 了 该 基 因 所 有 的经 过 实 验 证 明 的 转 录 本 及 其 表 达 信 息 . Questions: 什 么 是 UniGene?2. 根 据 目 前 的 内 容 ,GenBank的 作 用 ?
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。