使用eUtils建立定制的数据流程

上传人:s****a 文档编号:185165267 上传时间:2023-02-03 格式:DOCX 页数:3 大小:12.18KB
收藏 版权申诉 举报 下载
使用eUtils建立定制的数据流程_第1页
第1页 / 共3页
使用eUtils建立定制的数据流程_第2页
第2页 / 共3页
使用eUtils建立定制的数据流程_第3页
第3页 / 共3页
资源描述:

《使用eUtils建立定制的数据流程》由会员分享,可在线阅读,更多相关《使用eUtils建立定制的数据流程(3页珍藏版)》请在装配图网上搜索。

1、使用eUtils建立定制的数据流程已有433次阅读2012-5-25 17:32 |个人分类:程序设计|系统分类:科研笔记|关键词:数据库系统style程 序今天偶尔发现NCBI上的这个东东,觉得非常有用,共享一下。eUtils(Entrez Programming Utilities)是七个服务器端的程序,用来提供NCBI上查询和数据 库系统的一个稳定的结构。eUtils使用URL后缀的语法用来设置查询的参数。支持Entrez 的23个数据库,包括核酸和蛋白序列、基因信息、分子3。信息和文献。一个URL被发送 至eUtils,返回一个XML响应。Entrez数据库中的每个记录都是用一个UID

2、表示的,如 核酸和蛋白数据库用GI号,PubMed用PMID,3D结构使用MMDB号 三个主要的搜索引 擎:EGQuery,ESearch,ESummary Entrez搜索引擎主要完成两件事:1将输入的字串 转换为UID,2按照UID输出summary。EGQuery和ESearch类似,但是能够搜索全部 的Entrez数据库EInfo, EFetch和ELink EInfo可以得到数据库的详细信息,包括支持的索 引域和与其他Entrez数据库的连接EFetch能够依据UID定制输出的格式ELink能够得到 UID连接到其他数据库的链接EPost Entrez系统的特点之一是能够将用户查询的

3、UID暂时 存储起来,构建查询URL的注意事项 除了 WebEnv参数以外所有参数的字母都应该小写, 空值和不合法的值都会被忽略,如果查询字串中有空格,用+代替错误的: &id=352, 25125, 234, .正确的: &id=352,25125,234,.错误的: &term=biomol mrnaproperties AND mouseorganism 正确的: &term=biomol+mrnaproperties+AND+mouseorganism如果有其他字符的,需要转化为URL编码字符,比如#用23来代替NCBI建议在查询字 串后加上&tool和&email来定制自己的查询,&

4、tool是一个特有的字符串eUtils中的7个工 具EInfo:指定数据库的条目数、可以用来查询的域、上次更新时间等EGQuery:查询字 串在所有数据库中的查询结果ESearch:得到查询字串搜索到的UID列表,并包含有对 查询字串的拆分ESummary:基于UID得到相应的简介EPost:上传UID列表缓存在服务 器上,可以通过EPost直接使用此缓存的UID列表EFetch:依据UID返回数据记录ELink: 与其他数据库的链接如果要大量上传UID时,建议分成多份上传下载结果时,建议使用 retstart(开始下载题目记录)和retmax(下载的条目数)参数 使用ELink elink.

5、fcgi?dbfrom=nucleotide&db=protein&id=41282244,41282247,40789264 elink.fcgi?dbfrom=nucleotide&db=protein&id=41282244&id=41282247&id=40 789264elink.fcgi?dbfrom=nucleotide&db=protein&Webenv=Webenv&query_key=key 第一个和第三个返回相同的结果,转换后的蛋白GI号在集中在一起,而第二个可以给出那 个核酸的GI号转换为蛋白的GI号ELink返回的其他数据库的UID不能缓存在服务器上 ESearch-

6、ESummary/EFetch第一步:查询返回UID列表,并且缓存至服务器上 esearch.fcgi?db=database&term=query&usehistory=y 第二步:从返回的 XML 文件中解析 出Webenv和key的值 第三步:用ESummary或者EFetch得到相应的UID的记录 esummary.fcgi?db=database&WebEnv=Webenv&query_key=keyefetch.fcgi?db=database&WebEnv=Webenv&query_key=key EPost-ESummary/EFetch 第一步:将id列表存储在历史服务器上e

7、post.fcgi?db=database&id=id_list第二部:从返 回的XML文件中解析出Webenv和key的值 第三部:用ESummary或者EFetch得到相 应的 UID 的记录 esummary.fcgi?db=database&WebEnv=Webenv&query_key=key efetch.fcgi?db=database&WebEnv=Webenv&query_key=key einfo 返回了所支持的数据 库 http:/eutils.ncbi.nlm.nih.gov/entrez/eutils/einfo.fcgi? pubmed proteinnucleot

8、ide nuccore nucgss nucest structure genomebiosystems books cancerchromosomescdd ga p dbvardomains gene genomeprjgensat geo gdshomologene journals meshncbisearch nlmcatalog omiaomim pepdome pmcpopset probe proteinclusterspcassay pccompound pcsubstanceseqannot snp srataxonomy toolkit toolkitallunigene

9、 uni sts 部分数据库的 UIDEntrez DatabasePrimary IDE-Utility Database Name3D Domains3D SDIdomainsDomainsPSSM-IDcddGenomeGenome IDgenomeNucleotideGI numbernucleotideOMIMMIM numberomimPopSetPopset IDpopsetProteinGI numberproteinProbeSetGEO IDgeoPubMedPMIDpubmedStructureMMDB IDstructureSNPSNP IDsnpTaxonomyTAX

10、IDtaxonomyUniGeneUniGene IDunigeneUniSTSUniSTS IDunistsEInfo url: http:/eutils.ncbi.nlm.nih.gov/entrez/eutils/einfo.fcgi?参数:db=database 参数: 数据库名称,默认pubmed db=database name是否需要保存为历史usehistory=y查询字 串term=search stratery查询的域field=迄今为止的天数reldate=时间区间mindata= maxdate=约束时间的域datetype=edat显示的条目数retstart=第一个记录retmax=最 大取回的记录个数返回数据的格式retmode=xml返回的类型rettype=排序sort在 ELink中的参数dbfrom原始数据库ncbi提供的linkname http:/eutils.ncbi.nlm.nih.gov/corehtml/query/static/entrezlinks.html

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!