Python下实现Fisher富集分析方法

上传人:d**** 文档编号:101410308 上传时间:2022-06-05 格式:DOCX 页数:2 大小:17.35KB
收藏 版权申诉 举报 下载
Python下实现Fisher富集分析方法_第1页
第1页 / 共2页
Python下实现Fisher富集分析方法_第2页
第2页 / 共2页
资源描述:

《Python下实现Fisher富集分析方法》由会员分享,可在线阅读,更多相关《Python下实现Fisher富集分析方法(2页珍藏版)》请在装配图网上搜索。

1、Python下实现Fisher富集分析方法Fishers精确概率方法利用超几何分布的原理推断每个基因集中的目标基因(ADR基因)的比例是否与整个基因组中目标基因(ADR基因)的比例相同。包括2个原假设:基因是否目标基因(ADR基因);基因是否属于的功能基因集(如GOTerm),如表:ADR基因非ADR基因合计功能基因集n11n12M非功能基因集n21n22合计注示:N表示全基因组中基因总数;M表示功能基因集中的基因个数,K表示ADR基因数目.。Fishers得分表示k个ADR基因中至少有x个被功能基因集注释的概率:x.1p=1-xi=0例如我们要研究药物相关基因和功能term之间的相关性,可以

2、利用下面两种情况Drug显者基因非drug显者基因合计功能基因集niini2M非功能基因集“21“22NM合计KNKN(全基因组个数)miRNA靶基因非miRNA靶基因合计功能基因集niini2M非功能基因集n21n22NM合计KNKN(所有miRNA靶基因个数)在Python语言中,Fisher精确检验主要依赖于scipy.stats包以及numpy包,安装和调用命令如下:FileEditFormatRunOptionsWindowsHelprromfutureimportdivision=tscipy.statsipj广匚二fisherexact,hypergeom,binom_r.o?2

3、:tnrnrtpy己三np-ronrandom:rportshuffleL?.-.pz?i-roperator7.irp;?-trandoin假设我们有一个待查基因集,命名为interest,我们想知道这个基因集和通路path之间的相关性,即这个interest基因集是否可以显著富集到通路path中,通路path中包含基因个数为num_sp,另外还有一个背景基因集,即全部的基因个数,命名为num_allgene。接下来就是如何计算四格表,pathnonpathinterestabnum_interestgenenoninterestcnum_allgene-numnterestgenenum_

4、spnum_allgene-num_sp这里a为待查基因集和通路基因集的交集,b为不在通路path的待查基因个数,c为不属于interest待查基因的通路基因个数。计算过程如下spinallpdth:num_sp=len(sp)-1|a=len(set(sp)&set(genelist)b=num_interestgene-ac=nuin_sp-apvalue=fisherexact(Ila,Idyc,d1a,b,c,d分别为四个表的四个得分值,红圈内的函数即为利用四格表计算的显著性得分。函数fisher_exact()返回的是一个列表,列表第二个值就是我们要的P值了最后我们以P小于0.05作

5、为显著性阈值,通过下面命令进行筛选ifpvalue0.05:print(spO+t+pvalue)以上过程是对于一个通路path而言的,如果对于所有的KEGG通路,或者是GOterm,通过一个迭代循环,就可以实现批处理的富集分析。最后一步就是FDR校正,由于经过对所有KEGG通路或GOterm进行富集分析,fisher精确检验会输出一列P值,往往存在假阳性,因此需要经过FDR校正。这里采用的FDR校正方法为BH校正法。命令如下口we(匚vJ:|pv=;returnmion(pv)args,pv=zip(*sort皀df亡num皀r且七上(pv)operator*itemgetter(1)ifpv01:Yn丄usErroj:(1,p-va丄u匕sTustbebetween0andI1)qvalues-m*D:aiincceff-pv-llvaluesfarjs111=mincoeftijxrsnge(m-2-1-1)icoe-m*pvj/float(j+1)二costmircoeff:mince已EE-贮口eEfqy吐1口esargs()=mincoeffreturnvalues

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!