10X单细胞10X空间转录组之深刻理解方差分析ANOVA

上传人:仙*** 文档编号:106661833 上传时间:2022-06-13 格式:DOC 页数:11 大小:360.50KB
收藏 版权申诉 举报 下载
10X单细胞10X空间转录组之深刻理解方差分析ANOVA_第1页
第1页 / 共11页
10X单细胞10X空间转录组之深刻理解方差分析ANOVA_第2页
第2页 / 共11页
10X单细胞10X空间转录组之深刻理解方差分析ANOVA_第3页
第3页 / 共11页
资源描述:

《10X单细胞10X空间转录组之深刻理解方差分析ANOVA》由会员分享,可在线阅读,更多相关《10X单细胞10X空间转录组之深刻理解方差分析ANOVA(11页珍藏版)》请在装配图网上搜索。

1、10X单细胞(10X空间转录组)之深刻理解方差分析(ANOVA)相信不少同学在做检验的时候,甚至看文献的时候,多次遇到了ANOVA分析,无论是分析基因表达量差异,还是细胞类型在空间上的分布变化,都会用到它,之前也零星的说过一些,但今天我们来详细解释一下这个分析。方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。(源于百度百科)方差分析:单因素方差分析

2、从分析步骤角度再次介绍单因素方差分析:对多个总体均值进行检验,需要用到方差分析方法(ANalysisOfVAriance,简称ANOVA)。例如,某工厂有A、B、C三台轧制板材的设备,如果想知道这三台设备轧制板材的厚度是否一致,就可以转化为检验来自三个总体的均值是否相同的问题。以上面所说轧制板材为例,检验AB、C三台设备轧制的板材厚度是否一致,可以建立如下假设:H0:u1=u2=ur;H1:u1,u2,,ur不全相等。三个总体均值是否相等无从知道,但是可以通过样本均值是否有显著差异来检验总体均值是否相等。因为,如果H0为真时,则可以期望样本均值很接近,如果样本均值很接近,则推断总体均值相等的证

3、据很充分,就可以接受H0。否则,当样本均值相距较远,就认为总体均值相等的证据不充分,从而拒绝H0,接受H1。样本均值之间距离的所谓远近是相对的,是通过假定的共同方差的两个点估计值比较得出的。第一个点估计是组内方差,用各个样本方差估计得到的,只与每个样本内部的方差有关,反映各个水平内部随机性的变动。第二个点估计值是组间方差,在H0为真的前提下,由均值抽样平均误差计算得到,这样得到的方差包含两部分的变动:一是各个水平内部的随机性变动,二是各个水平之间的变动。将组间方差与组内方差相比,可以得到一个F统计量(F=组间方差/组内方差),可以证明该统计量服从F分布。由推断可知,如果三台设备轧制板材的厚度均

4、值相差很小,即组间方差中的各个水平之间的变动很小,F比值会接近于1。反之,则F的比值会显著地大于1,根据上面计算得到的F值,在显著性水平a给定的情况下,就可以做出是否接受三台设备轧制板材厚度均值相等的假设。单因素方差分析步骤现在假定一个因素B具有c个水平的因变量进行方差分析检验,例如上面提到的工厂轧制设备是因素,分别试验轧制了10块板材是水平。1、建立假设HO:u1=u2=uc;H1:u1,u2,,uc不全相等。2、计算样本均值和样本方差君为第j八水平的栏本旳值叩谬j个水平的第,各热值丐为第.各水平的释本爭董S2_MJ切西)c:卑生iZ-H阴拌*甘李v2-95df5b105f3e9bc1fa3

5、d0b9f15b048fa_1440w.jpg3、计算组间方差组间方差记为MSE,轰示是B因素的戈方c-1阿-幻称为水平项平方和,记为SSE;c-l是asm的自由度;三_;=丄匸1切Av2-46a0a7c7122cc93ec544c38ad6314d4b_1440w.jpg4、组内方差的估计:组內方筆记为MSE,其计買公式为:nT-c复龟一即称为误差项12方和记为SSE圮y_-产昱空F皆兰口冷:v2-115b8694fcec0bb66c35ad1ab03eab1e_1440w.jpg5、构造F统计量进行检验卩=组间方差/组内方差=MSB/MSEF(c-1,nT-1)临界值的大小I如果c个总体均

6、值不相等,则组间方差(MSB)会大于组内方差(MSE)。当F值大到某一临界值时,就可以拒绝H0。和自由度决定。所以,当给定显著性水平为a时,F的拒绝域为FFa(c-1,nT-c)。6、方差分析表方差分析蔻方差来源离哇平方和自白度席古方加SSBC-1KISBMSBISE鉅内SSEnrlMSE总方潼S&Iny-Cv2-703fa9e6ea02b8ca4b84ef745894f8d1_1440w.jpg范例分析例题:有8位食品专家对三种配方的食品随机品尝,然后给食品的口感分别打分(满分10分),如下表。问三种配方的平均分数是否相同?(a=0.05)(假定打分服从标准相等的正态分布)。令鮎杀对妄三的打

7、分兮監夷号療23-5tTs配方8-567j配肓252753-55761ii5图片.png解:设pA,pB,pC分别代表配方1、2、3。已知因变量是分数,因素是配方,水平为3,具有相同的样本容量8。根据题意建立假设:H0:uA=uB=uC;H1:总体均值不全相等。首先,计算样本均值及方差兀=6J25,X2=5=5.255=1.4s8r=1.E52,S3=i.309v2-3d8a3791501a34196d3ef721f36705c4_1440w.jpg其次,计算组间方差MSBr一-MSB=2.792v2-f8b77379f475b709741fe771003a63d3_1440w.jpg第四,计

8、算F统计量打卽图片.png最后,查表Fa(c-1,nT-c)=F0.05(2,21)=3.47。因为F=1.1193.47=F0.05(2,21),落在接受域。所以接受HO,拒绝H1,即三种配方的口感分数没有显著的差异。方差分析:有交互作用的两因素方差分析在多样本的参数估计与假设检验基础和方差分析:单因素方差分析中以单因素方差分析为例,介绍了对于多个总体(大于等于3)均值假设检验的原理和假设检验过程,文章中多个总体是以单因素为标准划分的,不同总体有n个水平,以下表为例:如果多个总体由两个因素影响,需要用到两因素方差分析,就是在方差分析中需要考虑两个因素对因变量结果的影响,两因素方差分析有两种类

9、型:1、有交互作用的方差分析:两个因素对因变量都有影响,同时还有两因素同时存在时,共同对因变量产生的影响。2、无交互作用的方差分析:两个因素对因变量的影响是独立的,不存在对因变量的共同影响。它们的取样要求也是不一样的:有交互作用方差分折在每个交咒点的囲巫v2-da350daab834b5ec638b8e7aa48756a3_1440w.jpg无交互作用方妾分折,在囲交量在每个交叉点天需聪一进行无交互作用的方差分析,一般是在完成有交互作用方差分析之后,当检验结果证明交互作用不显著时,就可以不考虑这个影响,重新进行无交互作用的方差分析。或者是在观察(试验)之前,有意识地控制某一因素,主要研究另一因

10、素对因变量的影响,这样的观察(试验)的结果也适合做无交互作用方差分析。有交互作用方差分析步骤1、建立建设对于A因素(行因素)H0:u1=u2=ur;H1:u1,从2,,ur不全相等。对于B因素(列因素)*HO:u1=u2=uc;H1:u1,u2,,uc不全相等。对于AB交互因素HO:不存在交互作用影响;H1:存在交互作用影响。2、各均值的计算公式Sk=1kr*cn.j=lQ=lXLkv2-853787077ad9d438d541140b008ef430_1440w.jpg3、计算各项离差平方和v2-217e8edaff817464837e0047eef27e26_1440w.jpg4、计算均方

11、MSA=SSA/(r-1)MSB=SSB/(c-1)MSAB=SSAB/(c-1)(r-1)MSE=SSE/rc(n-1)5、构造检验的F统计量对于A因素,FA=MSA/MSEFar-1,rc(n-1)对于B因素,FB=MSB/MSEFac-1,rc(n-1)对于AB交互因素,FAB=MSAB/MSEFa(c-1)(r-1),rc(n-1);如果FFa时,则可拒绝各自的H0,接受H1;接受各自的H0,拒绝H1。上述计算结果可以通过方差分析表:鶴是平方和(閔)自半度苣均衣疵F宣SSAr-1MSA=SSA.T-lFg望VMEESSBC-1MSB=SSB/c-lfe=msb.mse交互咋甲SSAB(

12、c-lXr-1XdSAB=SSAB(c-l;(r-lFaf=X侣ABNEESSErc(n-l)MSE=SSEXn-D翻Tv2-b00278dc9dde84487cefc0a41a845b5f_1440w.jpg范例分析如果人事部门想同时研究奖励制度和领导的类型两个因素对员工生产力的影响,则需要调查更多的数据。下表给出了每个水平交叉单元都包含三个数据的调查资料。试检验各因素对员工生产力的影响是否一致?(a=0.05)1r2318:&:9223,5434-.63斗成4裁丄v2-8c841fbd07b2e3ee2c043af9241d44a8_1440w.jpg解:1、建立假设关于奖励制度假设H0:

13、Q=u2=u3;H1:u1,u2,u3不全相等。关于领导类型假设H0:Q=u2=u3;H1:u1,u2,u3不全相等。关于交互作用假设H0:不存在交互作用的影响;H1:存在交互作用的影响。2、各均值的计算1T23143:33:?:9290723,54,4-63斗贞443,5也4v2-8c841fbd07b2e3ee2c043af9241d44a8_1440w.jpg根据题目数据,求出各均值,列于下表:123疔均值13.S573.33J3.颁5222v2-fcf946d3fd517d6cded1d8706ff37b7d_1440w.jpg3、计算各项离差平方和牌=疔=1吐1&;孙-习二(5-E)

14、+(3-5)=126SSA=-刃=3沁i522-5:-十喙尊-5):=6221SSB-rn|-=3t3*(5.556-5)+(5.83-=28.667SSAE=兀._旬-x)2=3(3.667-5.222嚓錚仆5-,+(4333-333_5.88一力=321.925=65.778SWE=殁=1哥=辽=1(咒护-丘认I=-%57H+(23.667)+:-斗,3淘+C3-v2-264a4d98e30d7505d06f48129399c2eb_1440w.jpg4、计算均方因素A差异,自由度为r-1=3-1=2,所以因素A均方MSA为:MSA=6.222/2=3.111因素B差异,自由度为c-1=3

15、-1=2,所以因素A均方MSB为:MSB=28.667/2=14.333交互因素AB差异,自由度为(r-1)(c-1)=(3-1)(3-1)=4,所以交互因素AB均方MSAB为:MSAB=65.778/4=16.444内部差异,自由度为rc(k-1)=33(3-1)=18,所以内部均方为:MSE=25.333/18=1.4075、构造检验的F统计量FA=MSA/MSE=3.111/1.407=2.211FB=MSB/MSE=14.333/1.407=10.184FAB=MSA/MSE=16.444/1.407=11.684方差分析表:差异滙霁dfFP-valueF;cit因麹6.222r3.;

16、1112,211.1393.:E5i28.667厂辺紳10.184:.JOI3yE5565.77E:16.4411.泅E.JOO内部差异25.3.31JL4J7.总计12626v2-b51d70d0c3af59c3f80c2e9a3b183f85_1440w.jpg根据给定显著水平a=0.05,查F分布表,得F0.05(2,18)=3.55,F0.05(4,18)=2.93。对于A因素,FA=2.2113.55=F0.05(2,18),落在拒绝域,即奖励制度对员工生产力的影响显著不同。对于AB交叉作用,FAB=16.4442.93=F0.05(4,18),落在拒绝域,即AB交互作用对员工的生产

17、力的影响是显著不同的。这就类型的水平本身没有影响,但当与奖励制度水平结合时就产生了交互作用的影响。在进行两因素方差分析时,如果存在交互作用,主要影响就变得不再重要,就不能再使用通常的方法分析主要影响,检验结果已不能明确地说明行或列影响的差异是否显著。因此,当存在交互作用的影响时,一般不应去解释行或列因素的主要影响。方差分析:无交互作用的两因素方差分析进行无交互作用的方差分析,一般是在完成有交互作用方差分析之后,当检验结果证明交互作用不显著时,就可以不考虑这个影响,重新进行无交互作用的方差分析。或者是在观察(试验)之前,有意识地控制某一因素,主要研究另一因素对因变量的影响,这样的观察(试验)的结

18、果也适合做无交互作用方差分析。无交互作用两因素方差分析假设A和B两个因素,因素A有r个水平,因素B有c个水平。假定不存在A与B的交互作用,或已知交互作用对因变量影响很小,则在观察或试验时,在r*c个整体中只抽取一个样本或只做一次试验即可,如下表:无交亘作用方蛊分析,在因更量崔v2-19753a335d2511ac42e8ac1ffe8626ee_1440w.jpg无交互作用两因素方差分析步骤与有交互的一致:1、建立建设对于A因素H0:u1=u2=ur;H1:u.1,从2,,ur不全相等。对于B因素H0:u1=u2=uc;H1:u1,u2,,uc不全相等。2、计算各项离差平方和v2-5ee3ad

19、880c3022ade4b99774dd4eb013_1440w.jpg3、计算均方MSA=SSA/(r-1)MSB=SSB/(c-1)MSE=SSE/(c-1)(r-1)4、构造检验的F统计量对于A因素,FA=MSA/MSEFa(r-1,(c-1)(r-1);对于B因素,FB=MSB/MSEFa(c-1,(c-1)(r-1);对于给定的a,A因素的拒绝域为FAFa(r-1,(c-1)(r-1);B因素的拒绝域为FBFa(c-1,(c-1)(r-1)上述计算结果可以通过方差分析表表示出来:礙童平方和住閒巨日室df均方临FlSSAMSA=SSA.;r-lFa=M&A-MSESBC-1MSB=SS

20、E/c-lfb=msb-mseSSE1加)曲TIC-1v2-ff17e4de761fdf31db4257f059589216_1440w.jpg范例分析某人事部门想研究奖励制度对员工生产力是否有不同的影响。为了消除不同类型领导对员工生产力的影响,分别按三种领导的类型调查了9个公司的员工生产力情况,如下表所示。表中数字是生产力分数(分数高代表生产力高)。试检验三种奖励制度对员工生产力的影响是否一致?(a=0.05)_1440w.jpg解:假设领导类型与奖励制度没有交互作用,按无交互作用的方差分析方法。1、建立假设*关于奖励制度假设H0:Q=u2=u3;H1:u1,u2,u3不全相等;关于领导类型

21、假设H0:Q=u2=u3;H1:u1,u2,u3不全相等。2、计算各项离差平方和将题目信息整理如下表:1219.345.333295e6.567344J3.齡7亦dn-ifi15.122v2-4336da2e3211b557029f450b97f1abd6_1440w.jpg离差平方和计算如下:(5333-5.222)-+-+(16&7-52221a|13.SE6Ct.jr-x/3-(7,3J3-5.222+(4333十S.222a=2H222SfEy3Y(li,+jcL+iv+a=(9-5.333-7,333-I-5,222)J1-+(3-5333-7J35+5.222)3=9J704Ji=

22、丄厶JMJ.S5T=3g(Xj-*)1=(9-5-222)2*f3-5.222)2=43556v2-c0a95e8265e322ab4c0e131b2b25baaf_1440w.jpg3、计算各项均方MSA=SSA/(c-1)=13.556/2=6.778MSA=SSB/(r-1)=20.222/2=10.111MSE=SSE/(c-1)(r-1)=9.778/2*2=2.4444、计算F统计量对于领导类型:FA=MSA/MSE=6.778/2.444=2.773对于奖励制度:FB=MSB/MSE=10.111/2.444=4.136唉差来源宫差平方和胚曲自由度矗if)均方训必F113.E569j6.UE2.773因幕9Li10.1114;136內部9,7782.144总计4S.E568v2-b8af9ff35c7f565c7a376a5ecbbcdc41_1440w.jpg5、查F分布表确定临界值已知a=0.05,对于奖励制度,查的F0.05(2,4)=6.94。因为FB=4.1366.94=F0.05(2,4),落在接受域。所以接受H0,拒绝H1,即三种奖励制度对于员工的生产力没有明显差别。同理因为FA=2.7736.94=F0.05(2,4),所以领导类型对员工生产力的影响也无明显差别。生活很好,有你更好

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!