心理统计公式汇总

上传人:daj****de 文档编号:161187953 上传时间:2022-10-13 格式:DOCX 页数:33 大小:367.77KB
收藏 版权申诉 举报 下载
心理统计公式汇总_第1页
第1页 / 共33页
心理统计公式汇总_第2页
第2页 / 共33页
心理统计公式汇总_第3页
第3页 / 共33页
资源描述:

《心理统计公式汇总》由会员分享,可在线阅读,更多相关《心理统计公式汇总(33页珍藏版)》请在装配图网上搜索。

1、博仁琴研心理统计公式汇总心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕 和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生 需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难 懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。第三章集中量数1、几个集中量数的公式计算一览表平 均 数 (M)算术平均数(M) X未分组:X -t1n工f X 分组数据:M =; “i加权平均数(单位权重不相 等的情况)工W XMw = V匚乙Wi几何平均数(解决

2、增长率的 问题)工 lg xilgMg 一一 ; Mg - N斤;Mg -帆.,XN Y 1调和平均数(解决速度的问 题)N倒数的算术平均数的倒数:M -;H工丄Xi中数(Md)未分组:无重复值N +1N二奇数:中数即一亍位置的数;N二偶数:中数即中间两个数的平均数;有重复值若重复值没有位于中间,则求法与无重复值时 致;若重复值位于中间,则(P62):图示:思路:连续性数字,不是一个点,是一个区 间;有几个重复的,则将组距除以几;分组NiMd - L + (F ) b2b fMd1、直接观察法。2、公式法。(皮尔逊经验法&金式插补法)众数(Mo) 皮尔逊经验法:Mo = 3Md - 2M ;

3、金式插补法:Mo = L + a xi ;b f + fa b【组中值的计算】第四章差异量数百分位数(点)P x N - FP = L + 100p b fbx i ;未分组:P = 100 -(100R - 50)百分等级RN分组:P =列 x F + f (X - Lb)R Nbi四分位差Q = Q3Qi ;(Q3 与 Q1 即 P25 与 P75)工| X - XEi x十 /、厶HA D =1一 1 /未分组:/A.D.=nn平均差人E f|x/Lr 口 T)丿 1;(IxI为各组中点值对平均数离差的绝对值)分组:A.D .nc工(X - X)2E X 2未分组:S2 NN原始数据代入

4、:S2:工X 2疋X、2N E X 2 - (E X )2NN丿一N 2方差与标准差分绢 s 2= 1 f (X-X):2 = E fX 2刀组:t_VN Ns = P fd 2-(晋)Xi N始于2Q0E年yNs2+yNd2 .总方差与总标准差:s i y n i i ;(d X X)i标准差 的应用差异 系数sCV = = X100% X标准 分数7 X X xss第五章相关关系相关系数适用资料公式积差相关(皮尔逊) 成对的数据(三30对); 连续变量;正态双变 量;线性关系;工xyr = s (N为成对数,Ns Sx y原始值代入:x、y为离均差);y工X工y乙XY Ny X(y X )

5、2 :y Y (y Y)2X 2 Y 2 Nr6y D21、等级差数法:r =1(D为对偶等级之差)RN (N 2 1)2、等级序数法:r =启R N 1-4工 R R 1XY ( N + 1)N (N +1)斯皮尔曼等级相关(两列)两列具有线性关系的等级 或顺序变量;3、出现相同等级时:rRCy x 2+y y2y D 22 jy x 2 y y2其中,皿辔y CX;y CX = y(N为成对数据数目,n为各列变量相同等级数)博仁歩研抬于20師年肯德尔等级相 关(多列)肯德尔W系数(和谐系数): K个评分人评N个对象, 分析K个评分人的一致性 程度; 同一个人先后K次评价 N个对象,分析其前

6、后一致 性;1、基本公式:s; (K为评价者数,NW 一 1 K 2(N3 - N ) 12为被评对象数)12工R 23(N +1)W 一M 1; (R 为评价对象获得的KK 2 N (N 2 一 1) N 一 1i个评价者给的等级之和,V 工 R 2 v(工 R )2s 一 v (R l ) 一 v R 2 1);i NiN2、相同等级时:sW一 1;其中,S的意义同上,T如K 2( N 3 N) K v T12下:VV n3 nVT = V- ; (n为相同等级数)肯德尔U系数(一致性系 数):对偶比较法:将N个事物 两两配对,可配成N(N-1)/N对,然后对每一 对进行比较,择优选择,

7、优者记1,非优者记0;8(V r2 KV r)U 一ijij +1 ;N (N 1) K (K 1)N为被评价对象数目(即等级数),K为评价者数目,厂.为对偶比较表中ij (或iVj)格中的择优分数。(几 1个评价者认为i比j好,则为几)质 与 量 的 相 关点二列相关 正态连续变量 &二分名义变 量(真正的)【用于非类测验(得分只 有两种结果,答对得分, 答错不得分)的测验内部 一致性,每道题与总分的 相关等问题;】X - X;r - pq 寸 pq ;PbSt(其中,p、q二分称名变量两个值所占比例,X与X为pq二分称名变量各自对应值的平均数,st为连续变量的标准 差);二列相关 两列数据

8、均正态 一列为连续变量,一列 为二分变量(人为划分);X Xpq、X Xpr pq ; 或 r p 一 ;bsybsytt其中,y为标准正态曲线中p值对应的高度,查正态分布 表可知。博匚蓉研始于2Q0E年多列相关适用于两列止态变量,其 中一列为连续变量,另一 列被人为地划分为多种类 别(名义变量);工(y - y ) X r =;其中,s” y (y y)2s 厶一LHtPiPi为每系列的次数比率,yL与yH分别为每一名义变量下(上)限的正态曲线高度,可由pi差正态表得知;品 质 相 关四分相关两列都是连续正态变量, 且都人为地被划分为两个 类别。相关资料可以整理 成四格表;/ 180 、r

9、二 cos()厂tad十(Jbc、1 +;或 r COS( L) bctVad +yfbc0系数(列联系数)两列变量均为真正的二分 变量;(四格表)(与卡方检验联系)ad 一 bc小 ad - bcr ; Q =;0 J(a + b)(a + c)(b + d)(c + d) ad + bc ad -y/bc4ad +bc列联表相关数据属于RC表的计数数 据,欲分析所研究的二因 素之间的相关程度时使用皮尔逊定义的列联系数(常用):c = J-yn + x2另:T = J 兰R - 1)(C - 1)N第六章概率分布1、几个基本概念(1)概率:表明随机事件出现的可能性大小的客观指标。(2)后验概

10、率(统计概率):先验概率(古典概率):(3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。2、概率的基本性质:探概率的公理系统:任何一个随机事件的概率都是非负的;在一定条件下必然发生的必然事件概率为1;在一定条件下必然不发生的事件,即不可能事件的概率为0.探概率的加法定理博仁昭研始于20師年探概率的乘法定理3、概率的分布类型划分划分标准分类备注依据随机变量是否具有连续性离散分布:离散随机变量的概率分布。 (如:二项分布)离散随机变量:随机变量 只取孤立的值。连续分布:连续随机变量的概率分布, 即测量数据的概率分布。(如:正态分布)(即计数数据)依据分布函数的来源来分经验性:据

11、观察或实验获得的数据而编 制的次数分布或相对频率分布。理论性:一是随机变量概率分布的函数 (数学模型),二是按数学模型计算出 的总体的次数分布(总体分布)。依据概率分布所描述的数据特 征而划分基本随机变量分布。常用的有二项分布 和正态分布。统计量(随机变量的函 数):平均数、平均数之 差、方差、标准差、相关 系数、回归系数等。抽样分布:样本统计量的理论分布。4、几个重要分布正态分布(1)特征: 正态分布的形式是对称的,对称轴是经过平均数的垂线。 正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位 于正负1个标准差处,曲线两端向基线无线靠近,但不相交。 正态曲线

12、下面积为1。 正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。 正态分布中各差异量数值间有固定比率。 正态曲线下,标准差和概率(面积)有一定的数量关系。(2)正态分布表的利用 已知Z分数求概率p,即已知标准分数求面积。 已知概率P求Z分数。 已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是两尾。】(3)次数分布是否为正态的检验方法(4)正态分布理论在测验中的应用 化等级评定为测量数据 标准测验题目的难易度 在能力分组或等级评定时确定人数 测验分数的正态化二项分布(贝努里分布)(1)几个重要概念理解二项试验:必须满足几个条件一

13、一任何一次实验恰好只有2个结果;共有n次实验,n是事先给定的 一个正整数;某种结果出现的概率在任何一次实验中都是固定的。二项分布:试验仅有两种不同性质结果的概率分布。(两个对立事件的概率分布)。具体定义如下:设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件 不出现的概率都是口,即(1-p),则对于某事件出现X次的概率分布为:b(x,n, p)二Cxpxqx ;nCxn!x !(n - x)!)表示在n次试验中有X次成功,成功的概率为p。(2)二项分布的性质 二项分布是离散型分布,概率直方图是跃阶式(p=q与pq) 二项分布的平均数与标准差当pq, np5,二项分布接近

14、正态。此时有,P=np ,3=npq(3)二项分布的应用当p30),样本平均数渐进正态分布。【卩-中;=-=】Xx yjnT 分 布含义 及基 本公 式学生式分布。左右对称、峰态比较咼狭,分布形态随样本容量n-1的变化而变化的一X2 X2族分布。【-s/尼1 ; 7 N】分布 特点1、平均值为0;2、以平均值0左右对称分布,左侧t为负值,右侧为正值。3、变量取值在4、当n趋近于无穷大时,t分布为正态分布,方差为1;当n-130, t分布接近正态分布,方差大于1,随n-1的增大而渐趋于1; 当n-1V30, t分布于正态分布相差较大。分布 表的 使用10.05 (双侧)=t 0.025 (单侧)

15、样本 平均 数的 分布总体分布为正态,总体方差未知时,样本平均数为t分布。ss/乙 X2【s _ = /4 =1-1,其中,s = H】X Jn -1 Jnn-1 Y n -1总体非正态,总体方差未知,若n 30,则近似正态分布。X2分 布概念 与公 式随机变量平方和的分布;或随机变量转为标准分数,标准分数的平方和的分布也服从 X2分布。乂 (X-卩)2【X2=或用样本平均数估计总体总体平均数卩时为Q 2工(X -X)2 ns2X 2 =i二】Q 2Q 2分布 特点1、正偏态分布。df趋近无穷大时,为正态分布。2、X 2值都是正值。3、X2分布的可加性。即卡方分布的和也是X 2分布。应用计数数

16、据的假设检验;样本方差和总体方差差异是否显著的检验;F含义分 布与公 式7 2 /dfS2 / b 2S2F 二 ;F =1- ;F q-1 ;7 2 /dfS2 / b 2 S22 2n2-12n2-1分布 特点1、正偏态分布;2、F总为正值;应用F检验:考察任意两个样本的方差是否取自冋一整体;方差齐性检验与方差分析;第七章参数估计1、几个重要概念点估计、区间估计、置信区间、显著性水平(a)、置信度(置信水平即1-a)、标准误(平均数的离散程度):匚b X二石2、参数估计步骤总结(1)分析条件,选择方法,计算样本统计量;(2)计算样本平均数的标准误;【是关键!】(3)确定显著性水平,求置信区

17、间;(4)查找Z值或t值;(5)计算置信区间;(6)结果解释。正态分布表:X Z o_WpW X + Z 一 或 X ZX + Z b _a /2Xa /2 X(1a )/2X(1a )/2XT 分布表:X t b_WpW X +1或 X tX +1b _a /2Xa /2 X(1a )/2X(1a )/2X3、参数估计一览表总 体 平 均 Ms数 的 估 计总体方差已知(正态估计法)总体正态分布。总体非正态,n30 (近似正态估计法)。b标准误为b - -X Jn总体方差未知 (t分布估计 法)总体正态分布。总体非正态,n30 (近似t分布估计法)。一ss标准误采用样本的无偏方差作为总体方差

18、的估计值即b . 严 X 30 (样本标准差的分布为渐进正态),-b标准差的平均数为X -b ,标准差分布的标准差为b -,ss 2n则置信区间为:s Z卩 s + Zn1 a /2sn1 a /2 s博仁考研始于20餡隼区 间 估 计方差自正态总体中,随机抽取容量为n的样本,其样本方差和总体方差的比值的分布为X2分布,故可直接查X2表来确定x2和x2,置信区间为:0/2(i_a)/2(nT) s2(nT) s2n_1 Y Q 2 Y n1X2X2o /2(10 )/2二总体方差之 比1S2Q 2S2置信区间为厂Y F;FS 2Q 2o /2 s 20 /2 n2-12n2-1Q 2根据样本方

19、差估计十在1上下一定区间内(即区间是否包含1),可推论一总体方Q 22差相等。若只关注两个总体方差是否相等则用单侧,若要比较一者谁大谁小则用双侧。相 关 系 数 的 区 间 估 计积差 相关 【思 路:先 假设P =0, 求出置 信区 间,若 不包含 0,说明 假设错 误,再 根据P 不为0 的情况 来解 题。】总体 相关 系数 为0即P =0时。样本相关系数分布为t分布,Q = f r Jn - 2 置信区间为:r t xq 500,Q ;置信区间为:r Z xq y20时,r的分布近似正态分布,标准误为SE Rr比率的区间估 计置信区间改为:rR 土Za/2(df = n - 2);置信区

20、间为当n 5,标准误-p或SEp=p 一 Z SE y 卩 Y p + Z SEa /2ppa /2p【ps:样本比率p二x/n,是总体比率p的点估计值,可代替总体比率。故比 率 及 比 率 差 异 的 区 间 估 计当np 1 r rrr * y其他不变)总体方差木知时,可直接用样本标准差S代替总体标准差R ,正U态2、当nV30,不可用Z或t检验,只能选择非参数检验。(X- X )-(卩-卩)D-一卩一1亦宀缶咲田/古71212XD平均数1、独立样本:临界值Z SE丄厶 XXSE _差异的两DXDX显著性个两个卄fc 2Q 2甘 rh SE1 i +2检验总其中,Q1 L 12总体DXV

21、nn(两个 样本是体 都方差 都已1 2(X X )-(卩-|LX)D-卩 _Z i2 12XD否来自正知【Z】2、相人样本:临界值同上为,Zj1SE _小厂XSE _同一总态DXDX体)卄c 2c 2c c其中,SE _ f + 2r DX Y nn1、独立样本。X - x两个总体方差一致或相等。(齐性)临界值t= +2SEDX(df = n + n - 2)1 2其中,SEDX =S 2(丄+丄)为联合方差,p n npi1ccJLZZ-n + n - 21 2(联合方差S 2是总体方差最好的估计值)P两个总体方差不齐性。柯克兰-柯克斯t检验. X - XX - X两个 总体 方差 都未

22、知【t】S 2TnS 21n1 -1 +n2( a)SE 2 tx 1(a)x1 SE 2 + SE 2X1X 2+ SE 2 t;(查t值时,df=1)【PS:若实际得到的t :,则认为两个样本的平均数在a水平差异显著】2、相关样本。 相关系数未知。X - Xt =1SEDX(df = n -1);(用d表示每一对数据对应的数据之差。)其中,SEdxS2d丄(d - d)2工d2 -孕相关系数已知。X - X 1t = 12 ( df = n 1);SEDX其中,SE _DXS2 + S2 - 2rs s12两 个 总 体 非 正 态当样本容量足够大时:【Z】1、独立样本:1C 222(方差

23、未知时以样本方差代替各自的总体方差)2、相关样本:s2 + s2 - 2rs s-421-方差的 差异检 验样本 与总 体正态总体中样本,其样本方差与总体方差比值的分布为X2分布,即X 2 = 一O 20从X2表中查X 2、X 2(df=l,),当X 2X2或X2Y X2,差异显著。0/2(10/2)0/2(10/2)样本 之间S21、独立样本:【F检验】F =夫S2小S 2 S 22、相关样本:【t检验】t =12( (df n 2)4 S 2 S 2(1 r 2)相关系 数的显 著性检 验积差 相关r 01、P=0 (r的分布近似正态)【t检验】t (df n 2)1 r 2 Vn 2Z

24、Z2、pM0,将r和P都转化为费舍Z,然后再进行【Z检验】Zj 1 Pn 3【总结思路】:题目若未说明P是否为0,则先假定P为0,若计算得出要拒绝H ( p =0 ), 0则必须重新再用P#0的方法来算一遍。其他 类型 相关1、点二列相关2、二列相关3、多列相关4、四格相关5、斯皮尔曼等级相关6、肯德尔W系数相关 系数 差异(仅 论积 差相 关情 况)1、r1和r2分别由两组彼此独立的被试得到。Z Z将r1、r2分别进行费舍Z的转换。【Z检验】Z =r1r2 =” 1 + y n 3 n 31 1 22、两个样本相关系数由冋一组被试算得P、P、P,检验P与P的差异。1223131213首先计算

25、3列变量的两两相关系数P、P、P,然后进行【t检验】122313t -厂匕叮J( 3)(1+7(df -n-3)J2(l r2 r2 r2 + 2 r r r )V121323121323博仁垮研权威师资优质教学博仁考硏 WWW比率 的显 著性_p p1、np A 5 ,【Z检验】Z =彳p qV n2、np 5,直接查表一项分布置信上下界限比率的 显著性 检验比率 差异 的显 著性 检验1、独立样本:若统计假设仅假设p1=p2,不涉及具体数值时,临界比率Z =Pp2苴中标准误a “-帆p1+n2p2)(n1 q1+n2q2)临界比率Z12 ;苴中怀准误OO訂112 /112 2aDpp1p2

26、 Yn n (n + n )p1 - p211212若统计假设还假定了具体的比率时(p p p , p为正负1之间的任意数。)12DDZ-(P1 -P D,其中标准误为a-阿+匝ap1p2 nn卩严21122、相关样本:步骤:将实验结果整理成四格表,将其中前后两次不 致的项目的格内数字标以A或D;H : p p 0 H : p p丰0 应用下式求临界比率(条件:A+D二k210,kp25) 012112A dd AZ- 或 ;若不满足上面的条件,则用一项分布计算pA (或qD )以上的概率JA + D QA + D和,若概率和小于0.005或0.025为差异显著(这是双侧。单侧为小于0.05及

27、0.01)始于200召羊第九章方差分析1、几个基本概念【方差分析】即变异分析。本质仍然是假设检验。主要功能在于分析实验数据中不同来源的变异对总 变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。【方差分析的要求】总体分布呈正态;每个实验组的方差齐性;变异具有可加性;【方差分析依据的基本原理】即方差(或变异)的可加性原则【方差分析目的】通过F检验讨论组间变异在总变异中的作用,借以对两组以上的平均数进行差异检 验。【方差分析的步骤】(1)齐性检验;(哈特莱最大F比率法)(2)构建综合虚无假设;博仁哮研始于20萌年(3) 计算平方和;(4) 计算自由度;(5) 计算均方;(6) 确定检验

28、统计量(计算F值);(7) 确定显著性水平的临界值(查F值表进行F检验);(8) 做出统计决断;(9) 陈列方差分析表2、方差分析一览表即单因素分析。安排被试的一般格式宀 兀 全 随 机 设 计 的 方 差 分 析计算平方和计算自由度计算均方计算F值yy(工工X )2总变异SS -乙乙X 2 -;Tnk组间自由度:组间均方:df k -1 ;“ SSMS b ;B df ,By(y X )2(yy X )2组间变异SS =乙-一B组内自由度:口 MSF BBnnkdf k (n -1);MS组内均方:W组内变异Wyy(y x )2ss ss ss yy x2总自由度:df df + df nk

29、 -1TBW“ SSW dfwtBnW需要计算的统计量基本公式一览表完全随机设计(单因素)方差分析表处理1处理2处理k被试11被试21被试k1被试12被试22被试k2被试13被试23被试k3变异来源平方和自由度均方Fp组间VVVVV组内VVV总变异VVPS:有以下几种应用 各实验处理组样本容量相同 各实验处理组样本容量不同(此时总数据个数用nk用N来表示) 利用样本统计量进行方差分析即组内设计的方差分析。【每个组均接受所有的实验处理】 安排被试的一般格式处理1处理2处理k被试1被试1被试1被试1被试2被试2被试1被试3被试3随机区组设计的方差分析表随 机 区 组 设 计 的 方 差 分 析变异

30、来源平方和自由度均方Fp组间VVVVV区组VVVVV误差VVV总变异VV计算平方和计算自由度计算均方计算F值总变异组间均方:yy(XX x )2ss = XX x 2 组间“ SS组间方差是tnkB df否大于误差变异总自由度:df N 1T项的方差:区组均方:(一般)Z X (X X )2(XX X )2组间自由度:df k 1BMSSS Bnnk区组自由度:df n 1“ SS MS r-F B B MS区组变异R dfERR检验区组效应:Z _X(X R)2(XX R)2误差自由度:误差均方:Rknk1df (k 1)(n 1)E厂MS SSF R误差项平方和MS e e dfR MSE

31、SS 二 SS -SS SSETBR需要计算的统计量基本公式一览表PS:实验原则:同一区组内的被试应该同质。区组效应:被试之间性质不同产生的差异。区组效应显著说明分组成功。在方差分析基础上,若结果是拒绝了虚无假设,即差异显著,但究竟是那几对平均数存在差异,则需要进行事后检 验。(事后多重比较)事 后 检 验注意:事后多重比较并不限于方差分析,只要是对多个平均数进行两两比较,都可以采用此方法。 N-K检验法:即q检验法。步骤如下:等级1 (最小)23456 平均数X下标X下标X下标X下标X下标X下标 把要比较的平均数从小到大做等级排列;可列表如下博仁号研抬于20苗年可列出具体数值根据比较等级(,

32、自由度叭,查附表(q分布的临界值表)中对应的仏(比较等级r是被比较的两个平均数的等级数之差再加1,即r二r - r +1。i j完全随机设计中的组内自由度叽相等)。求样本平均数的标准误:SE-=X(或0.01水平)的值;叭即方差分析中的误差自由度与牛(其中,MSe为组内均方,n为每组容量。完全随机设计时用MSW),完全随机设计,各组容量不同时使用:SE-=XMS J 1、 2w (+)2 n nabSEX q0.05就是对应于某一个(值得两个平均数相比较时的临界值。若两个平均数的差异(SE- q ),则认为这两个平均数在0.05水平差异显著;可列表如下: X 0.05表中数值表示平均数两两之间

33、的差数,显著可加*号。比较时,注意对应的是哪个r值。X下标(数值)X下标X下标X下标X下标(两平均数差)X下标VVX下标VVVX下标VVVV第十章咒2检验1、相关知识点【X2检验】是对类别数据的检验,对数据总体的分布形态不做任何要求,实际上是一种非参数检验。处理的是一个因素两项或多项分类的【实际观察频数】与【理论频数】(即期望次数)是否一致。【X2的假设】 分类相互排斥,互不包容;观测值相互独立;(要求每个被试只有一个观测值)期望次数的大小;(每一个单元格中的期望次数至少在5个以上)类别配合度检验即无差假说检验。用来检验一个因素多项分类的实际观察数与某理论次数是否接近。 涉及的是某总体的分布是

34、否与某种分布相符合。(当对连续数据的正态性进行检验时,此法也称正态吻合性检验。)独立性检验用来检验两个或两个以上因素各种分类之间是否有关联或是否有独立性的问题。(交互作用。例如:性别与对某个问题的态度是否有关联等)同质性检验检定不同人群母总体在某一变量的反应是否具有显著差异。基本公式2 V (f-f )2X 2=V0fee基本步骤提出假设;计算X2值;查表,比较并做出决断。小期望次数的连续性校正1、单元格合并法;2、增加样本数;3、去除样本法;4、使用校正公式;2X2列联表中, 若单元格的期望次数在5到10之间,则用耶茨校正公式; 若期望次数低于5,或样本总人数低于20,则用费舍精确概率检验法

35、; 若单元格内容涉及到重复测量设计(如前后测设计),则使用麦内玛检验;2、X2检验一览表配 合 度 检 验一般问题1、统计假设。Hi: fo - f刊或f丰f2、理论次数的计算: 无差假说。即理论次数=总数X(1/分类项数);按照某种理论分布。3、自由度:分类项目减去计算时用的统计量数,一般为分类项目减去1.。博仁歩研拾于20苗年被学员誉为“最信得过、最值得上”的辅导班应用检验无差假说无差假说,即各项分类的实计数之间没有差异,也就是各项分类间机会相等(概率相等),理论 次数完全按概率相等的条件算,即理论次数=总数X(1/分类项数)检验假设分布的概率假设某因素各项分类的次数为正态分布,检验实计数

36、与理论上期望的结果之间是否有差异。吻合性检验即拟合度检验。针对连续性数据,检验其是否符合某种理论分布。比率或百分 数的针对搜集到的资料是用百分数表示的情况,方法与上同。只是将最后的X2值乘以iNo后,再查X2表。(亦可先将百分数转换为实际频数来计算)二项分类的 配合度检验二项分类的X2检验与比率显著性检验相同,配合度检验更为简便。当期望次数小于5时,比率的显著性检验不能用近似正态而应用二项分布概率计算。X2的连续性校正或采用耶茨提出的校正公式为:X 2=1(f0 ”)21、统计假设。一般多用文字描述。虚无假设为因素间无关联(或独立的),备择假设则为因素间有关联(或差异显著)。一般问题与 步骤2

37、、理论次数(直接用列联表中数据推算):-xiyi(fx为每行之和,fy为每列之和)3、自由度:df = (R - 1)(C -1) ; (R为每一行的分类项目,C为每一列的分类项目)独 立 性 检 验因素B因素A分类1分类2分类1ABA+B分类2CDC+DA+BB+DN=A+B+C+D1、独立样本。(相当于独立样本比率差异的显著性检验) 独立样本的四格表示意:四格 表独 立性 检验当f三5时,eN(AD-BC)2X 2 =(A + B)(C + D)(A + C)(B + D)(df=1)当某一个f V5时,用校正公式:eN(|AD-BC|- 2 )2(A + B)(C + D)( A + C

38、)(B + D)2、相关样本。(相当于相关样本比率差异的显著性检验)当f三5时,X 2 = 字害(df=1)。其中A、D为两次实验或调查中分类项目不同的两个格的 eA + D实计数。(如,学生测两次成绩,第1次答对但第2次答错&第一次答错但第二次答对。)博仁荐研 当某一个f 5时,用校正公式:e3、四格表的费舍精确概率检验法。(期望次数小于5时,除用校正公式,亦可用此法)P314Y (f f)2f f基本公式为X 2=& ,其中f = x 玮RXC 表独 立性 检验多重 列联 表分 析fei Neif 2较简便的公式为X 2 = N(Y ff -1)【无需计算理论次数】xi yiPS:允许实计

39、数为0,最小的理论次数为0.5即可。若不满足,一般采用合并项目的方法,而不 用连续性校正公式。变量类别多于两个以上时使用。需要将其中一个变量作为分层或控制变量,分别就控制变量下的 每一个水平的另两个变量所形成列联表来比较分析。分别就两个列联表各自的统计量进行计算。(一般以人口学变量等不易受到其他因素影响的为分层变量,如男、女) 分析几种因素间是否有实质上的差异或几次重复实验的结果是否同质。 几次或几组实验数据合并的问题步骤: 计算各个样本的X2值和自由度; 累加各样本组的X2值,计算其总和和自由度的总和; 将各个样本的原始数据按照相应类别合并,产生一个总的数据表,并计算这个总的数据表的同 质

40、性 检 验单因素分类数 据的同质性检 验X2值和自由度; 计算异质性X2值(即累加的X2值与计算的总的X2值之差),其自由度为累计自由度与总自由度之差; 查X2值表,判断异质性X2值的显著性;可列分析表如下列联表形式的 同质性检验方法同上。(应用列联表形式的X2值计算公式)变异原因X2自由度p合并X2值VVV异质性X2值VVV总计VV始于20師年博仁垮研始于2 00召年5、分表理论次数合并法;(没有其他方法,不得已时采用此法)方法:分别计算各分表中各格的理论次数,再将各分表对应格的理论次数相加,作为简单合并 表的理论次数,据此计算Z 2值。RXC 表数据 的合并1、简单合并法;条件:各分表相应

41、比率接近;各分表的Z2都未达到显者性水平(样本齐性)2、分表理论次数合并法;方法:分别计算各分表中各格的理论次数,再将各分表的实计数合并,作为总表的实计数,将各分表对应格的理论次数相加作为总表的理论次数,据此用X2基本公式计算计算X2值,查表,确定显著性水平。(df = (R - 1)(C -1)【相关源分析】前提是总的X2值显著。RXC表检验结果说明两因素有关联。同方差分析与事后检验的关系一样,相关源分析离析出相关源。具体见下表:4、相关源的分析一览表博仁考研蜡于20D5年1、将2XC表分解为独立的2X2表进行分析将2XC表分解为(C1)个四格表,如下表:ala2a3 atnxlblb2b3

42、 btnx2nylny2ny3 nytNA表若明显不关联则合并为B表,B表明显不关联再合并为C表,依次类推。A表:B表:C表:ala2a1+ a2a3a1+ a2+ a3a4blb2b1+ b2b3b1+ b2+ b3b4A表X 2值:N2(b a - a b )221 In n n n (n + n )x1 x 2 y1 y 2 y1y 2B表X 2值:B表X 2值:2XC表的 离析N2 b (a + a ) - a (b + b ) 1X 2=3123122 n n n (n + n ) (n+ n + n )x1x 2y 3y1y 2y1y 2y 3N2 b (a + a +a ) -

43、a (b + b + b ) 1X 2=412341233 n n n (n+ n + n ) (n+ n + n + n )x1x 2 y 4 y1 y 2 y 3y1y 2y 3y 4将分解的四格表依下式计算各自的X 2值:X 2=nx1N2 b S a -a 工 bt十1it十1i11, n n S n S nx 2 y (t + 1)yiyi1 1其中,N为总表中的总数;nxi、nx2为总表中的边缘次数(横行);nyi为总表中的边缘次数 (纵);ai、bi为总表中各格的实计数;2、将2XC表分解为非独立的2X2表进行分析适用于实验组与对照组比较的问题,每一个实验组都要和对照组比较(即非

44、独立的)评价原方法(对照组)新方法1(实验组1)新方法2(实验组2)新方法3(实验组3)新方法4(实验组4)好一般或不好, a各分解的四格表的显著性水平a为:a = 2(c一);其中,a为所规定的总的显著性水平,C为总表的项目数。方法步骤基本与上面相同。但计算分表的X2值时一般采用简单的基本公式,即RXC表的 离析S (f - f )2f ff 2X 2=0i& ,其中/ =点 #或较简便的公式为X 2 = N(S叮一1)eifeiNf fxi yi第十一章非参数检验1、非参数检验一览表适用资料:当两个独立样本都为顺序变量时;(与参数检验中的t检验相对应)(1)当两个样本容量均小于10时:将两

45、个样本的数据混合,由小到大排列(最小的排1);【排等级】等级12 .n*组42 *组46.92 将容量较小的样本中的各数据的等级相加,以T表示;【计算秩和即等级和】秩 和 检 验 法 把T值和秩和检验表中的临界值比较。【查秩和检验表】若TWT1或T三T2 (小于小的或大于大的),则差异显著; 若T介于Tl、T2之间,则没有显著差异。(2)当两个样本容量均大于10时:秩和T近似正态分布。用公式z =匸斗;独立样本其平均数与标准差如下:卩=件(ni + n2 + 1); b =、也#件土件山(n1Vn2) T2T q12Z落在-1.961.96差异显著(双侧,0.05水平);在r1.651.65差

46、异显著(单侧,0.05水平); PS:等秩情况的校正n n (n + n + 1)12Y (13 一 t )k 1(n + n )3 一 (n + n )1 2 12 -;lT 一 U 1一 0.5 Z =LbT中 数 检 验 法tk表示第k个相同等级中相同值得个数。适用条件、地位都与秩和检验法相当。PS:任何一个单元格的期望次数V1,或超过20%的单元格中的期望次数25,正态近似法【Z检验】U =np = * N -ZNbVn博仁粤研怡于2006年为更接近正态分布,校正公式:(r 土 0.5) N/2丽(当r大于N/2时,用减号,反之用加号。)即符号秩和检验。(维克尔送检验法)(1)当 NW25 时 把相关样本对应数据之差按绝对值从小到大做等级排列(差值为0,不参与排列);符 号 等 级 检 验 在各个等级前面添上原来的正负号; 分别求出带正号的等级和(T+)和带负号的等级和(T-),取两者较小者为T; 查表。T大于临界值则差异不显著,小于时显著!【特别特别哦

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!