现代心理与教育统计学复习

上传人:m**** 文档编号:180772430 上传时间:2023-01-07 格式:DOCX 页数:31 大小:104.04KB
收藏 版权申诉 举报 下载
现代心理与教育统计学复习_第1页
第1页 / 共31页
现代心理与教育统计学复习_第2页
第2页 / 共31页
现代心理与教育统计学复习_第3页
第3页 / 共31页
资源描述:

《现代心理与教育统计学复习》由会员分享,可在线阅读,更多相关《现代心理与教育统计学复习(31页珍藏版)》请在装配图网上搜索。

1、1、数据类型厂称名数据计数数据Y离散型数据-顺序数据等距数据测量数据A连续型数据L等比数据2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表 示这个指标的观察结果时,这个指标是一个变量。用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。3、需要研究的同质对象的全体,称为总体。每一个具体研究对象,称为一个个体。从总体中抽出的用以推测总体的部分对象的集合称为样本样本中包含的个体数,称为样本的容量 n。一般把容量n 30的样本称为大样本;而n v 30的样本称为小样本。4、统计量和参数统

2、计指标统计量参数平均数?M标准差SCT相关系数rp回归系数b5、统计误差误差是测得值与真值之间的差值。测得值二真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量 差。由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N )或百

3、分比-100%)来表示次数,就可以制成相对次数分布表N(三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特 点的指标,或同一组被试在两种实验条件下获得的结果。三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析简单次(频)数分布图一一直方图、次数多边形图累加次数分布图一一累加直方图、累加曲线(一)简单次数分布图一一直方图(二)简单次数分布图一次数多边图次数分布多边形图是一种表示连续性随机变量次数分布的线形

4、图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以 直线连接即构成多边图形。(三)累加次数分布图一累加直方图(四)累加次数分布图一一累加曲线四、其他统计图表条形图:用直条的长短来表示统计项目数值大小的图形, 主要是用来比较性质相似的间断型 资料。圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的 面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。线形图用来表示连续型资料。它能表示两个变量之间的函数关系; 一种事物随另一种事物变 化的情况;某种事物随

5、时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量 比较,又可分析发展的趋势。散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。第三章集中量数用来表现数据资料的典型水平或集中趋势。常用的集中量包括算术平均数、加权平均数、中位数和众数等等。、算术平均数一般用M,或者用X表示。算术平均数是最常用的集中量(一)算术平均数的计算公式(二)算术平均数的意义算术平均数是应用最普遍的一种集中量。它是“真值”(true score )的最佳估计值。真值是反映某种现象的真实水平的分数。 由于测量过程中的各种偶然因素的影响,真值往往很难得到。在实际测量中,往往采用“多次测量,取平均数

6、”的方法,用平均数去估计真值。(三)算术平均数的优缺点优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。(四)计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示同类数据的集中趋势。平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。 平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程 度。二、中位数中位数又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用 Md或Mdn表示(一)中位数的计算方法1、原始数据计算法一组数据

7、中无重复数值的情况首先将一组数据按顺序排列2、次数分布表计算法公式中:Lb为中位数所在组的精确下限Xni 2 -fb I2fMd若n为偶数L则哼ffb为中位数所在组下限以下的累积频数n为数据总和fMd为中位数所在组的频数i为组距三众数众数 用Mo表示,有两种定义:次数分布表中,频数最多那一组数据的组中值,即为众数四、算术平均数、中位数、众数三者的关系在正态分布中:X二Md二MO 在正偏态分布中:XMd M O在负偏态分布中:X ”: Md以Mo 五、其它集中量数(一)加权平均数加权平均数是不同比重数据(或平均数)的平均数,一般用表示。其计算公式有两种:Wi X i(二X几w何平龙Wj几何平均数

8、 (geometric meaniX w 二二一)是n个数值连乘积的n次方根g,廣gni X或 表示。计算公式为:当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势Xn-1Xn几何平均数的变式两边取对数,得几何平均数计算的需要从几何平均数中减去基数1 2.应用几何平均数的变式计算按一定 比例变化 的一列数据,一般用来求 平均变化率 如 平均增长率.(三)调和平均数调和平均数(harmonic mean), 用符号MH表示调和平均数的应用 学习速度方面的问题调和平均数在描述速度方面的集中趋势时,优于其他集中量第四章描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;差

9、异量越 小,表明数据越集中,变动范围越小、全距、四分位距和百分位距(一)全距R 全距是一组数据中的 最大值 与该组数据中 最小值 之差,又称极差R=Xmax Xmin(二)百分位差(百分位距)百分位差是指两个百分位数之差(三)四分位距四分位距是第一个四分位数与第三个四分位数之差的一半(四)平均差 平均差 是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通 常用AD或MD表示。AD =原始数据计算公式(五)方差和标准差方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差2 2用S表示,总体的方差用表示。标准差是方差的算术平方根。一般样本的标准差用S表

10、示,总体的标准差用表示。标准差和方差是描述数据离散程度的最常用的差异量1、样本方差及标准差定义公式3、原始数据的方差与标准差计算可以计算几个小组联合在4、总标准差的合成 方差具有可加性的特点。当已知几个小组数据的方差或标准差时, 一起的总的方差或标准差。计算公式公式中S: 为总方差 , 为总标准差Si为各小组标准差2 Enj Sj + EnjXT -ni为各小组数据个数S t 二:y n i5、方差和标准差的性质方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:如果Y = X C 贝収=Sx如果 Y = c贝

11、S C Sx7、标准差的应用差异系数差异系数 是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以CV表SCV 100%X示,其计算公式为:差异系数的作用:比较不同单位资料的差异程度比较单位相同而平均数相差较大的两组资料的差异程度可判断特殊差异情况8、标准差的应用标准分数Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。(1) 标准分数的计算公式及其性质X - XZ = 没有实际单位;S 可正可负,可为零; 一组原始数据中,各个z分数的标准差为1 ; 正态分布的原始数据,转换得到的 Z分数是标准的正态分布(0,1 )。(2)Z分数的作用Z分数可以表明原始分数在团体

12、中的相对位置,因此称为相对位置量数。把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差 为单位、以平均数为参照点的分数。(3 )标准分数的优点可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。明确性:标准分数较原始分数的意义更为明确。合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地 反映事实。第五章相关系数 用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数, 一般样本的相关 系数用r表示,总体的相关系数用p表示。相关系数的取值:-1 r w+1

13、0 0 时,PZ 0.5 PZ+ Z V 0 时,PZ 0.5 + PZ.求某一 Z值以下的概率+ Z 0 时,P x Z = 0.5 + PZ+ Z V 0 时,P x Z = 0.5 PZ已知面积(概率)求Z值.求Z = 0以上或以下某一面积对应的 Z值:直接查表.求与正态曲线上端或下端某一面积 P相对应的Z值:先用0.5 PZ,再查表.求与正态曲线下中央部位某一面积相对应的Z值:先计算P/2,再查表已知概率P或Z值,求概率密度Y.直接查正态分布表就能得到相应的概率密度Y值。.如果由概率P求Y值,要注意区分已知概率是位于正态曲线的中间部分,还是两尾端部 分,才能通过查表求得正确的概率密度。

14、三、概率分布二项分布(一)二项试验与二项分布二项分布是一种具有广泛用途的离散型随机变量的概率分布1 .二项试验满足以下条件的试验称为二项试验:+ 一次试验只有两种可能的结果,即成功和失败;+共有n次试验,并且n是预先给定的任一正整数;+各次试验相互独立,即各次试验之间互不影响;+各次试验中成功的概率相等,失败的概率也相等。2 .二项分布函数 二项分布是一种离散型随机变量的概率分布。用n次方的二项展开式来表达在 n次二项试验中成功事件出现的不同次数(X= 0,1) 的概率分布,叫做二项分布函数。X X n_X二项展开式的通式(即二项分布函数)D(X,n,P Cn p q3、二项分布的平均数和标准

15、差+如果二项分布满足p q且nq 5 (或者p v q且np 5时,二项分布接近于正态分 布。可用下面的方法计算二项分布的平均数和标准差。療二项分布的平均数为:二np+二项分布的标准差为:二 二 、/npq四、概率分布样本分布(一)、抽样分布区分三种不同性质的分布:+总体分布:总体内个体数值的频数分布*样本分布:样本内个体数值的频数分布+抽样分布:某一种统计量的概率分布1. 抽样分布的概念抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。抽样分布是一个理论的概率分布,是统计推断的依据。2 .平均数抽样分布的几个定理.从总体中随机抽出容量为 n的一切可能样本的平均数之平均数等于总体的平均数

16、。.容量为E的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的平方根。.从正态总体中,随机抽取的容量为 n的一切可能样本平均数的分布也呈正态分布.虽然总体不呈正态分布,如果样本容量较大,反映总体卩和祷勺样本平均数的抽样分布,也接近于正态分布。(二)标准误 某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小, 表明样本统计量与总体参数的值越接近, 样本对总体越有代表性,用样本统计量推断总体参 数的可靠度越大。因此,标准误是统计推断可靠性的指标。平均数标准误的计算1 总体正态,C已知(不管样本容量大小),或总体非正态,(T已知,大样本平均数的标准误

17、为:二X二 -Vn2 .总体正态,o未知(不管样本容量大小),或总体非正态,0未知,大样本平均数标准误的估计值为:二乂二(二)平均数离差统计量的分布1 .总体正态,o已知(不管样本容量大小),或总体非正态,o已知,大样本平均数离差的的抽样分布呈正态分布Z正态总体,样本平均数的抽样分布2 .总体正态,o未知(不管样本容量大小)X - X - JCTTn_或总体非正态,0未知,大样本nCF X平均数离差的的抽样分布呈t分布 t分布的特点.形状与正态分布曲线相似.t分布曲线随自由度不同而有一簇曲线.自由度的计算:自由度是指能够独立变化的数据个数。.查t分布表时,需根据自由度及相应的显着性水平, 并要

18、注意是单侧数据还是双侧 3.总体o未知,大样本时的近似处理样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理: 厂一卩 F-zs7 n第七章一、点估计、区间估计与标准误(一)总体参数估计的基本原理 根据样本统计量对相应总体参数所作的估计叫做总体参数估计。 总体参数估计分为点估计和区间估计。由样本的标准差估计总体的标准差即为点估计; 而由样本的平均数估计总体平均数的取值范 围则为区间估计。(二)点估计1、良好的点估计量应具备的条件无偏性: 如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。有效性: 当总体参数不止有一种无偏估计量时,某

19、一种估计量的一切可能样本值的方差小 者为有效性高,方差大者为有效性低。一致性: 当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种 估计是总体参数一致性估计量。充分性 :一个容量为 n 的样本统计量 ,应能充分地反映全部 n 个数据所反映的总体的信息。2、点估计量的缺点:有偏差,没有提供正确估计的概率 ,即不能提供估计值与参数真值的接 近程度和可靠程度(三)区间估计区间估计得出的不是一个单一数值, 而是一个数值区间。 它既可以告诉我们参数的真值在什 么范围内,又能告诉我们参数的真值落在这个范围的概率有多大。区间估计的基础抽样分布 根据抽样分布的特点及原理,不同总体条件下,可

20、能会有不同的抽样分布,则可得到不同条 件下总体参数的区间估计的计算方法。区间估计涉及和置信区间和显着性水平。区间估计以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;要求出该种统计量的标准误;要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。置信区间置信度,即置信概

21、率,是作出某种推断时正确的可能性(概率)。置信区间,也称置信间距(confidence interval,CI )是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。显着性水平对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显着性水平(significanee level)就是指估计总体参数落在某一区间时,可能 犯错误的概率,用符号a表示。P=1 - a2、平均数区间估计的基本原理通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或 非正态总体中的n 30的样本),而计算出来的实际平

22、均数是无数容量为 n的样本平均数中 的一个。根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。、总体平均数的估计(一)总体平均数的区间估计 析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒 绝零假设、接受研究假设。1 总体平均数区间估计的基本步骤根据样本的数据,计算样本的平均数和标准差;计算平均数抽样分布的标准误;.确定置信概率或显着性水平;根据样本平均数的抽样分布确定查何种统计表;.解释总体平均数的置信区间。2 .平均数区间估计的计算.计算置信区间;总体正态,c已知(不管样本容量大小),或总体非正态,样本平均数的分布呈正态,平均数

23、的置信区间为:-J2总体正态,o未知(不管样本容量大小),或总体非正态,样本平均数的分布为t分布,平均数的置信区间为:t df -:o已知,大样本卓X no未知,大样本SCTZ:2 - n总体正态,o未知,大样本平均数的抽样分布接近于正态分布,用正态分布代替 t分布近似处理:S_ X Zn2X Z丄2 不能进行参数估计,即不能根据样本分布对总体平均数进行估计。总体非正态,小样本第八章、假设检验的原理利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为 假设检验。1、假设检验一般有两互相对立的假设。H0 :零假设,或称原假设、虚无假设 ;是要检验的对象之间没有差异的假

24、设。H1 :备择假设,或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设 进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分2、小概率事件:样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平, 这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理 认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性 是极小的,实际中是罕见的,几乎是不可能的。3、显着性水平统计学中把拒绝零假设的概率称为显着性水平,用a表示。显着性水平

25、也是进行统计推断时,可能犯错误的概率。常用的显着性水平有两个:a= 0.05 和 a= 0.01。4 假设检验中的两类错误及其控制对于总体参数的假设检验,有可能犯两种类型的错误,即a错误和B错误。假设检验中的两类错误H0为真H0为假拒绝H0误 辟正确接受H0正确B错误两类错误实际情况H0正确H0错误研究结论拒绝H0I型错误正确接受H0正确U型错误结论(1)两类错误既有联系又有区别:错误只在否定H0时发生:错误增加:错误减小:错误只在接受H0时发生:错误增加:错误减小(2)n ,2可使两类错误的概率都减小.为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显着性水平而对a错误进行控

26、制,如a = 0.05或a= 0.01 o对B错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单侧检验或双侧检验)来使B误差得到控制。在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,a被分散在概率分布曲线的两端,因此称为双侧检验。双侧检验的假设形式为:H0 : ii= 10,H1 : 严卩0凡是检验大于或小于某一特定条件的假设检验,a是在概率分布曲线的一端,因此称为单侧检验。单侧检验的假设形式为:H0 :,H1 :卩0或者 H0 :,H1 : 15.假设检验的基本步骤提出假设.选择检验统计量并计算统计量的值.确定显着性水平.做出统计结论二、平均数的显着性检验(一)总体平均

27、数的显着性检验总体平均数的显着性检验是指对样本平均数与总体平均数之间的差异进行的显着性检验。若检验的结果差异显着,可以认为该样本不是来自当前的总体,而来自另一个、与当前总体存 在显着差异的总体。即,该样本与当前的总体不一致1 总体平均数显着性检验的原理 检验的思路是:假定研究样本是从平均数为 卩的总体随机抽取的,而目标总体的平均数为 ,检验卩与之间是否存在差异。如果差异显着,可以认为研究样本的总体不是平均数为 的总体,也就是说,研究样本不是来自平均数为 的总体。2 总体平均数显着性检验的步骤提出假设双侧检验的假设形式为:H0 : i= 10,H1 :尸卩0 单侧检验的假设形式为:H0 : 1p

28、0, H1:卩0 (左侧检验)或者 H0: i 1 (右侧检验)选择检验统计量并计算结果直接应用原始数据检验假设是有困难的,必须借助于根据样本构造出来的统计量,而且针对不同的条件,需要选择不同的检验统计量确定显着性水平在假设检验中有可能会犯错误。如果零假设是正确的,却把它当成错误的加以拒绝,就会犯 a错误。a表示做出统计结论时犯错误的概率,称为显着性水平。显着性水平一般为0.05和0.01 o.做出统计结论根据已确定的显着性水平,查统计量的分布表,找到该显着性水平时统计量的临界值,并以 计算得到的统计量值与查表得到的临界值比较, 根据统计决断规则做出拒绝或接受零假设的 决定。例1:某小学历届毕

29、业生汉语拼音测验平均分数为 66分,标准差为11.7。现以同样的试题 测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试卷,算得平 均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?解:HO : (i= (10,H1 : (1(10学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。总体标准差已知,样本统计量的抽样分布服从正态,以Z为检验统计量显着性水平为5=0.05,双侧检验查表得Z a=1.96,而计算得到的Z=1.09CT|Z| VZ a,则概率 P0.05差异不显着,应在0.05显着性水平接受零假设结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致

30、,没有显着差异。双侧Z检验统计决断规则Z1与临界值比较P值显着性检验结果IZ 1 0.05不显着保留H0,拒绝H1在 0.05显着性水1.96 Z 1P 0.01显着*平拒绝H0,接受H1在 0.01显着性水IZ 1垦.58PW0.01极其显着*平拒绝H0,接受H1单侧Z检验统计决断规则IZ 1与临界值比较P值显着性检验结果IZ 1 0.05不显着保留H0,拒绝H1在 0.05显着性水1.65 Z 1P 0.01显着*平拒绝H0,接受H1在 0.01显着性水IZ 1233PW0.01极其显着*平拒绝H0,接受H13 平均数显着性检验的几种情形.总体为正态,总体标准差 c已知平均数的抽样分布服从

31、正态分布,以Z为检验统计量,其计算公式为:.总体为正态,总体标准差 c未知,样本容量小于30平均数的抽样分布服从t分布,以t为检验统计量,计算公式为: .总体标准差c未知,样本容量大于30平均数的抽样分布服从t分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z代替t近似处理,计算公式为:Z=XXS。X.总体非正态,小样本不能对总体平均数进行显着性检验。 n三、平均数差异的显着性检验平均数差异显着性检验的统计量及计算公式(一)两总体正态,两总体方差已知总体方差已知条件下,平均数之差的抽样分布服从正态分布,以z作为检验统计量,计算公式为:Z1.两样本独立XiX2SEDX2.两样

32、本相关两样本相关的判断:两个样本的数据之间存在着对应的关系时,称两样本为相关样本二是同一组常见的情形主要包括三种:一是同一组被试在前后两次在同一类测验上的结果;被试分别接受两种不同实验的测验结果;三是按条件相同的原则选择的配对实验结果 例1:某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(卢佝,结果平均智商为106一年后再对同组被试施测,结果平均智商分数为110。已知两次测验结果的相关系数为 r=0.74,问能否说随着年龄的增长和一年的教育,儿童智商有了显着提高?解:HO:卩1 w p2H1:卩1 p2正常儿童的智力测验结果,可以认为是从正态总体中随机抽出的样本。总体标准差已知,而同一组被

33、试前后两次的测验成绩,属于相关样本。因此平均数之差的抽样分布服从正态分 布,应选用Z作检验统计量,并选择相关样本、总体标准差已知的计算公式。提示:自=0-2 = 16显着性水平为a=0.05单侧检验时 Z 0.05=1.65,Z 0.01=2.33而计算得到的Z =1.71,Z 0.05 V|Z| VZ 0.0 1,则概率 0.05 P 0.01差异显着,应在0.05显着性水平接受零假设结论:可以说随着年龄的增长和一年的教育,儿童智商有了显着提高。(二)两总体正态,两总体方差未知总体方差未知条件下,平均数之差的抽样分布服从t分布,以t作为检验统计量,计算公式为:丄X1X2t =1 两样本独立两

34、总体方差一致方差齐性检验 方差齐性检验是对两总体方差是否齐性(即是否一致或是否存在显着性差异)进行的检验方差齐性检验的统计量是F,其概率分布遵循F分布。若从方差相同的两个正态总体中,随机抽取两个独立样本,以此为基础,分别求出两个相应 a 2总体方差的估计值,这两个总体方差的估计值的比值称为F比值,其计算公式为n1 s; / - 12n2S2 / n2 T12 实际应用中,常需以样本方差估计总体方差,因此公式申=S12当两样本容量相差不大时,上式可简化为F丁S;2、两样本独立,两总体方差不齐性对于方差不齐性的独立样本,平均数差异的显着性可能由两方面的原因造成:一是两平均数 确实存在显着差异;二是

35、两总体方差之间存在显着差异。当两总体的方差之间差异显着时,运用一般的 t检验不准确,需要进行特别的检验。总体方差不齐性的两个独立样本平均数之差的标准误,可用两个样本方差分别估计出的两个平均数标准误平方之和再开方来表示。这时样本平均数之差与相应总体平均数之差的离差统计量,既不是Z分布,也不是t分布,而是与t分布相近似的t 分布。这种检验方法被称为t检验,其统计量的计算公式为t临界值的计算公式t 3 总体方差未知1,独立样本和相关样本n2大于30 (或50)(三)两总体非正态,snE和总体标准差未知条件下,平均数之差的抽样分布服从 t分布,但样本容量较大,t分布SEd_X接近于正态分布,可以以Z近

36、似处理,因此以 z作为检验统计量,计算公式为X1 - X2“Xi X2两样本独立2号+乜_ 2 T F心2 Z四)总体非正态2小样本匚2二2第九章n:一、方差分析的基本原理及步骤两样本相关Z 一Xi - X2. X 烤 + S; - 2 r Si S2 苕能对平均数差异进行显着性检验。空.S;5 n21、方差:又叫均方,是标准差的平方,是表示变异的量方差分析通过对多组平均数的差异进行显着性检验,分析实验数据中不同来源的变异对总变 异影响的大小。2、方差分析的基本原理方差分析通过对多组平均数的差异进行显着性检验,分析实验数据中不同来源的变异对总变 异影响的大小。3、方差分析的逻辑因而它方差分析作

37、为一种统计方法, 是把实验数据的总变异分解为若干个不同来源的分量 所依据的基本原理是变异的可加性。在统计分析中,一般用方差来描述变量的变异性。 方差分析是将总平方和分解为几个不同来源的平方和(实验数据与平均数离差的平方和) 。 然后分别计算不同来源的方差,并计算方差的比值即F值。根据F值是否显着对几组数据的 差异是否显着做出判断。4、方差分析的基本过程提出假设选择检验统计量并计算分解平方和 SS 分解自由度 df 计算方差 MS 计算 F 值 作出统计结论并列方差分析表5、 方差分析的基本条件.总体正态分布.各实验处理是随机的且相互独立(一般情况下都能满足).各实验处理内方差一致(需要进行检验

38、)6、方差分析中的几个概念实验中的自变量称为因素。 只有一个自变量的实验称为单因素实验, 两个或两个以上称为多 因素实验。某一因素的不同情况称为因素的“水平” 。水平包括量差或质别两类情况,按各个“水平”条件进行的重复实验称为各种实验处理。如 果是单因素实验,则处理数就是水平数;如果是多因素实验,处理数就是各因素的水平数的 乘积。二、完全随机设计的方差分析 方差分析处理的一般是由多个实验组接受一个变量或多个变量的多种水平的实验结果, 是一 种多组实验设计。这种多组实验设计的类型常用的有组间设计、组内设计和混合设计等等。完全随机设计的方差分析,是单因素组间设计的方差分析为了检验某一个因素多种不同

39、水平间差异的显着性,将从同一个总体中随机抽取的被试,再 随机地分入各实验组,施以各种不同的实验处理之后,用方差分析法对这多个独立样本平均 数差异的显着性进行检验,称为完全随机设计的方差分析。完全随机设计的方差分析中,把各种变异的总和称为总变异,并把总变异分成两部分:一部 分称为组间变异,是在不同实验组之间表现出来的差异;另一部分称为组内变异,是在同一 实验组内部不同被试之间表现出来的差异。三、随机区组设计的方差分析随机区组设计的方差分析,是对多个相关样本平均数的差异进行显着性检验。在检验某一因素多种不同水平(即不同实验处理)之间差异的显着性时,为了减少被试间个别差异对结果的影响,把从同一个总体

40、中抽取的被试按条件相同的原则分成各个组(称为区组),使每个区组内的被试尽量保持同质。在对各区组施以多种实验处理之后,用方差分析法对这多个相关样本平均数差异所进行的显着性检验,称为随机区组设计的方差分析。1 区组:随机区组设计的原则是同一区组内的被试应尽量“同质”,每一区组内被试的人数分配有以下三种方式:.每一个被试作为一个区组,所有的被试都要分别接受各种实验 处理;每一区组内的被试人数是实验处理数的整倍数。同一区组内的每几个被试可以随 机接受同一种实验处理;以一个团体为一个基本单元。总之,就区组来说,每一个区组都接受所有的各种实验处理;就实验处理来说,每一种实验处理在各个区组中重复的次数相同。

41、随机区组设计的方差分析中,接受各种实验处理的是同一些区组,故个别差异可以从组内差 异中分离出来,从而减少由个别差异造成的误差,增加实验的信息,提高实验的效率。2 .变异来源 随机区组设计的方差分析将变异来源分解为组间变异、 区组变异和误差变异 三部分: SS T 二 SS B SS R ss E3 随机区组设计方差分析的计算公式总平方和SSr = X 2USX )组间平方和区组平方和公式中:R表示某一区组在某种处理的分数n表示区组数,K表示处理数误差平方和SS eSS t-ss b + ss r分解自由度总自由度可以分解为组间、区组和误差自由度:dfT = dfB + dfR + dfE总自由

42、度df nk -1组间自由度df k -1区组自由度dfR二n -1误差自由度dfE二- dfR组间方差 MSB二 SSb dfB区组方差误差方差计算F值组间方差与误差方差的F比值FMSbmse区组方差与误差方差的F比值 随机区组设计的方差分析表表9 - 1随机区组设计方差分析表变异来源平方和自由度方差F值概率组间变异ssbdfBMSBP区组变异ssrdfRmsrP误差变异SSEdfEMSE总变异SSTdfT随机区组设计的方差分析,根据实验设计的特点,把区组效应从组内平方和中分离出来。这时总平方和被分解为组间平方和、区组平方和、误差项平方和。与完全随机设计的方差分析相比,其最大优点是考虑到个别差异的影响(即区组效应),可以将这种影响从组内变异中分离出来,从而提高效率。但是这种设计也有不足,主要表现在 划分区组的困难上。如果不能保证同一区组内尽量同质,贝U有出现更大误差的可能。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!