5教育统计学第五章
LOGO第五章第五章 概率及概率分布概率及概率分布第一节 概率的一般概念第二节 二项分布第三节 正态分布 一、概率的定义一、概率的定义 1.后验概率(统计概率)的定义后验概率(统计概率)的定义 其中其中 是随机事件出现的频率是随机事件出现的频率 2.先验概率(古典概率)的定义先验概率(古典概率)的定义 其中其中n是全部基本事件的个数,是全部基本事件的个数,m是表现是表现A的基本事件的个的基本事件的个数。数。)()(limAnAWPnmWA)(nmPA 先验概率实在特定条件下直接计算出来的,是随机事件的先验概率实在特定条件下直接计算出来的,是随机事件的真实概率,不是由频率估计出来的。但是试验重复次数充分大真实概率,不是由频率估计出来的。但是试验重复次数充分大时,后验概率也接近先验概率。时,后验概率也接近先验概率。第一节第一节 概率的一般概念概率的一般概念 10)(AP 1uP0VP二、概率的性质二、概率的性质BABAPPP)()()(BABAPPP三、概率的加法和乘法三、概率的加法和乘法 设设P(A)=p(0pq,np5)时,二项分布接近正态分布。时,二项分布接近正态分布。四、二项分布的平均数和标准差四、二项分布的平均数和标准差npnpq例如例如P70。五、二项分布的应用五、二项分布的应用 二项分布在心理与教育研究中,主要用于解决二项分布在心理与教育研究中,主要用于解决含有机遇性质的问题。例如含有机遇性质的问题。例如P71。第三节第三节 正态分布正态分布一、正态曲线一、正态曲线1.正态曲线函数正态曲线函数222)(21XeY标准正态分布曲线函数标准正态分布曲线函数2221ZeY2.正态曲线正态曲线具有下列性质:具有下列性质:2、当、当 时达到最大值时达到最大值x 21fx离离 越远,越远,f(x)的值越小;的值越小;1、曲线关于、曲线关于 对称,对称,称为位置参数;称为位置参数;x3、曲线在、曲线在 处有拐点,以处有拐点,以ox轴为渐近线;轴为渐近线;4、越小,图形越高狭,越小,图形越高狭,Y落在落在 附近的概率越大。附近的概率越大。3.标准正态分布曲线标准正态分布曲线具有下列性具有下列性质:质:一、正态曲线的面积与纵线一、正态曲线的面积与纵线1.累积正态分布函数:累积正态分布函数:dxePXaaX222)()(212.标准正态分布曲线下面积的求法标准正态分布曲线下面积的求法3.正态分布曲线的纵线正态分布曲线的纵线正态分布表的编制正态分布表的编制 本书附表本书附表1的正态分布表的编制,是从的正态分布表的编制,是从Z=0 开始,逐渐开始,逐渐变化变化Z 值,计算从值,计算从Z=0 至某一定值之间的概率。这是因为正至某一定值之间的概率。这是因为正态分布为对称分布,且对称轴为过态分布为对称分布,且对称轴为过Z=0 点的纵线,故点的纵线,故Z0 当当时,其概率与时,其概率与Z0 时的相应的时的相应的Z 值下的概率值相等。值下的概率值相等。l 正态分布表的结构正态分布表的结构 正态分布表(参见附表正态分布表(参见附表1)一般包括三栏:第一栏是)一般包括三栏:第一栏是Z 值单位,一般标为值单位,一般标为Z。第二栏为密度函数或比率数值。第二栏为密度函数或比率数值(Y),即,即某一某一Z 值点上的曲线纵坐标的高度。第三栏为概率值(值点上的曲线纵坐标的高度。第三栏为概率值(P),),即某一即某一Z 值与值与 Z=0之间的面积之间的面积(概率)(概率)。正态分布表的编制与结构正态分布表的编制与结构(1)依据)依据 Z 值值求概率求概率(P),即已知,即已知Z值值求面积。求面积。求求Z 值值与平均数与平均数(Z=0)之间的概率;之间的概率;P(0Z1),P(Z1)求两个求两个Z 值值之间的概率之间的概率.P(-1Z1),P(1Z2)例如:某校例如:某校480个学生的语文成绩呈正态分布个学生的语文成绩呈正态分布,其平均数其平均数为为75,标准差为,标准差为10,问从理论上说,问从理论上说65至至83分之间应当有多分之间应当有多少人?少人?正态分布表的使用正态分布表的使用(2)已知已知概率求概率求Z值值,即从面积求,即从面积求Z值值。已知从平均数开始的概率值求已知从平均数开始的概率值求Z值;值;P(0Zz)=0.24857,求求z?P(zZ0)=0.05172,求求z?已知位于正态分布两端的概率值求该概率值分界点的已知位于正态分布两端的概率值求该概率值分界点的Z值;值;P(Zz)=0.05,求求z?若已知正态曲线下中央部分的概率,求若已知正态曲线下中央部分的概率,求Z值值。P(-zZz)=0.10,求求Y(z)?P(-zZz)=0.6,求求Y(z)?三、正态分布在测验记分方面的应用三、正态分布在测验记分方面的应用1.将原始分数转换成标准分数将原始分数转换成标准分数考试考试科目科目原始原始分数分数团体团体的平的平均数均数团体团体的标的标准差准差标准数分标准数分在团体中的位置在团体中的位置(在该分数之下的人数(在该分数之下的人数比例)比例)甲甲乙乙甲甲乙乙甲甲乙乙语文语文数学数学英语英语59756351797250746741092.250.10-0.440.250.500.560.987780.539830.329970.598710.691460.71226总和总和1972021.911.31总平均总平均0.640.440.738910.67003 标准分数的优点:标准分数的优点:l 各科标准分数的单位是绝对等价的各科标准分数的单位是绝对等价的;l 标准分数的数值大小和正负,可以反映某一考分在团标准分数的数值大小和正负,可以反映某一考分在团 体中所处的位置体中所处的位置.3.确定等级评定的人数确定等级评定的人数 例如,例如,100人某种能力呈正态分布,将其分成甲乙丙人某种能力呈正态分布,将其分成甲乙丙丁四个等距的等级,问各等级应有多少人?丁四个等距的等级,问各等级应有多少人?2.确定录取分数线确定录取分数线 例如,某项职业录取考试,考试人数为例如,某项职业录取考试,考试人数为1600人,录人,录取取200人,考试分数接近正态分布平均分数为人,考试分数接近正态分布平均分数为74分,标分,标准差为准差为11,问录取分数线是多少?,问录取分数线是多少?例如:张李老师对例如:张李老师对45位学生的书法作业进行评定,位学生的书法作业进行评定,由于两位老师的审美观和对评定标准的掌握不完全相由于两位老师的审美观和对评定标准的掌握不完全相同,对于学生同,对于学生A,张老师评给他甲等,李老师评给他,张老师评给他甲等,李老师评给他丙等;对于学生丙等;对于学生B,张老师评给他乙等,李老师评给,张老师评给他乙等,李老师评给他丙等试比较两位学生的书法作业成绩。他丙等试比较两位学生的书法作业成绩。4.品质评定数量化品质评定数量化评定评定的等的等级级评定者评定者张老师张老师李老师李老师n比率比率本组本组1/2以下面以下面积和积和本组本组1/2至至z=0的的面积面积中位中位数数n比率比率本组本组1/2以下面以下面积和积和本组本组1/2至至z=0的的面积面积中位中位数数甲甲乙乙丙丙丁丁戊戊11216610.244450.466670.133330.133330.022220.877780.522220.222220.888890.011110.377780.022220.277780.411110.488891.160.06-0.76-1.35-2.29512131230.111110.266670.288890.266660.066670.944450.755560.477780.200000.033340.444450.255560.022220.300000.466661.590.69-0.06-0.84-1.83总和总和451.00000451.00000计算张老师所评定各等级人数的比率计算张老师所评定各等级人数的比率计算本组计算本组1/2面积与本组以下面积之和面积与本组以下面积之和计算本组面积的平分点至计算本组面积的平分点至Z=0之间的面积之间的面积求平分各块面积的中位数求平分各块面积的中位数根据上述步骤,将张李老师所评定的等级转化成根据上述步骤,将张李老师所评定的等级转化成数量化分数后,在计算两位老师对一个学生等级数量化分数后,在计算两位老师对一个学生等级数量化分数的平均数,用以表示每个学生的成绩。数量化分数的平均数,用以表示每个学生的成绩。学生学生A等级数量化分数的平均数为等级数量化分数的平均数为 (1.16-0.06)/2=0.55学生学生B等级数量化分数的平均数为等级数量化分数的平均数为 (0.06-0.06)/2=0.00两生相比,两生相比,A生作业优于生作业优于B生作业。生作业。