心理测量学第三章和第四章.ppt

上传人:za****8 文档编号:14114457 上传时间:2020-07-03 格式:PPT 页数:68 大小:330.56KB
收藏 版权申诉 举报 下载
心理测量学第三章和第四章.ppt_第1页
第1页 / 共68页
心理测量学第三章和第四章.ppt_第2页
第2页 / 共68页
心理测量学第三章和第四章.ppt_第3页
第3页 / 共68页
资源描述:

《心理测量学第三章和第四章.ppt》由会员分享,可在线阅读,更多相关《心理测量学第三章和第四章.ppt(68页珍藏版)》请在装配图网上搜索。

1、第三章经典测验理论的基本假设,主讲:许莹电邮:,2020/7/3,2,第一节心理特质及其可测性假设,2020/7/3,3,一、心理特质的含义,内涵表现在一个人身上所特有的相对稳定的行为方式为人的心理特质(trait)。理解特质是一组具有内部相关的行为的概括,具有一定的抽象性,如善良、聪明。比较稳定,对不同的刺激做相同的反应;,2020/7/3,4,特质是一个人身上比较稳定的特点。一个人的精神面貌(人格)是由多种特质分多个层次有机组合而成的。智力可以分语言和操作,语言可以分为词汇和文法。特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。,2020/7/3,5,二、心理特质的可测

2、性,Thorndike“凡客观存在的事物都有其数量。”McCall“凡有数量的东西都可以测量。,2020/7/3,6,第二节测量误差及其来源,2020/7/3,7,一、测量误差的含义,定义在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。理解测量误差由那些与测量目的无关的变因所致测量误差表现为不准确或不一致两种方式。,2020/7/3,8,二、测量误差的种类,系统误差:由与测量目的无关的变因引起的一种恒定而有规律的效应(稳定);随机误差:由与测量目的无关的、偶然因素引起、而又不易控制的误差(不稳定)。,2020/7/3,9,(一)测量工具(测验内部)引起的误差题目

3、取样(影响最大)指导语难度时限测验复本不等值,三、测量误差的来源,2020/7/3,10,(二)由测量对象引起的误差(最复杂最难控制的误差)测验的经验练习因素应试动机测验焦虑反应定势生理因素,2020/7/3,11,(三)由施测过程引起的误差物理环境主试者方面意外干扰评分计分,2020/7/3,12,第三节真分数及其有关的假设,2020/7/3,13,一、真分数的含义,真分数(TrueScore):一个测量工具在没有测量误差时,所得到的纯正值。操作定义:经过无数次测量所得到的平均值。观察分数(ObservedScore):实测分数,2020/7/3,14,某一物理测量数据,(1)实测重量=真实

4、重量+误差(2)误差之和为零(3)实测重量的平均值=真实重量的平均值,2020/7/3,15,二、数学模型及其假设(一)CTT的数学模型经典测验理论假定,观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记为E)。即X=T+E(二)3个相关联的假设公理1.若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。即:E(X)=T或E(E)=02.真分数和误差分数之间的相关为零。即:(T,E)=0,2020/7/3,16,SX2,ST2,3.各平行测验上的误差分数之间相关为零。即(E1,E2)=0,SX2=ST2+SE2ST2=SV2+S

5、I2SX2=SV2+SI2+SE2,2020/7/3,17,第四章测量信度,2020/7/3,18,请列举一些你所使用过或接触过的量表,思考:量表的作用是什么?,2020/7/3,19,你如何解释下述现象?,一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值,2020/7/3,20,量表帮助我们了解心理现象(心理特质),就像尺子帮助我们测量身高。,思考:我们如何知道我们有多高?有两个工具:尺子/秤,2020/7/3,21,尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具效度。,什么材料的尺

6、子?钢铁(热胀冷缩)涉及到一致性的问题。信度,2020/7/3,22,1.70=1.7?,2020/7/3,23,量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差是不可避免的,但误差要控制在一个许可的范围内。,2020/7/3,24,回顾,什么是误差?误差的种类有哪些?,2020/7/3,25,第一节信度概述一、什么是信度?信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。操作定义:指真实方差除以测量方差所得的商.注意:(1)信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性;(2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,

7、只能根据一组实得分数作出估计。,2020/7/3,26,三种等价的信度定义,定义一信度乃是一个被测团体真分数的变异数(方差)与实得分数的变异数(方差)之比。如果他们的比率是.87,说明了什么?,测量方差的87%属于真实方差,2020/7/3,27,2020/7/3,28,信度的定义二,信度乃是一个被测团体真分数与实得分数的相关系数的平方。rXX=P2TX思考:相关系数的平方?,2020/7/3,29,2020/7/3,30,信度的定义三,信度乃是一个测验X与它的任意一个平行测验X的相关系数。rXX=PXX,2020/7/3,31,A卷:你是一个喜欢热闹的人吗?,1=绝对是2=是3=不一定4=不

8、是5=绝对不是,2020/7/3,32,B卷:你是一个喜欢安静的人吗?,1=绝对是2=是3=不一定4=不是5=绝对不是,2020/7/3,33,二、信度系数与信度指数,信度指数:相关系数信度系数:相关系数的平方注意:(1)信度系数有多种。(2)同一种信度系数也会因样本、测查时间不同而有多个。(3)信度系数只是对测量分数一致性的估计,但并没有指出不一致的原因。(4)获得较高的信度只是测验有效的必要条件。,2020/7/3,34,三、信度的作用,1信度是测量过程中所存在的随机误差大小的反映2信度可以用来解释个人测验分数的意义SE=Sx1rxx真分数的置信区间(95%)=X1.96SE3信度可以帮助

9、进行不同测验分数的比较,2020/7/3,35,注意:信度参照的是测验分数或测量值,而非测验本身。测验由题目组成,而这些题目本身并不能提供信度的估计值。估计信度前必须先进行施测和计分。,2020/7/3,36,第二节信度的估计方法,一、重测信度(稳定系数)1含义和计算同一量表,同一被试群体,在不同时间,两次施测,求其相关。皮尔逊积差相关系数2使用的前提条件所测量的心理特质必须是稳定的;(人格测验)练习和遗忘的效果基本上相互抵消;在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。,2020/7/3,37,3.实质:表示测验结果的稳定性。故称之为稳定性系数(Coeffi

10、cientofStability)4.形式:施测适当时间再施测,2020/7/3,38,5.时间间隔的把握一个校区每年都对学生进行IQ测验,而另一个校区则两年一次。第一个校区的老师可能认为IQ测验的分数在一年中会保持稳定,所以有必要进行再测,因为学生在一年后的回答可能不一致。第二个校区的老师则认为在一年中分数并没有明显的波动,那么施测的频率没有必要高于两年一次。哪种结果正确呢?取决于第一年和第二年成绩的相关。通常来说,大约为0.80或0.90,且保持相对稳定(Bayley,1949)所以,频率没必要高于两年一次。,2020/7/3,39,间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、

11、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)适用于速度测验和人格测验,而不适用于难度测验.,2020/7/3,40,注意:同样一个量表,随着第二次测量的时间不同,它可以有不同的重测信度,在报告重测信度时,要说明两次施测的间隔,以及在此期间内被试的有关经历。在中国修订韦氏儿童智力量表手册(C-WISC)中,就曾对重测信度的计算报告了被试情况(6-16岁城市儿童151名,农村儿童74名且各年龄儿童分配较均匀),并报

12、告了两次测验的间隔(2-7周)及两次的相关系数(城市:0.59-0.86,农村:0.56-0.81)。,2020/7/3,41,二、复本信度1含义和计算复本信度(Alternate-formreliability)是指两个平行的测验测量同一批被试所得结果的一致性程度。复本等值要符合下列条件:各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。,2020/7/3,42,2使用的前提条件两测验真正平行;被试要有条件接受两个测验。(

13、时间,经费的限制)等值性系数:同时连续施测,反映内容变异。形式:复本A最短时间复本B稳定性与等值性系数:时间间隔施测,内容变异重测信度误差形式:复本A适当时间复本B,2020/7/3,43,3.缺点:,只能减少而不能完全排除练习和记忆的影响.对许多测验来说,建立复本是相当困难的.4.误差来源:测验的两种形式是否等值:测题取样是否匹配,格式是否相同,内容、题数、难度、平均数、标准差是否一致;被试方面情绪波动、动机变化等;测验情景的变化;偶发因素的干扰。,2020/7/3,44,三、分半信度,1含义和计算分半信度(split-halfreliability)是指将一个测验分成对等的两半后,所有被试

14、在这两半上所得分数的一致性程度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高,2020/7/3,45,分半信度(Split-HalfReliability),被试在两半测验上得分的相关系数只是半个测验的信度,还必须用斯皮而曼布朗公式校正校正公式:斯皮尔曼-布朗公式rxx=2rhh/(1+rhh)但只能在两半测验分数的变异数(sa2、Sb2)相等时才能用。,2020/7/3,46,弗朗那根公式:rxx=21-(sa2+Sb

15、2)/Sx2卢仑公式:rxx=1-Sd2/Sx22使用的前提条件,2020/7/3,47,例题:,100个题目,分半信度r.70,整个测验的估计信度是多少?,2020/7/3,48,四、同质性信度,1.含义同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。同质性信度(homogeneityreliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。2计算及适用范围rxx=Krij/1+(K-1)rij,2020/7/3,49,KR20公式(仅适用于(0,1)记分的测验)rxx=K/(K-1)1-(piqi)/Sx2pi

16、为答对第i题的人数的比例;qi为答错第i题的人数的比例。K为题目数,Sx2为测验总分的变异。KR21公式(所有题目难度接近时才适用)rxx=K/(K-1)1-(Kpq)/Sx2,2020/7/3,50,克龙巴赫系数(可处理任何内部一致性系数的计算问题)=K/(K-1)1-(Si2)/Sx2菏伊特信度:rxx=1-MS人题/MS人一般用于预测的测验或学绩测验可不考虑同质性。而验证理论构想时必须考虑同质性。因此,同质性不但与信度有关,还与效度有关。,2020/7/3,51,五、评分者信度1含义和计算评分者信度(scorerreliability)是指多个评分者给同一批人的答卷进行评分的一致性程度。

17、在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高2人时:最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。相关系数,2020/7/3,52,多人时:肯德尔和谐系数W=12Ri2-(Ri)2/N/K2(N3-N)(K=320;N=37时,查W表检验)RI为第i个被试被评的水平等级之和若N7,用2检验。2=K(N-1)W,df=N-1若评分中有相同等级时,需校正:W=

18、12Ri2-(Ri)2/N/K2(N2-N)-K(n3-n)/12,2020/7/3,53,一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。,2020/7/3,54,各种信度系数相应误差变异的来源,2020/7/3,55,估计信度的方法与测验复本的数目以及施测次数的关系,2020/7/3,56,在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。,2020/7/3,57,假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的AB两个复本,所得的等值性与稳定性系数为0.7

19、0。我们还根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正)。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误差变异进行分析。,2020/7/3,58,一个假想测验的误差变异来源分析,2020/7/3,59,一个假想测验的误差变异来源分析,第三节提高测量信度的方法,2020/7/3,61,一、影响测量信度的主要因素(2007心理学统考真题:),(一)被试方面1、单个被试:身心健康情况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差,它们会影响被试心理特质

20、水平的稳定性。2、被试团体:(1)被试团体同质性越高(个体差异越小),所得相关系数(信度)就越低。(2)被试团体异质性越高(个体差异越大),所得相关系数(信度)就越高。,2020/7/3,62,不能认为当该测验在一个团体中有较高的信度时,在另一个团体也具有较高的信度。当将测验用于异质性团体时,用下面的公式推算出新的信度系数。rnn=1-So2(1-roo)/Sn2roo为用于原团体的信度,rnn为用于异质程度不同的团体的信度,Sn为异质程度不同的团体的分数分布的标准差,So为原团体的的分数分布的标准差某测验的被试为25年级的小学生,已知信度是0.85,标准差为10,现欲知道仅用于4年级时信度是

21、多少,4年级的标准差是5。(0.4),2020/7/3,63,(二)主试方面施测者:指导语、态度、期望等评分者:评分标准(三)施测情境考场是否安静,光线和通风,设备,桌面,空间等(四)测量工具测验内容:试题取样不当,内部一致性低,题意模糊,信度则低。如:押题,2020/7/3,64,测验长度:测验越长,信度越高。rkk=Krxx/1+(K-1)rxxK为改变后的测验长度与原来长度之比,rxx为原测验的信度,rkk为测验长度增加为k倍后测验的信度。测验难度:过难或过易都会使个体间得分差异减小,降低信度。(五)两次施测的间隔时间间隔时间越短,信度越高;间隔时间越长,信度越低。,2020/7/3,6

22、5,二、提高测量信度的常用方法(一)适当增加测验的长度1.新增项目必须与试卷中的原有项目同质。2.新增项目的数量必须适度。(二)使测验中所有试题的难度接近正态分布,并控制在中等水平(三)努力提高测验试题的区分度(四)选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度(五)主试者严格执行施测规程,评分者严格按照标准给分,施测场地按测验手册的要求进行布置,减少无关因素的干扰,2020/7/3,66,三、信度的特殊问题1速度测验的信度问题因为速度测验的题目难度都很低,所以不能用奇偶分半求分半信度;可以将测验分两半来施测。因为几乎不可能把题目做完,所以同质性信度不适用。可以用重测信度和复本信度

23、。2标准参照测验的信度问题总体越同质,相关系数越低。用复本,通过人数的百分比差别越小,信度越高。,2020/7/3,67,3分测验的信度除整个测验的信度外,各个分测验也应有信度,否则,从分测验得分来做推论就会出问题。4差异的信度比较两门课成绩的差异,若两门课的信度都不可靠时,二者的差别更不可靠。5行为改变(变迁)的测量,2020/7/3,68,四、信度好坏的判断标准标准化能力或学绩测验:0.90人格测验:0.80教师自编学绩测验:0.60五、测验使用时的信度标准一般来说,当信度0.70,测验不能用于对个人作出评价与预测,而且不能作团体间比较;当0.70信度0.85时,可用于团体比较;当信度0.85时,才能用来鉴别或预测个人成绩。,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!