SPSS中的缺失值分析

上传人:小** 文档编号:146714227 上传时间:2022-08-31 格式:DOC 页数:9 大小:519.50KB
收藏 版权申诉 举报 下载
SPSS中的缺失值分析_第1页
第1页 / 共9页
SPSS中的缺失值分析_第2页
第2页 / 共9页
SPSS中的缺失值分析_第3页
第3页 / 共9页
资源描述:

《SPSS中的缺失值分析》由会员分享,可在线阅读,更多相关《SPSS中的缺失值分析(9页珍藏版)》请在装配图网上搜索。

1、SPSS中的缺失值分析缺失值经常在下列一些情况出现:拒绝回答问题;没有答案;调查研究中的损耗;从多个数据源中合并数据。众所周知,在诸如收入、交通事故等问题的调查研究中,大量存在未回答的问题。以下是一些例子:在一项消费者经济状况调查中,28%的受访者没有回答收入情况;在一次人口调查中,20%的人没有回答收入情况,高收入者的回答率比中等收入者要低;在严重交通事故报告中,诸如是否使用安全带和酒精浓度等关键问题在很多个案中都没有记录。缺失值会表现为以下问题:有缺失值的个案系统地不同于完整的个案;有缺失值的个案表明信息不完整;标准统计方法只接受完整数据。以上问题意味着:偏向:分析结果可能会有偏差;无效:

2、较少的有效个案导致估计精度下降;某些情况下,诸如均值置换和列表删除等大量可用逼近方法可能过于天真,甚至是错误的统计学家研究出一个缺失值逼近方法,如极大似然逼近(maximunlikelihood,ML)。要使用ML,必须有数据模型和缺失值机制模型。数据模型可能是数据为多变量正态,缺失值机制模型可能是数据完全随机缺失(missingcompletelyatrandom,MCAR)或者随机缺失(missingatrandom,MAR)。下面给出这些术语的定义和描述:数据完全随机缺失(MissingCompletelyAtRandom,MCAR),表示缺失和变量的取值无关。例如,假设您在研究年龄和收

3、入。如果缺失和年龄或收入数值无关,则缺失值方式为MCAR。要评估MCAR是否为站得住脚的假设,您可以用比较回答者和未回答者的分布来评估观察数据。也可以使用单变量t-检验或LittlesMCAR多变量检验来进行更正规的评估。如果MCAR假设为真,可以使用列表删除(listwisedeletion)(完整个案分析),无需担心估计偏差,尽管可能会丧失一些有效性。如果MCAR不成立,列表删除、均值置换等逼近方法就可能不是好的选择。如果数据不为MCAR,可以考虑评估回答者和未回答者的特性差异是否能够用同时测度回答者和未回答者的变量来理解。这就引出了随时缺失(missingatrandom,MAR)的概念

4、,其中缺失分布中调查变量只依赖于数据组数中有记录的变量。继续上面的例子,考虑到年龄全部被观察,而且收入有时有缺失。这样,如果收入缺失值仅依赖于年龄,缺失值就为MAR。如果收入缺失值依赖于收入值,则既不是MCAR,也不是MAR。区别MCAR和MAR的含义在于:由于MCAR通常实际上很难遇到,应该在进行调查之前就考虑哪些重要变量可能会有非无效的未回答,还要尽量在调查中包括共变量,以便用这些变量来估算缺失值MCAR举例图一显示了相关系数为0.6的两个高斯变量X和Y的1000个观测值的散点图。假设对X和Y随机地删除了大约5%的回答。在这样的随机机制下,期望结果数据为MCAR。对结果变量XMISS和YM

5、ISS进行相关分析,相关系数用基于列表删除的方法来计算,期望这个相关是已知相关0.6的无偏估计。图二显示了SPSS相关分析的结果。CorrelationsXMISSYMISSXMISSPearsonCorrelation1.00CSiQ.(2-tailed).000N956907YMISSPearsonCorrelation.596*1.000SiQ.(2-tailed).000N907948Correlationissignificantatthe0.01levelFigure-2.在图二中,我们看到XMISS有956个有效观测值,YMISS有948个。经过列表删除以后,相关性用907个完整

6、个案来计算。相关系数为0.596,和已知值0.6非常接近。EMCorrelations3YMISS|XMISSYMI331.000.5951.000a.LittlesMCARtest:Chisquare=.270,df=2,Prob=.874Figure3.图三是在SPSSMVA中用极大似然估计计算的相关系数,以及LittlesMCAR检验。p-值为0.874,表示不具显著性。这样就不能拒绝零假设(数据为MCAR)。MAR举例图四显示了相关系数为0.6的两个高斯变量X和Y的400个观测值的散点图。通过随机地设置X值大于0的个案中40%的Y值缺失,以判断Y值的缺失对X值是否是偶然的,这样就形成了

7、缺失值结构MAR。lJ11.1=1-J1-I图五显示设为缺失(预示变量Ind等于1)的个案:图六只显示了回答完整的个案。-3-2-1012X图六通过列表删除,YMISS和X之间的相关系数是0.576(331个个案)图七显示了对Y变量缺失值进行均值置换的效果:DNH图七阐明了均值置换的一个主要问题:保持YMISS的均值时,YMISS和X之间的相关性是曲解的。均值置换的YMISS和X之间的相关系数为0.505(400个观测量)。假设不进行均值置换,而用YMISS对X的回归构造一个回归方程,然后预示YMISS缺失的个案的YMISS。图八显示了结果:天真的回归估算的问题是估算值的方差太小。回归估算的Y

8、MISS和X之间的相关系数为0.627,夸大了Y和X的相关系数。图九显示了在SPSSMVA中使用极大似然估计作出的估计相关性:EMCorrelationsYMISS1.000.5911.000a.LittlesMCARtest:Chisquare=64.874,d仁1,Prob=.000Figure9.估计值为0.591,与Y和X已知的相关系数0.6非常接近。请注意LittersMCAR检验非常具有统计显著性。由于数据被构造成展示MAR缺失值方式,我们不应对数据不是MCAR感到奇怪。最后,图10显示了使用SPSSMVA回归估算时YMISS和X的散点图。DM口口旳一芝ASPSSMVA回归估算是单步极大似然逼近,加入了保持相关结构的误差条件。回归估算的YMISS和X之间的相关系数为0.601,与已知值0.6非常接近。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!