欢迎来到装配图网! | 帮助中心 装配图网zhuangpeitu.com!
装配图网
ImageVerifierCode 换一换
首页 装配图网 > 资源分类 > DOC文档下载
 

SPSS中的缺失值分析

  • 资源ID:146714227       资源大小:519.50KB        全文页数:9页
  • 资源格式: DOC        下载积分:18积分
快捷下载 游客一键下载
会员登录下载
微信登录下载
三方登录下载: 微信开放平台登录 支付宝登录   QQ登录   微博登录  
二维码
微信扫一扫登录
下载资源需要18积分
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

SPSS中的缺失值分析

SPSS中的缺失值分析缺失值经常在下列一些情况出现:拒绝回答问题;没有答案;调查研究中的损耗;从多个数据源中合并数据。众所周知,在诸如收入、交通事故等问题的调查研究中,大量存在未回答的问题。以下是一些例子:在一项消费者经济状况调查中,28%的受访者没有回答收入情况;在一次人口调查中,20%的人没有回答收入情况,高收入者的回答率比中等收入者要低;在严重交通事故报告中,诸如是否使用安全带和酒精浓度等关键问题在很多个案中都没有记录。缺失值会表现为以下问题:有缺失值的个案系统地不同于完整的个案;有缺失值的个案表明信息不完整;标准统计方法只接受完整数据。以上问题意味着:偏向:分析结果可能会有偏差;无效:较少的有效个案导致估计精度下降;某些情况下,诸如均值置换和列表删除等大量可用逼近方法可能过于天真,甚至是错误的统计学家研究出一个缺失值逼近方法,如极大似然逼近(maximunlikelihood,ML)。要使用ML,必须有数据模型和缺失值机制模型。数据模型可能是数据为多变量正态,缺失值机制模型可能是数据完全随机缺失(missingcompletelyatrandom,MCAR)或者随机缺失(missingatrandom,MAR)。下面给出这些术语的定义和描述:数据完全随机缺失(MissingCompletelyAtRandom,MCAR),表示缺失和变量的取值无关。例如,假设您在研究年龄和收入。如果缺失和年龄或收入数值无关,则缺失值方式为MCAR。要评估MCAR是否为站得住脚的假设,您可以用比较回答者和未回答者的分布来评估观察数据。也可以使用单变量t-检验或Little'sMCAR多变量检验来进行更正规的评估。如果MCAR假设为真,可以使用列表删除(listwisedeletion)(完整个案分析),无需担心估计偏差,尽管可能会丧失一些有效性。如果MCAR不成立,列表删除、均值置换等逼近方法就可能不是好的选择。如果数据不为MCAR,可以考虑评估回答者和未回答者的特性差异是否能够用同时测度回答者和未回答者的变量来理解。这就引出了随时缺失(missingatrandom,MAR)的概念,其中缺失分布中调查变量只依赖于数据组数中有记录的变量。继续上面的例子,考虑到年龄全部被观察,而且收入有时有缺失。这样,如果收入缺失值仅依赖于年龄,缺失值就为MAR。如果收入缺失值依赖于收入值,则既不是MCAR,也不是MAR。区别MCAR和MAR的含义在于:由于MCAR通常实际上很难遇到,应该在进行调查之前就考虑哪些重要变量可能会有非无效的未回答,还要尽量在调查中包括共变量,以便用这些变量来估算缺失值MCAR举例图一显示了相关系数为0.6的两个高斯变量X和Y的1000个观测值的散点图。假设对X和Y随机地删除了大约5%的回答。在这样的随机机制下,期望结果数据为MCAR。对结果变量XMISS和YMISS进行相关分析,相关系数用基于列表删除的方法来计算,期望这个相关是已知相关0.6的无偏估计。图二显示了SPSS相关分析的结果。CorrelationsXMISSYMISSXMISSPearsonCorrelation1.00CSiQ.(2-tailed).000N956907YMISSPearsonCorrelation.596*1.000SiQ.(2-tailed).000N907948Correlationissignificantatthe0.01levelFigure-2.在图二中,我们看到XMISS有956个有效观测值,YMISS有948个。经过列表删除以后,相关性用907个完整个案来计算。相关系数为0.596,和已知值0.6非常接近。EMCorrelations3YMISS|XMISSYMI331.000.5951.000a.Little'sMCARtest:Chisquare=.270,df=2,Prob=.874Figure3.图三是在SPSSMVA中用极大似然估计计算的相关系数,以及Little'sMCAR检验。p-值为0.874,表示不具显著性。这样就不能拒绝零假设(数据为MCAR)。MAR举例图四显示了相关系数为0.6的两个高斯变量X和Y的400个观测值的散点图。通过随机地设置X值大于0的个案中40%的Y值缺失,以判断Y值的缺失对X值是否是偶然的,这样就形成了缺失值结构MAR。lJ11.1=1-J1-I图五显示设为缺失(预示变量Ind等于1)的个案:图六只显示了回答完整的个案。-3-2-1012X图六通过列表删除,YMISS和X之间的相关系数是0.576(331个个案)图七显示了对Y变量缺失值进行均值置换的效果:DNH图七阐明了均值置换的一个主要问题:保持YMISS的均值时,YMISS和X之间的相关性是曲解的。均值置换的YMISS和X之间的相关系数为0.505(400个观测量)。假设不进行均值置换,而用YMISS对X的回归构造一个回归方程,然后预示YMISS缺失的个案的YMISS。图八显示了结果:天真的回归估算的问题是估算值的方差太小。回归估算的YMISS和X之间的相关系数为0.627,夸大了Y和X的相关系数。图九显示了在SPSSMVA中使用极大似然估计作出的估计相关性:EMCorrelationsYMISS1.000.5911.000a.Little'sMCARtest:Chisquare=64.874,d仁1,Prob=.000Figure9.估计值为0.591,与Y和X已知的相关系数0.6非常接近。请注意Litter'sMCAR检验非常具有统计显著性。由于数据被构造成展示MAR缺失值方式,我们不应对数据不是MCAR感到奇怪。最后,图10显示了使用SPSSMVA回归估算时YMISS和X的散点图。DM口口旳一芝ASPSSMVA回归估算是单步极大似然逼近,加入了保持相关结构的误差条件。回归估算的YMISS和X之间的相关系数为0.601,与已知值0.6非常接近。

注意事项

本文(SPSS中的缺失值分析)为本站会员(小**)主动上传,装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知装配图网(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!