SPSS与次数分布及其数据检查

上传人:ba****u6 文档编号:143100587 上传时间:2022-08-25 格式:DOCX 页数:14 大小:368.68KB
收藏 版权申诉 举报 下载
SPSS与次数分布及其数据检查_第1页
第1页 / 共14页
SPSS与次数分布及其数据检查_第2页
第2页 / 共14页
SPSS与次数分布及其数据检查_第3页
第3页 / 共14页
资源描述:

《SPSS与次数分布及其数据检查》由会员分享,可在线阅读,更多相关《SPSS与次数分布及其数据检查(14页珍藏版)》请在装配图网上搜索。

1、Analyze、Graphs 部分用法1. Analyze 简要介绍Analyze是SPSS主要的分析工具,下面有多个菜单:报告二二 Rportsi描述性统计分析- Descriptive Statistics菜单-表格-Tables!-均数间的比较-Compare Means菜单!般线性模型General Linear Model 菜单i相关分析Correlate菜单-i多元线性回归与曲线拟合Regression菜单!-对数线性模型Loglinear菜单!聚类分析与判别分析lassify菜单ii因子分析与对应分析Data Reduction菜单 -:信度分析与多维尺度分析Scale菜单!非参

2、数检验Nonparametric Tests 菜单;I-时间序列分析-Time series-: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ I2.描述性统计分析(Descriptive Statistics )的用法描述性统计分析(Descriptive Statistics)是统计分析的第一步,做好这第一步是 下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析(比如说 GRAPH 中就直接可以做散点图)但专门为该目的而设计的几个模块则集中在 Descriptive Statistics (描述统计)菜单中,主要包括以下几种:Frequencies

3、(频数分布分析):频数分析过程,通过频数分布表、直方图、以及 集中趋势、离散趋势的各种统计量,描述数据的分布特征。(主要针对分类变量);Descriptives (描述性统计分析):数据描述过程,进行一般性的统计描述(主要 针对数值型变量),除了用来描述集中趋势和离散趋势的各种统计量之外(比方说均 值、标准差、最大值、最小值之外),还有个重要的功能就是对变量做标准化变化, 也就是Z变换。Explore (探索性分析):数据探察过程,用于对数据概况不清时的探索性分析, 主要作用是对数据进行初步检查,判断有没有极端值,是否符合正太分布等。探索分 析时在对数据的基本特征统计量有了初步了解的基础上,对

4、数据进行的更为深入详细 的描述性观察分析,在上面所进行的般描述性统计指标的基础上,增加了有关数据 的其他特征的文字与图形描述,显得更加细致与全面,有助于使用者对数据进行进 步分析的方案。Crosstabs :多维频数分布交叉表分析(列联表分析)Ratio statistics :比率分析F面对Frequencies (频数分布分析)、Explore (探索性分析)的用法进行介绍1 )频数分析(Frequencies):基本统计分析往往从频数分析开始。目的:通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用 的。基本任务:频数分析的第一个基本任务是编制频数分布表。即变量值落在某个

5、区间 (或某个类别)中的次数;频数分析的第二个任务是绘制统计图,可绘制的统计图包 括:条形图(Bar Chart,用宽度相同的条形的高度或长短来表示频数分布变化的图形, 适用于定序和定类变量的分析);饼图(Pie Chart,用圆形及圆内扇形的面积来表示 频数百分比变化的图形,以利于研究事物内在结构组成等问题);直方图( Histograms ,用矩形的面积来表示频数分布变化的图形,适用于定距型变量的分析)SPSS 基本操作:频数分析的基本操作( 1)选择菜单 AnalyzeDescriptive StatisticsFrequencies。(2 )将若干频数分析变量选择到Variable(s

6、)框中。3)单击 statistics集中趋势Add分布形态I |continue U&ncel , HelpFrequencies: Statiistics,i 7alusD are group midpointsrDlstrlDutionl_i Skewness KurtosisFerceniHe-aliiesit Central TendencyLMean| Median h l Sumequal groupsLI Quartiles.Cutpcirtsfor: Percntils s| Change |Remove |离散趋势输出百分位数: 端岀酚位瓶显示 25%、50%. 75%的百

7、分丄将數据平均分为所设定 的相等等佻可输入2-100的整数,如键入4则输 岀第25、50. ?5百分杭数 定义百分也数,可输 AO-10Q的整数。Maximum二 s.E. meancisperslcni Sttl. deviation Minmum | I Variance图Statistics对话框单击Chart按钮选择绘制统计图形,在Chart Values框中选择条形图中纵坐标 (或饼图中扇形面积)的含义,其中Frequencies表示频数;Percentages表示百 分比。图 Chart 对话框单击Format可得下面的对话框,对频数表中的排列顺序进行设置;此外可以选择处理多种变量

8、的方式。具体入下:处理多个变量的方式:第一种是界定 多个同一报表并列比较;第二个是界 定各变量分别处理报表输出Order by3 p选择频数表中排 列顺序丄按变量升序排 列,此为默认丄按变量降序排 列丄按变量各种取 值发生的频数的 升序排列丄按变量各种取 值发牛的频数的矣 Frequenci-es: Format就是某变量超过几个类别就不输出次数分布表,默认为10G帀分组已皓換辽)毎農对敕殛鉴包匸二二二二二二二-Spreadvs Levehvith LeveneTestFMone Power estimation TransFormed Powr Matural log Untransforr

9、nedCDndnij可 J cancelHelp图 explore-plot 对话框箱图(Boxplots )栏(单选项组)”:箱图,又称箱锁图。 按因子水平分组(Factor levels together,系统默认):选择此项,将为每 个因变量创建一个箱锁图,在每个箱锁图内根据分组变量的不同水平的取值创 建箱形单元。 不分组(Dependents together) ”:选择此项,将为每个分组变量的水平创 建一个箱锁图,在每个箱锁图内用不同的颜色区分不同因变量所对应的箱形单 元,方便用户进行比较。 无(None)”:选择此项,不创建箱图。描述性(Descriptive )栏”:选择该组内的

10、选项,可以生成茎叶图和(或)直 方图。 茎叶图(Stem-and-leaf,系统默认):茎叶图主要由3个部分组成,即频 率( Frequency)、茎(Stem)和叶(Leaf),在图中按从左到右的顺序依次 排列,在图的底端,注明了茎的宽(Stem Width )和每一叶所代表的观测量数( Each Leaf)。 直方图(Histogram) ”:直接绘制直方图 带检验的正态图(Normality plots with test,复选框)”:选择此项,将进行 正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。伸展与级别 Levene 检验(Spread vs level with L

11、evene Test )栏(单选项 组)”:对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归直 线的斜率及方差齐性的Leve ne检验,但如果没有指定分组变量,则此选项无 效。点击右侧 Option:Explore: Options曲探秦:趣竝失值continueCan celHelp-Missing values- Exclude cases listwiseO Exclude cases pairwise0 Report values按对排降个案芒抿告值迟图 explore-options在这个对话框中,可选择缺失值的处理方式,SPSS提供了 3种处理方式: 按列表排除个案(E

12、xclude cases listwise,系统默认)”:选择此项,对所有 的分析过程剔除分组变量和因变量中所有带有缺失值的观测量数据; 按对排除个案(Exclude cases pairwise)” :同时剔除带缺失值的观测量及与 缺失值有成对关系的观测量。在当前分析过程中用到的变量数据中剔除带有缺 失值的观测量数据,在其他分析过程中可能包含缺失值; 报告值(Report values) ”:选择此项,将分组变量的缺失值单独分为一组, 在输出频数表的同时输出缺失值。具体操作:了解男性企业员工在起薪变量上的分布是否符合正太性的假设,同时 检查数据中是否出现了极端值。操作步骤:第一步:选择男性:

13、 dataselect cases if condition is satisfied-continueok第二步:数据检验:analyze-descriptive statistics-explore选中起薪 begsal- 移到dependent list (因变量)中,这时还可以选中code移到label cases by中用作 报表输出时辨认极端值在数据文件中的编号在 statistics 中点击 discriptive,outliers-continuePlot-stem-a nd-leaf, n ormally plots with tests (正太图)-con ti nue 输

14、出结果分析:案例处理摘要案例有效缺失合计N百分比N百分比N百分比BEGSAL216100.0%00.0%216100.0%描述统计量标准误均值5226.6076.462均值的95%置信区间下限5075.89上限5377.315%修整均值5139.83中值4950.00BEGSAL 方差1262836.306标准差1123.760极小值3600极大值9996范围6396四分位距1248偏度1.334.166峰度2.039.330极值案例号CODE值1461758999624508669800最高3317377992441331979925477137800aBEGSAL2179213600220

15、64593600最低319024536004223754390052204913900ba. 上限值表中仅显示一部分具有值7800的案例。b. 下限值表中仅显示一部分具有值3900的案例。SPSS输出了 10个可能的极端值,(outlier )的统计结果,由表可知,可能的 极端值的编码最大者是原数据文件中的第461笔数据,他的员工识别码是758, 值为9996,其次依次是员工识别码为866、737、319、713的观察值,这是初步 的数据检查,那么观察者也可以进行进一步的检查数据,确定观察值在起薪这 个变量上是极端值的原因。图中下端注解的意思:编码值为7800的观察值,只 列出了一部分。正态性

16、检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.BEGSAI.142216.000.886216.000a. Lilliefors显著水平修正用来检验数据是否服从正太性的统计量为Kolmogorov-Smirnov,Kolmogorov-Smir nov当检验结果达到显著性水平时,可以拒绝原假设(原假设 为是正太性分布)Shapiro-Wilk,Shapiro-Wilk主要用于研究的样本为小样本时, 采用这个方法进行正太性检验,较不容易出现偏差。可以在表中看到,满足a=0.05,sig值的意思就是显著性(significance),也就 是

17、说不服从正太分布。BEGSAL Stem-and-Leaf PlotFrequency Stem & Leaf9.00366699999946.004000000000000000000000022222333333333333333444458.004555555555555555555555555556666666888888888888888888899999939.00511111111111112222223444444444444444444419.005555555567777777777812.00600000113333312.0066666666799998.0072222

18、22224.00755559.00 Extremes(=7800)Stem width:1000Each leaf:1case(s)茎叶图:Frequency :出现的次数;9.00 Extremes (=7800):大于7800的观察值共有9名,经与其他观察值相较后,都被 归于极值。Stem width: 1000,表示组距1代表1000。期軀專ifi:正太概率分布图,可以先将分布图表的右上角及左下角亮点的对角线画出,这 一45度角的对角线就是理论的正太累计概率分布线,再与圆圈构成的实际累计 概率分不限相比较,由图可知,圆圈构成的实际累计概率分布线偏离45度角对 角线特别多,因此违反正太分布

19、假设,不是正太分布。这与上面提到的 Kolmogorov-Smirnov 检验结果一致。10000-756*8668000=sooo-+000-了37 口口CC85 3190 796BEGSftL方格内的直线是中位数,中位线没有在方盒的中间位置,而是偏低一些,且下限的盒 须较上限段,表示观察值呈正偏态。圆圈代表该观察值可能为界外值(outlier)星号 表示该观察值可能是极值。3散点图除了上述提到的直方图、茎叶图之外, SPSS 还提供了相当多的绘图指令,在 Graphs 中可以做散点图,散点图也可以检验数据中存不存在极端值,通过散点图可以 比较直观地看出来,此外,散点图是描述变量之间关系的一

20、种直观地方法,可以从散 点图中直观地看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关。 也可以大致看出变量之间关系强度如何,但是具体的相关性还要根据后面相关分析中 的相关系数来判断。如果散点图显示你选的变量没有相关性,那么你就要重新去思考 你的研究是不是哪里出了问题。点击GRAPH,得到下面菜单栏:其中,提供了四中散点图模式:Simple :简单散点图,只显示一对相关变量的散点图;Matrix: 矩阵散点图 ,显示三 个相关变量之间的散点图;Simple dot :简单点图,只显示一个变量的点图。Overlay :重叠散点图,可显示多个相关变量的散点图。3-D :三维散点图,显示三个相关变量之间的散点图。在实际应用中我们多选用简单散点图,选中simple,然后点击define,进入简单散 点图窗口。实际例子操作:起薪与目前薪资的交叉散点图操作步骤:选择simple ;现在薪酬一Y,基本薪酬-X,title写标题:Linel :目前薪资对起薪的交叉散点图;Subtitle : 474企业员工;3M00-圈圈表示有多少个观察值,在这个结果中我们可以看到,大致呈现从右上 到左下的椭圆形分布,同时分布点颇为集中,而且也没有出现语种不同的极端 值,可以大致推测下目前薪资与起薪之间应该是正相关的关系,而且相关强度 不弱。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!