素质量化的方法课件

上传人:沈*** 文档编号:172184802 上传时间:2022-12-01 格式:PPT 页数:33 大小:419KB
收藏 版权申诉 举报 下载
素质量化的方法课件_第1页
第1页 / 共33页
素质量化的方法课件_第2页
第2页 / 共33页
素质量化的方法课件_第3页
第3页 / 共33页
资源描述:

《素质量化的方法课件》由会员分享,可在线阅读,更多相关《素质量化的方法课件(33页珍藏版)》请在装配图网上搜索。

1、素质量化的方法素质量化的方法本章内容本章内容量化的必要性量化的必要性数据的收集数据的收集数据的分析数据的分析一、量化的必要性一、量化的必要性二、数据收集二、数据收集2.1 2.1 定义变量定义变量2.2 2.2 变量的测量层次变量的测量层次2.3 2.3 观察数据观察数据抽样调查:问题和可能性抽样调查:问题和可能性2.4 2.4 问卷设计中常出现的问题问卷设计中常出现的问题2.5 2.5 数据文件的格式数据文件的格式2.1 2.1 定义变量定义变量 数据收集的第一个工作,就是要清楚测量和数据收集的第一个工作,就是要清楚测量和收集什么。你要将你的研究问题转化为用变收集什么。你要将你的研究问题转化

2、为用变量的语言来描述,并且要对变量进行清楚的量的语言来描述,并且要对变量进行清楚的定义。定义。例如:思考一下,假设你已经为人父母,当例如:思考一下,假设你已经为人父母,当要求你回答这个问题的时候,你有什么困惑。要求你回答这个问题的时候,你有什么困惑。“在你家庭中有多少个孩子?在你家庭中有多少个孩子?”2.1 2.1 定义变量定义变量至少存在以下问题:至少存在以下问题:(1 1)孩子是否应该小于)孩子是否应该小于1818周岁?周岁?(2 2)孩子是仅仅指亲生子女,还是包括养子养)孩子是仅仅指亲生子女,还是包括养子养女?过继的算不算?对于不和亲生父母生活在女?过继的算不算?对于不和亲生父母生活在一

3、起的孩子算不算?父母离了婚而共同抚养的一起的孩子算不算?父母离了婚而共同抚养的孩子怎么算?孩子怎么算?所以要对所以要对“孩子孩子”这个变量做清楚的界定。这个变量做清楚的界定。思考:这个调查问题存在什么问题:思考:这个调查问题存在什么问题:“请问贵企业的销售收入是多少?请问贵企业的销售收入是多少?_”2.2 2.2 变量的测量层次变量的测量层次思考题思考题:以下收集到的数据,可以进行以下收集到的数据,可以进行“”,“”,“、”,“,”中的哪些运算?中的哪些运算?l 五个人的性别:五个人的性别:1 1,0 0,0 0,1 1,1 1(1 1:男性;:男性;0 0:女性):女性)l 五个人的身高:五

4、个人的身高:170170,173173,165165,180180,161161(单位:(单位:厘米)厘米)l 七天的气温(摄氏温度七天的气温(摄氏温度):):1515,2424,2727,1818,3434,3030,1919。l 五个人对一项政策满意程度的评分:五个人对一项政策满意程度的评分:5 5,3 3,3 3,4 4,2 2 (1 1:十分不满意;:十分不满意;2 2:不满意;:不满意;3 3:一般或中立;:一般或中立;4 4:满意;满意;5 5:十分满意):十分满意)2.2 2.2 变量的测量层次变量的测量层次按照数据适合的运算规则,统计学将数据(或变量)按照数据适合的运算规则,统

5、计学将数据(或变量)划分为四个层次:划分为四个层次:定类数据(变量)定类数据(变量)。它仅仅是一种标志,取数值仅仅。它仅仅是一种标志,取数值仅仅是用以区分变量中的类型名称。是用以区分变量中的类型名称。不适合任何四则运算不适合任何四则运算和大小运算和大小运算。定序数据。定序数据。定序数据值定序数据值能够比较大小,不能够做加减能够比较大小,不能够做加减乘除运算乘除运算,它表示一种次序。,它表示一种次序。定距数据。定距数据。这类数据这类数据可以做大小比较以及加减运算,可以做大小比较以及加减运算,不能做乘除运算不能做乘除运算。数据之间的距离是相等的。其根本。数据之间的距离是相等的。其根本特征是,数据中

6、的特征是,数据中的0 0不是物理客观存在的,而是人为不是物理客观存在的,而是人为设定的。例如:温度测量值就是定距。设定的。例如:温度测量值就是定距。定比数据。定比数据。定比数据是数据中最高层次的测度等级。定比数据是数据中最高层次的测度等级。这类数据这类数据可以做大小比较和加减运算外,还可以做乘可以做大小比较和加减运算外,还可以做乘除运算除运算。这时的。这时的0 0值不是人为确定的,而是物理客观值不是人为确定的,而是物理客观存在的。例如:人的身高数据、体重数据。存在的。例如:人的身高数据、体重数据。2.2 2.2 变量的测量层次变量的测量层次思考题:思考题:1 1)我们用一个量表测量人们对一项法

7、律的态度,如我们用一个量表测量人们对一项法律的态度,如果果1 1表示不赞成,表示不赞成,2 2表示无所谓,表示无所谓,3 3表示赞成,对于表示赞成,对于3 3个人我们测得的值分别为:个人我们测得的值分别为:3 3、1 1、2 2,这些数据为,这些数据为_定序定序_ _数据。数据。2 2)测量测量1010个大学生所在的年级,如果用个大学生所在的年级,如果用1 1表示大一、表示大一、2 2表示大二、表示大二、3 3表示大三、表示大三、4 4表示大四、表示大四、5 5表示其他。表示其他。测量的值为:测量的值为:1 1、3 3、4 4、1 1、2 2、3 3、2 2、1 1、1 1、4 4,这,这些数

8、据为些数据为_定序定序_数据。数据。3 3)测得测得5 5个人的第一次结婚年龄(单位:周岁)为:个人的第一次结婚年龄(单位:周岁)为:2020、2222、2424、3030和和2626,这些数据为,这些数据为_定序定序_数据。数据。2.2 2.2 变量的测量层次变量的测量层次注意三点:注意三点:SPSSSPSS中将定距数据和定比数据合并为一类,叫中将定距数据和定比数据合并为一类,叫刻度刻度级数据级数据。所以。所以SPSSSPSS的数据测量层次只有三种的数据测量层次只有三种。一项统计方法适合低级别的数据,也适用于高级别一项统计方法适合低级别的数据,也适用于高级别的数据。但反过来不存立。例如我们可

9、以计算身高的数据。但反过来不存立。例如我们可以计算身高数据的均值,但不能计算五个人性别的均值。数据的均值,但不能计算五个人性别的均值。在社会科学研究对在社会科学研究对定序数据的处理定序数据的处理有两种方式:一有两种方式:一是将其作为定类数据看待;另一是将其作为刻度级是将其作为定类数据看待;另一是将其作为刻度级数据看待。数据看待。2.3 2.3 观察数据观察数据抽样调查抽样调查定义:凡是在获得数据的过程中,定义:凡是在获得数据的过程中,不对被调不对被调查对象数据产生的条件施加任何控制查对象数据产生的条件施加任何控制所得到所得到的数据,称为观察数据。的数据,称为观察数据。两种方式:普查与抽样调查。

10、两种方式:普查与抽样调查。普查普查(Census)(Census):就是收集总体中的所有个体的:就是收集总体中的所有个体的数据。数据。抽样调查(抽样调查(SamplingSampling):是在总体中选择出一:是在总体中选择出一个样本,然后对样本中的个体进行调查,从个样本,然后对样本中的个体进行调查,从所了解的样本数据来推断总体情况。所了解的样本数据来推断总体情况。抽样调查的优点抽样调查的优点:经济性。经济性。时效性强。抽样调查可以迅速、及时地获取到所时效性强。抽样调查可以迅速、及时地获取到所需要的信息。需要的信息。准确性高。准确性高。抽样调查的一个原则抽样调查的一个原则“确信锅里的汤被搅拌均

11、匀确信锅里的汤被搅拌均匀”样本的两种类型:样本的两种类型:随机样本方便样本。随机样本方便样本。思考题:思考题:有时候杂志要求读者回答某些问题并寄回答案,有时候杂志要求读者回答某些问题并寄回答案,从而构成一个样本。从而构成一个样本。请问这个样本能不能代表读请问这个样本能不能代表读者群总体?为什么?者群总体?为什么?抽样调查的方法:抽样调查的方法:(1)简单随机样本)简单随机样本(2)分层抽样)分层抽样(3)等距离抽样)等距离抽样(4)整群抽样)整群抽样思考题:思考题:假如你要调查广州市市区内的居民假如你要调查广州市市区内的居民月收入,假设抽样容量为月收入,假设抽样容量为1000。你如何展。你如何

12、展开抽样?开抽样?2.4 2.4 问卷设计中常出现的问题问卷设计中常出现的问题问卷长度不能太长,一般来说不要超过问卷长度不能太长,一般来说不要超过3页页A4纸,纸,问卷能够让被调查人在问卷能够让被调查人在1520分钟完成是最好分钟完成是最好的。的。用词要通俗易懂,如果涉及到专业词语尽量转化用词要通俗易懂,如果涉及到专业词语尽量转化为普通人能理解的词语,如果实在没办法,你要为普通人能理解的词语,如果实在没办法,你要对其进行解释。对其进行解释。用词要确切。就是说要让填问卷的人读到你的问用词要确切。就是说要让填问卷的人读到你的问题和答案没有偏差。这可以通过题和答案没有偏差。这可以通过6W准则来保证:

13、准则来保证:Who,Where,When,Why,What,How。避免诱导性提问。也就是提问的问题不能带有倾避免诱导性提问。也就是提问的问题不能带有倾向性,应该保持中立。例如向性,应该保持中立。例如l大多数人认为北京大学是中国最好的高校,你觉得怎样?大多数人认为北京大学是中国最好的高校,你觉得怎样?您觉得北京大学在全国高校综合排名中可以排第几?您觉得北京大学在全国高校综合排名中可以排第几?避免双重否定形式的提问。避免双重否定形式的提问。l1992 “在你看来,在你看来,纳粹对犹太人的灭绝从未发生过纳粹对犹太人的灭绝从未发生过是是可能的还是不可能的可能的还是不可能的”(22怀疑)怀疑)l199

14、4“在你看来,在你看来,纳粹对犹太人的灭绝从未发生过纳粹对犹太人的灭绝从未发生过可可能吗?还是你确信它发生过?能吗?还是你确信它发生过?”(1)注意问题所在的位置。不要将敏感性问题放在问卷注意问题所在的位置。不要将敏感性问题放在问卷的前面,要结束调查时的问题要短且简单。的前面,要结束调查时的问题要短且简单。注意调查员的影响。调查设计者要尽量让调查员和注意调查员的影响。调查设计者要尽量让调查员和被调查者在人口统计特征,如:年龄、性别、种族被调查者在人口统计特征,如:年龄、性别、种族等,相近。特别是一些敏感问题。例如你要调查女等,相近。特别是一些敏感问题。例如你要调查女性对化妆品的看法,找男性去就

15、不合适。性对化妆品的看法,找男性去就不合适。2.5 2.5 数据文件的格式数据文件的格式编号编号年龄年龄性别性别年收入年收入(万元)(万元)态度态度120033227162338153三、数据分析三、数据分析初步整理初步整理离散分析离散分析相关性分析相关性分析差异性检验差异性检验回归分析回归分析3.1 3.1 初步整理初步整理统计表统计表频数分布表、累积频数、累积百分比频数分布表、累积频数、累积百分比统计图统计图频数分布图频数分布图频次和频率频次和频率所谓频次所谓频次就是一个特定数据值在整个数据集合就是一个特定数据值在整个数据集合中出现的次数。中出现的次数。频率频率就是某个特定数据值出现的频次

16、与数据集就是某个特定数据值出现的频次与数据集合的数据总数之比。合的数据总数之比。一个延伸的概念是一个延伸的概念是累积频率累积频率,当数据的测量层,当数据的测量层次在定序级以上时,次在定序级以上时,设设x1 x2 xm,是,是样本数据集合中的不重复的样本值样本数据集合中的不重复的样本值(mn样本个样本个数数)。若把样本值若把样本值小于等于某个样本数据小于等于某个样本数据xi 的的频率值,都累加起来,就得到频率值,都累加起来,就得到“小于等于小于等于xi”的的累积频率累积频率饼型图、条形图、茎叶图和直方图饼型图、条形图、茎叶图和直方图直方图与茎叶图的区别:直方图与茎叶图的区别:直方图和茎叶图都用来

17、展示直方图和茎叶图都用来展示刻度级刻度级的数据,的数据,茎叶图类似于横放的直方图。但是茎叶图类似于横放的直方图。但是直方图主要直方图主要用于对原始数据进行分组后的展示用于对原始数据进行分组后的展示(当然,分(当然,分组这个过程可以有组这个过程可以有SPSS自动完成),而自动完成),而茎叶茎叶图主要对于原始数据的展示图主要对于原始数据的展示。同时,。同时,茎叶图既茎叶图既能给出数据的分布,又能给出每一个原始数据能给出数据的分布,又能给出每一个原始数据值,即保留了原始数据的信息值,即保留了原始数据的信息。而直方图不能。而直方图不能给出原始的数值。给出原始的数值。茎叶图茎叶图茎叶图茎叶图3.2 3.

18、2 离散分析离散分析中位数、众数、平均数中位数、众数、平均数极差极差方差、标准差、变异系数方差、标准差、变异系数中位数、众数、样本均值中位数、众数、样本均值中位数中位数:就是将资料排序(从大到小,从小:就是将资料排序(从大到小,从小到大都可)后,居于中间位置的那个数称为到大都可)后,居于中间位置的那个数称为中位数。用中位数。用 表示。表示。eM当当n为奇数的时候为奇数的时候1()2enMx当当n为偶数的时候为偶数的时候()(1)222nnexxM区别:一般来说,区别:一般来说,众数适合于定类数据;中位数众数适合于定类数据;中位数适合于定序数据及其以上的数据;均值适合于样适合于定序数据及其以上的

19、数据;均值适合于样本均值本均值但是对于刻度级数据,如果存在异常值的时候,但是对于刻度级数据,如果存在异常值的时候,要用中位数来代表数据集的集中趋势。要用中位数来代表数据集的集中趋势。思考题思考题1 1:最适合代表定类数据的集中趋势的是:最适合代表定类数据的集中趋势的是:_._.(A)(A)中位数;中位数;(B)(B)众数;众数;(C)(C)平均数;平均数;(D)(D)方差。方差。6 6个人的身高数据为:个人的身高数据为:173cm173cm、173cm173cm、178cm178cm、176cm176cm、171cm171cm和和226cm226cm,请你选择代表这个数据集集中趋势,最,请你选择代表这个数据集集中趋势,最适合的是:适合的是:_._.A A、中位数、中位数;B B、众数;、众数;C C、平均数;、平均数;D D、方差。、方差。极差、方差、标准差、变异系数极差、方差、标准差、变异系数极差、方差、标准差极差、方差、标准差(绝对差异量)(绝对差异量)变异系数变异系数是标准差与平均差的比率。是标准差与平均差的比率。(相对差异量)(相对差异量)3.3 3.3 相关性分析相关性分析积差相关系数积差相关系数等级相关系数等级相关系数点二列相关系数点二列相关系数3.4 3.4 差异性分析差异性分析U检验检验t检验检验卡方检验卡方检验3.5 3.5 回归分析回归分析最小二乘法

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!