人大版贾俊平第五版统计学第2章数据的搜集

上传人:san****019 文档编号:16309075 上传时间:2020-09-25 格式:PPT 页数:29 大小:1.98MB
收藏 版权申诉 举报 下载
人大版贾俊平第五版统计学第2章数据的搜集_第1页
第1页 / 共29页
人大版贾俊平第五版统计学第2章数据的搜集_第2页
第2页 / 共29页
人大版贾俊平第五版统计学第2章数据的搜集_第3页
第3页 / 共29页
资源描述:

《人大版贾俊平第五版统计学第2章数据的搜集》由会员分享,可在线阅读,更多相关《人大版贾俊平第五版统计学第2章数据的搜集(29页珍藏版)》请在装配图网上搜索。

1、第2章 数据的搜集,2.1 数据的来源,2.1.1 数据的间接来源 中华人民共和国2012年国民经济和社会发展统计公报 2.1.2 数据的直接来源,2.2 调查数据,2.2.1 概率抽样和非概率抽样 好样本必须: 1.针对研究的问题 2.具有最好的性能价格比,1.概率抽样 遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本,排除主观上有意识的抽取调查单位 每个单位被抽中的概率是已知或可计算的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,(1)简单随机抽样,只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知

2、信息等,每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性,从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式,(2)分层抽样,先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性,当总体是由差异明显的几部分组成时,往往选择分层抽样的方法,例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容

3、量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取.因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。,(3)整群抽样,优点是实施方便、节省经费;缺点是抽样误差往往大于简单随机抽样,例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等,(4)系统抽样,首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种,最主要的优势就是经济性。最大的缺陷在于总体单位的排列上。一

4、些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本,先将总体从1N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K,直至抽够n个单位为止,(5)多阶段抽样,2.非概率抽样 又称为不等概率抽样或非随机抽样,就是调查者根据自己的方便或主观判断抽取样本的方法 虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体,非概率抽样,方便抽样,判断抽样,自愿样本,滚雪球抽样,配额抽样,调查人员本着随意性原则去选择样本的抽样方式 两种最常见的方法:

5、“街头拦人法” “空间抽样法” 一般在调查总体中每一个体都是同质时,才能采用此类方法。,(1)方便抽样,(2)判断抽样,根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法 例如,要对安徽省旅游市场状况进行调查,有关部门选择黄山、九华山等旅游风景区做为样本调查,这就是判断抽样。,(3)自愿样本 被调查者自愿参加,成为样本中的一份子,向调查人员提供信息。 如:网络调查,先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象 在特定总体的成员难以找到时最适合的一种抽样方法,(4)滚雪球抽样,(5)配额

6、抽样,将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。 与分层抽样的区别:分层抽样是按随机原则在层内抽选样本,而配额抽样则是由调查人员在配额内主观判断选定样本,3.概率抽样与非概率抽样的比较,概率抽样,非概率抽样,抽样原则,特点,非随机原则,统计量的分布不确定,无法进行参数估计.,操作简便、时效快、成本低,适用于探索性研究,抽样原则,特点,随机原则,可以据以对总体参数进行估计,更精确,技术含量高,调查成本高,2.2.2 搜集数据的基本方法 1.自填式,调查者将调查问卷发送给(或者邮寄给)被调查者,由被调查自己阅读和填答,然后再由调查者收回的方法

7、,优点:1、节省时间、经费和人力. 2、具有很好的匿名性. 3、可避免某些人为误差 缺点:1、问卷的回收革有时难以保证2、自填问卷法对被调查者的文化水平有一定要求3、调查资料的质量常常得不到保证,2.面访式,调查者直接走访被调查者,当面听取被调查者的意见。形式上可以个别面谈,也可以小组座谈,提高调查的回答率,提高调查数据的质量,对数据搜集所花费的时间进行调节 调查成本高,对调查的质量控制有一定的难度,对不起,打扰了!,3.电话式 调查者利用电话与被调查者进行语言交流以获得信息 优点:时效快、成本低 缺点:问题的数量不宜过多,4.数据搜集方法的选择,实施调查的资源,抽样框中的有关信息,管理与控制

8、,质量要求,目标总体的特征,调查问题的内容,有形辅助物的使用,考虑 因素,是指在实验中控制实验对象而搜集到的变量的数据。在实验中,研究人员要控制某一情形的所有相关方面,操纵少数感兴趣的变量,然后观察实验的结果。,2.3实验数据,2.3.1 实验组和对照组 实验的基本逻辑:改变A的情况,观察B是否随A的变化而变化,实验组,对照组,2.3.2 实验中的若干问题,心理问题,道德问题,2.3.3 实验中的统计,Text in here,实验设计,多变量 研究,实验,2.4 数据的误差,2.4.1 抽样误差 指由于抽样的随机性引起的样本结果与总体真值之间的误差 “实际抽样误差” “抽样平均误差”,2.4.2 非抽样误差,非抽样误差是指除抽样误差以外所有的误差的总和 任何一个环节出错都有可能导致非抽样误差增加而使数据失真,2.4.3 误差的控制,抽样误差是不可避免的,能够在调查过程中进行控制的只有非抽样误差。抽样误差可以计算,因此可以通过统计学专业知识根据允许误差确定样本量,以控制抽样误差,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!