抽样和研究设计

上传人:y****3 文档编号:23438107 上传时间:2021-06-08 格式:PPT 页数:44 大小:2.04MB
收藏 版权申诉 举报 下载
抽样和研究设计_第1页
第1页 / 共44页
抽样和研究设计_第2页
第2页 / 共44页
抽样和研究设计_第3页
第3页 / 共44页
资源描述:

《抽样和研究设计》由会员分享,可在线阅读,更多相关《抽样和研究设计(44页珍藏版)》请在装配图网上搜索。

1、第五讲 抽样和研究设计 引言和问题在很多情况下,社会研究者希望对某一社会现象总体或某一类人的总体作出描述,但若对这些总体中的每一个元素(或个体)都进行研究,则往往是不现实的。因此,选择能够代表总体的一部分个体,成为研究者必须解决的问题之一。这种选择就是抽样。 问题: 1我们为什么要抽样? 2. 如何抽样,抽样包括哪些类型? 3. 有哪些具体的抽样方法? 4. 如何做好一个研究设计? 思考:央视调查显示有80%左右的观众对春晚满意,新浪网站调查现实只有20%的观众对春晚满意。 一、抽样的意义和作用(一)抽样的优势:时间、成本和准确。在很多情况下,社会研究者希望对某一社会现象总体或某一类人的总体作

2、出描述,但若对这些总体中的每一个元素(或个体)都进行研究,则往往是不现实的。因此,选择能够代表总体的一部分个体,成为研究者必须解决的问题之一。这种选择就是抽样。抽样能够节省时间和成本。同时,在研究结果的准确性上,认真抽样后所研究的结果,并不比研究总体中的每一个个体的结果差。 (二)抽样的作用向人们提供一种实现“由部分认识总体”这一目标的途径和手段。案例:里根于1984年当选为美国新一任总统。(见:风笑天,2009,119页) 对于任何类型的研究者来说,抽样都是个问题。我们不能、也不应该祈求研究自己感兴趣的每一个个案。每个科学计划都试着通过研究少数例子,发现能够被应用于所有事物的东西,这种研究的

3、结果,按照我们的通常说法,是“通则化的”。贝克尔,交易的诡计,67 (四)抽样的两种类型: 1. 概率抽样:以数学上的概率理论为基础,按随机原则进行抽样。“大部分有关抽样的讨论来自定量研究者。他们的基本目标是获取一个有代表性的样本,或从一个较大的单位或个案的集合或总体中,获取一个小的单位或个案的集合,这样,研究者可以研究较小的群体,并对较大的群体进行精确的推论。研究者关注能产生较大代表性样本(即样本与总体非常相似)的特定技术。定量研究者倾向于使用以数学上的概率理论为基础的抽样类型(被称为概率抽样)”(纽曼2007:266)。2. 非概率抽样:依据研究者的主观意愿、判断或是否方便等因素来抽样。

4、“定性研究者不太关注样本的代表性和抽取一个概率样本的技术细节。相反,他们关注样本、小的单位、个案或行为的集合,是怎样展示社会生活的。抽样的基本目的是收集特殊的个案,事件和行动,以澄清和深化理解。定性研究这侧重的是发现个案,以提升研究者在特定内容方面对社会生活过程的认识。由于这个原因,定性研究者倾向于采用第二类的抽 样:非概率抽样。”(纽曼2007:267)。3. 这两种类型的抽样还可以细分出若干不同的形式。(见风笑天2009:120) 三 抽样的概念(风笑天,2009,116-118页) 1、总体(population)(1)总体(population)是由构成它的所有元素所形成的集合。(2)

5、元素(element)是构成总体的最基本单位。在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是这个总体的元素。 案例一:要研究某省在校大学生的择业倾向。那么,该省所有在校大学生的集合就是我们研究的总体,而每一个在校大学生就是该总体的元素。案例二:要研究某城市居民的家庭生活质量。那么,该市所有居民家庭就是总体,而其中的每一户家庭就是该总体的要素。 2. 样本和抽样(1)样本(sample):从总体中按一定方式抽出的一部分元素的集合。或者说,一个样本是一个总体的一个子集。(2)抽样(sampling):从组成某个总体的所有元素的集合中,按一定的方式选择或抽出一部分元素的过程。 3

6、. 抽样单位和抽样框(1)抽样单位(sampling unit):一次直接抽样所使用的基本单位。 抽样单位与元素有时相同,有时不同。如:若从该省在校大学生总体(12.8万)中直接抽取1000名大学生,这些单个大学生同时是元素和抽样单位。若从该总体中抽取40个班级(这些班级的人数恰好是1000人),这时,班级就是抽样单位。 (2)抽样框(sampling frame)又称抽样范围。是在一次直接抽样时,总体中所有抽样单位的名单。如案例一,在研究某省在校大学生的择业倾向时,直接抽取的1000名单个大学生的名单就是这次抽样的抽样框。而那40个班级的名单是另外一个抽样框。 案例讨论:美国杂志文学摘要曾在

7、1920年、1924年、1928年和1932年在美国总统选举的时候,从车主登记簿和电话簿挑选样本寄送明信片调查选举意向,被调查者把投票意向寄回,这四次预测全部正确。在1936年将样本增加到1000万人,预测兰登会大胜罗斯福,但结果是错误的。罗斯福当选了。分析:(1)原因在于抽样框错误,没有正确代表目标总体(所有选民),排除了没有电话或汽车的人,在1936年,这部分选民占很高百分比,这个框架排除了近65%的总体元素和倾向于偏好罗斯福的低收入选民。 (2)前几次预测正确的原因:高收入和低收入人群的投票对象没有多大差异;另外在大恐慌之前,较多的低收入者可能也买得起电话和汽车。 “好的抽样框是达到好的

8、抽样的关键。抽样框与概念所界定的总体之间不吻合,可能是偏差的主要来源。正如变量的理论定义和操作定义之间的不匹配,会产生缺乏效度的测量,抽样框和总体之间的不匹配也会产生无效的抽样。研究者要尽力减少这种不匹配的情况”(纽曼2007:274)。 4. 参数值和统计值(1)参数值(parametre),也称总体值,关于总体中某一变量的综合描述,或者是,总体中所有元素的某种特征(变量)的综合数量表现。在统计中最常见的就是某一变量的平均值,如某市待业青年的平均年龄。(2)统计值(statistic),也称样本值。关于样本中某一变量的综合描述。或者是,样本中所有元素的某种特征(变量)的综合数量表现。 样本值

9、是从样本的所有元素中计算出来的,对于相应的总体来说,这只是一个估量值。 5. 抽样分布:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。它是一种根据概率原则而成立的理性分布。 三、如何抽样:(一)非概率抽样非概率抽样不是按照等概率原则,而是按照人们的主观经验或其他条件来抽取样本。常常只在定性研究中使用。常见的几种方法如下。(一)偶遇抽样(accidental sampling )又称方便抽样或自然抽样。研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或仅仅选择那些离得近、最容易找到的人作为对象。 (二)定额抽样(quota sampling)又称作配额抽样。 1、

10、研究者对总体进行分类,然后决定在每一个类别中抽取的人数。 2、可以保证样本具有总体的某些差异。 (三)判断抽样(judgemental sampling)又称立意抽样(purposive sampling),研究者根据自己的研究目标和主观分析来选择和确定研究对象的方法。这种方法带有很大的主观性,其结果如何,往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很大关系。“它借助专家的判断来选择个案,或者以心中特定的目的来选择个案”(纽曼2007:269)。 1、使用它选择特别能提供信息的独特个案。 2、研究者可能使用立意抽样来选取很难接近的特殊总体中的成员。 3、研究者确认特殊个案类型,以便进

11、行深入探究。 (四)滚雪球抽样(snowball sampling)当我们无法了解总体的情况时,可先调查总体中的少数成员,向他们询问他们还知道哪些符合条件的人;再去调查那些人,并询问他们还知道哪些人符合条件。(风笑天2009:148) “社会研究者常对相互关联的人或者组织网络感兴趣。这种网络可以是全世界探讨相同问题的科学家、在一个中等规模城市中的精英分子、从事组织化犯罪的家庭的成员、出任重要银行和企业董事会的董事或在大学校园中彼此有性关系的人。其中的关键特征是每一个人或单位都和其他部分通过直接或间接的联系而联结起来。这并不意味着网络中每一个人会彼此直接认识、相互交往或是受对方的影响。相反的,这

12、意味着,大部分的人和事物都会因直接或间接的关系,置身于一个具有相互关联的网络中”(纽曼2007:270)。 (五)异常个案抽样 “当研究者搜寻与主导模式不同,或与其他个案主要特征不同的个案时,会采用异常个案抽样法(也称为极端个案抽样法)。与立意抽样类似,研究者使用多种技术来确定具有某种特征的个案。而异常个案抽样与立意抽样不同之处在于,其目的是确定一个不平常、有差异或特殊的个案集合,并不要求它代表总体。之所以选中某些异常个案,是因为它们是不平常的,研究者希望通过考察那些落在一般模式之外的个案,或者说包含超出主流事件的东西,更多地了解社会生活。”(纽曼2007:271) (六)理论抽样“当研究者发

13、展出扎根理论时,他会采用理论抽样,仔细地选择样本(例如,人群、局面、时间、时间段等)。不断增长的理论兴趣引导个案的选取。研究者根据对个案特点新的理解来选取个案。例如,实地研究者也许会在周末观察某个场景和一群人。理论上,它也许会问在其他时间、场景的其他方面改变后,人们的行为是否相同。于是研究者可能会在其他时间段(例如,夜晚和周末)进行抽样以获取更丰富的图像,了解重要的条件是否相同。”(纽曼2007:272) 案例:关于微博现象的考察。 II 如何抽样(二):概率抽样(probobility sampling)(一)定义 1. 概率抽样:以数学上的概率理论为基础,按随机原则进行抽样。 2. 随机(

14、random) “随机一词在数学上有其特殊的意义,它指的是产生一种数学上所谓随机结果的过程。这就是说,选择过程讲求的是真正随机的方法,而且研究者能够计算出结果出现的概率。在真正的随机历程中,每一个元素都有同等大小被选取的概率”(纽曼2007:275)。 3. 案例讨论:美国杂志文学摘要曾在1920年、1924年、1928年和1932年在美国总统选举的时候,从车主登记簿和电话簿挑选样本寄送明信片调查选举意向,被调查者把投票意向寄回,这四次预测全部正确。在1936年将样本增加到1000万人,预测兰登会大胜罗斯福,但结果是错误的。罗斯福当选了。分析:(1)抽样框错误的原因,没有正确代表目标总体(所有

15、选民),排除了没有电话或汽车的人,在1936年,这部分选民占很高百分比,这个框架排除了近65%的总体元素和倾向于偏好罗斯福的低收入选民。 (2)前几次预测正确的原因:高收入和低收入人群的投票对象没有多大差异;另外在大恐慌之前,较多的低收入者可能也买得起电话和汽车。 4. 抽样分布:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。它是一种根据概率原则而成立的理性分布。 (二)概率抽样的一般程序 1. 界定总体:在抽样前,对总体的范围与界限做明确的界定。 2. 制定抽样框:收集全部抽样单位的名单,并对名单统一编号。 3. 决定抽样方案:决定具体采用哪种抽样方法。 4. 实际抽取样本

16、:到实地抽取样本。 5. 评估样本质量:根据研究者的抽样设计和抽样实施过程的质量进行评估。通常用比较法:将可得到的反应总体中某些重要特征及其分布的资料,与样本中的同类指标的资料进行对比。若二者之见差别小,则样本的质量较高;反之,则样本的质量较低。案例见风笑天2009:127. (三)抽样设计的原则: 1. 目的性原则。设计抽样方案时,要从所研究的问题、最有利于研究资料的获取、以及最符合研究目的等因素出发。 2. 可测性原则:能从样本自身计算出有效的估计值。 3. 可行性原则:抽样方案必须在实际中切实可行。 4. 经济性原则:抽样方案要与可得资源相适应。 1. 简单随机抽样(simple ran

17、dom sampling)又称纯随机抽样。按等概率原则直接从含有N个元素的总体中随机抽取n个元素,以此来组成样本,其中Nn。这类似于抽签。(1)最简单的随机样本,同时也是其它类型模仿的对象。 (2)发展一个准确的抽样框,对抽样框内部的所有元素编号,根据数学随机数从抽样框中选取元素。 中央极限定理:“随着抽样分布中不同的随机样本组数的不断增加,直至无限大时,样本的模式和总体参数将变得越来越可预测。在很多组随机样本下,抽样分布会呈现出一条常态曲线,而且这个曲线的中点,随着抽出的样本组数的增加,就会趋近总体的参数”(纽曼2007:278)。 “随机抽样并不保证每一组随机样本都能完美地代表总体。相反的

18、,它是指大部分的随机样本在大多数的情况下,都相当接近总体;因而可以计算出某组特定样本不准确的概率。研究者利用从这组样本得到的信息估计抽样分布,进而估计这组样本偏离或不代表总体的机会(即抽样误差的大小)。同时,他把这些信息与中央极限定理的知识结合起来构造置信区间”(纽曼2007:279)。 2. 系统抽样(systematic sampling)又称等距抽样或机械抽样。把总体中的单位进行编号后,再计算出某种间隔,然后按这一固定间隔抽取个体的号码,以此来组成样本。 K(抽样间距)= N(总体规模)/n(样本规模)优点:比简单随机抽样简便易行。(1)对抽样框中的每一个元素编号。 (2)计算抽样间距,

19、间距成为准随机的抽取方法。 3. 分层抽样(stratified sampling)又称类型抽样。先将总体中的所有单位按某种特征划分成若干类型或层次,然后再每一个层次中用简单随机抽样或系统抽样方法抽取一个子样本,最后把这些子样本合起来,以此构成总体的样本。(1)根据补充信息将总体分为若干个次总体(层)。(2)将总体分层之后,从每一个次总体中选取随机样本(可采取简单随机抽样或系统抽样)。 (3)控制每一个层的相对大小,而不是任由随机过程控制各层抽到的个数,固定一组样本中各层抽取的比例。优点:(1)在不增加样本规模的情况下,降低抽样误差。(2)便于理解总体内不同层次的情况,以及对总体中不同的层次进

20、行单独研究,或进行比较。 4. 整群抽样(cluster sampling):从总体中抽取一些小的群体,由这些群体的所有元素构成样本。与前面三种抽样方法最大的不同就在于,整群抽样的抽样单位不是单个的个体,而是成群的个体。(1)为什么要采用整群抽样? 1.1面对的是一个分散的总体,缺少一个理想的抽样框。 1.2取得样本的成本很昂贵。 (2)过程:第一阶段随机抽取较大的群,第二阶段是在每个大群中随机抽取小群,第三阶段从被抽出的小群中再抽出元素。优点:简便易行、节省费用。缺点:样本的分布面不广、样本对总体的代表性比较差。 5. 多段抽样(multistage sampling)前提:元素之间具有隶属

21、关系或层次关系。并且,中每一个阶段中,元素的规模是相同的。方法:先从总体中随机抽取若干大群(组),然后再从这几个大群中抽取几个小群(组),这样一层层抽下来,指导抽到最基本的元素为止。 6. 户内抽样(within-househlod sampling)研究者以家庭为分析单位,以入户访谈的方法收集资料。 户内抽样是从所抽中的每户家庭中抽取一个成年人,以组成访谈对象的样本。 7. PPS抽样(sampling with probability to size)原理:以阶段性的不等概率换取最终的、总体的等概率。方法见风笑天2009:143-144. III 样本规模与抽样误差(一)样本规模(samp

22、le size)样本规模:即样本的容量,指样本中所含的个案的数目。大样本:大于30个个案。小样本:小于30个个案。一般来说,社会研究中的样本规模不能小于100个个案。 (二)抽样误差(sampling error) 1. 抽样误差:就是样本统计值与总体参数值之间的偏差。它是由抽样本身的随机性所引起的误差。无论采用什么样的抽样方式,这种误差都是不可避免的。但是,在样本设计中也可事先进行一定程度的控制。 2. 度量误差:是由记录、填答、汇总等工作中所出现的误差。 IV 研究设计一 具体方案(风笑天,2009,82页)从大的方面说,一项研究的具体方案应当包括以下几个方面的内容:(风笑天2009:82

23、-84) 1. 说明研究课题的目的和意义即包括对研究课题本身含义的理解,即该研究要探讨什么问题和回答什么问题。也包括研究课题组人们认识社会、改造社会中所具有的作用的理解。 2. 说明研究的内容研究内容是对研究目的的具体分解和细化,说明应该研究哪些对象。这可为研究指标的选择、问卷的设计打下就好基础。 3. 说明研究的理论假设在解释性研究的具体方案中,必须对所采用的理论假设作出明确陈述。在探索性研究和描述性研究中,可以不做理论假设。 4. 说明研究的分析单位和抽样方案确定分析单位,可以避免层次谬误和简化论的错误。在具体的抽样方案中,需要说明:(1) 研究的总体是什么,即对研究对象所取自的总体做界定

24、。(2)采用什么样的抽样方法和程序进行抽样。即是以某一种抽样方法单独进行抽样,还是采用几种方法结合进行,抽样的具体步骤又是如何等等。 (3)样本规模的大小,以及样本准确性程度的要求等。 5. 说明研究资料的收集方法和分析方法资料收集方法的选择要依据多种因素综合考虑,作出恰当的安排。如:研究总体的性质、样本规模的大小、研究的目标和重点、研究课题完成的时间要求、研究者的人力、物力是否充足等。根据研究类型的不同,资料的分析方法有一定差别。探索性研究主要依赖于定性分析方法,描述性研究主要侧重于基本的描述统计和推论统计,而解释性研究主要用到双变量和多变量的相关分析以及一些更为复杂的统计分析方法。 具体分

25、析方法的选择同样要紧密结合研究课题的目标、内容和要求来进行。 6. 说明研究人员的组成、组织结构及培训调查员的安排确定课题组成员,对各成员进行明确分工,制定相应的管理办法。对调查员的培训要事先规划,制定切实可行的培训方案。 7. 确定研究的时间进度和经费使用计划对整个研究工作的时间分配和进度进行合适安排,还要留有一定的余地。 特别要注意给研究设计和准备阶段多安排一些时间,不要匆匆忙忙开始收集资料。对于课题经费的使用要有一个大致的考虑和合理的安排。有些费用要按照相关的规章制度制定。 该模式对申请各种社会研究课题、撰写课题申请报告、撰写学位论文开题报告具有很好的参考价值。参见风笑天2009第407页附录五的课题申请书例子。 作业: 1. 各小组一起讨论,选一个大家感兴趣的问题,做一个研究设计。各组的组长和副组长要充分发挥组织协调作用。 2. 下次课携带第一次课要求大家下载的全国综合社会调查2003年城市问卷,上课时用。 谢 谢 !

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!