抽样调查习题集

上传人:沈*** 文档编号:146870464 上传时间:2022-09-01 格式:DOC 页数:8 大小:158KB
收藏 版权申诉 举报 下载
抽样调查习题集_第1页
第1页 / 共8页
抽样调查习题集_第2页
第2页 / 共8页
抽样调查习题集_第3页
第3页 / 共8页
资源描述:

《抽样调查习题集》由会员分享,可在线阅读,更多相关《抽样调查习题集(8页珍藏版)》请在装配图网上搜索。

1、抽样调查习题第一章 概述1.1 什么是概率抽样?什么是非概率抽样?它们各有什么优点?1.2 怎样理解抽样调查的科学性?1.3 抽样调查基础理论及其意义;1.4 抽样调查的特点。第二章 抽样调查基本原理2.1 试说明以下术语或概念之间的关系与区别; 1.总体、样本与个体; 2.总体与抽样框; 3.个体、抽样单元与抽样框。2.2 试说明以下术语或概念之间的关系与区别; 1.均方误差、方差与偏倚; 2.方差、标准差与标准误。2.3 影响抽样误差的因素;2.4 抽样分布及其意义;2.5 抽样估计的基本原理;2.6 置信区间的确定。第三章 简单随机抽样3.1 设总体N=5,其指标值为3,5,6,7,9

2、1.计算总体方差和S2; 2.从中抽取n=2的随机样本,计算不放回抽样的方差; 3.按不放回抽样列出所有可能的样本并计算,验证=; 4.按不放回抽样所有可能的样本,计算其方差,并与公式计算的结果进行比较; 5.对所有的可能样本计算样本方差s2,并验证在不放回的情况下:E(s2)= S2。3.2 在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公顷的方形样地,测得这50块样地的平均储蓄量为9m3,标准差为1.63 m3,试以95%的置信度估计该林场的木材储蓄量。3.3 某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,

3、得=12.5,s2=1252。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本?3.4 某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。3.5 从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,试以95%的置信度估计这批单据中有错误的比例。若已知这批单据共1000张,你的结论有何变化?若要求估计的绝对误差不超过1

4、%,则至少抽取多少张单据作样本?第四章 分层抽样4.1 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:工人技术人员行政管理人员N1=132 N2=92N3=27S12=36 S22=25S32=9若样本量n=30,试用你乃曼分配确定各层的样本量。4.2 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:工人技术人员行政管理人员8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,04,5,0,24,8,12,3,2,1,81,8试估计总的工时损失数并给出它的置信

5、度为95%的置信区间。4.3调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据层村总数样本村养牛头数1 2 3 4 5 6 7 8 9 10 12341411470525581499743 84 98 0 10 44 0 124 13 050 147 62 87 84 158 170 104 56 160228 262 110 232 139 178 334 0 63 22017 34 25 34 36 0 25 7 15 31要求:(1) 估计该地区养牛总头数Y及其估计量的相对标准误差(2) 讨论分层抽样与不分层抽

6、样比较效率有否提高。(3) 若样本量不变采用Neyman分配可以减少方差多少?4.4 用下面的工厂分组资料按工人人数分组工厂数目每工厂产值(万元)标准差14950991002492509991000人以上18260431522331057567100250500176022508020060019002500若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率:(1) 按工厂数多少分配样本;(2) 按最优(奈曼)分配。4.5 怎样分层能提高精度?4.6 总样本量在各层间分配的方法有哪些?4.7 分层的原则及其意义。第五章 比估计与回归估计5.1 欲估计某小区居民的食品支出占总收入的

7、比重,该地区共有150户,现用简单随机抽样抽取14户为样本,经调查每户的食品支出yi与总收入xi的数据如下表:样本户总收入xi食品支出yi1234567891011121314251003220029600350003440026500287002820034600327003150030600277002850038005100420062005800410039003600380041004500510042004000要求估计食品支出占收入比重的95%置信度的置信区间。5.2 某林场欲估计一批出售木材的材积量,从N=250株砍伐的树木中随机抽取了n=12株作为样本,每株分别测量了根部横截

8、面积和材积量(见附表)。为了估计总材积量又测量了这250株树木根部的横截面积之和为75平方尺。要求:(1) 估计这250株树的总材积量及相对标准差;(2) 比较采用比估计与简单估计的效率。附表样本序号根部横截面积(平方尺)材积量(立方尺)1234567891011120.30.50.40.90.70.20.60.50.80.40.80.66971915512920918135.3 某乡欲估计今年的小麦总产量,全县共有123个村,按简单随机抽样抽取13个村作为样本,取得资料如下:样本村去年的小麦产量(百斤)今年的小麦产量(百斤)1234567891011121355072015001020620

9、98092812001350175067072915306107801600103060010509771440157022109808651710(1) 若已知去年的小麦总产量为128200(百斤),采用比估计法估计今年的小麦总产量和置信度为95%的置信区间。(2) 估计每个村的平均小麦产量及估计的相对标准差。5.4 一公司欲了解广告对其产品销售量的作用,从销售该公司产品的452家企业中抽选了20家,分别调查了广告前与广告后的月销售量数据如下表:样本企业广告前广告后12345678910 2084004402593518802734871838632394284722763639422945

10、14195897样本企业广告前广告后11121314151617181920599510828473924110829257388244626538888510998171889265419257(1) 若广告前的月总销售量为216256,估计广告后的月销售量及其相对标准差。(2) 求广告后比广告前销售量增加百分比的置信区间(a=0.05)。(3) 若允许估计总销售量的最大绝对误差为=3800,置信度为95%,确定应抽取多少企业作样本。5.5 某养兔专业户购进100只兔子,平均重量为3.1磅,随机抽取了10只兔子为样本,记录其重量,经过两个月的饲养,现欲了解其平均重量,经过称重,其资料如下:样

11、本原重(磅)现重(磅)123456789103.23.02.92.82.83.13.03.22.92.84.144.13.93.74.14.24.13.93.8要求:(1) 用回归估计法估计每只兔现有的重量,并计算其方差的近似估计量。(2) 若每只兔的平均重量允许最大误差为0.05磅,置信度为95%,应该取多少只兔为样本?5.6 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分平原和山区两层采用分层抽样。同时当年产量与去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200(百斤)。现从平原

12、用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下: 平原 山区样本去年产量(百斤)当年产量(百斤)123456 2041438225627519821016075280300190样本去年产量(百斤)当年产量(百斤)123456789137189119631031071596387150200125601101001807590 试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上述两种结果进行比较和分析。5.7 回归估计、比估计与简单估计间的区别;5.8 辅助变量的选择原则。第七章 不等概率抽样7.1 对与N=4的假设总体1,2,3,4按给顶的概率0.1,

13、0.2,0.4,0.4进行有放回抽样,n=2(1)试列出所有可能样本以及每个出现的概率;(2)对每个样本计算对总体和Y的估计,验证是Y的无偏估计;(3)根据可能样本计算,验证其结果是否按公式计算的结果一致?7.2 研究人员欲估计一批电子元件板上的缺陷数,由于缺陷数与板上的电子元件数目有关,故采用与元件数目成比例的放回的PPS抽样。设N=10,每块板上电子元件的数目按顺序分别为10,12,22,8,16,24,9,10,8,31,设n=4。现要求 (1)说明样本的抽选方法; (2) 若抽中的单元按前面排列的序号是第2,3,5,7这四个元件板,其缺陷数分别为1,3,2,1,试根据这一抽样结果,估计

14、这批元件上共有多少个缺陷数。 (3)给出上述估计量的方差估计。7.3 假设总体大小N=7,单元指标值分别为10,20,30,40,50,60和70,采取n=2的不放回PS抽样。试列出所有可能的样本,计算每个单元和每对单元被抽入样本的包含改良和并验证,。7.4 有一个估计某城镇现有第三产业单位数的例子。假设有去年年底的普查数和现有的实际单位数,分街道统计如下:街道去年普查数现有单位数街道去年普查数现有单位数123456789109912121214141718189131212141715201918111213141516171819201921232424252627304019252721

15、352225274737假设n=1,采用以下几种估计量(1) 等概率抽选,简单(无偏)估计;(2) 等概率抽选,以去年普查数为辅助变量的比估计;(3) 按与去年普查数成比例的概率抽样,汉森赫维茨估计。比较这三种估计的方差或均方误差,(计算比估计的均方误差时应计算真值而不用近似公式)并加以讨论。第八章 整群抽样 8.1 某一社会研究机构,研究南方某一城镇的社会民俗等情况。设该镇共有415个居民小组,现从中按简单随机抽样抽取25个居民小组作样本,取得了以下一些数据。样本数户数其中三代人户数总收入样本数户数其中三代人户数总收入1234567891011121381245667583265471334

16、4232132960001210004200065000520004000075000650004500050000850004300054000141516171819202122232425109365546873864142313340349000530005000032000220004500037000510003000039000470004100合计151721329000要求:(1) 估计该地区户平均收入及其标准差。(2) 估计三代人的户占总户数的比例,并计算其标准差;8.2 某工业系统准备一项改革措施,对全系统的人进行一项民意测验,该系统共有87个单位,现采用整群抽样,用简单

17、随机抽取15个单位作为样本,对抽中的单位作全面征求意见,其结果如下:单位总人数赞成人数1234567891011121314155162497310148654973615852654955425340456331383054455129463742要求:(1) 估计该系统同意这一改革人数的比例,并计算估计标准误;(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的绝对误差不超过4%,置信度为95%,则应抽多少个单位作样本。8.3 假设整群抽样的样本群数为n,每个群有M个单元,群间方差为,群内方差为试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(fpc可忽略不计)

18、。8.4 整群抽样与分层抽样的区别;8.5 整群抽样的设计效应。第九章 多阶抽样9.1 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽取10块地,再从每块抽中的地块中抽10%的树苗,对抽中的苗木测量其高度取得资料如下:地块(i)秧苗数(Mi)抽样数(mi)苗木高度yij1234567891052566046495150616045566555566612,11,12,10,1310,9,7,9,8,106,5,7,5,6,47,8,7,7,610,11,13,12,1214,15,13,12,136,7,6,8,7,9,10,8,9,9,107,10,8,9,9,1

19、012,11,12,13,12,12已知共有M0=2600株苗木(1) 若两阶抽样都是简单随机的,调查结果用加权平均数来估计总体均值,求估计值,并计算;(2) 抽样方法同(1),但估计量不加权,即用,求估计值并计算(3) 抽样方法不变,使用比估计,即,求估计值及其标准误差(4) 讨论上述三种方法的适用条件 9.2 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一半饮食店进行检查,检查结果如下:样本城市饮食店总数样本店数检查卫生不合格数123425101816135984142要求估计这32个

20、城市不合卫生要求的饮食店所占的比例及95%的置信区间。9.3 估计一个地区的每一住户平均消费支出,拟采用二阶抽样设计,第一阶抽村,第二阶抽户,都采用简单随机抽样。为了设计这一调查先作了一试调查获得以下信息:(a),(b)村与村之间的方差,(c)村内户与户之间的方差,(d)调查每个村的费用元,(e)调查每一住户的费用元,(f)调查的组成管理费用为元。若总的调查费用CT=10000元。请计算最忧的样本村数和每村的样本住户数。9.4 多阶抽样与单阶抽样的关系;9.5 二阶抽样与整群抽样和分层抽样的关系。第十章 系统抽样10.1 以美国某镇的360户为总体,编号从1360,排列的顺序按户主的姓的字母排

21、列,下列的号码是家长为非白人的住户号码:28,31一33,3641,44,45,47,55,56,58,68,69,82,83,85,86,8994,98,99,101,107一110,114,154,156,178,223,224,296,298300,302304,306323,325331,333,335339,341,342)由于姓与肤色有关系,所以非白种人的住户显出某些“聚集”的现象)。为了估计家长为飞白人住户在全部住户中所占的比例,每8户抽1户,取得一个系统样本。试将这一系统样本的精度与同样样本量的简单随机抽样的精度加以比较。10.2 现欲对一条街上的居民调查住户的平均居住年限,用每隔20户抽取1户的系统抽样方法,共调查了115户,得;。求平均居住年限并作出95%的置信区间。你在作出估计中对总体的排序作了什么样的假设?10.3 下面是美国1900年以来每隔5年的离婚率资料:年份离婚率%1900190519101915192019251930193519400.70.80.91.01.61.51.61.72.0 (1)估计这期间的年平均离婚事并估计其方差。 (2)根据这一资料讨论用系统抽样好还是简单随机抽样好?10.4 怎样理解等距抽样的随机性问题;10.5 等距抽样与分层抽样的关系;10.6 等距抽样的实施方法。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!