分层随机抽样工科

上传人:feng****ing 文档编号:53630652 上传时间:2022-02-10 格式:DOC 页数:10 大小:195.50KB
收藏 版权申诉 举报 下载
分层随机抽样工科_第1页
第1页 / 共10页
分层随机抽样工科_第2页
第2页 / 共10页
分层随机抽样工科_第3页
第3页 / 共10页
资源描述:

《分层随机抽样工科》由会员分享,可在线阅读,更多相关《分层随机抽样工科(10页珍藏版)》请在装配图网上搜索。

1、分层随机抽样一、单选题1分层抽样设计效应满足(B)A、deff = 1 b、deff : 1 c 、deff : 1 d 、deff . 12、分层抽样的特点是(A)A、层内差异小,层间差异大B层间差异小,层内差异大C层间差异小D层内差异大3、 下面的表达式中错误的是(D)A、二 fh = 1 B 、二 nh = n C、二 Wh = 1 D 二 Nh = 14、 在给定费用下估计量的方差v(ysJ达到最小,或者对于给定的估计量方差V使得总费用达到最小的样本量分配称为(C)A、常数分配B 、比例分配C最优分配 D 、奈曼分配5、 最优分配(Vopt )、比例分配(Vprop)的分层随机抽样与相

2、同样本量的简单随机抽样(Vsrs ) 的精度之间的关系式为(A)A Vopt Vprop -VsrsB 、Vp 空陷乞 V$rsCV prop - Vopt -Vsrs、Vsrs - Vprop - Vopt6、下面哪种样本量分配方式属于比例分配?(A)NhnhN hSh ChL、NhSh=1nhNh ShC 二 1n 、NhShh:1nhWhShL、WhShhW7、下面哪种样本量分配属于一般最优分配?B)nhNhN hShI Ch一L N h Shi 5h dnh Nh ShL NhShh 4nhWh ShL、WhSh h丄二、多选题1. 分层抽样又被称为A.整群抽样2. 在分层随机抽样中,

3、A.分层比估计D.联合回归估计(BC )B.类型抽样当存在可利用的辅助变量时,B.联合比估计E.分别简单估计(ABCD )比例分配 C.最优分配C.分类抽样D.系统抽样E. 逆抽样,为了提高估计精度,可以采用(BCD )C.分别回归估计3. 样本量在各层的分配方式有A.常数分配B.4. 分层抽样的优点有(ABCDE )A.在调查中可以对各个子总体进行参数估计C.可以提高估计量的精度D.实施方便5. 关于分层数的确定,下面说法正确的有(CE )A.层数多一些比较好B.层数少一些比较好D.层数一般以4层为最好E.6. 下面哪种样本量分配方式属于奈曼分配D.B.E.奈曼分配E.等比分配易于分工组织及

4、逐级汇总 保证样本更具有代表性层数一般以不超过 6为宜 应该充分考虑费用和精度要求等因素来确定层数? ( CD )C.nhA.NhB.L_、NhSh/、Gh=1C.nkNhShL二.N hShh=1WhSh_ L、WhShh=1E.nhnWhSh /ChL_WhShA.Ch d7.事后分层的适用场合有各层的抽样框无法得到几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难 一个单位到底属于哪一层要等到样本数据收集到以后才知道 总体规模太大,事先分层太费事一般场合都可以适用(ABCD )A.B.C.D.E.三、名次解释1.分层随机抽样四、简答题简述分层随机抽样相对于简单随机抽样的优点。请

5、列举出样本量在各层的三种分配方法,并说明各种方法的主要思想。 怎样分层能提高精度?总样本量在各层间分配的方法有哪些?分层的原则及其意义。2.自加权3.最优分配1.2.3.4.5.五、计算题1.抽查一个城市的家庭,目的是评估平均每个住户很容易变换为现款的财产金额。住 户分为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财产的9倍,Sh与第h层的均值的平方根成正比。高房租层有4000个住户,低房租层有2000 个住户。请问:(1)包含1000个住户的样本应该如何在这两层中分配?(2)若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(假定各层的单位调查费

6、用相等)?2. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。农场规模(英亩)农场数Nh平均每一农场的玉米面积 Yh标准差Sh0 403945.48.341 8046116.313.381 12039124.315.112116033434.519.816120016942.124.520124011350.126.024114863.835.2总和或均值201026.3-现要抽出一个包含 100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:(1)按比例分配时,各层的样本量为多少?(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用

7、相等)(3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。3.设费用函数具有形式 C 7 th., nh,其中c0及th均为已知数,请证明当总费用W2 s 2固定时,为了使V(yst)达到最小值,nh必与(土仝匸)2/3成比例。并求出下述条件中,一个t h含量为1000的样本所对应的nh。层舛Shth10.44120.35230.3644. 在一个商行内,62%勺雇员是熟练的或不熟练的男性,31%是办事的女性,7催管理人员。从商行内抽取由400人组成的一个样本,目的是估计使用某些娱乐设备的人所占的比 例。按照粗略的猜测,这些设备40%到50%是由男性使用的,20%到30%是由女性使

8、用的,5%到10%是由管理人员使用的。请问:(1)你如何把样本单位分配在这三组人之间?(2) 若真正使用者占的比例分别是48% 21%和4%则估计比例 卩戎的标准误是多少?(3) n=400的简单随机样本算得的p的标准误是多少?5. 为调查某个高血压发病地区青少年与成年人高血压患病率,对14岁以上的人分四个年龄组进行分层随机抽样, 调查结果见下表。求总体高血压患病率 P的估计及其标准差的估 计。高血压患病率调查数据年龄组层权Wh层样本量nhPhqh14 25 岁0.2814000.0830.91726 40 岁0.3226500.1740.82641 60 岁0.2136000.3100.69

9、061岁以上0.8143500.4640.5366. 设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得到S2的较好的估计值。第三层是一些新开设的商店和以前调查中没有销售额的商店,因此,Ss的值只好加以猜测。若 S3的实际值是10,当被猜作(a) 5,(b) 20 时,请分别计算一下由奈曼分配所得的估计量的 V(yst)。并请证明在这两种情况下,与真正的最优值相比, 方差中按比例的增量稍大于 2%层WhSh真值估计的Sh(1)(2)10.330303020.620202030.1105207.调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分 成

10、四层,每层抽取10个村作为样本单元,经过调查获得下列数据:层村总数样本村养牛头数123456789101141143849801044012413024705501476287841581701045616032558228262110232139178334063220414997173425343602571531请估计该地区养牛总头数Y及其估计量的相对标准差s(Y)/ Y。8. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管 理人员的事故率不同,故采用分层随机抽样。已知下列资料:工人技术人员行政管理人员N1=132N2 =92N =272S| =36Sf =25

11、S32 =9若总样本量n=30,试用奈曼分配确定各层的样本量。9. 上题中若实际调查了 18个工人、10个技术人员、2个行政人员,其损失的工时数如 下:工人技术人员行政管理人员8, 24,6,0,9,5,0, 0, 16, 32, 16, 7, 4, 4,8, 18, 2, 04, 5, 0, 24, 8,12, 3, 2, 1, 81 , 8试估计总的工时损失数并给出它的置信度为95%的置信区间。10. 某县欲调查某种农作物的产量, 由于平原和山区的产量有差别, 故拟划分为平原和 山区两层采用分层抽样。 同时当年产量和去年产量之间有相关关系, 故还计划采用比估计方 法。已知平原共有 120个

12、村,去年总产量为 24500 (百斤),山区共有180个村,去年总产 出为21200 (百斤)。现从平原用简单随机抽样抽取 6个村,从山区抽取 9个村,两年的产 量资料列在下表中。 试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上面的两种结果进行比较和分析。平原样本去年产量(百斤)当年产量(百斤)1204210214316038275425628052753006198190山区样本去年产量(百斤)当年产量(百斤)11371502189200311912546360510311061071007159180863759879011. 一公司希望估计某一个月内由于事故引

13、起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:工人技术人员行政管理人员N1=132N2=92N3=27S2=36S22=25S32=9若样本量n=30,试用你乃曼分配确定各层的样本量。12.上题中若实际调查了 18个工人,10个技术人员,2个行政人员,其中损失的工时 数如下:工人技术人员行政管理人员8, 24, 0, 0, 16, 32,6, 0, 16, 7, 4, 4, 9, 5,8, 18, 2, 04, 5, 0, 24, 8, 12, 3, 2,1,81 , 8试估计总的工时损失数并给出它的置信度为95%的置信区间。13.在估计比例问题时:

14、(1) 假设P=0.5,W1=W=0.5,则P1和P2为何值时可以使按比例分配的分层抽样精度可以得益 20% (即 V(Pprop) V(Psrs)=0.8)(2) 若 P=4% 其中 W=0.05,P1=45% W=0.2,B=5%; W3=0.75, P 3=1%则采用按比例分 配的分层抽样比简单随机抽样精度得益有多大?14.调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分 成四层,每层取10个村作为样本单元,经过调查获得下列数据层村总数样本村养牛头数67891012345114114384980104401241302470550147 628784158170

15、10456 16032558228 262 110232139 178 3340632204149971734253436025 71531要求:(1) 估计该地区养牛总头数 Y及其估计量的相对标准误差s(Y). Y?(2) 讨论分层抽样与不分层抽样比较效率有否提高。(3) 若样本量不变采用乃曼分配可以减少方差多少?15. 用下面的工厂分组资料按工人人数分组工厂数目每工厂产值(万兀)标准差1 49182601008050 99431525020010024922335006002509991057176019001000人以上56722502500(1) 若欲抽取3000个工厂作样本来估计产值

16、,试比较下列各种分配的效率:(2) 按工厂数多少分配样本;按最优(奈曼)分配。16. 一个样本为1000的简单随机样本,其结果可分为三层,相应的2 2 2y =10.2,12.6,17.1,Sh =10.82(各层相同),S =17.66,估计的层权是 Wh =0.5,0.3,02已知这些权数有误差,但误差在5%以内,最不好的情况是Wh =0.525 , 0.285 , 0.190或Wh =0.475,0.315,0.210,你认为是否需要分层?L17. 设费用函数具有形式 CT二C0Chnh ,其中C0 , Ch ( h=1,丄)均为已知数。h 二2 2试证明当总的费用固定时,为了使 V(yst)达到最小,nh必与(Wh S )23成比例。Ch18. 假设总体包含大小相等的L个层,且N相对于L和n来说很大。Vran表示简单随机样本均值的方差,Vprop表示按比例分配的分层随机抽样时的相应方差。试证明下列两式近 似成立:1 L2(1) nVran 二 Sh (斗-丫)2L h =12(2 )nVprop - Sh2其中Sh表示层内的平均方差,即Sh

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!