社会统计学期末复习题与答案整理

上传人:沈*** 文档编号:78260131 上传时间:2022-04-21 格式:DOC 页数:60 大小:561.50KB
收藏 版权申诉 举报 下载
社会统计学期末复习题与答案整理_第1页
第1页 / 共60页
社会统计学期末复习题与答案整理_第2页
第2页 / 共60页
社会统计学期末复习题与答案整理_第3页
第3页 / 共60页
资源描述:

《社会统计学期末复习题与答案整理》由会员分享,可在线阅读,更多相关《社会统计学期末复习题与答案整理(60页珍藏版)》请在装配图网上搜索。

1、社会统计学期末复习题与答案 整理社会统计学期末复习训练一、单项选择题(2O=2X 10)1. 为了解IT行业从业者收入水平,某研究机构 从全市IT行业从业者随机抽取800人作为样本 进行调查,其中44%回答他们的月收入在6000 元以上,30%回答他们每月用于娱乐消费在1000 元以上。此处800人是.样本2. 某地区政府想了解全市 332.1万户家庭年均 收入水平,从中抽取3000户家庭进行调查,以 推断所有家庭的年均收入水平。这项研究的总体 是332.1户家庭的年均收入3. 学校后勤集团想了解学校 22000学生的每月 生活费用,从中抽取2200名学生进行调查,以 推断所有学生的每月生活费

2、用水平。这项研究的 总体是22000名学生的每月生活费用4. 为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000 元以上,40%回答他们每月用于通讯、网络的费 用在300元以上。此处5000户是 样本5 从变 量分类看,下列变量属于定序变量的是产品等级6. 下列变量属于数值型变量的是工资收入7. 从含有N个元素的总体中,抽取n个元素作为 样本,同时保证总体中每个元素都有相同的机会 入选样本,这样的抽样方式称为.简单随机抽样 8某班级有60名男生,40名女生,为了了解 学生购书支出,从男生中抽取 12名学生,从女 生中抽取8名学生进行调查。这种调查方法属于

3、 分层抽样9. 先将总体按某标志分为不同的类别或层次, 然 后在各个类别中采用简单随机抽样或系统抽样 的方式抽取子样本,这样的抽样方式称为分层抽 样10. 某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后, 在前十名 学生中随机抽出成绩为第3名的学生,后面依次 选出第 13、23、33、43、53、63、73、83、93 九名同学进行调查。这种调查方法属于系统抽样11. 在频数分布表中,某一小组中数据个数占总 数据个数的比例称为频率12. 在频数分布表中,将各个有序类别或组的百 分比逐级累加起来称为 累积频率13. 在频数分布表中,频率是指各组频数与总频数之比14. 在

4、频数分布表中,比率是指不同小组的频数 之比15. 如果用一个图形描述比较两个或多个样本或 总体的结构性问题时,适合选用环形图16. 某地区2001-2010年人口总量(单位:万人) 分别为 98, 102, 103, 106, 108, 109, 110, 111, 114, 115,下列哪种图形最适合描述这些 数据线图17. 当我们用图形描述甲乙两地区的人口年龄结 构时,适合选用哪种图形 环形图18在某市随机抽取10家企业,7月份利润额(单位:万元)分另I为72.0、63.1、20.0、23.0、 54.7、54.3、23.9、25.0、26.9、29.0,那么这 10家企业7月份利润额均值

5、为39.1919 .某班级10名同学期末统计课考试分数分别为 76、 93、 95、 80、 92、 83、 88、 90、 92、 72, 那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组: 1)1500 元及以下;2) 1500-2000 元;3) 2000-2500 元;4) 2500-3000 元;5) 3000 元及以上,则 3000 元及以上这一组的组中值为 3250元21 为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份 利润额均值为45.222. 某专业共8名同学,他们的统

6、计课成绩分别 为 86、77、97、94、82、90、83、92,那么该 班考试成绩的中位数是 8823. 某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2) 1-2小时;3)2-3小时;4) 3-4小时;5) 4-5小时;6) 5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24. 对于左偏分布,平均数、中位数和众数之间 的关系是众数 中位数平均数25. 对于右偏分布,平均数、中位数和众数之间 的关系是平均数中位数众数26离散系数的主要目的是比较多组数据的离散 程度27 两组数据的平均数不相等,但是标准差相等。 那么平均数大的,离散程度小28. 已知某单位平均月收入

7、为 3500元,离散系 数为0.2,那么他们月收入的标准差为 70029. 班学生的平均体重均为 55千克,二班学 生的平均体重为52千克,两个班级学生体重的 标准差均为5千克。那么二班学生体重的离散 程度大30. 已知某单位平均月收入标准差为 700元,离 散系数为0.2,那么他们月收入的均值为 350031. 正态分布中, 值越小,则 离散趋势越小32. 已知某单位职工平均每月工资为 3000元, 标准差为500元。如果职工的月收入是正态分 布,可以判断月收入在2500元一3500元之间的 职工人数大约占总体的68%33 .如果一组数据中某一个数值的标准分值为-1.5,这表明该数值 比平均

8、数低1.5个标准差34. 某班级学生期末英语考试平均成绩为 75分, 标准差为10分。如果已知这个班学生的考试分 数服从正态分布,可以判断成绩在65-85之间的 学生大约占全班学生的68%35. 经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有95%的数据36. 期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是正太 分布,可以判断成绩在 72分-88分之间的学生大约占总体的95%37如果一组数据中某个数值的标准分值为 1.8, 这表明该数值比平均数高出1.8个标准差38. 某班级学生期末统计学考试平均成绩为82 分,标准差为5分。如果已知这

9、个班学生的考试 分数服从正态分布,可以判断成绩在77-87之间 的学生大约占全班学生的68%39. 经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有68%的数据40. 用样本统计量的值直接作为总体参数的估计 值,这种方法称为点估计41. 用样本统计量的值构造一个置信区间,作为 总体参数的估计,这种方法称为区间估计42. 某单位对该厂第一加工车间残品率的估计高 达10%而该车间主任认为该比例()偏高 如果要检验该说法是否正确,则假设形式应该是H0 : 0.1 ; H1 : 0.13 ; H1:Compare MeansPaired Sample T Test,出现图 1

10、1 4所示窗口。 “Paired Variables ”框中的变量作为分析变量,总是 成对出现,指定要检验的两个变量到 “ Paired Variables 输入栏里的 “ VariableT 和 “ Variable2 ” 中,在 “ Current Selections ” 栏中就会显示被选中的成对变量,在“Optio ns ”选项中可以进行置信水平和缺失值的设置,同单样本T检验。22 .简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。P207T检验(T Test )是最常见的一种假设检验类型,主要验证总体均值间是否存在 显著性差异。T检验属于参数假设检验,所以它适用的范围是

11、数值型的数据, 在 网站分析中可以是访问数、独立访客数、停留时间等,电子商务的订单数、销 售额等。T检验还需要符合一个条件 一一总体符合正态分布。卡方检验(chi-square test ),也就是检验,用来验证两个总体间某个比 率之间是否存在显著性差异。卡方检验属于非参数假设检验,适用于布尔型或 二项分布数据,基于两个概率间的比较,早期用于生产企业的产品合格率等, 在网站分析中可以用于转化率、Bou nee Rate等所有比率度量的比较分析,23.简要说明卡方的拟合优度检验和独立性检验的含义。P仃82 、拟合优度检验(1) 拟合优度检验从总体的不同类别中抽取元素构成样本,样本包含总体中各个类

12、别的元素,对不同类 别的目标量之间是否存在显著性差异进行的检验称为拟合优度检验。拟合优度检验是2检验中重要的一部分,可以同时对多个总 体进行比较。在2检验中,如果2统计量小 于给定的2,那么就不能拒绝原假设,如果 大于则拒绝。即2检验的拒绝域是2 2(k 1),其中k 1是自由度。自由度是可以 自由变动的变量个数,在列联表中,自由度 =(R 1) * (C 1)。独立性检验(1) 独立性检验:2检验还可用于判断两 个分类变量之间是否存在联系,例如,对宿 舍管理改革的态度是否与专业有关、对性行 为的态度是否与学历有关等。如果两个分类 变量之间没有关系,则称为独立,我们用2判断它们之间是否关联,这

13、时称为独立性检 验。3432四、计算题(每题15分,共30分)12-16题 题型一样,公式自己抄1.某校社会学专业同学统计课成绩如下表 所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010

14、459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1) 对考试成绩按由低到高进行排序,求 出众数、中位数和平均数。(2) 对考试成绩进行适当分组,编制频数 分布表,并计算累计频数和累计频率。解答:(1)对考试成绩按由低到高进行排序如 下:62, 66,68,70,70,75,76,76,76,76,76,77, 78,79,80,80,80,81,82,82,83,83,85

15、, 86,86,87,87,88,88,90,90,90,91,91, 92, 93, 93, 94, 95, 95, 96, 97其中,众数为76,中位数为83,平均数为83.1(2) 对考试成绩进行适当分组,编制频数分布 表如下:按成绩分 组(分)频数累计频数累计频率6070337%7080111433%8090152969%901001342100%2.某行业管理局所属40个企业2011年产品 销售额数据如下所示。40个企业2011年产品销售额企业 编号销售 额企业 编号销售 额企业 编号销售 额企业 编号销售 额1152111052110331136210512123221033214

16、63117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求:(1) 对2011年销售额按由低到高进行排 序,求出众数、中位数和平均数。(2) 如果按照规定,销售额在 125万元以 上的为先进企业,115万-125万之间的为良好企 业,105万-115万之间的为一般企业,105万以 下的为落后企业,请按先进企业、良好企业、一 般企业、落后企业进行分组,编制

17、频数分布表,并计算累积频数和累积频率。解答:(1)对2011年销售额按由低到高进 行排序如下:87, 88,91,95,97,100,103,103,104,105,105,107,108,108,110,112,113,115,115,115,116,117,117,118,119,119,120,123,124,125,126,127,129,135,136,137,138,142,146,152得到众数攵为115 ;中位数为1155 ;平均数为 116.175 。(2) 对企业按销售额进行适当分组,编制频数 分布表如下:60等级频数累计频数累计频率先进111127.5 %良好122357

18、.5 %般83177.5 %落后940100%3. 甲单位人均月收入4500元,标准差1200 元。乙单位月收入分布如下所示。乙单位月收入分布表按收入分组(元)人数(个)3000分以下1203000400042040005000540500060004206000以上300合计1800要求:(1)计算乙单位员工月收入的均值和标准差。(2)比较甲单位和乙单位哪个单位员工月 收入的离散程度更大?(提示:使用离散系数) 解答:对分组数据先求出各组的组中值乙单位月收入分布表按收入分组(元)人数(个)组中值3000分以下120250030004000420350040005000540450050006

19、00042055006000以上3006500合计1800(1)乙单位员工月收入的均值为-2500 120 3500 420 4500 540 5500 420 6500 300X乙47001800乙单位员工月收入的标准差为I (Mi X)2 人乙#f(2500 4700)2 120 (3500 4700)2 420(45004700)2 540 (5500 4700)2 420(6500V18001166(2)甲单位员工收入的离散系数V甲1200 0.267,乙4500单位员工收入的离散系数V乙 1766 0.248,故甲单4700位员工月收入的离散程度大。4. 某校社会学专业共有两个班级。

20、期末考试 时,一班同学社会学理论平均成绩为 86分,标 准差为12分。二班同学成绩如下所示。二班同学社会学理论成绩分组数据表按成绩分组 (分)人数(个)60分以下2607077080980907901005合计30要求:(1)计算二班同学考试成绩的均值和标准 差。(2)比较一班和二班哪个班成绩的离散程 度更大?(提示:使用离散系数)解答:对分组数据先求出各组的组中值二班同学社会学理论成绩分组数据表故二班的成绩的离散程度大5. 某公司招聘职员时,要求对职员进行两项 基本能力测试。已知,A项测试中平均分数为90 分,标准差是12分;B考试中平均分数为200 分,标准差为25分。一位应试者在A项测试

21、中 得了 102分,在B项测试中得了 215分。若两项 测试的成绩均服从正太分布,该位应试者哪一项 测试更理想? 解答:在A项测试中z 罟 i,在B项测试中匹竺0.625说明该位应试者在A项测试中的成绩高于均值1倍的标准差,在B项测试中的成绩高于均值0.6 倍的标准差,故该位应试者 A项测试成绩更理 想。6. 一项关于大学生体重状况的研究发现,男 生的平均体重为60千克,标准差为5千克;女 生的平均体重为50千克,标准差为5千克。请 问:(1 )是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3) 女生中有多少比重的人体重在 40千克-60

22、千克之间?解答:(1)男生体重的离散系数Vi 60 0.083,女60 为估计每个网络用户每天上网的平均时间是多少,抽取了 225个网络用户的简单随机样生体重的离散系数为Vi 50 0.1,故女生体重差异507(2) 男生体重XiN(60,52),令乙 牛60N(0,1),757从而P(55 Xi 65) P(55 60 Xi 60 65 60) p( i Zi 1) 68%,555*故男生中有68%的人体重在5565千克之 间。(3)女生体重 X2N(50,52),令 Z2N(0,i),5从而P(40 X260)P(4L_50X2 50560 50)5)P( 2 Z22) 95% ,故女生中有95%的人体重在4060千克之 间。本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%勺置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄 在20岁以下的用户为90个。以95%勺置信水平, 计算年龄在20岁以下的网络用户比例的置信区 间。了注:Z 0.0251 .96解答:(1)网络用户每天平均上网时间的 95%勺 置信水平下置信区间为(6.51

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!