CDA数据分析师认证题库精选.

上传人:ba****u 文档编号:119636508 上传时间:2022-07-15 格式:DOCX 页数:24 大小:26.17KB
收藏 版权申诉 举报 下载
CDA数据分析师认证题库精选._第1页
第1页 / 共24页
CDA数据分析师认证题库精选._第2页
第2页 / 共24页
CDA数据分析师认证题库精选._第3页
第3页 / 共24页
资源描述:

《CDA数据分析师认证题库精选.》由会员分享,可在线阅读,更多相关《CDA数据分析师认证题库精选.(24页珍藏版)》请在装配图网上搜索。

1、CDA 等级考试模拟题库:基础理论部分第一部分:判断题1. 统计学是研究社会领域和自然领域的规律的实质性科学。2. 大量观察法是统计研究的最基本的方法。3. 总体单位的属性既可以用数值表示,也可以用文字表示。4. 对任何一事物进行统计研究的前提是构成统计总体的各个个体单位必须具有的差异性。5. 构成总体的各个个体单位至少在某一属性上相同,才能准确地确定总体范围。6. 统计学与哲学相同,属于认识客观世界的最一般的方法论科学。7. 运用统计方法E以研究和解释事物发展的原因和规律。8. 总体的同质性、变异性、大量性是平均法的应用前提。9. 在用计算机数据进行汇总时,往往将男性用“1”来表示,女性用“

2、0”来表示,所以可以 讲性别 视为量别变量。10. 在人工干预或操作情况下收集的数据称为实验数据。11. 截面数列按分组标志不同可以分为品质数列和变量数列。12. 同龄人的身高,用频数曲线描述一般表现为钟型分布。13. 欲掌握我国人口是否具有老龄化特征,对人口按年龄分组,适合采用等距式分组。14 .对在校大学生的年龄进行分组适合采用组距式分组。15. 在组距式分组中,采用组中值作为每组一般水平的代表值。16. 直方图仅适合用于显示连续型分组数据。17. 茎叶图不仅能够反映数据的分布情况,还能显示数据的原始信息。18. 频数分布表中的组距在茎叶图中称为步长。20. 箱索图的优点是便于同时比较多组

3、数据的分布特征。21. 如果一组数据呈正态分布,则算术平均数的大小不会受极端值的影响。22. 计算加权算术平均数时,若各组权数相同,权数对算术平均数结果没有影响23. 若一组数据的众数大于算术平均数时,该数据呈右偏分布。24. 当一组数据分布明显偏斜时,不宜采用算术平均数作为中心趋势的测度值。25. 当一组数据的各个观察值与该组数据的算术平均数的离差平方和等于零。26. 中位数与众数相同,具有唯一性的特点。27. 依据组距式分组数据计算的加权算术平均数有时会产生较大的误差。28. 任一组数据都可以计算算术平均数、众数和中位数三个集中趋势指标。第二部分:单项选择题1. 调查城镇居民对政府服务的满

4、意度,需要抽取足够的居民,这种方法称为()A. 随机抽样法B. 统计分组法C. 回归分析法D. 大量观察法2. 用部分数据推断总体数据的方法,属于()A. 理论统计学的内容B. 应用统计学的内容C. 推断统计学的内容D. 描述统计学的内容A.数量性B.同质性C.变异性D.大量性4. 下列不属于原始数据来源的是()A. 行政记录B. 统计调查C. 统计年鉴D. 实验5. 在进行普查时,必须要规定标准时间,其目的是为了()A. 避免登记的重复和遗漏B. 确定调查对象的范围C. 确定调查单位D. 保证调查的及时性6. 某出口企业对其产品质量进行检验,采用的调查方式是()A.普查 B.随机抽样调查C.

5、判断抽样调查D.方便抽样调查7. 了解居民消费水平的变化状况,一般采用入户调查。确定样本户的方式是(A. 系统抽样B. 分层抽样C. 整群抽样D. 多步抽样C. 选取观察值的方法不同D.精确度不同9. 在抽样调查中,()A. 不会出现登记性误差,只会出现代表性误差B. 会出现登记性误差,不会出现代表性误差C. 既会出现登记性误差,也会出现代表性误差D. 既不会出现登记性误差,也不会出现代表性误差10. 统计调查表中的调查项目就是()A.统计指标B.统计数值C.统计分组D.统计标志11. 街头拦截获得样本数据的方式属于()A.普查B.方便抽样调查C. 判断抽样调查D.随机抽样调查12. 普查中的

6、标志时间是指()A. 进行调查工作的时间 B.调查数据所属时间C. 记录数据的时间D.数据上报的时间13. 某次调查收集了 300 名学生的性别、专业和月手机支出额的数据,这项调查的变量个数 有 ()A. 1 个 B.2 个 C.3 个 D.300 个14. 构成截面数据的两个要素是()A 组距和各组频数B 组限和各组频数C 组中值和各组频数D 分组标志和各组频数15. 在全距既定的情况下()A. 组数越多则组距越大B. 组数越多则组距越小C. 组数越少则组距越小D. 组数与组距无对应关系16. 适合编制单值数列的数据是()A. 连续型变量且数据变动范围较小B. 离散型变量且数据变动范围较小C

7、. 连续型变量且数据变动范围较大D. 离散型变量且数据变动范围较大17. 在编制等距式分组数列时如果全距57,组数为7,为了计算方便,组距应当取(A. 8.1 B. 8 C. 7 D. 1018. 在平面直角坐标轴中,横轴刻度表示直方图的()A.频数B.组中值C.组距D.组限19. 对数据进行分组时,采用等距分组还是异组距分组,取决于()A. 变量值的多少B. 次数的多少C. 研究现象的特点D. 组数的多少20. 对工业企业按经济类型分组和按利润额分组()A. 都属于质别标志分组B. 都属于量别标志分组C. 前者属于质别标志分组,后者属于堇别标志分组D. 前者属于量别标志分组,后者属于质别标志

8、分组21. 集中趋势描述指标中最常用的是()A.算术平均数B.几何平均数C.众数D.中位数22. 在离中趋势的描述指标中,最容易受极端值影响的是()A 变异系数B 方差C 全距D 标准23. 用组中值来计算均值时,假定各组变量()A. 次数相等B. 组限是封闭的C. 在组内均匀分布或对称分布D. 组中值是整数24. 两组数据的均值不等,但标准差相等,则()A. 均值大的一组数据差异程度大B.均值小的一组数据差异程度大C.两组数据的差异程度相同D.无法对两组数据进行比较25. 已知甲班学生“统计学”的平均成绩为 86 分,标准差是 12.8 分,乙班学生“统计学”的 平均成绩是 90分,标准差是

9、 10.3 分,下列表述正确的是()乙班平均成绩的代表性高于甲班甲班平均成绩的代表性高于乙班 甲、乙两班平均成绩的代表性相同 甲、乙两班平均成绩的代表性无法比较26. 对同一变量数列,以不同集中趋势指标为中心计算标准差,标准差数值最小的是()A. 以中位数为中心计算的标准差B. 以算术平均数为中心计算的标准差C. 以众数为中心计算的标准差D. 以几何平均数为中心计算的标准差27. 某地区城镇居民家庭年收入最多的是 7.2 万元,家庭年收入的平均数是 8 万元,该地区家 庭年收入的分布为()A.左偏分布B.右偏分布C.J型分布D.对称分布28. 权数对算术平均数的影响取决于( )。A 权数的总和

10、 B 权数的绝对值 C 权数的平均数 D 权数的相对数29. 某市有各类书店 500家,其中大型 50家,中型 150家,小型 300家。为了调查该市图书 销售情况,拟抽取 30家书店进行调查。如果采用分层等比例抽样法,下列在大型、中型、 小 型书店中样本的正确分配量为()A. 5、15、10 B . 7、10、13 C.10、10、10 D.3、9、1830. 抽样调查中,无法避免和消除的是()A.登记误差B.系统性误差C.随机误差D.测量工具误差31. 估计量的数学期望等于总体参数这一性质称为()A.一致性B.无偏性C.有效性D.随机性32. 总体均值的置信区间等于样本均值加减估计误差,其

11、中的估计误差等于置信水平的临界 值 乘以()A. 样本均值的抽样标准差B.样本标志差C.样本方差D.总体标志差33. 下列关于统计量的表述中,不正确的是()A. 统计量是样本的函数B. 估计同一总体参数可以用多个不同统计量C. 统计量是随机变量D. 统计量的数值是唯一的34. 某品牌袋装白糖每袋重量的标志是 500 5克。为了检验该产品的重量是否符合标准, 现 从某日生产的这种糖果中随机抽查 10袋,测得平均每袋重量为 498克。下列说法中错误 的是 ()A.样本量为10B.抽样误差是2克C.样本平均每袋重量是估计量D.点估计值为498克35. 对一部贺岁片收视率进行调查,随机抽取1 00 人

12、,其中有 20 人没有看过该部贺岁片, 则 看过该部贺岁片人数点估计值为()20%B.20C.80D.80%36. 某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的 95%置信度的置信区间是(56%, 64%)o 下列正确的表述是()。A. 总体比率的 95%置信度的置信区间为(56%, 64%)B. 总体真实比率有 95%的可能落在(56%, 64%)中C. 区间(56%, 64%)有 95%的概率包含了总体真实比率D. 由 100 次抽样构造的 100 个置信区间中,约有 95个覆盖了总体真实比率 第三部分:多项选择题1.统计学的内容包括( )A. 决策的方法B.数据的描

13、述方法C.数据的推断方法D.数理的分析方法E. 数据的整理方法2.统计数据必须具有的特点是( )C.具体性D.通用性E.总和性3. 描述统计学的内容包括(A. 收集数据的方法B. 整理数据的方法C. 用集中趋势量数描述数据D. 用离中趋势量数描述数据E. 用样本数据对总体数据进行推断4. 推断统计学的内容包括(A. 收集数据的方法B. 怎样从总体中抽取样本C. 用集中趋势量数描述数据D. 怎样控制样本对总体的代表性误差E. 用样本数据对总体数据进行推断5. 统计数据的特点( )A. 大量性B. 客观性C. 具体性D. 总合性E. 数量性6. 统计数据按来源分类,可以分为(A. 质别数据B. 次

14、级数据C. 量别数据D. 初级数据E. 截-面数据7. 在抽样调查中,产生非抽样误差的原因有( )A. 错误地定义调查总体B.问卷设计的不合理C.抽样方法不正确D.被调查人员的配合程度E. 调查人员的工作态度和业务水平8. 调查过程中产生登记误差的原因是()A. 调查者记录数据有误B. 调查者计算数据有误C. 调查者汇总数据有误D. 被调查者提供数据有误E. 调查样本分布不合理9. 对采集来的初级数据在整理之前应该进行()A. 相关性审核B. 完整性审核C. 时效性审核D. 适用性审核E. 准确性审核C.确定调查项目和调查表D.确定调查时间和地点E. 确定调查的组织计划11. 对于次级数据,应

15、该进行以下一些方面的审核()A.完整性B.准确性C.时效性D.适用性E.合理性12. 统计分组应该遵循的基本原则是(A. 穷尽B. 适用C. 互斥D. 合理E. 随机13. 关于离散型变量,下列表述正确的是( )A. 可以采用单值分组B. 可以采用组距分组C. 相邻组的上下限可以间断D. 相邻的上下限可以重叠E. 可按“上限不在组内”原则处理上下限相同的变量14. 编制频数分布表的目的是()A.显示数据的差异B. 显示数据的分布状况C. 显示数据的中心D. 显示数据的相互关系E. 显示数据的属性15. 编制组距数列时,对于组限的确定,()A. 最小组的下限应大于最小变量值B. 最小组的下限应略

16、小于最小变量值C. 最大组的上限应小于最大变量值D. 最大组的上限应略大于最大变量值E. 最小组的下限和最大组的上限应分别等于最小和最大变量值16. 下列可以表示连续型变量的统计图有( )A.条型图B.直方图C.折线图D.饼图E.茎叶图17. 正确计算组中值的方法是()A. (上限+卜限)/2B. 上限+下限/2C. 上限下限/2D. 上限.邻组组距/2E. 下限+邻组组距/2A. 不同变量数列的相对集中趋势B. 不同变量数列的相对高中趋势C. 不同变量数列的绝对离中趋势D. 均值不同的变量数列的相对集中趋势E. 均值不同的变量数列的相对离中趋势19. 茎叶图包含如下信息( )A. 变量的原始

17、数据信息B. 变量的频数信息C. 累积频数信息D. 数据的分布形态信息E. 数据的众数信息20. 一组数据的标准差数值越小,说明该组数据的( )A 分布远离集中趋势指标 B 集中趋势指标具有较高的代表性C 分布比较接近集中趋势指标 D 集中趋势指标具有较低的代表性E 分布呈均匀分布21. 箱索图是用一组数据的五个顺序统计量来描述数据的分布状况的,这五个统计量是(A 中位数 B 众数 C 四分位数D 极值 E 算术平均数22. 变异系数抽象了( )A. 总体指标数值多少的影响B.总体单位数多少的影响C.标志变动度的影响D.平均水平的影响E.计量单位的影响23. 不同总体间的标准差不能简单地进行比

18、较,是因为(B.离差平方之和不同C总A. 计量单位不同体单位数不同D平均指标不同E.标志差不同A.是数据排序后处于中间位置的数值B.不受极端数值的影响C.是-组数据一般水平的代表值D. 当数据高度偏斜时更能描述集中趋势E是根据所有标志值计算出来的25. 关于众数,下列说法正确的有(A. 是数据中出现次数最多的标志值B. 不受极端数值的影响C. 是-组数据一般水平的代表值D. 对一个变量数列来说不一定存在E. 是根据所有观测值计算出来的26.基本的随机抽样设计有( )A. 整群抽样B. 分层抽样C. 简单随机抽样D. 系统抽样E. 多步抽样27. 下列哪些情况符合使用正态分布的条件?(A. 从正

19、态总体中抽取小样本,总体标志差已知B. 从正态总体中抽取大样本,总体标志差LL知C. 从非正态总体中抽取小样本,总体标准差己知D. 从非正态总体中抽取大样本,总体标志差未知E. 从正态总体中抽取小样本,总体标准差未知A.致性B. 把 握 性C.有效性D.无偏性E.正态性29. 在对总体均值进行区间估计时,影响置信区间宽度的影响是( )A. 总体中各个数据的差异程度B. 抽取样本的方式C. 样本容量的大小D. 估计的可靠性E. 总体数量的大小30. 要提高抽样判断的精度,可采用的方法有()A. 增加样本单位数目B. 减少样本单位数目C. 缩小观测值之间的差异程度D. 改善抽样的组织方式E. 改善

20、抽样的方法SPSS 部分(一)单选题1. SPSS 主要应用于以下哪种类型的数据 ()A、横截面数据B、数据序列数据C、面板数据D、以上都不对2. SPSS 处理多选题格式在以下哪个菜单里进行()A、 设定表B、多响应集C、均值过程D、交叉表3. 检查异常值常用的统计图形()A、 条形图B、箱体图C、伯累托图D、线图4. 使用 SPSS 变换长形或宽形数据结构的过程是(A、 排列变量B、正交设计C、数据重组D、数据转置5. 线性同归里的残差分析不可能用于诊断()A、 残差独立性B、变量分布C、异常值侦察D、最大迭代次数6. 使用单尾还是双尾检验主要依据()A、统计检验B、理论依据C、样本量大小D、偏度或峰度值

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!