南开大学21秋《数据科学导论》复习考核试题库答案参考套卷17

上传人:住在****她 文档编号:90523756 上传时间:2022-05-15 格式:DOCX 页数:11 大小:14.21KB
收藏 版权申诉 举报 下载
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷17_第1页
第1页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷17_第2页
第2页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷17_第3页
第3页 / 共11页
资源描述:

《南开大学21秋《数据科学导论》复习考核试题库答案参考套卷17》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》复习考核试题库答案参考套卷17(11页珍藏版)》请在装配图网上搜索。

1、南开大学21秋数据科学导论复习考核试题库答案参考1. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C2. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明( )。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C3. 在list对象中添加元素可以使用add( )函数,将要添加的值加入列表尾部。( )A.正确B.错误参考答案

2、:B4. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B5. 一拍档能帮客户买通关单。( )一拍档能帮客户买通关单。( )参考答案:6. 基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。( )T.对F.错参考答案:T7. 函数的名称可以任意字符组合形成的。( )A.正确B.错误参考答案:B8. 整数和浮点数混合运算,输出结果是浮点数。( )A.正确B.错误参考答案:A9. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了( )、( )、( )、( )。A.数

3、据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD10. 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。( )T.对F.错参考答案:T11. 下列哪一种不是Python的特性?( )A.跨平台特性B.解释型语言C.编译型语言D.面向对象参考答案:C12. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD13. 关于网络广告付费模式,以下关于PPC解释正确的是( )A:按行动付费B:按点击付费C:按显示付费D:按关于网络广告付费模式,以下关

4、于PPC解释正确的是( )A:按行动付费B:按点击付费C:按显示付费D:按销售付费答案:B14. 拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )参考答案:15. 一元回归参数估计的参数求解方法有( )。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法参考答案:ABC16. 使用SVD方法进行图像压缩不可以保留图像的重要特征。( )A.正确B.错误参考答案:B17. Python中,字典是一个键值对的集合,字典以键为索引,一个键只对应一个值。( )A.正确B.错误参考答案:A18. 下列不属于Google云计算平台技术架构的是(

5、 )A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2参考答案:D19. 云存储(名词解释)参考答案:云存储是在云计算(cloud rncomputing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术。它是云计算的重要组成部分,也是云计算的重要应用之一。云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。20. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.fina

6、lly参考答案:A21. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T22. k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B23. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A24. 概念描述(concept description)对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。( )T.对F.错参考答案:T25. 对于k近邻法,下列说法错误的是( )。对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大

7、,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C26. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考答案:T27. 云存储中用户需要按需付费并使用存储服务。( )T.对F.错参考答案:T28. 信息熵越小,样本结合的纯度越低。( )A.正确B.错误参考答案:B29. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C30. 相关性分析主要是分析个别独立变量之间线性相

8、关程度的强弱,并用适当的统计指标表示出来的过程。( )A.正确B.错误参考答案:B31. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5;假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C32. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD33. 单层感知机模型属于( )模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性

9、分类模型D.多分类的非线性分类模型参考答案:A34. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A35. Extranet有哪些功能?Extranet有哪些功能?参考答案:1.信息资源共享:与外部企业共享信息资源2.业务协作处理:建立业务协同处理链接,优化业务流程3.共同开发新业务:形成虚拟联合企业36. 空间视图提供了交通堵塞的概览。( )T.对F.错参考答案:T37. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B38. 2002年博客引进中国,建立的第一个博客网站是新浪博客。( )2002年博客引

10、进中国,建立的第一个博客网站是新浪博客。( )答案:错误39. 规划一个C类网,需要将网络分为20个子网,每个子网最多5台主机,下列哪个是合适的子网掩码( )A、255. 255. 255.0。B、 255. 255. 255.224。C、 255. 255. 255.240。D、 255. 255. 255.248参考答案:D40. 给定关联规则AB,意味着:若A发生,B也会发生。( )A.正确B.错误参考答案:B41. 决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件

11、概率分布。( )决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布。( )A.正确B.错误参考答案:A42. 如何测试自己家中的宽带速率?宽带速率如何快速检测?如何测试自己家中的宽带速率?宽带速率如何快速检测?答案:1.停止其它设备的上网行为,只留一台电脑通过网线与光纤猫或路由器连接;2.打开电脑的浏览器,输入“”,进入网站(pc端,手机版需要下载)3.等待网页加载完成后点击“begin”,开始测试。4.测试结果很会显示在网页的正中央,出用户的延迟,下载速率和上传速

12、率都会详细显示。43. 下列选项是BFR的对象是( )。A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD44. 由于列表是动态可变的,所以它不能作为集合的元素或者字典的key。( )A.正确B.错误参考答案:A45. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络

13、论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。46. Internet Explorer不能识别的格

14、式是( )A.cssB.scriptingC.datD.htm参考答案:C47. 一个HDFS集群由一个( )和( )构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点参考答案:AD48. 以下哪一项不是特征选择常见的方法?( )A.过滤式B.封装式C.嵌入式D.开放式参考答案:D49. 在k近邻法中,选择较小的k值时,学习的“近似误差”会( ),“估计误差”会( )。A.减小,减小B.减小,增大C.增大,减小D.增大,增大参考答案:B50. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!