南开大学22春《数据科学导论》综合作业一答案参考33

上传人:住在****他 文档编号:89210559 上传时间:2022-05-12 格式:DOCX 页数:12 大小:14.34KB
收藏 版权申诉 举报 下载
南开大学22春《数据科学导论》综合作业一答案参考33_第1页
第1页 / 共12页
南开大学22春《数据科学导论》综合作业一答案参考33_第2页
第2页 / 共12页
南开大学22春《数据科学导论》综合作业一答案参考33_第3页
第3页 / 共12页
资源描述:

《南开大学22春《数据科学导论》综合作业一答案参考33》由会员分享,可在线阅读,更多相关《南开大学22春《数据科学导论》综合作业一答案参考33(12页珍藏版)》请在装配图网上搜索。

1、南开大学22春数据科学导论综合作业一答案参考1. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A2. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A3. 整数和整数之间的运算结果一定的是整数。( )A.正确B.错误参考答案:B4. 梦幻西游手游情缘使者在哪?梦幻西游手游情缘使者在哪?点击活动因缘际会,这样就可以自动寻路找到情缘使者了。5. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考

2、答案:T6. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D7. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。8. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C9. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A10. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明

3、相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B11. 下列哪个R语言扩展包可以创建带有点和边的网络图( )A.ggplot2B.networkC.ggmapsD.animation参考答案:B12. 随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。( )A.正确B.错误参考答案:A13. 用于描述相等时间间隔下连续数据随时间变化趋势的是( )A.折线图B.散点图C.条形图D.饼图参考答案:A14. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T15. 多层感知

4、机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD16. 关于R语言扩展包下列正确的是( )A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具参考答案:AB17. 某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。参考答案:数据集市18. 商业智能(BI)可以被描

5、述为“一组用于获取原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具”。( )T.对F.错参考答案:T19. 关于Python语言的注释,以下描述错误的是( )。A.Python语言的多行注释以(三个单引号)开头和结尾B.Python语言的单行注释以#开头C.Python语言有两种注释方式:单行注释和多行注释D.Python语言的单行注释以单引号开头参考答案:D20. 地下城与勇士(DNF)TP提示码(3,172000xx,x)是什么意思?地下城与勇士(DNF)TP提示码(3,172000xx,x)是什么意思?请查杀病毒和木马,重启机器后再试。21. 关于Python语言的

6、注释,以下描述错误的是( )。A.Python语言的多行注释以(三个单引号)开头和结尾B.Python语言的单行注释以#开头C.Python语言有两种注释方式:单行注释和多行注释D.Python语言的单行注释以单引号开头参考答案:D22. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A23. 空间视图提供了交通堵塞的概览。( )T.对F.错参考答案:T24. 决策树分类时将该结点的实例强行分到条件概率大的那一类去。( )A.正确B.错误参考答案:A25. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B26. 一元线性

7、回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D27. 地下城与勇士(DNF)使用加百利后,队长怎么无法进行再次挑战等操作?地下城与勇士(DNF)使用加百利后,队长怎么无法进行再次挑战等操作?1、组队后,如果有用户使用加百利秘密商店或者点击出现了加百利商店的交易界面,那么队长无法选择再次挑战、选择其他地下城、返回城镇等菜单;2、加百利只出现三分钟,三分钟后秘密商店自动关闭,届时队长即可进行再次挑战、选择其他地下城及返回城镇等操作。28. GFS中的文件切分成( )的块进行存储A.32MBB.64MBC.128MBD.1G参考答案:B29. Pearson

8、相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A30. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD31. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A32. 下列不属于Google云计算平台技术架构的是( )A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2参考答案:D33. 2002年博客引进中国,建立的第一个博客网站是新浪博客。( )2002年博客引进中国,

9、建立的第一个博客网站是新浪博客。( )答案:错误34. K均值(K-Means)算法是密度聚类。( )A.正确B.错误参考答案:B35. 决策树内部结点表示一个类,叶结点表示一个特征或属性。( )A.正确B.错误参考答案:B36. 地下城与勇士(DNF)SX警告码(2,xxx,0)是什么意思?地下城与勇士(DNF)SX警告码(2,xxx,0)是什么意思?您的电脑中存在非法模块,请重启电脑后登陆游戏,同时请不要使用第三方非法软件进行游戏,并建议您使用“腾讯游戏木马专杀”提高帐户安全性。37. BFR聚类簇的坐标可以与空间的坐标保持一致。( )A.正确B.错误参考答案:B38. 以下选项中,不是P

10、ython对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A39. 时空数据是指带有地理位置与时间标签的数据。( )T.对F.错参考答案:T40. 数据变换的常用方法有( ),( ),( ),( )A.中心化变换B.极差规格化变换C.标准化变换D.对数变换参考答案:ABCD41. 函数是一段具有特定功能的、可重用的语句组,用函数名来表示并通过函数名进行功能调用。( )A.正确B.错误参考答案:A42. 上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信

11、誉,以吸引客户C.后期可能根据物流数据展示出此拍档的物流服务能力,以吸引客户D.没有作用参考答案:ABC43. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A44. 聚类的最简单最基本方法是( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A45. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B46. 选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。( )A.正确B.错误参考答案:A47. 获取数据为数

12、据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B48. 函数体现的是代码复用和模块化设计思想。( )A.正确B.错误参考答案:A49. 朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能。( )A.正确B.错误参考答案:A50. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC51. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C52. 对于k近

13、邻法,下列说法错误的是( )。对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C53. 域名是一个企业或机构在网上的永久性电子商标,它的作用如同商标在市场上的作用一样。( )域名是一个企业或机构在网上的永久性电子商标,它的作用如同商标在市场上的作用一样。( )答案:正确54. 如何理解计算机网络?如何理解计算机网络?参考答案:计算机网络就是将地理位置不同、具有独立功能的多个计算机系统,用通信线路和通信设备连接起来,在网络软件支持下,实现数据通信和资源共享的系统。55. 宁家骏委员指出,我国发

14、展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T56. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析参考答案:ABC57. 给定关联规则AB,意味着若A发生,B也会发生。( )A.正确B.错误参考答案:B58. SAN是一种( )A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBA参考答案:B59. 定义和使用函数的主要原因是函数执行速度更快。( )A.正确B.错误参考答案:B60. 一个HDFS集群由一个( )和( )构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点参考答案:AD

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!