南开大学21秋《大数据开发技术》平时作业一参考答案53

上传人:住在****她 文档编号:92895979 上传时间:2022-05-19 格式:DOCX 页数:13 大小:13.59KB
收藏 版权申诉 举报 下载
南开大学21秋《大数据开发技术》平时作业一参考答案53_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》平时作业一参考答案53_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》平时作业一参考答案53_第3页
第3页 / 共13页
资源描述:

《南开大学21秋《大数据开发技术》平时作业一参考答案53》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》平时作业一参考答案53(13页珍藏版)》请在装配图网上搜索。

1、南开大学21秋大数据开发技术平时作业一参考答案1. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD2. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B3. 广度优先是什么的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A4. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C5. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案:B6. NA

2、S是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )A.对B.错参考答案:A7. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A8. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T9. 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。( )A.对B.错参考答案:A10. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案:B11. Storm中如果要让每一个Task都会收

3、到所有的Tuple,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:B12. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B13. Hbase中Zookeeper提供了( )A.分布式同步B.组服务C.域名服务D.配置维护参考答案:ABCD14. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD15. Spark SQL读取的数据源支持

4、( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD16. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F17. 大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案:A18. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T19. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快参考答案:B20. 实现大

5、整数的乘法是利用( )的算法。A.贪心法B.动态规划法C.分治策略D.回溯法参考答案:C21. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC22. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B23. 动态规划算法的基本思想是将待求解问题分解成若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解。( )A.错误B.正确参考答案:B24. MapReduce中最优的Reduce任务个数取决于集群中可用的( )的数目。A.SplitB.SlotC.MapD.Shuff

6、le参考答案:B25. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A26. 可视化工具包括( )。A.ExcelB.Google ChartC.GephiD.ppt参考答案:ABC27. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T28. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B29. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟。( )A.正确B.错误参考答案:A30. Storm中如果要保证相同字段的T

7、uple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D31. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C32. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B33. MapReduce将输入文件切分成M个分片,Master将其中( )个分片分给处于空闲状态的N个Worke

8、r来处理。A.MB.NC.M-1D.N-1参考答案:A34. 优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:D35. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A36. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC37. PairRDD可以通过( )获得仅包含键的RDDA.keyB.keysC.valueD.values参考答案:B38. Spark SQL可以通

9、过( )方法加载json文件为DataFrameA.formatB.jsonC.getD.read参考答案:AB39. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A40. 以深度优先方式系统搜索问题解的算法称为回溯法。( )A.错误B.正确参考答案:B41. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A42. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C43. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A44. 数据

10、产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A45. 下列算法中通常以深度优先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:D46. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T47. 我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。( )A.对B.错参考答案:A48. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:D49. PairRDD的( )方法,可以把两

11、个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A50. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B51. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F52. 内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。( )A.对B.错参考答案:A53. 使用回溯法进行状态空间树裁剪分支时一般有两个标准:约束条件和目标函数的界,N皇后问题和0/1背包问题正好是两种不同

12、的类型,其中同时使用约束条件和目标函数的界进行裁剪的是0/1背包问题,只使用约束条件进行裁剪的是N皇后问题。( )A.错误B.正确参考答案:B54. Mllib中线性会馆算法中的参数numIterations表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A55. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B56. 图(Graph)是一种复杂的非线性结构。( )T.对F.错参考答案:T57. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C58. BigTable采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B59. 分支限界法是一种只带有系统性的搜索算法。( )A.错误B.正确参考答案:A60. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!