南开大学22春《大数据开发技术》综合作业一答案参考79

上传人:住在****他 文档编号:89501739 上传时间:2022-05-13 格式:DOCX 页数:13 大小:13.50KB
收藏 版权申诉 举报 下载
南开大学22春《大数据开发技术》综合作业一答案参考79_第1页
第1页 / 共13页
南开大学22春《大数据开发技术》综合作业一答案参考79_第2页
第2页 / 共13页
南开大学22春《大数据开发技术》综合作业一答案参考79_第3页
第3页 / 共13页
资源描述:

《南开大学22春《大数据开发技术》综合作业一答案参考79》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》综合作业一答案参考79(13页珍藏版)》请在装配图网上搜索。

1、南开大学22春大数据开发技术综合作业一答案参考1. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B2. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC3. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD4. Scala列表方法中输出符号指定条件的所有元素的方法是( )A.dropB.headC.filterD.init参考答案:C5. RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元

2、素删除。( )A.正确B.错误参考答案:A6. Spark GraphX中类Graph的joinVertices方法可以( )A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中参考答案:D7. Map Task和Reduce Task均由( )启动。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D8. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B9. Scala 集合分为可变的和不可变的集合。( )A.正确B.错误参考答案:A10. 问题的最优子结构性质

3、是该问题不可用动态规划算法或贪心算法求解的关键特征。( )A.错误B.正确参考答案:A11. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B12. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A13. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中B.Hadoop自带有一套脚本,用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazo

4、n EC2为Hadoop提供了存储服务参考答案:D14. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A15. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD16. 分支限界法是一种只带有系统性的搜索算法。( )A.错误B.正确参考答案:A17. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:D18. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. Laye

5、rD.Infrastructure Layer参考答案:B19. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B20. RDD中join操作最后只返回两个RDD都存在的键的连接结果。( )A.正确B.错误参考答案:A21. RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD。( )A.正确B.错误参考答案:A22. Python是一种面向对象的解释型计算机程序设计语言。( )A.对B.错参考答案:A23. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-execu

6、tor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A24. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A25. 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A26. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B27. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些

7、子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B28. Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:C29. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )A.对B.错参考答案:A30. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A31. 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重

8、分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案:BD32. 解决0/1背包问题可以使用动态规划、回溯法和分支限界法,其中不需要排序的是动态规划,需要排序的是回溯法,分支限界法。( )A.错误B.正确参考答案:B33. 分支限界法解最大团问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:B34. RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD。( )A.正确B.错误参考答案:A35. 以下不可以使用分治法求解的是( )。A.

9、棋盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案:D36. Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F37. Scala列表方法中将函数应用到列表的所有元素的方法是( )A.filterB.foreachC.mapD.mkString参考答案:B38. Scala中元组是是一种可迭代的键值对(key/value)结构。( )A.正确B.错误参考答案:B39. var a=10; for(aA.10B.11C.20D.19参考答案:D40. Scala函数组合器可以通过一个函数重新计算列表中所有元

10、素,没有返回值。( )T.对F.错参考答案:F41. 流计算系统的需求有( )。A.实时性B.廉价C.高性能D.高带宽E.分布式参考答案:ACE42. MLlib中用于线性回归算法的包主要有( )A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression参考答案:ABC43. Scala函数组合器中foreach和map类似,有返回值。( )A.正确B.错误参考答案:B44. Scala通过( )来定义变量A.valB.valC.defineD.def参考答案:A45. 数据归约(Data Re

11、duction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD46. Hadoop在配置伪分布式时需要修改哪几个配置文件( )。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml参考答案:BC47. 以下哪些是数据可视化时间线工具( )A.EchartsB.TimetoastC.XtimelineD.R参考答案:BC48. BigTable采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B49. RDD的inters

12、ection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A50. Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:A51. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D52. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B53. 在H

13、Base中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。( )A.正确B.错误参考答案:B54. Pentaho是最流行的开源商业智能软件之一。( )A.对B.错参考答案:A55. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A56. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC57. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C58. 我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。( )A.对B.错参考答案:A59. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B60. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案:B

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!