南开大学22春《大数据开发技术》在线作业一及答案参考22

上传人:住在山****ck 文档编号:86408760 上传时间:2022-05-07 格式:DOCX 页数:13 大小:13.25KB
收藏 版权申诉 举报 下载
南开大学22春《大数据开发技术》在线作业一及答案参考22_第1页
第1页 / 共13页
南开大学22春《大数据开发技术》在线作业一及答案参考22_第2页
第2页 / 共13页
南开大学22春《大数据开发技术》在线作业一及答案参考22_第3页
第3页 / 共13页
资源描述:

《南开大学22春《大数据开发技术》在线作业一及答案参考22》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》在线作业一及答案参考22(13页珍藏版)》请在装配图网上搜索。

1、南开大学22春大数据开发技术在线作业一及答案参考1. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B2. MapReduce的main函数中设置输出类型的方法有( )。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClass参考答案:AC3. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快参考答案:B4. MLBase包括( )A.MllibB.MLIC

2、.SparkRD.GraphX参考答案:AB5. 0-1背包问题的回溯算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:A6. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:D7. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B8. RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD。( )A.正确B.错误参考答案:A9. 大数据计算处理方法主要

3、分为两种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A10. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A11. UMP系通过( )来实现实现数据路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B12. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A13. Scala列表方法中丢弃前n个元素,并返回新列表的方法是( )A.dropB.headC.filterD.init参考答案:A14. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQ

4、LB.OracleC.HbaseD.NosSQL参考答案:C15. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B16. Hbase中Zookeeper提供了( )A.分布式同步B.组服务C.域名服务D.配置维护参考答案:ABCD17. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案:A18. 对于不同顶点之间的信息交换,Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案:C19. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B20.

5、 Mllib中metrics.recallByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:B21. Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。( )A.正确B.错误参考答案:A22. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案:B23. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A24. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机

6、森林D.Kmeans参考答案:ABC25. PairRDD中( )函数可以合并具有相同键的值A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:A26. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T27. 早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架。( )A.正确B.错误参考答案:A28. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F29. Spark SQL读取的数据源支持

7、( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD30. RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。( )T.对F.错参考答案:T31. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC32. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A33. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A34.

8、 Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A35. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B36. 图的结构通常表示为:G(V,E),其中,E是图G中( )A.顶点B.顶点的集合C.边D.边的集合参考答案:D37. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案:B38. 实现大整数的乘法是利用( )的算法。A.贪心法B.动态规划法C.分治策略D.回溯法参考答案:C39. 静态数据采取( )计算模式A.批量B.实时C.大数据D

9、.动态参考答案:A40. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD41. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A42. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( )A.正确B.错误参考答案:A43. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B44. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案:B45. 如果nu

10、mPartitions是分区个数,那么Spark每个RDD的分区ID范围是( )A.0,numPartitionsB.0,numPartitions-1C.1,numPartitions-1D.1,numPartitions参考答案:B46. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A47. 关于Map端Shuffle过程中的合并与归并,说法正确的是( )。A.两个键值对和,如果合并,会得到B.合并不会改变最终结果C.两个键值对和,如果归并,会得到D.两个键值对和,如果归并,会得到参考答案:ABD48. Spark

11、可以从( )分布式文件系统中读取数据A.HDFSB.HbaseC.HiveD.Tachyon参考答案:ABCD49. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C50. RDD的map操作不会改变RDD的分区数目。( )A.正确B.错误参考答案:A51. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案:T52. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B53. ( )是Spark的核心,提供底层框架及核心支持A.Spark CoreB.Sp

12、ark SQLC.Spark StreamingD.Mllib参考答案:A54. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A55. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A56. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2

13、n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B57. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A58. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD59. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A60. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!