南开大学21春“物联网工程”《大数据开发技术(二)》离线作业(一)辅导答案2
《南开大学21春“物联网工程”《大数据开发技术(二)》离线作业(一)辅导答案2》由会员分享,可在线阅读,更多相关《南开大学21春“物联网工程”《大数据开发技术(二)》离线作业(一)辅导答案2(13页珍藏版)》请在装配图网上搜索。
1、长风破浪会有时,直挂云帆济沧海。 住在富人区的她 南开大学21春“物联网工程”大数据开发技术(二)离线作业(一)辅导答案一.综合考核(共50题)1.图(Graph)是一种复杂的非线性结构。()A.正确B.错误参考答案:A2.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D3.Spark Streaming支持实时流式数据,包括()。A.Web服务器日志文件B.社交网络数据C.实时交易数据D.类似Kaf
2、ka的信息数据参考答案:ABCD4.Scala列表方法中通过给定的方法将所有元素重新计算的方法是()A.filterB.foreachC.mapD.mkString参考答案:C5.Scala在子类中重写超类的抽象方法时,需要使用override关键字。()T.对F.错参考答案:F6.Scala列表与数组非常相似,列表的所有元素可具有不同的类型。()A.正确B.错误参考答案:B7.以下哪个不是Scala的数据类型()A.IntB.Short IntC.LongD.Any参考答案:B8.图是一种数据元素间为()关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A9.用户可以在Apac
3、he Mesos上运行Spark。()T.对F.错参考答案:T10.RDD的sortBy排序默认是升序。()T.对F.错参考答案:T11.Spark中DataFrame的()方法是进行连接查询。A.whereB.joinC.limitD.apply参考答案:B12.PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。()A.正确B.错误参考答案:B13.RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。()A.正确B.错误参考答案:A14.Mllib中线性会馆算法中的参数reParam表示()A.要运行的迭代
4、次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D15.spark-submit配置项中()表示executor内存大小A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:B16.以下哪个方法可以从外部存储中创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:C17.Scala 使用()关键字来继承一个类A.extendsB.overrideC
5、.extendD.overrides参考答案:A18.TF-IDF中TF指的是()A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率参考答案:AB19.Spark中DataFrame的查询操作也是一个懒操作,仅仅生成一个查询计划,只有触发Action 操作才会进行计算并返回查询结果。()A.正确B.错误参考答案:A20.Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindow
6、D.reduceByKeyAndWindow参考答案:D21.Scala中高阶函数可以使用函数作为参数,也可以使用函数作为输出结果。()A.正确B.错误参考答案:A22.PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。()T.对F.错参考答案:F23.以下哪个不是Scala的数据类型()A.AnyRefB.AnythingC.NULLD.Nothing参考答案:B24.以下哪个方法可以从集合中创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:AB25.Scala中定义函
7、数的关键字是()参考答案:ef26.以下哪个函数可以求两个RDD的笛卡尔积()A.unionB.substractC.intersectionD.cartesian参考答案:D27.Spark Streming中()函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C28.Spark GraphX中类Graph的aggregateMessages方法可以()A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC
8、.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中参考答案:C29.RDD的()操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C30.Spark SQL可以通过()方法加载json文件为DataFrameA.formatB.jsonC.getD.read参考答案:AB31.Spark Streming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W)键值对的一个新 DStream。A.unionB.reduceC.joinD.cogroup参考答案:D32.Spark Da
9、taFrame中()方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB33.Scala函数组合器可以把一个二维的列表展开成一个一维的列表的方法是()参考答案:flatten34.Scala源代码被编译成()字节码,所以它可以运行于JVM之上A.SparkB.ScalaC.JavaD.JDK参考答案:C35.以下哪个方法可以从外部存储中创建RDD?()A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:C36.Scala函数组合器中foreach和map类似,有返回值。()A.
10、正确B.错误参考答案:B37.PairRDD中()函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC38.Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。()A.正确B.错误参考答案:A39.()是Spark的数据挖掘算法库。A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D40.键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。()A.正确B.错误参考答案:A41.Spark SQL可以通过()方法将HDFS上的格式化文件转换为Da
11、taFrame参考答案:load42.Scala中如果函数无返回值,则函数返回类型为()A.NULLB.VoidC.NothingD.Unit参考答案:D43.Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。()A.正确B.错误参考答案:A44.Spark支持使用()语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD45.Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A46.MLBase包括()A.MllibB.MLIC.SparkRD.GraphX参考答案:AB47.Scala中可以用()方法来连接两个或多个列表A.:B.#:C.List.:()D.List.concat()参考答案:BCD48.MapReudce不适合()任务A.大数据计算B.迭代C.交互式D.离线分析参考答案:BC49.RDD的map操作不会改变RDD的分区数目。()T.对F.错参考答案:T50.以下哪个函数可以求两个RDD差集()A.unionB.substractC.intersectionD.cartesian参考答案:B
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 嵌入式系统概论-以S3C2440核心为架构课件
- 地理事象的季节变化课件
- 地理中外著名旅游景观欣赏课件
- 地理中图版选修5第一章第二节主要自然灾害及其分布课件
- 地理中考复习-地图课件
- 北师大版历史八年级下册第17课《筑起钢铁长城》课件1
- 北师大版历史八下《祖国统一的历史大潮》课件5
- 北师大版历史八下《欣欣向荣的科教文体事业》3课件
- 北师大版历史八下《蓝色的地中海文明》课件
- 北师大版历史九年级下册第10课“冷战”与“热战”丁飞鹤T-课件
- 北师大版历史八下第17课《大河流域的文明曙光》课件
- 北师大版历史九上1718课课件
- 高中化学热力学复习10多重平衡与化学计算ppt课件
- 高中化学第1章化学反应与能量转化第3节化学能转化为电能电池ppt课件1鲁科版选修
- 高中化学第三节玻璃、陶瓷和水泥公开课课件