南开大学22春《大数据开发技术》离线作业1答案参考40

上传人:住在****她 文档编号:74843693 上传时间:2022-04-14 格式:DOCX 页数:11 大小:12.50KB
收藏 版权申诉 举报 下载
南开大学22春《大数据开发技术》离线作业1答案参考40_第1页
第1页 / 共11页
南开大学22春《大数据开发技术》离线作业1答案参考40_第2页
第2页 / 共11页
南开大学22春《大数据开发技术》离线作业1答案参考40_第3页
第3页 / 共11页
资源描述:

《南开大学22春《大数据开发技术》离线作业1答案参考40》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》离线作业1答案参考40(11页珍藏版)》请在装配图网上搜索。

1、南开大学22春大数据开发技术离线作业1答案参考1. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B2. Scala函数组合器中foreach和map类似,有返回值。( )A.正确B.错误参考答案:B3. Spark GraphX中类Graph的reverse方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:A4. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersi

2、stVerticesD.edges.unpersist参考答案:D5. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD6. RDD的map操作不会改变RDD的分区数目。( )A.正确B.错误参考答案:A7. HBase的客户端并不依赖Master,而是通过( )来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案:C8. 计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。( )A.错误B.正确参考答案:B9. Spar

3、k中DataFrame的( )方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A10. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案:A11. Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A12. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案:B13. 大数据时代预测人类移动行为

4、的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD14. Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:A15. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F16. SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD。( )A.正确B.错误参考答案:B17. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F18.

5、 Scala 集合分为可变的和不可变的集合。( )A.正确B.错误参考答案:A19. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。( )A.对B.错参考答案:A20. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B21. Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数。( )T.对F.错参考答案:F22. Spark GraphX中类Graph的joinVertices方法可以( )A.收集邻居

6、顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中参考答案:D23. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B24. Hadoop在配置伪分布式时需要修改哪几个配置文件( )。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml参考答案:BC25. Hadoop启动所有进程的命令为( )。A.all-start.shB.all-start.exeC.start-al

7、l.shD.start-all.exe参考答案:C26. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案:B27. 图的结构通常表示为:G(V,E),其中,G表示( )A.图B.子图C.顶点D.边参考答案:A28. Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:A29. MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。( )T.对F.错参考答案:T30. DataFrame是一个分布式的Row对象的数

8、据集合。( )A.正确B.错误参考答案:A31. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A32. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D33. 以下属于Hadoop的安装方式的有( )。A.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式参考答案:ACE34. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform

9、. LayerD.Infrastructure Layer参考答案:A35. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案:A36. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T37. Hbase中Zookeeper提供了( )A.分布式同步B.组服务C.域名服务D.配置维护参考答案:ABCD38. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD39. 下列算法中通常以自底向上的方式求解最优解的是( )。

10、A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:B40. Scala是一种纯面向对象的语言,每个值都是对象。( )T.对F.错参考答案:T41. 针对流数据,“量子恒道”可处理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案:A42. RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。( )A.正确B.错误参考答案:A43. 键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。( )A.正确B.错误参考答案:A44. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据

11、处理后的返回。( )T.对F.错参考答案:F45. 广度优先是什么的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A46. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T47. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A48. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B49. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A50. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!