hadoop开发实战培训36-MapReduce高阶实现.ppt

上传人：max****ui

文档编号：6349400

上传时间：2020-02-23

格式：PPT

页数：12

大小：1.73MB

《hadoop开发实战培训36-MapReduce高阶实现.ppt》由会员分享，可在线阅读，更多相关《hadoop开发实战培训36-MapReduce高阶实现.ppt（12页珍藏版）》请在装配图网上搜索。

Hadoop大数据解决方案进阶应用 Hadoop 讲师迪伦北风网版权所有 MapReduce高阶实现 10 Terasort算法分析二次排序课程目标 maptask对数据记录做标记每个maptask从文件 partition lst读取分割点并创建trie树假设是2 trie 即组织利用前两个字节 Maptask从split中一条一条读取数据并通过trie树查找每条记录所对应的reducetask编号二次排序辅助排序 MapReduce在记录到达reducer之前按key排好序但key所对应的value并没有被排序由于值来自不同的map任务多次运行程序时值出现的顺序并不固定二次排序是通过对键进行排序和分组以实现对值的排序二次排序就是首先按照第一字段排序然后再对第一字段相同的行按照第二字段排序实例设计一个MapReduce程序以计算每年最高气温思路实现全部记录按照年升序排列按照气温降序排列则只需获取各年份的首条记录即可实例二次排序处理过程构建一个同时包含年份和气温信息的组合键期望所有记录先按年份升序排列再按气温降序排列设定一个按照键的年份进行分区的partitioner 以确保同一年的记录被发送到同一个reducer中实例二次排序进行分组设置如果reducer中的值按照键的年份进行分组则一个reducer组将包括同一年份的所有记录排序方法的总结定义包括自然键和自然值的组合键键的comparator根据组合键对记录进行排序即同时利用自然键和自然值进行排序针对组合键的partitioner和分组comparator在进行分区和分组时均只考虑自然键二次排序相关的类 setOutputKeyComparatorClass 参数为继承RawComparator的子类通常利用继承WritableComparator来实现根据组合键进行排序setPartitionerClass 需要指定自定义分区的类根据组合键中的自然键进行分区setOutputValueGroupingComparator 指定用户自定义的comparator 用于将reduce的输入进行分组将自然键key相同的放到一起相同key的value放到一个value迭代器里实例代码二次排序实例代码二次排序实例代码二次排序实例二次排序运行程序 hadoopjarjob jarMaxTemperatureUsingSecondarySortinput ncdc alloutput secondarysort hadoopfs catoutput secondarysort part sort head 欢迎访问我们的官方网站

下载提示(请认真阅读)

1.请仔细阅读文档，确保文档完整性，对于不预览、不比对内容而直接下载带来的问题本站不予受理。
2.下载的文档，不会出现我们的网址水印。
3、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

文档包含非法信息？点此举报后获取现金奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

9.9 积分

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: hadoop 开发实战培训 36 MapReduce 实现

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

装配图网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：hadoop开发实战培训36-MapReduce高阶实现.ppt
链接地址：https://www.zhuangpeitu.com/p-6349400.html