Mapreduce程序中reduce的Iterable参数问题怎么解决
这篇文章主要讲解了“Mapreduce程序中reduce的Iterable参数问题怎么解决”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Mapreduce程序中reduce的Iterable参数问题怎么解决”吧!
创新互联建站服务项目包括高碑店网站建设、高碑店网站制作、高碑店网页制作以及高碑店网络营销策划等。多年来,我们专注于互联网行业,利用自身积累的技术优势、行业经验、深度合作伙伴关系等,向广大中小型企业、政府机构等提供互联网行业的解决方案,高碑店网站推广取得了明显的社会效益与经济效益。目前,我们服务的客户以成都为中心已经辐射到高碑店省份的部分城市,未来相信会继续扩大服务区域并继续获得客户的支持与信任!
今天在对reduce的参数Iterable进行迭代时,发现一个问题,即Iterator的next()方法每次返回的是同一个对象,next()只是修改了Writable对象的值,而不是重新返回一个新的Writable对象。
使用wordcount来验证:
我的代码如下:
protected void reduce(Text key, Iterablevalues, Reducer .Context context) throws IOException, InterruptedException { int sum = 0; // 保存每个IntWritable到list List intWritables = new ArrayList (); for (IntWritable val : values) { intWritables.add(val); sum += val.get(); } if(intWritables.size() > 1) { // 当list size大于1时,验证第一个元素和第二个元素是否是同一个对象 System.out.println("objects is same -> " + (intWritables.get(0) == intWritables.get(1))); } result.set(sum); context.write(key, result); }
日志输出:
objects is same -> true
这个Iterable的实现是org.apache.hadoop.mapreduce.task.ReduceContextImpl.ValueIterable
Iterator实现是org.apache.hadoop.mapreduce.task.ReduceContextImpl.ValueIterator
其中next()实现时,调用的是org.apache.hadoop.io.serializer.WritableSerialization的deserialize(Writable w)方法,
Writable deserialize(Writable w) IOException { Writable writable; (w == ) { writable = (Writable) ReflectionUtils.(, getConf()); } { writable = w; } writable.readFields(); writable; }
该方法只是调用了入参w的readFields方法,并没有创建新对象,除非w是null
感谢各位的阅读,以上就是“Mapreduce程序中reduce的Iterable参数问题怎么解决”的内容了,经过本文的学习后,相信大家对Mapreduce程序中reduce的Iterable参数问题怎么解决这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!
分享文章:Mapreduce程序中reduce的Iterable参数问题怎么解决
网站链接:http://scyanting.com/article/ishcip.html