首页
分布式计算/Hadoop
在Hadoop中使用RecordReader

在Hadoop中使用RecordReader [英] Working of RecordReader in Hadoop

查看：184 发布时间：2018/5/31 19:10:54 hadoop mapreduce

本文介绍了在Hadoop中使用RecordReader的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

任何人都可以解释RecordReader是如何工作的吗？ nextkeyvalue（）， getCurrentkey（）和 getprogress（）在程序开始执行后工作吗？

解决方案

看起来像这样：

  public void run（Context context）throws IOException，InterruptedException {
 setup（context）; $ context（），context.getCurrentValue（），context）; 
} 
 cleanup（context）; 
 
 
 
 $ b $  Context.nextKeyValue $ c>， Context.getCurrentKey（）和 Context.getCurrentValue（）方法是 RecordReader 方法。查看源文件 src / mapred / org / apache / hadoop / mapreduce / MapContext.java 。 循环执行并调用Mapper实现的映射（K，V，Context）方法。 
 
 你想知道吗？
 
Can anyone explain how the RecordReader actually works? How are the methods nextkeyvalue(), getCurrentkey() and getprogress() work after the program starts executing?
 解决方案 
(new API): The default Mapper class has a run method which looks like this:
public void run(Context context) throws IOException, InterruptedException {
    setup(context);
    while (context.nextKeyValue()) {
        map(context.getCurrentKey(), context.getCurrentValue(), context);
    }
    cleanup(context);
}
The Context.nextKeyValue(), Context.getCurrentKey() and Context.getCurrentValue() methods are wrappers for the RecordReader methods. See the source file src/mapred/org/apache/hadoop/mapreduce/MapContext.java.

So this loop executes and calls your Mapper implementation's map(K, V, Context) method.

Specifically, what else would you like to know?

                        这篇关于在Hadoop中使用RecordReader的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            RecordReader 在 Hadoop 中的工作;
                        
                    
                    
                        
                            在Hadoop中使用wget？;
                        
                    
                    
                        
                            在Hadoop MapReduce中为二进制文件创建自定义InputFormat和RecordReader;
                        
                    
                    
                        
                            在 Hadoop 中使用 NullWritable 的优势;
                        
                    
                    
                        
                            在Hadoop中使用NullWritable的优点;
                        
                    
                    
                        
                            在Cognos BI环境中使用Apache Hadoop;
                        
                    
                    
                        
                            在hadoop中使用正则表达式;
                        
                    
                    
                        
                            在Python中使用Hadoop Streaming中的文件;
                        
                    
                    
                        
                            无法在Hadoop中使用python运行map reduce？;
                        
                    
                    
                        
                            如何在Hadoop中使用CompressionCodec;
                        
                    
                    
                        
                            在Hadoop框架中使用的完整的属性列表;
                        
                    
                    
                        
                            在 hadoop 中在 Pig 中使用正则表达式;
                        
                    
                    
                        
                            如何在Cloudera hadoop中使用外部罐子？;
                        
                    
                    
                        
                            如何在mapper（Hadoop）中使用MATLAB代码？;
                        
                    
                    
                        
                            在HADOOP映射中使用泛型可以减少问题;
                        
                    
                    
                        
                            在RDD方法/闭包中使用SparkContext hadoop配置，例如foreachPartition;
                        
                    
                    
                        
                            使用Hadoop 2.6.0在Windows上运行wordcount Hadoop示例;
                        
                    
                    
                        
                            如何在容器格式的Hadoop中使用Snappy;
                        
                    
                    
                        
                            预期在Hadoop 0.21.0中使用打开的文件描述符;
                        
                    
                    
                        
                            避免在S3中使用hadoop(EMR)创建_ $ folder $键;
                        
                    
                    
                        
                            如何使用Hadoop Streaming在本地Hadoop集群中运行MRJob?;
                        
                    
                    
                        
                            为什么Apache Orc RecordReader.searchArgument()无法正确过滤?;
                        
                    
                    
                        
                            我如何在Hadoop / Spark中使用proto3？;
                        
                    
                    
                        
                            为什么我们需要在 Hadoop 堆栈中使用 ZooKeeper?;
                        
                    
                    
                        
                            Hadoop 框架中使用的属性的完整列表;


    
        
            分布式计算/Hadoop最新文章
            
                    
                        
                            SearchPhaseExecutionException [无法执行phase [query]，所有分片失败];
                        
                    
                    
                        
                            如何计算Hive中两个数组的交集和联合？;
                        
                    
                    
                        
                            Elasticsearch：执行精确搜索，其中查询包含特殊字符，如'＃';
                        
                    
                    
                        
                            找不到hadoop安装：必须设置$ HADOOP_HOME或hadoop必须位于路径中;
                        
                    
                    
                        
                            Hive错误：parseexception缺少EOF;
                        
                    
                    
                        
                            如何从HIVE中的日期中减去几个月;
                        
                    
                    
                        
                            在ambari hadoop安装过程中，许可被拒绝（publickey，gssapi-keyex，gssapi-with-mic，密码）;
                        
                    
                    
                        
                            从kibana导出到csv / excel;
                        
                    
                    
                        
                            检索ElasticSearch中所有_id的高效方法;
                        
                    
                    
                        
                            不正确的配置：namenode地址dfs.namenode.rpc-address未配置;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.