首页
Python
在hadoop上的一个流式作业中使用多个映射器输入？

在hadoop上的一个流式作业中使用多个映射器输入？ [英] Using multiple mapper inputs in one streaming job on hadoop?

查看：126 发布时间：2018/5/31 18:38:31 python hadoop streaming

本文介绍了在hadoop上的一个流式作业中使用多个映射器输入？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

在java中，我会使用：

lockquote
MultipleInputs.addInputPath（conf，path，inputFormatClass，mapperClass）

用不同的映射器添加多个输入。

现在我使用python编写在hadoop的流工作，可以做一个类似的工作吗？

  hadoop jar hadoop-streaming.jar -input foo.txt -input bar.txt ... 
  code>

In java I would use:

MultipleInputs.addInputPath(conf, path, inputFormatClass, mapperClass)

to add multiple inputs with a different mapper for each.



Now I am using python to write a streaming job in hadoop, can a similiar job be done?
 解决方案 
You can use multiple -input options to specify multiple input paths:  
hadoop jar hadoop-streaming.jar -input foo.txt -input bar.txt ...


                        
这篇关于在hadoop上的一个流式作业中使用多个映射器输入？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            在 hadoop 的一个流作业中使用多个映射器输入?;
                        
                    
                    
                        
                            Hadoop gzip输入文件只使用一个映射器;
                        
                    
                    
                        
                            hadoop中的多个映射器;
                        
                    
                    
                        
                            Hadoop MapReduce:可以在一个 hadoop 作业类中定义两个映射器和化简器吗?;
                        
                    
                    
                        
                            Hadoop中的映射器输入键值对;
                        
                    
                    
                        
                            在 Hadoop MapReduce 中是否可以使用多个不同的映射器进行多个输入?;
                        
                    
                    
                        
                            在Java中的另一个数据映射器中使用数据映射器?;
                        
                    
                    
                        
                            在Hadoop MapReduce中可以有多个不同映射器的输入吗？;
                        
                    
                    
                        
                            如何在映射器(Hadoop)中使用 MATLAB 代码?;
                        
                    
                    
                        
                            在Hadoop Map / Reduce中为多个映射器配置映射端连接;
                        
                    
                    
                        
                            Hadoop mapreduce:用于在 MapReduce 作业中链接映射器的驱动程序;
                        
                    
                    
                        
                            Hadoop映射器可以在输出中生成多个键吗？;
                        
                    
                    
                        
                            Hadoop无法找到映射器类;
                        
                    
                    
                        
                            STDIN或文件作为Hadoop环境中的映射器输入?;
                        
                    
                    
                        
                            是否有可能在一个节点上运行多个映射器;
                        
                    
                    
                        
                            Hadoop MapReduce：映射器的默认数量;
                        
                    
                    
                        
                            Hadoop：映射器和缩减器的数量;
                        
                    
                    
                        
                            Hadoop mapreduce：用于链接MapReduce作业内映射器的驱动程序;
                        
                    
                    
                        
                            Hadoop映射器从2个不同的源输入文件中读取数据;
                        
                    
                    
                        
                            对象类型的关键在hadoop映射器中;
                        
                    
                    
                        
                            将参数传递给 Hadoop 映射器;
                        
                    
                    
                        
                            Hadoop映射器上下文对象;
                        
                    
                    
                        
                            将参数传递给Hadoop映射器;
                        
                    
                    
                        
                            hadoop映射器中对象类型的键;
                        
                    
                    
                        
                            hadoop  - 总映射器是如何确定的;


    
        
            Python最新文章
            
                    
                        
                            类型错误：只有长度为1的阵列可以尝试拟合指数的数据转换到Python标量;
                        
                    
                    
                        
                            bs4.FeatureNotFound：找不到一棵树建设者您所要求的功能：LXML。你需要安装一个解析器库？;
                        
                    
                    
                        
                            系列的真值是不明确的。使用a.empty，a.bool（），a.item（），a.any（）或a.all（）;
                        
                    
                    
                        
                            （unicode错误）'unicodeescape'编解码器无法解码位置2-3中的字节：truncated \UXXXXXXXX escape;
                        
                    
                    
                        
                            将pandas dataframe中的列从int转换为string;
                        
                    
                    
                        
                            Python：由实例对象调用方法：“missing 1 required positional argument：'self'”;
                        
                    
                    
                        
                            Sparksql过滤与多个条件（与where子句中选择）;
                        
                    
                    
                        
                            JSONDe codeError：期待值：1行1列（CHAR 0）;
                        
                    
                    
                        
                            Cmake不能找到Python库;
                        
                    
                    
                        
                            Python  - 将Dataframe中的所有项目转换为字符串;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.