hdp相关内容

运行更大的纱线作业的主要限制是什么?我如何增加它?

运行更大的纱线作业(Hadoop版本HDP-3.1.0.0(3.1.0.0-78))的主要限制是什么?我如何增加它?基本上,我希望同时执行更多(所有都很大)的SQOOP作业。 我目前假设我需要增加资源管理器堆的大小(因为当我运行纱线作业时,这就是我在Ambari仪表板上看到的)。如何将更多资源添加到RM堆/为什么RM堆似乎只占可用总RAM的一小部分(用于纱线?)跨群集? 查看Ambar ..
发布时间:2022-04-15 18:01:27 其他开发

错误 1066:无法在 Pig 中打开别名的迭代器,通用解决方案

Apache Pig 中一个非常常见的错误消息是: 错误 1066:无法打开别名的迭代器 有几个问题提到了这个错误,但没有一个给出处理它的通用方法.因此这个问题: 收到 ERROR 1066: Unable to open iterator for alias 时该怎么办? 解决方案 消息“ERROR 1066: Unable to open iterator for a ..
发布时间:2021-11-12 04:01:11 其他开发

Spark SQL在HDP中的Hive中找不到表

我使用HDP3.1,并添加了所需的Spark2,Hive和其他服务.我打开了Hive中的ACID功能.spark作业无法在配置单元中找到表格.但是该表存在于Hive中.异常喜欢:org.apache.spark.sql.AnalysisException:找不到表或视图Spark的conf文件夹中有hive-site.xml.它是由HDP自动创建的.但这与hive的conf文件夹中的文件不同.并且 ..
发布时间:2021-04-08 20:13:29 其他开发

在Http模式下通过Thrift服务器连接到HBase的Python程序

我正在尝试编写一个简单的程序以节俭方式连接到HBase服务器,该节俭以Http模式启动(集群已进行kerberized),但我始终会收到``读取零字节错误消息'' 我已经参考了以下链接,但是仅当节俭服务器以二进制模式(??)启动时,这些示例才有效 https://github.com/joshelser/hbase-thrift1 -python-sasl/blob/master/get_r ..
发布时间:2021-02-14 21:05:43 Python

码头工人映像可以使用hadoop吗?

泊坞窗图像可以访问hadoop资源吗?例如.提交YARN作业并访问HDFS;类似于 MapR的Datasci.精炼厂,但适用于Hortonworks HDP 3.1. (可以假定该映像将在hadoop群集节点上启动.) 看到了hadoop docs 用于从hadoop节点启动docker应用程序,但对是否可以“另辟way径"感兴趣(例如,能够使用常规的docker -ti ...命令启动do ..
发布时间:2020-11-22 01:11:54 其他开发

用户是否需要在所有节点上都存在才能被hadoop集群/HDFS识别?

在MapR hadoop中,为了使用户能够访问HDFS或对程序使用YARN,他们需要在集群中的所有节点之间存在(具有相同的uid和gid),包括既不充当数据节点也不充当控制节点的客户端节点(MapR实际上没有名称节点的概念). Hortonworks HDP是否也一样? 解决方案 在Hortonworks上找到了此答案 用户不应在群集的所有节点上都具有帐户.他应该只在边缘节点上有帐户. ..
发布时间:2020-06-25 18:46:12 其他开发

在Atlas实体之间添加关系的简单示例?

使用REST API在Apache Atlas中的实体之间添加关系的正确方法是什么?在查看REST API的文档时,我很难分辨出什么一些字段的含义是必需的(不是必需的)(以及如果未输入该字段会发生什么)或默认值应该是什么(由于示例使用的是看起来是占位符的值(例如,provenanceType或propagateTags字段似乎需要某种枚举值,但从未指定有效的选项). 有人可以提供真实/有效值 ..
发布时间:2020-06-18 18:34:19 其他开发