hortonworks-data-platform相关内容

Spark on YARN 资源管理器:YARN Containers 和 Spark Executors 之间的关系

我是 YARN 上的 Spark 新手,不了解 YARN Containers 和 Spark Executors 之间的关系.我根据 yarn-utils.py 脚本的结果尝试了以下配置,可用于找到最佳集群配置. 我正在开发的 Hadoop 集群 (HDP 2.4): 1 个主节点: CPU:2 个 CPU,每个 CPU 6 个内核 = 12 个内核 内存:64 GB SSD: ..

将 TSV 文件导入 hbase 表

我正在使用带有 hbase 和 hive 的 hortonworks 2.1.我想从 tsv 文件创建一个 hbase 表.文件在这里: id c1 c2第 1 行 1 22行 2 e1 42行 3 g1 f2行4 f1 c2行 5 d1 c2第 6 行 c1 42行 7 e1 c2行8 c1 c2行9 c1 c2行 10 c1 22 我使用的命令是: bin/hbase org.apac ..
发布时间:2021-12-28 23:50:18 其他开发

Java - MySQL 到 Hive 导入,其中 MySQL 在 Windows 上运行,Hive 在 Cent OS(Horton Sandbox)上运行

在任何答案和评论之前.我尝试了在 Stackoverflow 中找到的几个选项,但以失败告终.以下是这些链接 - 如何在 Java 中执行 Sqoop? 如何在 Java 程序中使用 Sqoop? 如何将表从 MySQL 导入 Hive 使用Java? 如何将 SQL 数据加载到 Hortonworks? 我通过命令行在 Horton Sandbox 中尝试并成功. sqoop ..
发布时间:2021-12-28 23:45:28 Java开发

使用 spark-submit YARN 集群模式时缺少 hive-site

使用 HDP 2.5.3,我一直在尝试调试一些 YARN 容器类路径问题. 由于 HDP 包含 Spark 1.6 和 2.0.0,因此存在一些版本冲突 我支持的用户能够在 YARN client 模式下成功使用 Spark2 和 Hive 查询,但不能从 cluster 模式下,他们会收到有关找不到表的错误,或类似的错误那是因为未建立 Metastore 连接. 我猜是设置 - ..

使用 Hiveserver2 Thrift Java 客户端时请求挂起

这是这个问题的后续问题,我在那里问什么 Hiveserver 2 thrift java 客户端API 是.如果您不需要更多背景信息,这个问题应该可以在没有该背景的情况下成立. 找不到关于如何使用 hiverserver2 thrift api 的任何文档,我把它放在一起.我能找到的最好的参考是 Apache JDBC 实现. TSocket transport = new TSocket ..
发布时间:2021-12-15 18:55:04 Java开发

Storm UI 抛出“旧版本不支持 kafka 的偏移滞后".请将 kafka spout 更新到最新版本."

我已将我的 hdp 集群升级到 2.5,并将 Storm-core 的拓扑依赖关系升级到 1.0.1,将 Storm-kafka 的拓扑依赖关系升级到 1.0.1.使用新的 1.0.1 依赖项部署新拓扑后,一切都在后端按预期工作,但 Storm UI 并不总是显示“Acked"、“Emitted"、“Transferred"等为零. Storm UI 显示消息“旧版本不支持 kafka 的偏 ..
发布时间:2021-11-14 23:41:44 其他开发

如何以自定义格式加载带有时间戳的 CSV?

我在使用 spark csv 库加载到数据帧的 csv 文件中有一个时间戳字段.同一段代码在我的本地机器上使用 Spark 2.0 版本运行,但在 Azure Hortonworks HDP 3.5 和 3.6 上引发错误. 我已经检查过,Azure HDInsight 3.5 也在使用相同的 Spark 版本,所以我认为这不是 Spark 版本的问题. import org.apache ..