apache-hive相关内容

Apache Spark 的 Hive 部署问题(集群模式)

编辑: 我正在开发一个 Spark 应用程序,该应用程序从多个结构化架构中读取数据,并且我正在尝试从这些架构中聚合信息.我的应用程序在本地运行时运行良好.但是当我在集群上运行它时,我在配置(很可能是 hive-site.xml)或提交命令参数方面遇到了问题.我已经查找了其他相关帖子,但找不到针对我的场景的解决方案.我已经在下面详细提到了我尝试过的命令以及我遇到的错误.我是 Spark 的新手 ..
发布时间:2021-11-14 23:31:31 其他开发

Apache Spark 的 Hive 部署问题(集群模式)

编辑: 我正在开发一个 Spark 应用程序,该应用程序从多个结构化架构中读取数据,并且我正在尝试从这些架构中聚合信息.我的应用程序在本地运行时运行良好.但是当我在集群上运行它时,我在配置(很可能是 hive-site.xml)或提交命令参数方面遇到了问题.我已经查找了其他相关帖子,但找不到针对我的场景的解决方案.我已经在下面详细提到了我尝试过的命令以及我遇到的错误.我是 Spark 的新手 ..
发布时间:2021-11-14 23:25:56 其他开发

在Beeline(配置单元)中添加本地文件

我正在尝试通过Beeline客户端添加本地文件,但是我一直遇到一个问题,即它告诉我该文件不存在. [test @ test-001 tmp] $ touch/tmp/m.py[test @ test-001 tmp] $ stat/tmp/m.py文件:"/tmp/m.py"大小:0块:0 IO块:4096个常规空文件设备:801h/2049d索引节点:34091464链接:1访问:(0664 ..
发布时间:2021-05-14 19:10:19 其他开发

如何访问Hive& Hive中的HBase表反之亦然?

作为开发人员,我通过使用 sqoop job 从现有MySQL表导入数据,为我们的项目创建了HBase表。问题是我们的数据分析师团队熟悉MySQL语法,意味着他们可以很容易地查询 HIVE 表。对他们来说,我需要暴露HIVE中的HBase表。我不想通过在HIVE中重新填充数据来复制数据。 我可以在HIVE 中公开HBase表而不重复数据吗??如果是的话,我该怎么做?另外,如果我的HBase表中的插 ..
发布时间:2018-06-05 13:23:47 其他开发

没有添加Apache配置单元MSCK REPAIR TABLE新分区

我是Apache Hive的新手。在处理外部表分区时,如果我将新分区直接添加到HDFS,则在运行MSCK REPAIR表后不会添加新分区。以下是我试过的代码, - 创建外部表 蜂房>创建由(区域字符串)分区的外部表工厂(名称字符串,empid int,年龄int) >以','结尾的行格式定界字段; - 详细表格资讯 表类型:EXTERNAL_TABL ..
发布时间:2018-05-31 18:58:47 分布式计算/Hadoop

阿帕奇星火的部署问题(集群模式)蜂巢

修改 我正在开发一个应用程序的Spark从多个结构化模式读取数据,我想聚集来自这些模式的信息。我的应用程序运行良好,当我在本地运行。但是,当我在集群上运行它时,我遇到了麻烦配置(最有可能与蜂房的site.xml)或提交 - 命令参数。我看过的其他相关职位,但未能找到解决具体到我的方案。我已经提到过我试过,什么错误我详细下文了什么命令。我是新来的火花,我可能会丢失一些小事,但能提供更多的信息来支持 ..
发布时间:2016-05-22 16:39:50 其他开发