hivecontext相关内容

Spark HiveContext:插入覆盖它从中读取的同一个表

我想在 HiveContext 中使用 PySpark 应用 SCD1 和 SCD2.在我的方法中,我正在读取增量数据和目标表.阅读后,我加入了他们的 upsert 方法.我正在对所有源数据帧进行 registerTempTable.我正在尝试将最终数据集写入目标表,但我面临的问题是无法在读取它的表中插入覆盖. 请为此提出一些解决方案.我不想将中间数据写入物理表并再次读取. 是否有任何 ..
发布时间:2021-12-28 23:46:57 其他开发

“插入……"使用 SparkSQL HiveContext

我正在尝试使用我的 HiveContext 运行插入语句,如下所示: hiveContext.sql('insert into my_table (id, score) values (1, 10)') 1.5.2 Spark SQL 文档没有明确说明这是否是支持与否,虽然它确实支持“动态分区插入". 这会导致像 这样的堆栈跟踪 分析异常:查询中不支持的语言功能:插入 my_tabl ..

无法使用Spark在Hive上写入数据

我正在使用spark1.6.我正在使用spark上下文创建hivecontext.当我将数据保存到配置单元中时,会出现错误.我正在使用cloudera vm.我的蜂巢在cloudera vm内部,并在我的系统中启动.我可以使用IP访问虚拟机.我已经在vm上启动了Thrift服务器和hiveserver2.我有 hive.metastore.uris 的用户节俭服务器uri val hiveC ..
发布时间:2021-04-08 20:17:23 其他开发

Spark SQL sql("<​​某些聚合查询>").first().getDouble(0)给我不一致的结果

我有下面的查询,该查询应该查找列值的平均值并返回一个单一数字的结果. val avgVal = hiveContext.sql(“从users.payment中选择回合(avg(amount),4),其中dt在'2018-05-09'和'2018-05-09'"之间).().getDouble(0) 在此声明中,我面临行为不一致的情况.这通常会因以下错误而失败,但是通过Hive执行时会给出 ..
发布时间:2021-04-08 19:58:32 Java开发

从Spark hivecontext查询会锁定蜂巢表吗?

我知道如果我从Hive提交查询,则会获取一个共享锁,然后该Hive表将被查询锁定: https://cwiki.apache.org/confluence/display/Hive/Locking 因此,我只是想知道查询是否由Spark Hivecontext执行,是否需要锁定并且表也将被锁定?另外,如果我通过Spark Hivecontext将数据插入表中,是否需要排他锁? 谢谢 ..
发布时间:2021-04-08 19:54:35 其他开发

Spark HiveContext:插入覆盖从中读取的同一表

我想在HiveContext中使用PySpark来应用SCD1和SCD2.在我的方法中,我正在读取增量数据和目标表.阅读后,我将加入他们的进阶方法.我正在对所有源数据帧执行registerTempTable.我正在尝试将最终数据集写入目标表,但是我面临的问题是,在读取表的表中无法进行插入覆盖. 请为此提出一些解决方案.我不想将中间数据写入物理表并再次读取. 是否有任何属性或方法可以存储 ..
发布时间:2021-04-08 19:46:55 其他开发

以Python编程启动HiveThriftServer

在spark-shell(scala)中,我们导入了 org.apache.spark.sql.hive.thriftserver._ ,以便以编程方式启动Hive Thrift服务器,作为特定的配置单元上下文 HiveThriftServer2.startWithContext(hiveContext)为该特定会话公开一个已注册的临时表。 我们如何使用python做同样的事情? py ..
发布时间:2018-06-12 14:07:22 Python

&QUOT; INSERT INTO ..​​.&QUOT;与SparkSQL HiveContext

我想用我的HiveContext运行一个INSERT语句,像这样的: hiveContext.sql(“插入my_table的(ID,得分)值(1,10)') 借助 1.5.2星火SQL文档不明确指出这是否是支持或不,尽管它的确支持“动态分区插入。” 这导致堆栈跟踪像 AnalysisException: 不支持的语言功能的查询:插入my_table的(ID,得分)值(1,10) TOK_ ..