Spark Have SQL返回空数据帧 [英] Spark Hive SQL is Returning Empty Dataframe

查看：0 发布时间：2022/8/16 19:22:46 apache-spark hive amazon-emr aws-glue

本文介绍了Spark Have SQL返回空数据帧的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在使用胶水作为我的母公司元存储。我有一个每小时向注册分区写入文件的每小时作业。

表定义：

CREATE EXTERNAL TABLE table_name (
column_1 STRING,
column_2 STRING
)
PARTITIONED BY (process_date DATE)
STORED AS PARQUET
LOCATION "s3://bucket/table_name/";

spark.sql("ALTER TABLE table_name ADD IF NOT EXISTS partition(process_date='2019-11-13') 
LOCATION 's3://bucket/table_name/process_date=2019-11-13'")

分区和零件文件的S3位置为

s3://bucket/table_name/process_date=2019-11-13/hour=00/part-01.parquet
s3://bucket/table_name/process_date=2019-11-13/hour=00/part-02.parquet
s3://bucket/table_name/process_date=2019-11-13/hour=01/part-01.parquet
s3://bucket/table_name/process_date=2019-11-13/hour=01/part-02.parquet

我知道如果我将hour=00和hour=01添加到分区位置，它将在Spark SQL中工作。但通过这种方式，数据可以通过配置单元查询，但不能通过Spark SQL查询。

我也试过将这些Conf添加到我的火花壳中，但没有成功。

"spark.hadoop.mapreduce.input.fileinputformat.input.dir.recursive=true"
"spark.hadoop.hive.mapred.supports.subdirectories=true"

Spark Have SQL返回空数据帧 [英] Spark Hive SQL is Returning Empty Dataframe

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

Spark Have SQL返回空数据帧 [英] Spark Hive SQL is Returning Empty Dataframe

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭