Hive LLAP不能与Parquet格式一起使用 [英] Hive LLAP doesn't work with Parquet format

查看:291
本文介绍了Hive LLAP不能与Parquet格式一起使用的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

找出Hive LLAP 后,我真的很想使用它。



我启动了启用了LLAP的Azure HDinsight群集。但是,它似乎没有比普通的Hive更好的工作。我有存储在Parquet文件中的数据。我只能看到LLAP相关文档或会话中提到的ORC文件。

它是否也支持Parquet格式?

解决方案

回答我自己的问题。 我们联系了Azure支持。 Hive LLAP仅适用于ORC文件格式(截至05.2017)。



因此,使用Parquet或者我们必须使用Apache Impala进行快速交互式查询( https://impala.incubator.apache.org )替代LLAP或将存储的文件格式更改为ORC。


After finding out Hive LLAP, I really want to use it.

I started Azure HDinsight cluster with LLAP enabled. However, it doesn't seem to work any better than normal Hive. I have data stored in Parquet files. I only see ORC files mentioned in LLAP related docs or talks.

Does it also support Parquet format?

解决方案

Answering my own question.

We reached out to Azure support. Hive LLAP only works with ORC file format (as of 05.2017).

So with Parquet either we have to use Apache Impala for fast interactive queries (https://impala.incubator.apache.org) as alternative to LLAP or change the stored file format to ORC.

这篇关于Hive LLAP不能与Parquet格式一起使用的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆