与猪共同使用蜂巢 [英] Using Hive with Pig

查看:209
本文介绍了与猪共同使用蜂巢的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我的配置单元查询有多个外连接,需要很长时间才能执行。我想知道是否将它分解成多个较小的查询并使用猪进行转换是有意义的。

有没有一种方法可以查询配置单元表或读取猪脚本中的配置单元表数据?

谢谢 Howl项目允许Pig和Hive共享一个元数据存储库。一旦Howl成熟,您就可以在
相同的表上运行PigLatin和HiveQL查询。现在,您可以尝试使用存储在HDFS中的数据。



请注意,Howl已重命名为 HCatalog


My hive query has multiple outer joins and takes very long to execute. I was wondering if it would make sense to break it into multiple smaller queries and use pig to work the transformations.

Is there a way I could query hive tables or read hive table data within a pig script?

Thanks

解决方案

The goal of the Howl project is to allow Pig and Hive to share a single metadata repository. Once Howl is mature, you'll be able to run PigLatin and HiveQL queries over the same tables. For now, you can try to work with the data as it is stored in HDFS.

Note that Howl has been renamed to HCatalog.

这篇关于与猪共同使用蜂巢的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆