HBase上的Hive与HDFS上的Hive [英] Hive over HBase vs Hive over HDFS

查看:128
本文介绍了HBase上的Hive与HDFS上的Hive的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我的数据不需要实时加载,因此我不必使用HBASE,但是我想知道在MR Jobs中使用HBASE是否对性能有好处,由于索引数据?

My data does not need to be loaded in realtime so I don't have to use HBASE, but I was wondering if there are any performance benefits of using HBASE in MR Jobs, shouldn't the joins be faster due to the indexed data?

有人有基准吗?

推荐答案

通常来说,hive/hdfs将比HBase快得多. HBase位于HDFS之上,因此添加了另一层.如果您要查找单个记录,则HBase会更快,但您不会为此使用MR作业.

Generally speaking, hive/hdfs will be significantly faster than HBase. HBase sits on top of HDFS so it adds another layer. HBase would be faster if you are looking up individual records but you wouldn't use an MR job for that.

这篇关于HBase上的Hive与HDFS上的Hive的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆