为什么在配置单元中选择计数(*)比选择*要慢 [英] Why is Select Count(*) slower than Select * in hive

查看:162
本文介绍了为什么在配置单元中选择计数(*)比选择*要慢的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

当我在 VirtualBox Sandbox 中使用配置单元运行查询时。我觉得 Select count(*) Select * 慢太多。



任何人都可以解释背后发生了什么?



以及为什么这种延迟发生?

解决方案

  select * from table 

它可以是一个Map only job但是
$ b $ pre $ 从表
中选择Count(*) code>

它可以是一个Map和Reduce作业



希望这有帮助。

When i am running queries in VirtualBox Sandbox with hive. I feel Select count(*) is too much slower than the Select *.

Can anyone explain what is going on behind?

And why this delay is happening?

解决方案

select * from table

It can be a Map only job But

Select Count(*) from table 

It can be a Map and Reduce job

Hope this helps.

这篇关于为什么在配置单元中选择计数(*)比选择*要慢的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆