beeline相关内容

如何从直线访问 Metastore?

我需要做一些 SQL 查询(如 此处) 直接来自 Metasore. PS:SHOW/DESCRIBE 命令不够. 如何从它作为数据库启用访问,或者Metastore的数据库名称是什么?......在如今(2019年)有可能吗? 注意事项 什么是Metastore? 对我来说是 Hive 架构的一个非常重要的元素,最终用户需要对其进行一些访问... “所有 Hive 实现都需 ..
发布时间:2021-12-28 23:57:55 其他开发

使用 Beeline 连接到 Hive

我正在尝试通过 Beeline 客户端连接到安装在我机器上的配置单元.当我发出“直线"命令时连接到 Hive,客户端要求输入用户名 &密码 !connect jdbc:hive2://localhost:10000/default 我不知道我应该提供的用户名和密码是什么.我是否必须在某些配置文件中添加凭据(用户名和密码)? 解决方案 通过 Beeline 访问 HIVE: 启动直 ..
发布时间:2021-12-15 19:08:31 其他开发

在直线蜂巢中导出为 csv

我正在尝试将我的配置单元表导出为直线配置单元中的 csv.当我运行命令 !sql select * from database1 >/user/bob/output.csv 它给了我语法错误. 此时我已使用以下命令成功连接到数据库.查询在控制台输出正确的结果. beeline -u 'jdbc:hive2://[databaseaddress]' --outputformat=csv 另 ..
发布时间:2021-12-09 14:57:24 其他开发

在Beeline(配置单元)中添加本地文件

我正在尝试通过Beeline客户端添加本地文件,但是我一直遇到一个问题,即它告诉我该文件不存在. [test @ test-001 tmp] $ touch/tmp/m.py[test @ test-001 tmp] $ stat/tmp/m.py文件:"/tmp/m.py"大小:0块:0 IO块:4096个常规空文件设备:801h/2049d索引节点:34091464链接:1访问:(0664 ..
发布时间:2021-05-14 19:10:19 其他开发

使用正则表达式提取配置单元计数字符串

我正在尝试使用paramiko获取配置单元表中的记录总数.我知道我们可以使用Pyhive或pyhs2,但是它需要某些配置,并且需要很多时间才能从我的IT团队那里完成. 所以我正在使用paramiko执行以下命令并获取计数: beeline -u jdbc:hive2://localhost:10000 -n hive -e'从表名中选择count(*)' 我得到以下结果, + - ..
发布时间:2021-05-14 19:10:06 其他开发

优化配置单元查询.java.lang.OutOfMemoryError:超出了Java堆空间/GC开销限制

由于不断遇到此OOM错误,如何优化这种形式的查询?还是想出一个更好的执行计划?如果我删除了substring子句,查询将正常工作,表明这会占用大量内存. 当作业失败时,直线输出将显示OOM Java堆空间.在线阅读建议我增加 export HADOOP_HEAPSIZE ,但这仍然会导致错误.我尝试的另一件事是增加 hive.tez.container.size 和 hive.tez.jav ..
发布时间:2021-05-14 19:08:30 其他开发

如何从beeline访问Metastore?

我需要执行一些SQL查询(如此处)直接来自Metasore. PS:命令SHOW/DESCRIBE 不够. 如何启用作为数据库的访问权限,或者Metastore的数据库名称是什么?...在当今(2019年)有可能吗? 注意 什么是 Metastore ? 对我来说,这是Hive架构中非常重要的元素,最终用户需要对其进行访问... “所有Hive实施都需要一个元数据存储服务,用 ..
发布时间:2021-05-14 19:05:13 其他开发

如何将数据从CSV加载到Hive外部表(Avro格式)?

我尝试构建一条直线脚本,以将HDFS中存储的CSV文件加载到Hive中的外部表.首先,我创建一个空的外部表: 如果不存在则创建外部表db.table(列字符串)储存为AVRO位置'/foo/bar' 之后,我检查了表是否已创建.是的.我已经使用以下命令将CSV文件加载到HDFS中: hdfs dfs -put test.csv/temp/raw_csv 现在,我想将此CSV数据加载( ..
发布时间:2021-04-12 20:52:25 其他开发

Hive / Beeline,如何设置作业.staging目录?

在集群上,我正在为每个用户提供60GB的Hadoop配额。 历史上我正在处理的项目会生成很多Hive查询。 为了让事情工作更快,我试着平行这些查询(这是不相关的),但结果是/user/{myusername}/.staging/目录正在填充job_ {someid}目录反过来充满了蜂巢罐,并非常快地消耗这些60GB。尽管我可以限制并行化因素,但我还想看看是否可以让Hive将这些jar放在不同的 ..
发布时间:2018-06-12 14:19:30 其他开发

记录通过执行的配置单元查询。直线

我正在直线下面跑蜂巢。 0:jdbc:hive2://是否可以告诉我在哪里可以看到Map reudce日志? :10003 />选择a.offr_id offerID,a.offr_nm offerNm,b.disp_strt_ts dispStartDt,b.disp_end_ts dispEndDt,vld_strt_ts validStartDt,vl ..
发布时间:2018-06-12 14:08:34 其他开发

导出为直线配置单元中的csv

我试图将我的配置单元表作为直线配置单元中的csv导出。当我运行命令!sql select * from database1> /user/bob/output.csv 它给了我语法错误。 我已经使用以下命令成功连接到数据库。 beeline -u'jdbc:hive2:// [databaseaddress]'--outputformat = csv 另外,文件结尾 ..
发布时间:2018-06-12 13:34:29 其他开发

使用直线连接到蜂巢

我试图通过Beeline客户端连接到安装在我的机器上的配置单元。当我给予'直线'命令&连接到Hive,客户端要求用户名&密码 !connect jdbc:hive2:// localhost:10000 / default 我不知道我应该给的用户名和密码是什么。我需要在某个配置文件中添加凭证(用户名和密码)吗? 解决方案 没有用户名和密码。 !connec ..
发布时间:2018-05-31 18:47:30 分布式计算/Hadoop