hortonworks-sandbox相关内容

在spark中使用hive数据库

我是 spark 新手,正在尝试使用 HortonWorks Sandbox 在 tpcds 基准表上运行一些查询.http://www.tpc.org/tpcds/在沙箱上通过 shell 或 hive-view 使用 hive 时没有问题.问题是如果我想使用spark,我不知道如何连接到数据库.如何在 spark 中使用 hive 数据库来运行查询?到目前为止,我知道的唯一解决方案是使用以下 ..

在spark中使用hive数据库

我是 spark 新手,正在尝试使用 HortonWorks Sandbox 在 tpcds 基准表上运行一些查询.http://www.tpc.org/tpcds/在沙箱上通过 shell 或 hive-view 使用 hive 时没有问题.问题是如果我想使用spark,我不知道如何连接到数据库.如何在 spark 中使用 hive 数据库来运行查询?到目前为止,我知道的唯一解决方案是使用以下 ..

Apache NiFi - OutOfMemory 错误:SplitText 处理器超出了 GC 开销限制

我正在尝试使用 NiFi 使用 HDF 1.2 处理大型 CSV 文件(每个文件可能有数十亿条记录).我已经实现了我的流程,对于小文件一切正常. 问题是,如果我尝试将文件大小推到 100MB(1M 记录),我会从 SplitText 负责将文件拆分为单个记录的处理器.我已经搜索过了,这基本上意味着垃圾收集器执行时间过长而没有获得太多堆空间.我预计这意味着太多的流文件生成得太快了. 我该 ..

为什么无法连接到127.0.0.1 HortonWorks仪表板?

我已经在Windows 10上安装了Virtual Box(版本5.2.0 r118431(Qt5.6.2)),并且导入了设备HDP_2.4_virtualbox_v3(可从 CentO完成引导后,提示我输入ip 127.0.0.1:8888,它是与教程不同的地址, 并且没有服务器正在监听该地址,因为我得到了 "127.0.0.1拒绝连接."在浏览器中. 此处的图片 解决 ..
发布时间:2021-05-13 20:20:37 其他开发

Hortonworks沙箱是否在LinuxVM上安装?

如何在LinuxVM上安装Hortonworks沙箱?任何视频教程都将受到高度赞赏. 解决方案 在Oracle虚拟机上安装Hortonworks沙箱: 从此处下载HDP沙箱并将其解压缩. 从此处下载Virtual Box,然后在Windows上安装Virtual Box. 现在打开Oracle Virtual Box,转到文件“菜单",然后单击“导入设备". 根据您 ..
发布时间:2020-06-18 19:10:49 其他开发

在spark中使用hive数据库

我是Spark新手,尝试使用HortonWorks Sandbox在tpcds基准表上运行一些查询。 http://www.tpc.org/tpcds/ 有在通过shell或hive-view在沙箱上使用配置单元时没有问题。问题是我不知道如何连接到数据库,如果我想使用火花。 如何在火花中使用配置单元数据库来运行查询? 直到现在我才知道的唯一解决方案是手动重建每个表并使用下面的scala代码 ..

使用yum安装Apache Spark

我正在组织的HDP框中安装spark。我运行 yum install spark 并安装Spark 1.4.1。我如何安装Spark 2.0?请帮助! 解决方案 在HDP 2.5中支持Spark 2(作为技术预览版)。您可以将特定的HDP 2.5 repo添加到您的yum repo目录中,然后安装它。 Spark 1.6.2是HDP 2.5中的默认版本。 wget http://p ..
发布时间:2018-05-31 20:13:23 分布式计算/Hadoop

Apache NiFi - OutOfMemory错误:在SplitText处理器上超出了GC开销限制

我正在尝试使用NiFi来处理使用HDF 1.2的大型CSV文件(每个文件可能有数十亿条记录)。我已经实现了我的流程,并且对于小文件一切正常。 问题是如果我尝试将文件大小推到100MB(1M记录),我从负责将文件拆分为单个记录的 SplitText 处理器获取 java.lang.OutOfMemoryError:超过GC开销限制。我已经搜索了这一点,它基本上意味着垃圾收集器执行时间太长而没有 ..