hbase相关内容

Google Cloud Bigtable客户端连接池

我通过制作一个虚拟的Web应用程序对Google Cloud Bigtable进行了负载测试,该应用程序可以处理向Bigtable写入数据和从Bigtable读取数据的请求.刚开始时,我只使用一个Bigtable连接作为一个单例,并在所有线程(请求)中重用它.当我增加请求数量时,我注意到性能越来越慢.不知何故,我没有增加节点数,而是想到了建立多个Bigtable连接,然后将它们随机分配给任何线程, ..

将Spark数据框插入HBase

我有一个数据框,我想将其插入到hbase中。我遵循此文档。 这是我的数据框的样子: -------------------- | id |名称|地址| | -------------------- | | 23 |结婚|法国| | -------------------- | | 87 | zid | italie | -------------------- ..
发布时间:2020-10-17 00:23:24 其他开发

HBase:创建多个表还是包含多个列的单个表?

何时创建多个表而不是创建具有大量列的单个表是有意义的。我知道表通常只有几个列族(1-2),每个列族可以支持1000多个列。 何时创建单独的列有意义HBase在单个表中可能包含大量列的情况下表现良好的表? 解决方案 在回答问题本身之前,让我首先说明一些主要因素。我将假定使用的文件系统是HDFS。 一个表被划分为称为区域的键空间的非重叠分区。 键范围->区域映射存储在称为me ..
发布时间:2020-10-16 04:22:52 其他开发

HBase-WAL和MemStore有什么区别?

我试图了解HBase体系结构.我可以看到两个不同的术语用于同一目的. Write Ahead Logs和Memstore都用于存储尚未持久保存到permanent storage的新数据. WAL和MemStore有什么区别? 更新: WAL-用于在服务器崩溃时恢复尚未持久的数据. MemStore-将更新作为已排序键值存储在内存中. 在将数据写入磁盘之前,似乎有很多 ..
发布时间:2020-09-06 19:37:57 其他开发

使用Pyspark与Hbase进行交互的最佳方法是什么

我正在使用pyspark [spark2.3.1]和Hbase1.2.1,我想知道使用pyspark访问Hbase的最佳方法是什么吗? 我进行了一些初始搜索,发现几乎没有可用的选项,例如使用shc-core:1.1.1-2.1-s_2.11.jar,但这可以实现,但是无论我在哪里寻找示例,在大多数地方,代码都是用Scala编写的,或者示例也是基于Scala的.我尝试在pyspark中实现基本 ..
发布时间:2020-09-04 04:19:37 其他开发

具有Hbase集成的Spark结构化流

我们正在对从MySQL收集的kafka数据进行流式处理.现在,所有分析完成后,我想将数据直接保存到Hbase.我已经通过了Spark结构化的流式文档,但是使用Hbase找不到任何接收器.下面是我用来从Kafka读取数据的代码. val records = spark.readStream.format("kafka").option("subscribe", "kaapociot").op ..
发布时间:2020-09-04 01:44:32 其他开发

HRegionServer显示“错误通知主机我们已经启动".显示套接字异常:无效的参数

我正在尝试在3个centos机器中创建一个hbase集群. Hadoop(v-2.8.0)已启动并在顶部运行我配置了HBase(v-1.2.5).Hbase启动很好,它启动了HMaster和Region服务器,但仍然显示区域服务器和HMaster日志中的以下错误它显示没有签入任何区域服务器. 2017-04-20 19:30:33,950 WARN [regionserver/localh ..
发布时间:2020-09-03 03:53:06 服务器开发

运行伪分布式HBase时出错

我通过Homebrew在Mac OSX 10.9中安装了Hadoop和HBase. Hadoop的版本为2.5.1,HBase的版本为0.98.6.1. 启动HDFS,并尝试启动HBase之后,出现以下错误: 错误:找不到或加载主类org.apache.hadoop.hbase.util.HBaseConfTool 错误:找不到或加载主类org.apache.hadoop.hba ..
发布时间:2020-08-14 23:09:50 其他开发