HBase - 架构

在HBase中,表格分为多个区域,由区域服务器提供服务.区域按列族垂直划分为"商店".商店在HDFS中保存为文件.下面显示的是HBase的体系结构.

注意:术语"商店"用于区域来解释存储结构.

HBase Architecture

HBase有三个主要组件:客户端库,主服务器和区域服务器.可以根据要求添加或删除区域服务器.

MasterServer

主服务器 -

  • 将区域分配给区域服务器并获取Apache ZooKeeper的帮助以执行此任务.

  • Handles跨区域服务器的区域负载平衡.它卸载繁忙的服务器并将区域转移到占用较少的服务器.

  • 通过协商负载平衡来维护集群的状态.

  • 负责架构更改和其他元数据操作,例如创建表和列族.

区域

区域只是分割并分布在区域服务器上的表格.

区域服务器

区域服务器的区域为 -

  • 与客户端通信并处理与数据相关的操作.

  • 处理其下所有区域的读写请求.

  • 按照区域大小阈值确定区域大小.

当我们深入研究区域服务器时,它包含区域和存储,如下所示:

区域服务器

T.他的商店包含内存存储和HFiles. Memstore就像一个缓存.输入HBase的任何内容最初都存储在此处.之后,数据将作为块传输并保存在Hfiles中,并刷新存储库.

Zookeeper

  • Zookeeper是一个开源项目,提供维护配置信息,命名,提供分布式同步等服务.

  • Zookeeper有短暂的表示不同区域服务器的节点主服务器使用这些节点来发现可用的服务器.

  • 除可用性外,节点还用于跟踪服务器故障或网络分区.

  • 客户端通过zookeeper与区域服务器通信.

  • 在伪和独立模式下,HBase本身将采用照顾动物园管理员.