hbase是什么类型数据库

HBase是一个开源的、分布式的、版本化的NoSQL数据库，它利用Hadoop分布式文件系统HDFS来存储数据，HBase的设计初衷是为了在Hadoop生态系统中提供大规模的结构化存储，并且它是一个适合于非结构化或半结构化数据的存储系统。

（图片来源网络，侵删）

HBase的关键特性

分布式架构：HBase能够在多个服务器节点上分布数据和负载，实现高可扩展性和容错性。

列式存储：与传统的行式数据库不同，HBase将数据按列族（Column Family）进行组织，这使得针对特定列的查询更加高效。

稀疏存储：HBase为每个单元格（Cell）存储实际值，这意味着不需要为整个行分配空间，从而节省存储空间。

多版本并发控制（MVCC）：HBase支持对同一数据的不同版本的存储，使得可以处理并发写入和查询操作。

线性和模块化扩展：可以通过添加更多的硬件来增加存储和处理能力。

与Hadoop生态系统集成：HBase能够很好地与Hadoop的其他组件（如MapReduce、Hive等）集成使用。

HBase适用场景

大数据存储：适用于PB级数据的存储。

实时读写访问：适合需要快速随机读写的场景。

海量日志数据处理：用于存储和分析大量的日志数据。

大规模数据集的在线访问：用来支撑网页的后端存储。

HBase架构组件

组件	描述
Region Server	负责维护Master分配给它的Region，处理对这些Region的读写请求。
Master	负责监控所有的Region Server，并负责Region的负载均衡以及Region的迁移。
ZooKeeper	保证任何时候HBase集群中只有一个Master运行，保存所有Region Server的状态。
Region	由若干连续的Key组成，是HBase中分布式数据的最小单元。

与传统关系型数据库的比较