HBase是一个分布式的、面向列的、基于Hadoop的数据库,其数据存储方式主要有以下几种:
-
列簇(Column Family):HBase中的数据是按列簇进行存储的,每个列簇包含多个列族(Column Family),每个列族包含多个列(Column)。列簇在创建表的时候就指定了,并且不可更改。
-
行键(Row Key):行键是HBase中数据的唯一标识,用于快速定位数据。行键是按字典序排序存储的,可以根据行键的范围或前缀进行快速检索。
-
列限定符(Column Qualifier):列限定符是列的唯一标识,用于确定每个单元格的具体数据。列限定符在创建表时指定,并且可在每次插入数据时动态指定。
-
时间戳(Timestamp):HBase中的每个单元格可以存储多个版本的数据,每个版本都有一个时间戳标识,可以根据时间戳获取历史版本的数据。
-
单元格(Cell):HBase中的数据以单元格的形式存储,每个单元格由行键、列簇、列限定符和时间戳唯一确定。
-
命名空间(Namespace):HBase支持命名空间的概念,可以将表进行逻辑上的分组管理,更好地管理和组织数据。