短信预约-IT技能免费直播动态提醒

短信预约提醒成功

Hadoop数据存储—Hbase

2024-04-02 19:55

关注

大家都知道Hadoop是一个数据库，其实说的的就是Hbase。它和我们平常理解的关系型数据库有什么区别呢？

1.它是NoSQL的，它没有SQL的接口，有自己的一套API。

2.关系型数据库可以做汇总，可以进行常规的分析，但是Hbase不可以，它不能做汇总。那么Hbase操作不方便，不能做汇总，不能做分析，有什么作用呢？它的随机读写效率很高，可以存储海量数据，基于某个网点，某个城市，某个机器随机去查询速度快。或者去存储基于时间序列的数据，比如微信、微博、日志的数据，效率很高。

3.它的存储是列式的，平常我们接触的MySQL，Oracle,RDBMS都是行存储。行存储和列存储的区别是：行存储适合在线事务的场景，适合随机的访问，比如去银行修改账户记录，修改个人信息，这个修改就是从数据库中找到你信息所在的行。列存储就是以列为单位进行连续存储，如果以列存储放到银行这个场景中会是怎样的一种效果呢？如果想要修改信息，那么定义到用户所在行信息，就会扫描到整个表，所以行存储主要用于在线事务处理，而列存储适用于数据分析。因为在大数据的数据库场景中，我们会构建很宽的事实表，通过信息模型有个中心，围绕这个中心扩散出很多维度，这个中间表是一个很宽的表，在我们进行特定业务分析的时候，比如分析广告业务推广的情况，可能只需要从很多资料中选取一部分变量进行分析，如果使用行存储，那么就是全表扫描，而使用列存储会选取特定部分，效率很高。

HBase vs RDBMS

Hadoop数据存储—Hbase

通过以上描述，我们分析一下hbase的特点：

（1）存储海量数据：Pb+

（2）高吞吐：每秒每个节点上千次写

（3）适合处理稀疏数据（半结构化数据）：存储一行的空列没有空间浪费。因为半结构化数据有大量的空存在，那么使用结构化数据存储到关系型数据库，就会有大量的空间浪费，而且不适合做分析。

但是hbase访问模式是受到限制的，它对基于行键的查找做了优化，而不是全文查询；没有事务，只支持单行操作。

说了这么多，那么我们为什么使用Hbase呢？这里我们做一个对比：

（1）使用HDFS

你只需要追加到数据集（没有随机写）

通常读取整个数据集（没有随机读）

（2）使用HBase

你需要随机写或读

每秒对TB级的数据执行上千次操作

（3）使用RDBMS

数据放在一个大节点上

需要全部的事务支持

需要实时查询的能力

这就是个人对于Hbase的一些认知和了解，写出来和大家共同分享，希望可以共同进步。不过我个人平常也会关注CSDN论坛以及“大数据cn”、“大数据时代学习中心”这些微信公众号，从中我了解和学习了很多东西，也让自己的技术能力更上了一层楼，推荐大家看看。

阅读原文内容投诉

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

历年真题答案解析
备考技巧名师总结
高频考点精准押题

资料下载
历年真题

2024上半年软考中级软件测评师考试基础知识真题
193.9 KB下载数265
2024上半年软考中级软件设计师考试基础知识真题
191.63 KB下载数245
2023下半年-系统集成项目管理工程师-真题考点汇总（完整版）
143.91 KB下载数1148
2023年下半年系统集成项目管理工程师第一、二、三批次真题考点整理(考友回忆版)
183.71 KB下载数642
2023年上半年软考中级《系统集成项目管理工程师》-基础知识-考试真题及答案
644.84 KB下载数2756

2024年上半年信息系统项目管理师第二批次真题及答案解析（完整版）
难度 813人已做
查看
【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析
难度 354人已做
查看
【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析
难度 318人已做
查看
2024年上半年软考高项第一、二批次真题考点汇总（完整版）
难度 435人已做
查看
2024年上半年系统架构设计师考试综合知识真题
难度 224人已做
查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机

Hadoop数据存储—Hbase

数据库2024-04-02

HBase数据是怎么存储的

HBase数据是怎么存储的

数据库2024-03-05

HBase中怎么分布存储数据

HBase中怎么分布存储数据

数据库2024-04-09

hbase数据存储方式有哪些

hbase数据存储方式有哪些

数据库2024-04-16

hbase数据存储与查找原理

hbase数据存储与查找原理

数据库2018-09-01

hadoop存储数据的方法是什么

hadoop存储数据的方法是什么

数据库2024-03-04

HBase中数据存储的形式是什么

HBase中数据存储的形式是什么

数据库2024-04-09

hadoop怎么解决存储和数据处理

hadoop怎么解决存储和数据处理

数据库2024-04-09

hadoop数据怎么迁移至对象存储

hadoop数据怎么迁移至对象存储

数据库2024-04-11

HBase中的数据存储结构是怎样的

HBase中的数据存储结构是怎样的

数据库2024-04-09

HBase怎么存储和访问大规模数据

HBase怎么存储和访问大规模数据

数据库2024-04-09

HBase中如何实现数据的存储和检索

HBase中如何实现数据的存储和检索

数据库2024-04-09

MySQL的存储引擎与HBase的存储层在数据持久化上的对比

MySQL的存储引擎与HBase的存储层在数据持久化上的对比

数据库2024-10-22

如何理解大数据时代的结构化存储数据库HBase

数据库2024-04-02

如何利用数据压缩技术减少Hadoop存储空间

如何利用数据压缩技术减少Hadoop存储空间

数据库2024-02-29

MySQL的存储引擎与HBase的存储模型比较

MySQL的存储引擎与HBase的存储模型比较

数据库2024-10-19

HBase与Linux存储优化策略

HBase与Linux存储优化策略

数据库2024-10-20

hbase列族是怎么存储的

hbase列族是怎么存储的

数据库2024-04-19

Hbase列式存储入门教程

数据库2024-04-02

HBase如何处理数据的分布式存储和负载均衡

HBase如何处理数据的分布式存储和负载均衡

数据库2024-03-11

位置：首页-资讯-数据库

咦！没有更多了？去看看其它编程学习网内容吧