面试官：聊聊你对分库分表的理解？-编程学习网

分库分表技术不但是日常工作中用于解决数据库中的数据量会急剧增长，解决单库单表性能瓶颈的一种方案，更是面试中的高频知识点。

在阿里巴巴的《Java 开发手册》中规定：当单表的数据超过 500 万，或单表的大小超过 2GB 时，就要考虑分库分表了。那么什么是分库分表呢？

1.分库分表

首先来说，“分库分表”不是一个技术，而是两个技术实现，它分为：

分库

垂直分库
水平分库

分表
垂直分表
水平分表

（1）垂直分库

垂直分库是按照业务将不同的表拆分到不同的数据库中。例如，在一个电商数据库中的用户表和订单表分别存放到不同的数据库中，如下图所示：

（2）水平分库

水平分库是将数据按照一定的规则（如用户 ID 取模、哈希等）分布到不同的数据库中。比如，根据用户 ID 对 10 取模，将用户数据分布到 10 个不同的数据库中，每个数据库都保存着完整的数据表结构，如下图所示：

（3）垂直分表

垂直分表是将一张表按照列的相关性拆分成多张表。例如，将一个包含大量字段的用户表，拆分为用户基本信息表和用户扩展信息表，如下图所示：

（4）水平分表

水平分表是将一张表的数据按照行进行拆分。例如按照用户 ID 的范围或者哈希值将数据拆分到不同的表中。

如果搞不清楚什么是垂直分表和什么是水平分表？可以参考一下这幅图思考一下：

2.技术实现

分库分表的主流实现技术有以下两种：

MyCat
Apache Sharding Sphere

Sharding Sphere 相比于 MyCat 来说，它的优势是：

功能更多：除了读写分离和分库分表之外，还提供了数据加密、流量质量、数据迁移等功能。
社区更活跃度和生态更好：Sharding Sphere 拥有活跃的社区和丰富的文档，生态系统较为完善，有更多的用户和开发者参与。
灵活性和扩展性：Sharding Sphere 灵活性更高，扩展性也更好，它可以方便地与其他技术集成，这方便 MyCat 支持的比较有限。

3.Sharding Sphere

Sharding Sphere 最早是当当网的内部框架，后面捐献给了 Apache，目前也是分库分表的主流技术实现方案，在 Sharding Sphere 中有两种分库分表的技术实现：

Sharding Sphere JDBC：定位为轻量级 Java 框架，在 Java 的 JDBC 层提供的额外服务。它使用客户端直连数据库，以 jar 包形式提供服务，无需额外部署和依赖，可理解为增强版的 JDBC 驱动，完全兼容 JDBC 和各种 ORM 框架。

Sharding Sphere Proxy：定位为透明化的数据库代理端，通过实现数据库二进制协议，对异构语言提供支持。目前提供 MySQL 和 PostgreSQL 协议，透明化数据库操作，对 DBA 更加友好。

它们的区别如下：

	ShardingSphere-JDBC	ShardingSphere-Proxy
支持数据库	任意	MySQL/PostgreSQL
连接消耗数	高	低
支持语言	仅 Java	任意
性能	损耗低	损耗略高
无中心化	是	否

文章详情

面试官：聊聊你对分库分表的理解？

1.分库分表

（1）垂直分库

（2）水平分库

（3）垂直分表

（4）水平分表

2.技术实现

3.Sharding Sphere

软考中级精品资料免费领

相关文章

猜你喜欢

面试官：聊聊你对分库分表的理解？

美团面试官：说说你对数据库分库分表的理解？

分库分表真的适合你的系统吗？聊聊分库分表和NewSQL如何选择

聊聊分布式数据库的 Sharding，你了解吗？

面试官：说说你对 RESTful 的理解？

面试官：说说你对Git的理解？

面试官：谈谈你对 Volatile 的理解吧

面试官：谈一谈你对HashMap的理解？

面试官：说说你对分而治之、动态规划的理解？区别？

面试官：说说你对Java异常的理解

面试官：说说你对options请求的理解

面试官：谈谈你对“零拷贝”的理解？

面试官：谈谈你对零拷贝的理解？

面试官：谈谈你对 JavaScript 原型链的理解

面试官：说说你对二分查找的理解？如何实现？应用场景？

面试官：谈谈你对MySQL主从复制的理解？

面试官：谈谈你对IO多路复用的理解？

面试官：详细说说你对序列化的理解

阿里面试官：谈谈对Redis哈希表的理解

面试官：说说你对Git Stash 的理解？应用场景？