一、垂直拆分
1、垂直分库:在分布式系统开发中,基本都是按照模块划分,每个业务模块建立一个数据库
特点:业务区分度高,方便维护管理;各个模块独立维护,可以分摊系统的维护成本,提高可用性。
2、垂直分表:单张宽表,根据实际业务场景,可以拆分为多个子表。
垂直拆分的缺点:
阿里巴巴《Java 开发手册》提出单表行数超过 500 万行或者单表容量超过 2GB,会影响性能。
这个数值依据: 这个数值与MySQL 的配置以及机器的硬件有关。因为,MySQL 为了提高性能,会将表的索引装载到内存中。InnoDB buffer size 足够的情况下,其能完成全加载进内存,查询不会有问题。但是,当单表数据库到达某个量级的上限时,导致内存无法存储其索引,使得之后的 SQL 查询会产生磁盘 IO,从而导致性能下降。当然,这个还有具体的表结构的设计有关,最终导致的问题都是内存限制。这里,增加硬件配置,可能会带来立竿见影的性能提升哈。
根据模块分库(分布式事务问题):当系统之间交互操作数据库时无法完成事务问题,增加了开发的复杂度。
关联数据问题:如果需要一个综合数据,需要通过接口聚合各个模块的数据
二、水平拆分
水平拆分的核心:
- 数据均衡分配
- 数据查询尽可能在一张表,一个库中
1、水平分库
特点:两个子库的数据结构完全一样
优点:分库后,系统的可用性较高;每个库、每个表的数据量减少了,性能较高
2、水平分表
特点:两个子表的数据结构完全一致。
优点:每个表中的数据量减少了,缓解数据操作的压力
水平拆分优点:
- 分摊数据的存储、查询压力
- 由于拆分后的数据结构与之前一样,所以对于应用层来说,不用做较大的改动
水平拆分缺点:
- 拆分规则如何制定
- 数据的路由算法,如果后续加表、加库,是否需要重新处理老数据。
三、分库分表带来的问题
分布式ID,需要设计
分布式事务问题
跨库跨表查询问题:
JDBC连接层:sharding-jdb
proxy代理模式:mycat、mysql-proxy