文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

一篇带你了解什么是分布式ID

2024-12-03 02:21

关注

二 .为什么需要分布式ID

如果id我们使用的是数据库的自增长类型,在分布式系统中需要分库和分表时,会有两个相同的表,有可能产生主键冲突。

电商订单号,采用自增方式,是最简单的生成规则。但是!这种与流水号相同的订单号很容易就被竞争对手看出你公司真实的运营信息。

三 .分布式ID需要满足哪些条件

全局唯一:必须保证ID是全局性唯一的

高性能:高可用低延时,ID生成响应要快,否则会成为业务瓶颈

高可用:100%的可用性是骗人的,但是也要无限接近于100%的可用性

好接入:要秉着拿来即用的设计原则,在系统设计和实现上要尽可能的简单

趋势递增:最好趋势递增,这个要求就得看具体业务场景了,一般不严格要求

安全性:如果ID连续生成,势必会泄露业务信息,甚至可能被猜出,所以需要无规则不规则。

易读性:不要太长,想象一下用户在售后的时候本身就处在一个焦躁的心情中,再让他报/输一个很长的订单号,很容易造成错误率高,这个时候只能烦上加烦。如果订单号实在太长,还有一种办法:断句。

可扩展性:淘宝的订单号在最初的时候也还是12位、14位,现在已经变成16位了,随着一个网站的交易量逐年上升,订单号不可避免的会变长。

四 .分布式ID生成方式

注:主流生成ID方案都是基于数据库号段模式和雪花算法

五 .优缺点

1. 基于UUID

优点:

缺点:

2. 基于数据库自增ID

当我们需要一个ID的时候,向表中插入一条记录返回主键ID,但这种方式有一个比较致命的缺点,访问量激增时MySQL本身就是系统的瓶颈,用它来实现分布式服务风险比较大,不推荐!

优点:

实现简单,ID单调自增,数值类型查询速度快

缺点:

DB单点存在宕机风险,无法扛住高并发场景

3. 基于数据库集群模式

前边说了单点数据库方式不可取,那对上边的方式做一些高可用优化,换成主从模式集群。害怕一个主节点挂掉没法用,那就做双主模式集群,也就是两个Mysql实例都能单独的生产自增ID。那这样还会有个问题,两个MySQL实例的自增ID都从1开始,会生成重复的ID怎么办?

解决方案:设置起始值和自增步长

MySQL_1 配置:

  1. set @@auto_increment_offset = 1; -- 起始值 
  2. set @@auto_increment_increment = 2; -- 步长 

 MySQL_2 配置:

  1. set @@auto_increment_offset = 2;     -- 起始值 
  2. set @@auto_increment_increment = 2;  -- 步长 

这样两个MySQL实例的自增ID分别就是:

  1. 1、3、5、7、9  
  2. 2、4、6、8、10 

那如果集群后的性能还是扛不住高并发咋办?就要进行MySQL扩容增加节点,这是一个比较麻烦的事。

增加第三台MySQL实例需要人工修改一、二两台MySQL实例的起始值和步长,把第三台机器的ID起始生成位置设定在比现有最大自增ID的位置远一些,但必须在一、二两台MySQL实例ID还没有增长到第三台MySQL实例的起始ID值的时候,否则自增ID就要出现重复了,必要时可能还需要停机修改。

优点:

缺点:

4. 基于数据库的号段模式

号段模式是当下分布式ID生成器的主流实现方式之一,号段模式可以理解为从数据库批量的获取自增ID,每次从数据库取出一个号段范围,例如 (1,1000] 代表1000个ID,具体的业务服务将本号段,生成1~1000的自增ID并加载到内存。

由于多业务端可能同时操作,所以采用版本号version乐观锁方式更新,这种分布式ID生成方式不强依赖于数据库,不会频繁的访问数据库,对数据库的压力小很多。

5. 基于Redis模式

利用redis的incr命令实现ID的原子性自增。

  1. 127.0.0.1:6379> set seq_id 1     // 初始化自增ID为1 
  2. OK 
  3. 127.0.0.1:6379> incr seq_id      // 增加1,并返回递增后的数值 
  4. (integer) 2 

用redis实现需要注意一点,要考虑到redis持久化的问题。redis有两种持久化方式RDB和AOF

6. 基于雪花算法(Snowflake)模式

雪花算法(Snowflake)是twitter公司内部分布式项目采用的ID生成算法

Snowflake生成的是Long类型的ID,一个Long类型占8个字节,每个字节占8比特,也就是说一个Long类型占64个比特。Snowflake ID组成结构:正数位(占1比特)+ 时间戳(占41比特)+ 机器ID(占5比特)+ 数据中心(占5比特)+ 自增值(占12比特),总共64比特组成的一个Long类型。

根据这个算法的逻辑,只需要将这个算法用Java语言实现出来,封装为一个工具方法,那么各个业务应用可以直接使用该工具方法来获取分布式ID,只需保证每个业务应用有自己的工作机器id即可,而不需要单独去搭建一个获取分布式ID的应用。

雪花算法目前存在时间回拨问题,而且不同的机器也无法完全保证时间一样,所以可能会出现重复问题。

7. 美团(Leaf)

Leaf由美团开发,支持号段模式和snowflake算法模式,可以切换使用。

 

来源:今日头条内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯