当下,数据备份保护正迎来全新的发展周期,这是因为数据库这一基础软件迎来了全新的机遇。众所周知,在信创、国产替代,云计算、大数据深入普及的大背景下,集中式数据库正逐渐被分布式数据库取代,越来越多关键行业,如金融、电信的核心数据正在尝试部署于分布式数据库,至于快递、物流、互联网、餐饮、旅游等C端客户较多的行业更是很早就应用了分布式数据库。
2022年5月,Frost & Sullivan联合头豹研究院发布的《2021年中国分布式数据库市场报告》指出,在中国市场,分布式数据库发展正处于“爆发期”。中国的分布式数据库相关专利申请量从2012年的全球占比22%爬升至2021年的76%,中国已经成为全球分布式数据库的技术创新中心。
分布式数据库带来市场新难题
新机遇伴随新挑战,分布式数据库快速普及的同时,给数据备份保护带来了新的难题。与传统集中式数据库完全不同的是,分布式数据库有着自己的特性,最突出的两点:海量、云原生。
就海量而言,分布式数据库节点数量比集中式数据库大的多。集中式数据库几百个节点已经是非常大的数据库环境,而对于分布式数据库而言,成千上万个节点是很普遍的。
拿云原生来说,海量的备份作业对备份主节点是否可以横向扩展、备份的存储空间是否可以池化并横向扩展,以解决备份性能及备份存储空间都提出了新的要求。与此同时,大批量数据库上线及下线对备份系统能否自动感知并动态调整也提出了新的考验。
除此之外,海量节点引发的数据恢复一致性问题相比集中式数据库,概率更大,问题更严重。
在瑞数信息看来,如果数据没有恢复一致性保证,对于分布式数据库的数据备份将变得毫无意义。
目前,针对分布式数据库的数据备份挑战,市场供给侧基本上是空白的,主要有三个方面的原因:一是,分布式数据库市场还比较新,国外领先的数据备份厂商还没有跟进;二是,分布式数据库厂商当前主要的精力,是解决数据库的可用可靠,让数据库不掉链子,虽然有数据备份功能,但没有余力完备;三是,分布式数据库数据保护涉及到的技术门槛较高。
瑞数信息发布国内首款分布式数据库保护方案
在这样的大背景下,为了让用户能够更安心的部署新技术、拥抱新时代,瑞数信息率先推出了专门针对分布式数据库的保护方案,这也是国内首款分布式数据库保护方案。
瑞数分布式数据库保护方案的核心价值点可以总结为三个维度:
l 备份恢复方面,能够适配分布式数据库的特性,包括一致性、海量、云原生,让数据备份恢复功能可用、易用。
l 数据管理方面,增加了包括性能调优环境快速搭建、开发测试环境快速搭建、通过虚拟化数据供给实现了低成本的数据使用等功能,让备份下来的数据能用、好用。
l 数据安全方面,可提供备份数据安全保护、防勒索、数据安全使用、数据治理等功能,让企业备份数据安全、放心。
具体而言,瑞数分布式数据库保护方案涉及到很多关键技术。
l 数据一致性,实现数据恢复的金融级安全
实现数据恢复一致性,瑞数分布式数据库保护方案可确保任意时间点的数据一致性恢复,实现数据恢复的金融级安全。
l 永久增量模式,大幅降低备份时间
针对海量环境、海量数据,瑞数分布式数据库保护方案采用永久增量备份模式,除了第一次全量备份,之后只需备份增量数据和日志备份,系统内部自动增量合成,可大幅降低备份时间90%以上,进而解决分布式数据库备份窗口的问题。
l 海量数据,分钟级恢复
快速恢复方面,不同于其它备份软件会将备份下来的数据转换为另一种格式进行存储,瑞数分布式数据库保护方案的备份数据会保持数据的原始格式,这样在还原时可少转换一次格式,使得无论数据量有多大,瑞数分布式数据库保护方案都可实现分钟级恢复。
另外,瑞数分布式数据库保护方案还有多种功能特性,包括:
l 备份数据多副本使用,为测试、开发、大数据等即时供给数据,充分价值化使用数据;
l 提供异地复制、多种存储介质、不可变数据、保留周期锁定、自动化数据验证等功能,确保法规遵从;
l 针对海量环境的自动探测技术、无代理流式备份。
l 专业的存储空间管理,包括1+N*增量数据空间占用、透明压缩、对象存储对接等
瑞数信息持续不断为用户输出价值
尽管瑞数分布式数据库保护方案推出时间不长,但凭借突出的表现已在多个银行、运营商公司进行POC测试,收获好评不断。
比如在某银行测试环境中,客户的分布式数据库拥有500个左右数据库节点,每个Master配置2个Slave,共加载了40个DB,有单节点的DB,也有跨越10多个节点的DB,分库分表管理非常复杂。
经过测试,瑞数分布式数据库保护方案通过永久增量备份,可大幅减少备份时间至原有的10%-30%,大幅减少存储空间占用到原有的30%左右,而且无论数据量大小,都能实现分钟级恢复。另外,瑞数分布式数据库保护方案支持自动化恢复验证,从而可以保证数据保护的法规遵从和备份机制的执行。在客户提供的一致性恢复测试项目中,瑞数全部通过。给客户留下了深刻的印象
总体而言,如瑞数信息提到,国内分布式数据库一路走来,可以说筚路蓝缕,挑战很多。瑞数信息希望能够通过自己的努力,和业界众多分布式数据库厂商形成合力,助力用户不仅能用上分布式数据库,而且要安全地用好,给用户带去真正的价值。
为此,面向未来,瑞数信息将着重在两个层面发力:一是,在数据保护层面,继续完善功能,同时与分布式数据库厂商做好对接,让用户更便捷的实现数据备份、恢复;二是,助力用好分布式数据库,比如与瑞数信息现有的数据安全检测与应急响应系统(DDR)联动,实现海量数据快速备份的反勒索机制,解决海量数据的快速脱敏问题等。
结语
在分布式数据库快速发展的今天,瑞数信息敏锐地洞察到市场空白,基于多年来对数据安全的认知和技术积累,推出的国内首款分布式数据库保护方案,将为企业更好、更安全地应用分布式数据库、做好数据安全合规打下坚实基础,同时也引领着数据安全细分领域向更新兴的技术领域发展。