Ozone 是Apache Hadoop社区推出的面向大数据领域的新一代分布式存储系统,它的推出解决了Hadoop分布式文件系统在可扩展性上限方面的缺陷问题,能够支持百亿甚至千亿级文件规模的存储。
自1999年成立以来,Apache 软件基金会已成功建立起强大的生态圈,其社区涌现了非常多优秀的开源项目,同时有越来越多国内外项目走向这个国际开源社区进行孵化。目前所有的 Apache 项目都需要经过孵化器孵化,满足一系列质量要求之后才可毕业。Ozone从Hadoop社区孵化成功,不仅是项目本身的重要里程碑,也是对项目成员学习Apache Way和推动社区发展等一系列成果的认可。
今年9月,腾讯主导的Ozone 1.0.0版本在Apache Hadoop社区正式发布,标志着历经了2年多的社区持续开发,Ozone 已经具备了在大规模生产环境下部署使用的能力。Ozone的设计,吸收和借鉴了很多HDFS的优点。同时支持兼容AWS S3协议的对象访问接口,且兼容 Hadoop Compatible File System的分布式文件访问接口。
Ozone构架图
除了参与和贡献社区,在0zone的应用层面,腾讯也走在前列。据了解,在腾讯内部,目前已经在对象和容器等一些场景使用了Ozone,并且获得了内部用户积极的好评反馈,后续也会持续将这部分经验分享出来。
随着1.0.0 的发布,腾讯参与和见证了 Ozone 孵化成为一个 Apache 顶级开源项目的过程。腾讯大数据团队Ozone项目技术负责人陈怡也被社区推选为Apache Ozone 首位项目主席(Chair) ,同时项目团队诞生了多位PMC成员和committer,带领社区一起把Ozone向新一代大数据文件对象存储系统推进。
Ozone的生态栈
“随着Ozone 成为Apache 顶级项目,越来越多的贡献者加入到社区的开发中。腾讯内部,一方面计划在Ozone的基础上,开发基于SCM的新一代高性能分布式文件系统;另一方面,持续推进 Ozone 在更多业务落地,部署更大规模的生产集群,进一步提高Ozone的可靠性、稳定性和性能,立志将Ozone打磨成为新一代文件对象存储的标杆。”腾讯云大数据团队Ozone项目技术负责人陈怡表示。
开源协同是当前腾讯最重要的技术战略之一。以大数据团队为代表的腾讯内部技术团队经历了从使用开源、回馈开源再到主导开源的演变。除了在Ozone项目上的贡献之外,目前已完成了大数据核心能力全开源。如今,在Apache基金会的大数据项目上,腾讯已经为主流的Hadoop、Spark、Flink等项目贡献了大量的特性和patch。
从各大开源基金会公开的数据来看,腾讯已经成为对开源社区贡献最大的中国互联网公司之一。