IT基础架构变革在路上:青海移动的去“IE”之旅
近两年一场由互联网企业掀起的x86化浪潮已呈蔓延之势,迅速波及到传统行业。在互联网时代,这是一个必然结果,因为降低成本,并以低成本实现对客户需求的快速敏捷响应和极致用户体验,是加速业务创新、提高企业核心竞争力的重要手段。本着提升管理效率,降低交易成本的目的,IT优化是节约计划中不可或缺的因素。
2另一方面,传统的小型机和集中式存储的架构越来越不适应当前业务需要IT快速响应的要求。基础架构云化是简化IT架构、降低IT系统建设和运维成本、实现业务需求敏捷响应的必由之路。在可预见的将来,绝大部分中小企业的IT系统会选择部署在诸如阿里云、亚马逊AWS等公有云上,而传统的大型企业如金融保险、运营商等会将IT系统运行在私有云上。
3然而,IT系统的云化意味着对底层架构的改造,这将是一个漫长的过程。如何规划好技术路线,如何扎实地走出第一步,非常关键,也是一个不容易决策的过程。
4青海移动由于地理位置原因,IT人才相对匮乏。对于传统集中式架构越来越不适应当前需求以及较高的运维成本,他们有更深刻的体会,对改造IT基础架构的愿望也更为迫切。基于这些原因,青海移动启动了IT基础架构的变革路线,并在今年6月份迈出了关键一步。以下是这次项目的具体情况,以及在此基础上如何进一步去实现IT基础架构的跨越变革。希望通过这个案例,能够给类似的企业提供一个参考。
下定决心去“IE”
青海移动刚刚实现了将统计库从原来小型机和EMC存储迁移到了基于分布式存储的Oracle数据库上,这个项目的成功对他们而言意义重大。青海移动的大部分系统都是运行在小型机和集中式存储上。小型机和传统的磁盘阵列在硬件可靠性上比较占优势,但随着技术的发展特别是集群技术和软件方法的改进以及资源池化概念的再次提出,x86平台在应用软件风险的规避和分散上已经有了长足的进步。
虽然青海移动此前也利用过虚拟化技术建设了x86平台云资源池,但主要是用来运行一些应用软件,并没有在其上承载生产系统的数据库。在现代软件技术的运用下,应用软件系统几乎都是模块化的、非中心化的部署,硬件基本不会影响应用软件的运行。但是作为IT系统核心的数据库,是属于绝对中心化的部分。如果数据库或数据出现问题,将会严重影响生产的运行。
在此之前,青海移动对于x86服务器运行数据库几乎没有经验,将Oracle数据库迁移到x86服务器上,如何保障系统的长期可靠、稳定运行?青海移动有着非常大的顾虑。在此种情况下,青海移动决定选择与国内数据库服务商云和恩墨合作,正式启动迁移项目。从项目开始到正式迁移历经了半年时间,并在今年5月实现了统计库从传统架构迁移到x86分布式存储平台。到目前为止,系统运行非常稳定。可以说,青海移动成功地完成了Oracle数据库去“I(BM)E(MC)”的第一步。
性能、成本、运维:去 "IE" 给青海移动带来积极效果
在青海移动看来,这次成功的去“IE”项目,实现了以下两个目标:
1. 成本的大量降低。原来的小型机已经超期服役,磁盘阵列的存储容量也已经不能满足需求,需要更换小型机和进行存储扩容。而使用新的架构,其成本大幅低于原有架构。从长期的运维来看,TCO成本还会更低。
2. 性能的大幅提升。迁移后,系统的各个业务模块的性能普遍都得到提升,不少业务性能甚至获得了十倍以上的提升 。
比较重要的是,通过一个多月的实际感受,业务人员反映系统变得更快、更流畅了,并希望将其他系统也迁移到新的环境中。业务部门的正面反馈和积极配合,对于推动青海移动IT基础架构的真正变革将起到非常重要的作用。据了解,青海移动已经着手将结算系统迁移到新的基于分布式存储架构的x86平台上,并与原来的统计库实现整合,从而达到减少Oracle数据库分割管理数量的目的。而这正是业界针对“去IOE”口号的另一种声音,即“去IE减O”的实际践行。
青海移动前景规划
以下青海移动项目负责人对未来的一些规划,以及如何付诸实现,表明了其对IT基础架构改造的决心和信心:
1. 将边缘系统迁移到x86平台上,从0开始构造新的基础架构,并实现去“IE”方案的验证和经验积累。
2. 逐步将周边系统迁移到新的架构上,在此过程中实现数据库整合,实现“减O”方案的验证和经验积累。
3. 将一些重要系统迁移到新的架构上,最终形成数据库云平台的架构模式。
在前期项目成功的基础上,青海移动通过构建分布式存储架构上的数据库,实现更多系统的Oracle数据库整合迁移。如此一来,实现数据库私有云架构模式的探索就呈现出平稳但快速推进的态势。对于运营商而言,这样的方式无疑是见效最显著却又最安全的方式。
对于运维,新的架构模式下又会出现哪些变化呢?针对这个问题,青海移动业务支撑中心IT基础架构和运维的负责人表示,新的平台确实跟以住有很大的不同,现在都是开放式的标准化软硬件,在新平台上扩容为结算库的整合作准备时,不用再请专业的存储工程师来做,只需要走集中采购,购买标准的硬盘、PC服务器,接到分布式存储的网络上,安装分布式存储软件,通过简单的命令就实现了存储的扩容。因为都是标准化的开放式的设备:PC服务器、SAS硬盘、SSD硬盘,任何一个搞IT的技术人员都能很快熟悉这些设备并进行维护,不再需要像以前那样订购专门的硬件,并在故障时刻等待专门的主机和大型存储设备工程师到场维护,这对于运维的要求、运维的成本,都得到了大幅降低,而且运维响应度又得到了提升。甚至不再需要像以往那样,要做长期的容量规划,因为新的分布式存储架构下,存储容量和计算能力都可以做到即插即用。原来的容量规划,要么资源闲置,造成成本浪费;要么资源不足,系统能力受到影响。
采用全新存储架构
青海移动在这次项目中尝试了一套全新的分布式存储架构架构 - zData,云和恩墨西区负责人熊军深入了解了zData的技术架构情况并展示了如下的体系架构图例。
熊军介绍,云和恩墨的分布式存储架构zData是整合了标准化x86服务器、40/56Gb Infiniband高速网络、闪存卡、SAS盘、SSD盘和分布式存储软件形成的超融合解决方案。
该方案通过灵活的软件解决方案创建虚拟SAN,大幅降低了成本和复杂性,基于PCIe的闪存存储提供了极高的性能和超低延迟等优点来加快数据库的整体性能。通过方便灵活地搭配不同存储介质,能够以较低的成本应对以下这些应用场景:
1. 使用少量的SSD盘和闪存卡,加上大容量低成本的SAS硬盘和SATA硬盘,满足如数据仓库这样的大数据量、密集IO的系统。单个数据库节点高达每秒12GB的吞吐,可以轻松应对100TB级别的数据仓库。
2. 使用全闪存卡和SSD盘,满足对高并发、低延时OLTP类系统的需求。单个数据库节点超过100万IOPS,单个IO延时在0.6毫秒以下足以满足交易型系统极端性能要求。
3. SSD盘、闪存卡和SAS硬盘分层设计应用,形成不同IO需求的应用,应对数据库整合的混合IO要求。
面对去IE项目的成功实践,青海移动负责人表示:“IT基础架构的简化,让我们不用花太多精力在单个设备、单个系统上,而是让我们的精力可以更多聚焦在业务需求上,甚至实现IT驱动业务的目标。这就是IT基础架构变革带来的好处,青海移动也将继续在这条变革之路上探索、前行。”
加入"云和恩墨大讲堂"微信群,参与讨