AIGC风起云涌及能效要求不断提升,是影响数据中心未来发展趋势的两大核心变量。张炳华表示,随着主流CPU、GPU功耗和服务器节点功耗指数级增长,数据中心亟需进行技术创新和模式变革,要具备大规模、高算力、高弹性、高能效和智能化五大能力,才能应对人工智能大模型带来的算力供给和能耗挑战。五大能力具体是:
大规模:单个AZ(可用分区)需能提供1~5万卡GPU大规模的算力和存储资源,满足人工智能应用对数据和计算的需求,未来单个数据中心的IT容量规模将超30MW;
高算力:机柜功率密度达到21kW或更高,具备高性能的计算和数据处理能力,以支持复杂的人工智能算法和模型训练;
高弹性:分布式、全预制模块化设计,风冷、液冷等多种兼容架构,支持多种功率密度机柜场景,能够灵活地调整计算和存储资源,以适应AI应用在不同时间段的波动需求;
高能效:极简供电,极致冷却,充分利用自然资源,采用融合式数据中心全栈式解决方案,通过优化设计和运营策略,降低数据中心的能源消耗,提高能效比;
智能化:借助AI和机器学习技术,实现数据中心的自动化管理和优化,实现智能监控、智能预测、智能散热、故障智能定位,提高运营效率。
秦淮数据集团CTO 张炳华
秦淮数据对算力发展的趋势有所预见,通过持续的技术研发和创新,成功打造出“磐石”模块数据中心架构。该架构包含六大系统和24个产品模块,以技术先进、灵活弹性、产品预制、按需搭建为目标,全面覆盖从建筑模型到供电、冷却等全周期业务场景。基于该框架,秦淮数据近期发布AIGC新一代数据中心全栈解决方案,包括“玄铁”智能电力模块3.0、“玄冰”磁悬浮相变冷却系统、大规模全预制数据中心技术、鲲鹏IDC运营平台四大产品,为大模型时代数据中心提供了全新的技术框架和演进路线。
此外,在大会现场,秦淮数据主持编写的《冷板液冷工程标准化及技术优化》白皮书和《新型电力系统背景下源网荷储一体化发展白皮书》正式发布。其中,《冷板液冷工程标准化及技术优化》白皮书详细介绍了冷板液冷的技术特点、标准化发展方向,提出了关于冷板组件、快速接头、冷量分配单元CDU等产品的标准制定建议,为推动冷板液冷技术在行业的充分落地起到了积极的推动作用。
秦淮数据集团产品研发&规划总监 王舜
该项目负责人、秦淮数据集团产品研发&规划总监王舜在解读白皮书时表示,冷板液冷以往以定制化为主,不利于产品的规模性推广。希望通过此白皮书的技术普及,推动冷板液冷产品标准化,提升冷板式液冷的兼容性,加速冷板液冷系统的推广及应用,同时降低产品成本,助力规模性应用。白皮书还专门介绍了接液材料最新发展方向,并详解负压液冷、相变液冷和气-液混合技术等最前沿的冷板液冷技术。
秦淮数据创新与实践紧密结合,已经建立冷板液冷标准架构体系,实现20~30kW及以上的高密度液冷液体冷却的规模部署。在实际运营中,使用该技术的数据中心全年PUE低至1.15,WUE低至0.2,达到节能节水双赢。
面对AIGC时代的挑战,数据中心必须进行深度的技术变革和模式创新。张炳华表示,秦淮数据将积极拥抱这一变革,以全栈式解决方案帮助客户构建更高效、更绿色、更具竞争力的数据中心。