当前,人工智能技术加速了科学研究的范式变革,带来科研模式的重构和新一轮科技革命,也对科研基础设施提出新的需求。在智慧科研时代,中国科学技术大学升级建设了全新一代“融合计算平台”,推进科研基础设施发展,满足科研数据对计算存储的新需求,提升创新体系效能,提速科技创新。
数据为基,科技范式更迭对数据基础设施产生新要求
数据作为新型生产要素,是科学研究的核心生产力。例如,在脑神经网络研究中,探索人脑上亿个神经元之间是如何连接与工作的,带来每秒高达100 TB数据吞吐量;在天体观测和研究中,天文专家往往需要从数十PB海量数据中分析发现新天体;一个典型的粒子碰撞实验每秒产生超过100 TB的数据·······
当前,越来越多的科研项目已经在逐步使用人工智能技术,如通过人工智能预测蛋白质三维结构、发现新材料和新药物、自动识别和分类天体等。由数据驱动的人工智能技术的运用,进一步加强了科学数据的核心要素地位,这对存储基础设施的IO读写性能、带宽、时延有了更高的要求,同时还要求在多源异构数据之间实现快速转换与传输。
中国科学技术大学网络信息中心副主任李会民认为,近几年生命科学、材料科学、力学等学科的科研数据计算与存储需求不断更新,不仅数据量呈指数级增长,数据处理性能需求也不断提高。对教育科研行业来说,数据存储基础设施需要随科研范式的发展进行迭代升级,解决海量、多模态非结构化数据的存储、分析,以及数据流动问题,这样才能更好地满足科研人员的需求。
中国科大全面升级“融合计算平台”,打造科研基础设施新标杆
“千生一院士,七百硕博生,百生一杰青”,站在科研教育发展前沿的中国科学技术大学(以下简称“中国科大”),刚刚走过了65载科研春秋。作为国内建设最早的高校计算平台之一,20年来,中国科大网络信息中心负责的校级计算中心为中国科大取得世界领先的科研成果提供了强大的数据计算与存储支撑。
随着用户的持续增加和海量多模态科研数据的快速增长,计算中心原有的两套系统整体利用率居高不下,科研项目排队时间长等问题持续出现,计算、存储上的性能及规模难以满足学校的教育科研需求。因此,中国科大计算中心深入分析科研项目对计算和存储资源的需求变化,选择浪潮信息分层解耦的整体方案升级建设了“融合计算平台”,以异构计算和融合存储为核心支持数据全生命周期管理,总存储容量11PB,聚合带宽超过160GB/s,写带宽超过100GB/s,随机读IOPS达到205万,网络延迟低至1.45us,具有GPU算力强、存储容量大、IO读写性能强、高速网络通信等优势,整体性能在国内高校中领先。
李会民介绍,针对新科研范式对数据存储平台的要求,融合计算平台使用分布式并行文件存储AS13000系列解决了海量多模态数据的统一存储、高效的数据处理、全生命周期管理和稳定安全四个核心需求。
新的平台同时支持块、文件、对象、大数据等多种协议数据融合互通,为不同学科领域的多模态、多尺度科研数据提供更高效、更便捷的存储服务。系统分层搭建了高速存储及大容量存储池,可以自动根据读写频率实现数据智能迁移,并以聚合小文件优化技术提升读写性能,满足AI高并发计算情况下的数据处理需求。面向不同科研项目在不同研究时期对数据存储性能、容量的多样化需求,该平台支持热、温、冷、冰四级分层数据生命周期管理,实现了存储性能、容量和成本的极致平衡,高效实现对多学科领域的差异化支撑。同时,平台具有高冗余模式,可以在节点故障时自动切换备用节点,满足科研数据的长时间稳定写入需求,确保数据安全不丢失。
已经投入运行的“融合计算平台”,正在支撑中国科大的前沿探索与创新。中国科学技术大学特任教授、中国生物物理学会冷冻电子显微学分会委员张凯铭博士表示,计算中心平台的升级让实验效率取得了大幅度提升,借助冷冻电镜技术取得了一系列科研成果。
中国科大校级计算中心面向校内所有科研院系、实验室、师生及校外有计算需求的用户提供计算和数据存储服务,是科研创新发展的坚实公共基础设施平台。2022年,中国科大计算中心支持科研项目的成果显著,用户发表致谢计算中心SCI论文464篇,其中Nature系列、Science系列、PRL、JACS、Cell等顶级期刊论文达到38篇。如今,全面升级的融合计算平台将进一步加速科研成果涌现,激发科技创新活力,加快推动形成新质生产力,增强发展新动能。