隐私保护是数字经济的安全底座,如何在保障用户数据隐私的同时提供高质量连通服务,成为数字经济时代的重要技术课题。为破解隐私保护与数据应用的两难,以“数据不动模型动”为理念的联邦学习框架应运而生,其通过用户数据不出本地的方式完成云端模型训练,实现了“数据可用不可见”。近年来,联邦学习成为隐私保护计算主流技术之一。
然而,随着需应用隐私保护计算的场景和行业日趋多元,涉及到的数据类型日趋丰富,已有联邦学习框架难以灵活高效地满足现实中越来越复杂的计算需要,需从注重“可用”到注重“好用”。
为解决上述挑战,达摩院智能计算实验室研发了新型联邦学习框架FederatedScope,该框架使用事件驱动的编程范式来构建联邦学习,即将联邦学习看成是参与方之间收发消息的过程,通过定义消息类型以及处理消息的行为来描述联邦学习过程。通过这一方式,FederatedScope实现了支持在丰富应用场景中进行大规模、高效率的联邦学习异步训练。
同时,达摩院团队对FederatedScope训练模块进行抽象,使其不依赖特定的深度学习后端,能兼容PyTorch、Tensorflow等不同设备运行环境,大幅降低了联邦学习在科研与实际应用中的开发难度和成本。
为进一步适应不同应用场景,FederatedScope还集成了多种功能模块,包括自动调参、隐私保护、性能监控、端模型个性化等。FederatedScope支持开发者通过配置文件便捷地调用集成模块,方便快速入门;也允许通过注册的方式添加新的算法实现并调用,支持定制化及深度开发。
达摩院智能计算实验室隐私保护计算团队负责人丁博麟表示,“数据已成为重要的生产要素,而隐私保护计算是保障这一要素发挥作用的关键技术。通过开源最新联邦学习框架,我们希望促进隐私保护计算在研究和生产中的广泛应用,让医药研发、政务互通、人机交互等数据密集领域更安全、更顺畅地发展。”
Gartner相关报告显示,到2025年之前,约60%的大型企业预计将应用至少一种隐私保护计算技术。达摩院2022十大科技趋势同样将隐私保护计算列为重要趋势,认为该技术将从覆盖少量数据的场景走向全域保护,从而激发数字时代的新生产力。
关于此次开源的更多信息,可访问官网 https://federatedscope.io/及源代码地址 https://github.com/alibaba/FederatedScope