短信预约-IT技能免费直播动态提醒

短信预约提醒成功

FedAvg联邦学习FedProx异质网络优化实验总结

2024-04-02 19:55

关注

目录

前言
I. FedAvg
II. FedProx
III. 实验
IV. 总结

前言

题目： Federated Optimization for Heterogeneous Networks

会议： Conference on Machine Learning and Systems 2020

论文地址：Federated Optimization for Heterogeneous Networks

FedAvg对设备异质性和数据异质性没有太好的解决办法，FedProx在FedAvg的基础上做出了一些改进来尝试缓解这两个问题。

在Online Learning中，为了防止模型根据新到来的数据进行更新后偏离原来的模型太远，也就是为了防止过调节，通常会加入一个余项来限制更新前后模型参数的差异。FedProx中同样引入了一个余项，作用类似。

I. FedAvg

Google的团队首次提出了联邦学习，并引入了联邦学习的基本算法FedAvg。问题的一般形式：

FedAvg：

简单来说，在FedAvg的框架下：每一轮通信中，服务器分发全局参数到各个客户端，各个客户端利用本地数据训练相同的epoch，然后再将梯度上传到服务器进行聚合形成更新后的参数。

FedAvg存在着两个缺陷：

设备异质性：不同的设备间的通信和计算能力是有差异的。在FedAvg中，被选中的客户端在本地都训练相同的epoch，虽然作者指出提升epoch可以有效减小通信成本，但较大的epoch下，可能会有很多设备无法按时完成训练。无论是直接drop掉这部分客户端的模型还是直接利用这部分未完成的模型来进行聚合，都将对最终模型的收敛造成不好的影响。
数据异质性：不同设备中数据可能是非独立同分布的。如果数据是独立同分布的，那么本地模型训练较多的epoch会加快全局模型的收敛；如果不是独立同分布的，不同设备在利用非IID的本地数据进行训练并且训练轮数较大时，本地模型将会偏离初始的全局模型。

II. FedProx

为了缓解上述两个问题，本文作者提出了一个新的联邦学习框架FedProx。FedProx能够很好地处理异质性。

定义一：

简单来说，每个客户端都是优化所有样本的损失和，这个是正常的思路，让全局模型在本地数据集上表现更好。

但如果设备间的数据是异质的，每个客户端优化之后得到的模型就与初始时服务器分配的全局模型相差过大，本地模型将会偏离初始的全局模型，这将减缓全局模型的收敛。

为了有效限制这种偏差，本文作者提出，设备 k k k在本地进行训练时，需要最小化以下目标函数：

作者在FedAvg损失函数的基础上，引入了一个proximal term，我们可以称之为近端项。引入近端项后，客户端在本地训练后得到的模型参数 w将不会与初始时的服务器参数 wt偏离太多。

观察上式可以发现，当 μ=0时，FedProx客户端的优化目标就与FedAvg一致。

这个思路其实还是很常见的，在机器学习中，为了防止过调节，亦或者为了限制参数变化，通常都会在原有损失函数的基础上加上这样一个类似的项。比如在在线学习中，我们就可以添加此项来限制更新前后模型参数的差异。

FedProx的算法伪代码：

通过观察这个步骤可以发现，FedProx在FedAvg上做了两点改进：

引入了近端项，限制了因为数据异质性导致的模型偏离。引入了不精确解，各个客户端不再需要训练相同的轮数，只需要得到一个不精确解，这有效缓解了某些设备的计算压力。

III. 实验

图1给出了数据异质性对模型收敛的影响：

上图给出了损失随着通信轮数增加的变化情况，数据的异质性从左到右依次增加，其中 μ = 0 表示FedAvg。可以发现，数据间异质性越强，收敛越慢，但如果我们让 μ>0，将有效缓解这一情况，也就是模型将更快收敛。

图2：

左图：E增加后对μ=0情况的影响。可以发现，太多的本地训练将导致本地模型偏离全局模型，全局模型收敛变缓。

中图：同一数据集，增加μ后，收敛将加快，因为这有效缓解了模型的偏移，从而使FedProx的性能较少依赖于 E。

作者给出了一个trick：在实践中，μ可以根据模型当前的性能自适应地选择。比较简单的做法是当损失增加时增加 μ，当损失减少时减少μ。

但是对于 γ，作者貌似没有具体说明怎么选择，只能去GitHub上研究一下源码再给出解释了。

IV. 总结

数据和设备的异质性对传统的FedAvg算法提出了挑战，本文作者在FedAvg的基础上提出了FedProx，FedProx相比于FedAvg主要有以下两点不同：

考虑了不同设备通信和计算能力的差异，并引入了不精确解，不同设备不需要训练相同的轮数，只需要得到一个不精确解即可。引入了近端项，在数据异质的情况下，限制了本地训练时模型对全局模型的偏离。

以上就是FedProx异质网络的联邦优化经验总结的详细内容，更多关于FedProx异质网络联邦优化的资料请关注编程网其它相关文章！

阅读原文内容投诉

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

历年真题答案解析
备考技巧名师总结
高频考点精准押题

资料下载
历年真题

2024上半年软考中级软件测评师考试基础知识真题
193.9 KB下载数265
2024上半年软考中级软件设计师考试基础知识真题
191.63 KB下载数245
2023下半年-系统集成项目管理工程师-真题考点汇总（完整版）
143.91 KB下载数1148
2023年下半年系统集成项目管理工程师第一、二、三批次真题考点整理(考友回忆版)
183.71 KB下载数642
2023年上半年软考中级《系统集成项目管理工程师》-基础知识-考试真题及答案
644.84 KB下载数2756

2024年上半年信息系统项目管理师第二批次真题及答案解析（完整版）
难度 813人已做
查看
【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析
难度 354人已做
查看
【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析
难度 318人已做
查看
2024年上半年软考高项第一、二批次真题考点汇总（完整版）
难度 435人已做
查看
2024年上半年系统架构设计师考试综合知识真题
难度 224人已做
查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机

FedAvg联邦学习FedProx异质网络优化实验总结

后端开发2024-04-02

位置：首页-资讯-后端开发

咦！没有更多了？去看看其它编程学习网内容吧