智能AI
morning
信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26
2026-05-18
1 阅读
听雨
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26 听雨 2026-05-18 14:44:04 来源: 量子位 隐私和性能我全都要 FedRE团队 投稿 量子位 | 公众号 QbitAI 在联邦学习中,如何同时兼顾模型性能、数据隐私和通信开销,是一个亟需解决的挑战。 在实际应用中,各客户端往往采用不同的模型架构,例如部分客户端使用卷积神经网络,而其他客户端则采用Transformer,形成典型的模型异构场景,这进一步增加了联邦学习的优化难度。 为解决上述难题,来自 中国信通院泰尔英福公司、清华大学 等高校的联合研究团队,提出了一种 基于表征纠缠的联邦学习框架 (Federated Representation Entanglement, FedRE )。 该框架在保证模型性能的前提下,有效保护数据隐私并降低通信开销,同时可适配模型异构与模型同构两类联邦学习场景。 论文标题:FedRE: A Representation Entanglement Framework for Model-Heterogeneous Federated Learning 论文链接:https://arxiv.org/pdf/2511.22265 代码仓库:https://github.com/AIResearch-Group/FedRE 动机:如何兼顾联邦学习的模型性能、数据隐私与通信开销? 在模型异构场景下,多个客户端采用 不同架构的表征提取器 (如ResNet,ViT),但 分类器架构保持一致 (即任务一致),因此无法像FedAvg那样直接进行模型参数的聚合。 为解决这一问题,一个可行思路是利用客户端表征在服务器端训练全局分类器,同时兼顾隐私保护与通信效率。 一种朴素的方法是FedAllRep, 该方法将每个客户端的所有样本表征上传至服务器用于训练全局分类器 。 由于能够充分利用所有样本的表征,该方法通常能够获得较好的模型性能(如Figure 2左图所示),但其 通信开销较大 ,并且 容易受到表征逆向攻击进而泄漏隐私 。 为缓解此问题, FedGH采用类别原型作为客户端知识上传至服务器训练全局分类器 。 该方法能够有效降低通信成本并增强隐私保护能力。但由于类原型主要刻画类别中心信息,可能导致全局分类器过度关注类别原型,进而形成较为尖锐的决策边界(如Figure 2中间所示),最终影响模型性能。 上述方法的局限性启发了FedRE的设计,其引入 纠缠表征 作为一种新的客户端知识表示方式。 具体而言,在每个客户端, FedRE通过随机加权的方式,将来自不同类别的本地表征融合为一个纠缠表征,并生成对应的纠缠标签编码 。 随后, 每个客户端仅需上传一个纠缠表征及其纠缠标签编码至服务器,用于训练全局分类器 。 由于纠缠标签包含跨类别的监督信号,且在每一轮通信中都会重新采样权重以增加多样性,全局分类器在训练过程中能够同时考虑多个类别,从而避免对单一类别过度自信,学习到更加平滑的决策边界 (如Figure 2右图所示) 。 此外,一个纠缠表征融合了客户端的所有本地表征,增加了表征逆向攻击的难度;同时,每个客户端仅上传一个纠缠表征,也进一步降低了通信开销。 方法:FedRE整体工作流程是什么? 如图所示,FedRE框架主要包含三个步骤: 第一,各客户端利用本地数据完成局部模型训练更新。 第二,各客户端对本地所有表征进行聚合(具体方法请参考原文,可采用多种策略),生成统一的纠缠表征,同时聚合对应的标签编码形成统一的纠缠标签编码,并上传至服务器。 最后,服务器利用收到的纠缠表征训练全局分类器,并将更新后的全局模型下发给各客户端,用于替换局部模型的分类器,进入下一轮迭代。 实验:性能、隐私和通讯开销的评估效果如何? 模型性能评估 Table 1展示了模型异构设置下的实验结果(模型同构结果请参见原文附录)。 整体来看,FedRE取得了较为优异的性能表现,并优于FedGH。 这在一定程度上表明,相较于基于类别原型的方法,采用纠缠表征训练全局分类器可能更加有效。 隐私保护评估 为评估隐私保护能力,分别对原始表征、类别原型与纠缠表征进行表征逆向攻击重建原始样本。 Figure 4展示TinyImageNet结果:原始表征可较清晰恢复轮廓,存在较高攻击风险;类别原型可一定程度上恢复类别信息(如鱼类轮廓)。 而纠缠表征重建结果几乎不可辨识,表明其通过多类别信息融合显著降低了样本可恢复性。 通讯开销评估 Table 2可以看到,FedRE在上传阶段的通信开销最低,因为每个客户端只需上传一个纠缠表征及其对应的标签编码。 在广播阶段,其通信开销与基于分类器的方法(如LG-FedAvg)和基于原型的方法(如FedProto)大致相当。 总结与展望 在数据要素流通与隐私合规要求日益严格的背景下,如何兼顾数据价值挖掘与敏感信息防护,已成为行业面临的核心挑战。 为此,本文提出FedRE方法以解决模型异构的联邦学习问题,在性能、隐私保护与通信开销之间实现了较为均衡的权衡,为数据要素安全流通提供了一种可行路径。 版权所有,未经授权不得以任何形式转载及使用,违者必究。 AI 听雨 上交x创智x瑞金联合发布CX-Mind:胸片诊断进入“可验证推理”时代 2026-05-18 8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026 2026-05-18 奥特曼投的芯片涨疯了,今年最大科技IPO 2026-05-16 亚历山大王回应一切:LeCun、Manus,“我的父母都是中国人” 2026-05-14 扫码分享至朋友圈 相关阅读 摄影师用AI预测MJ、李小龙活到现在长什么样,网友看后泪目 更多名人活到今天会是什么样?AI生成了答案 alex 2022-10-16 AI 人像 人工智能创新创业大赛总决赛圆满收官 展现杭州拱墅区借势引才、布局AI产业新蓝海的关键一步 允中 2025-07-12 AI 杭州 科大讯飞赋能史上最“AI”东博会:打造全场景无障碍沟通体验,发布东盟系列产品 量子位 2025-09-18 AI 东博会 科大讯飞 大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背 dropout,但损失函数! henry 2025-09-03 AI AI学语言与人脑极为相似!新研究证明:语言并非人类与生特有的能力,机器也能学丨Nature子刊 网友:乔姆斯基错了? 西风 2023-07-19 AI Nature子刊 语言 只有5%AI项目在挣钱!MIT最新报告印证奥特曼警告 但头部大厂还将持续加码 鹭羽 2025-08-22 AI MIT 热门文章 做AI漫剧的、搞Agent的、投硅谷的,5.20这些赛道顶流碰头了|最新嘉宾阵容 2026-05-11 AI步入“自我进化”时代,李彦宏首提AI时代度量衡“DAA”|Create2026百度AI开发者⼤会速览 2026