基于联邦学习的标签噪声过滤算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:yaojing45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联邦学习(简称FL)是一种新的适用于分布式边缘计算的计算范式,它使得分布式客户端之间无需交换原始数据,仅交换加密后的模型参数或梯度,就可以协同训练一个模型,并达到数据隐私保护的目的。在联邦学习的实际应用场景中,由于人为标记错误、客户端设备差异等因素,标签噪声往往是不可避免的。同时,每个客户端呈现的标签噪声水平不一致,从而导致标签质量差异化的突出问题,更进一步降低了联邦学习模型的准确性和鲁棒性。联邦学习中解决标签质量差异化的通用方法是引入一个额外开销的基准数据集来抑制标签噪声客户端。然而,引入一个外部基准数据集同样具有挑战性,并将不可避免地带来潜在的数据偏见。例如,IBM、Microsoft等公司发布的多款人脸分析算法均存在不同程度的肤色或者性别偏见,当引入对应的基准数据集时,将给某些客户端带来有意识或无意识的数据偏见。为了有效应对上述挑战,本文提出了一种基于联邦学习的标签噪声过滤算法(简称FedIMF),旨在构造一个内部评测数据集来评价和过滤显著的标签噪声客户端,从而提高联邦学习模型的准确性和鲁棒性,具体研究内容如下:第一,设计了一个改进的内部评测数据集提取方法,即从数据量和标签种类最多的客户端中提取一个干净的、类平衡的内部评测数据集(简称IMD);第二,基于IMD对每个客户端进行信誉值评估(简称CE)来过滤标签噪声和噪声客户端,即使用JS散度衡量IMD与各客户端的损失累积分布的相似性;第三,在标签噪声滤除后,建立基于信誉值的联邦学习模型。最后,本文在两个公开的数据集(CIFAR-10,MNIST)上验证了算法的有效性和鲁棒性。实验结果表明,本文提出的FedIMF算法切实有效可行,且准确率优于现有的三个基线算法。本文的研究贡献包括:第一,设计了一个改进的标签噪声检测方法来提取内部评测数据集,从而消除了潜在的数据偏见;第二,设计了一个信誉值评估方法,更好地区分了干净标签样本和闭集标签噪声样本之间的损失累积分布,从而提高了联邦学习模型的准确性和鲁棒性。
其他文献
学位
商业银行能够对社会资源进行优化配置,其可持续发展影响着经济的稳定性,在经济发展和资源分配中承担着关键角色。商业银行的资产质量和风险管理能力可以通过不良贷款指标体现。近年来外部经济形势跌宕起伏,我国宏观经济增长持续放缓,实体经济发展面临较大困境,使银行不良贷款余额和比例不断上升。规模不断增长的不良贷款使银行信贷资产缺乏流动性,侵蚀银行利润,甚至威胁银行的生存和发展。对银行业不良贷款形成原因和防范措施
学位
大跨度自锚式悬索桥的柔度较大,在动荷载作用下易产生较大振动而出现损伤,针对该类型桥梁服役期的损伤识别研究在其检测、维护、加固甚至重建中具有重要意义。因此,本文在已有研究成果的基础上,根据位移影响线、小波包分析和神经网络原理,提出初步判断损伤、精准定位损伤和损伤程度分析的损伤识别方法。通过实例验证该方法的适用性,并对基于混合学习策略的BP神经网络进行可行性分析。以某高速公路大跨度自锚式悬索桥为研究对
学位
自人类迈入21世纪以来,受互联网这个时代因素的冲击,互联网金融登上了历史发展的舞台,同时其对人们日常生活产生了深远的影响。在该因素的影响之下,又有众多的金融产品如雨后春笋般出现。如第三方平台支付、众筹等。这些产品都有其身特色,通过对民众消费模式产生影响,从而将影响扩大到民众日常生活。对于互联网来说,由于其较之传统金融模式有着覆盖面更广、成本更低、效率更高的优点,所以更加受到当代消费者的欢迎。传统金
学位
随着互联网和旅游网络平台的迅猛发展,越来越多的游客喜欢通过网络渠道获取旅游相关信息、参考他人旅游评价、分享旅游心得。互联网发展及其在旅游中的广泛运用,不仅为旅游者获取旅游信息提供了更便捷的平台,也为目的地营销组织宣传自身品牌形象提供了更广泛更高效的传播媒介。旅游地也开始重视网上营销和服务,发布旅游信息,增强景区曝光度和旅游品牌的推广。旅游目的地之间的竞争在一定程度上变成了旅游形象的竞争。本文以郑州
学位
PPP是民间资本投资公用基础设施的重要渠道,但受到政策多变等因素影响,在国内的发展却一波三折。2014年,在财政部和国家发改委的大力推广下,各地PPP项目快速落地,目前财政部PPP全国库在库项目数9249个,总投资14.1万亿元。但在2017年,中央提出打好三大攻坚战,财政部、国资委出台一系列监管调控政策后,PPP行业进入剧烈震荡。不少PPP项目被强制退出财政部PPP项目库,后续建设资金保障和项目
学位
据报道,Li-O2电池的预期实际能量密度与汽车用汽油的可用能量密度相当,意味着Li-O2电池具有很大的潜力成为一种未来能源汽车的储能装置,也是应对全球变暖和能源危机问题的重要解决方案。但是,对于Li-O2电池的实际应用仍面临诸多棘手的问题,包括能量转换效率低、倍率性能差、以及循环稳定性不好等。其主要原因是在电池放电过程中产生了绝缘和不溶的放电产物过氧化锂(Li2O2),Li2O2堆积在电极和电解液
学位
以不同产地酱香型白酒为研究对象,利用感官定量描述分析法(QDA)和气相色谱-氢火焰离子检测法(GC-FID)研究了国内4个产地酱香型白酒的感官特征和重要挥发性成分。结果表明,不同产地酱香型白酒在感官香气特征中的陈香、曲香、酱香、醛香、果酸香、烘焙香、粮香、酯香和口感特征中的果酸味、甜味、咸味、鲜味、柔和度、细腻度、丰满度和舒适度的特征上均存在显著性差异;采用直接进样的方法,通过GC-FID结合内标
期刊
2021年10月8日,中共中央、国务院印发《黄河流域生态保护和高质量发展规划纲要》。随着黄河流域生态保护和高质量发展上升为国家战略,沿黄区域和中西部地区的交通基础设施建设需求不断增长,这其中建造了一些跨黄河、跨库区的深水大跨、体系和结构行为复杂的桥梁,为了满足承载和改善深水桥梁力学行为,一些桥梁下部结构形式复杂。不同于普通跨河桥梁,深水桥梁面临着更加复杂多变水动力环境,不可避免地遭受波浪、水流、冲
学位
当前工程建设过程管理中存在如安全隐患难以及时发现并实时预警、难以客观完整追溯质量安全施工情况、无法可视化再现隐蔽工程、工程进度等内业管理与实际施工状况存在脱节、失真等众多盲点、难点问题。通过聚焦工程项目全过程可视化数字监管,构建以远程视频测量技术和多传感器融合为核心的工程项目全过程可视化数字监管系统。通过对项目施工现场的人、机、料、法、环、测等关键要素进行智能感知与信息收集,建立对施工过程、行为、
期刊