【摘 要】
:
联邦学习是一种新型的分布式机器学习方法,可以使得各客户端在不分享隐私数据的前提下共同建立共享模型。然而现有联邦学习框架仅适用于有监督学习,即默认所有客户端数据均带有标签。由于现实中标记数据难以获取,联邦学习模型训练的前提假设通常很难成立。为解决此问题,对原有联邦学习进行扩展,提出一种基于自编码神经网络的半监督联邦学习模型ANN-SSFL,该模型允许无标记的客户端参与联邦学习。无标记数据利用自编码神
论文部分内容阅读
联邦学习是一种新型的分布式机器学习方法,可以使得各客户端在不分享隐私数据的前提下共同建立共享模型。然而现有联邦学习框架仅适用于有监督学习,即默认所有客户端数据均带有标签。由于现实中标记数据难以获取,联邦学习模型训练的前提假设通常很难成立。为解决此问题,对原有联邦学习进行扩展,提出一种基于自编码神经网络的半监督联邦学习模型ANN-SSFL,该模型允许无标记的客户端参与联邦学习。无标记数据利用自编码神经网络学习得到可被分类的潜在特征,从而在联邦学习中提供无标记数据的特征信息来作出自身贡献。本文在MNIS
其他文献
现存的成本函数没有考虑到业务流程中各活动在现实情境中有着不同的重要程度,于是在模型与日志的对齐过程中可能会导致对齐成本严重偏离感知成本。针对这一问题,基于业务流程中行为的典型流特征提出了重要同步成本函数的概念,并在该函数下给出一种能够提升效率的对齐方法。首先,基于感知成本的概念定义重要同步成本函数;接着,依据日志迹和流程模型中行为的典型流特征确定用以分割流程模型与日志迹的重要匹配子序列;最后,基于
针对已有的道路建模技术中建模效果不理想, 在大尺度道路网建模中缺乏有效的辅助交互技术支持的问题, 通过对立交结构进行分析, 提出一种有效的三维立交结构的欧拉图表达及交互设计方法. 首先将道路信息预处理, 根据处理后的有效数据构建欧拉图, 用来表达道路立交结构的拓扑关系; 然后利用欧拉图和道路的结构特性计算得到道路的层级关系; 再根据控制点、欧拉图的拓扑信息和道路网格, 构建立交结构的三维模型; 最
岩体质量分级是进行工程设计和施工的基础。通过搜集不同地区55组实测样本和17组插值样本建立案例库,考虑岩体的复杂不确定性以及异地岩体的差异性,在案例库基础上提出一种改进两阶段回归迁移学习(Two-stage TrAdaBoost.R2)-孤立森林(Isolated Forest)多因素岩体质量等级预测模型。将广州抽水蓄能电站第1期地下工程的12个样本用于模型测试,研究结果表明:(1)迁移学习可以通
针对由于驾驶员对于道路限速和时延信息获取的不确定性而引起的跟驰行为受扰和交通流失稳等问题,提出了一种车联网环境下考虑时延速度差和限速信息的跟驰模型(TD-VDVL)。首先,引入时延导致的速度变化量和道路限速信息对FVD(Full Velocity Difference)模型进行改进;然后利用线性谱波微扰法推导出TD-VDVL模型的交通流稳定性判断依据,分别分析模型中各参数对系统稳定性的影响;最后利
针对高维特征缺失数据在聚类过程中面临的数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题,提出一种面向高维特征缺失数据的K最近邻(KNN)插补子空间聚类算法。首先,利用高维特征缺失数据的子空间下的近邻关系对原始空间下的缺失数据进行KNN插补;然后,多次迭代矩阵分解和KNN插补获得数据的最终可靠的子空间结构;最后,利用获得的子空间结构进行聚类分析。通过在6个高维数据集上对不同算
当前性能最优的机器翻译模型之一Transformer基于标准的端到端结构,仅依赖于平行句对,默认模型能够自动学习语料中的知识。这种建模方式缺乏显式的引导,不能有效挖掘深层语言知识,特别是在语料规模和质量受限的低资源环境下,从而造成译文质量的下降。为了缓解上述问题,提出了基于源语言句法增强解码的神经机器翻译模型,显式地引入源语句句法信息指导解码。首先,模型利用源语句句法信息构造句法感知的遮挡机制;然
作为金融市场关键组成部分,股票市场波动研究对合理化控制金融市场风险、提高超额投资收益提供了重要支持,一直以来都是学术界和业界的关注焦点。然而,股票市场受各种因素影响,面对股票市场中多源化、异构化信息,如何高效挖掘、融合股票市场多源异构数据是面临的重要挑战。为能够充分解释不同信息及信息间相互作用对于股票市场价格波动的影响,提出一种基于多重注意力机制的图神经网络预测股票市场价格波动。首先,引入关系维度
网约车成为了人们日常出行的重要方式。在网约车平台中,匹配是一个核心功能,平台需要尽可能增加匹配订单的数量。网约车的需求分布通常是极度不均匀的,订单的起点或终点在某些时间段会呈现出高度集中的特征。因此,提出一种带预警的激励机制鼓励司机跨区域接单,达到平台跨区域运力再平衡的目的。通过对订单信息进行分析处理,建立邻近区域运力预警机制。在区域运力紧张时,激励邻近司机接受跨区域订单,减少运力紧张时期区域内的
针对目前网络谣言鉴别研究,文本学习往往会受到文本读入内容过长导致长距离信息丢失或者是为了捕捉局部信息而依赖于长期输入表示从而影响鉴别结果。通过提出S-LSTM(Sentence-stateLongShort TermMemory networks)算法在保留字词节点信息的同时对句子进行聚合,从而保留句子的局部和全局信息,进而提升网络谣言鉴别的精确性和有效性。与TextGCN、Bi-GCN、Att_
为了提高云制造环境下制造服务组合优化的效率,提出了一种基于改进北极熊算法的制造云服务组合优化方法。该方法对制造服务进行实数编码,并以服务功能和服务质量为评价指标,使用改进的北极熊算法对制造云服务组合优化问题进行求解,得到最优的服务组合方案。同时通过引入动态视野,对算法的局部搜索进行调整,并与遗传算法中的变异策略相结合,以提高求解多目标问题的效率,同时降低因初始参数影响而导致算法陷入局部最优的可能。