【摘 要】
:
联邦学习为解决在机器学习落地过程中遇到的数据孤岛难题,以不泄露数据拥有者的原始数据的方式,实现协同训练。然而,联邦学习引入的参数交换过程缺乏形式化的保证,为此,差分隐私方法被用来进一步保护数据的安全。从“数据拥有者之间”、“数据拥有者与服务提供者”和“数据拥有者与模型查询者”关系的角度出发,联邦学习中的差分隐私存在准确率有偏和信任级别多样的问题,联邦学习中以推荐系统为代表的应用存在意图隐私保护和遗
论文部分内容阅读
联邦学习为解决在机器学习落地过程中遇到的数据孤岛难题,以不泄露数据拥有者的原始数据的方式,实现协同训练。然而,联邦学习引入的参数交换过程缺乏形式化的保证,为此,差分隐私方法被用来进一步保护数据的安全。从“数据拥有者之间”、“数据拥有者与服务提供者”和“数据拥有者与模型查询者”关系的角度出发,联邦学习中的差分隐私存在准确率有偏和信任级别多样的问题,联邦学习中以推荐系统为代表的应用存在意图隐私保护和遗忘权实现的问题,同时在数据不均衡、隐私预算按需分配、计算代价高和选择性影响消除等方面难以适应数据拥有者的安全需求。如何在满足差分隐私定义的前提下,提供基于联邦学习的解决方案成为学术界和产业界的热点和前沿问题。针对上述联邦学习中差分隐私与推荐系统面临的挑战,本文对准确率影响均等的差分隐私联邦模型、联邦学习中混合信任级别的差分隐私、保护意图的差分隐私联邦推荐系统和可遗忘的差分隐私联邦推荐系统四个关键问题开展研究,主要研究内容与贡献如下:在联邦学习中数据拥有者之间的模型准确率方面,提出准确率影响均等的差分隐私联邦模型来减轻差分隐私对代表性不足或相对复杂的数据拥有者所属群体在联邦模型上准确率的不成比例的影响。将差分隐私的联邦学习过程构建成自适应差分隐私截断阈值与联邦学习相结合的双层规划问题。根据理论上的截断偏差-噪声方差界,动态地调整每名数据拥有者本地训练数据对联邦模型的影响。实验评估表明所提方法在从文本到视觉场景的联邦学习中对数据拥有者之间实现目前最公平的差分隐私准确率影响。在联邦学习中数据拥有者对服务提供者的不同信任需求方面,提出联邦学习中混合信任级别的差分隐私算法。将联邦学习中的数据拥有者根据他们的隐私需求划分为信任服务提供者的参与方和不信任服务提供者的参与方,分别使用中心化差分隐私和本地化差分隐私定义来保护数据拥有者的本地训练数据。从分析差分隐私的联邦学习算法的收敛性出发,在自适应差分隐私截断阈值的基础上,提出改进的组合定理来减少联邦学习中添加的差分隐私噪声。实验评估表明所提方法在满足联邦学习中数据拥有者的不同信任需求的前提下,兼顾联邦模型的可用性。进一步,在联邦推荐系统中数据拥有者对服务提供者隐藏行为意图方面,提出保护意图的差分隐私联邦推荐系统。发现联邦商品推荐系统需要保护用户-商品交互的存在性隐私,提出在保护数据拥有者交互数据隐私的前提下服务提供者协助他们在本地推理个人偏好的联邦协议。考虑隐式反馈中的噪声和差分隐私引入的噪声来定义(α,β)-准确率的概念,证明所提方法是(α,β)-准确的和(?)-差分隐私的。实验评估表明所提方法在为数据拥有者的数据提供差分隐私保护的同时,实现与非隐私的联邦推荐系统相当的准确率。在联邦推荐系统中数据拥有者对模型查询者行使被遗忘权方面,提出可遗忘的差分隐私联邦推荐系统来消除少量数据拥有者的本地交互数据对联邦推荐模型的影响。在保护意图的差分隐私联邦推荐系统框架下,提出数据拥有者通过在本地剩余的训练数据上以热启动的方式调整当前的联邦推荐模型,从而加速联邦推荐系统的遗忘过程。提出使用二阶优化器实现更大的联邦推荐遗忘加速。为了克服二阶优化器过高的计算成本,提出将联邦推荐遗忘的优化问题划分成多个易于处理的子问题来交替求解。在上述过程中引入差分隐私保护联邦推荐系统中数据拥有者的交互数据隐私。实验评估表明所提方法以极高的遗忘学习速度逼近彻底遗忘的重新训练的联邦推荐准确性。
其他文献
由于未彻底分析河湖水体污染源及黑臭成因,导致经过系统治理后的水体黑臭污染问题反弹严重。河湖黑臭水体整治工作的关键在于排污口的治理,核心在于要有完善、有功效和健康的排水管网。排污口排查工作包括现场排查、水质监测和溯源调查,能够掌握排污口数量和分布、污染物来源和排放情况,查明关联排水管网的混错接状况和健康状况,在武汉经济技术开发区(汉南区)桂子湖黑臭水体整治中取得较好的应用效果。
在高校开展国家安全教育是落实总体国家安全观、培养大学生树立国家安全意识、增强维护国家安全责任和能力的现实需求。当前,我国高校在国家安全教育教学上,存在缺乏专门的课程设置、缺少专职教师队伍、教学体系不完善、教学方式单一,以及学生学习积极性不高等问题。在学科理论建设上,存在基础理论尚未界定清楚、理论与实践结合度较低、本科阶段开设国家安全学专业进程缓慢、国家安全学学术期刊数量较少等问题。为促进国家安全教
联邦学习技术能够在不需要边缘端上传原始样本的条件下,协同边缘端与中心端完成模型训练。该技术保障了边缘端的数据隐私,并降低了海量样本上传带来的时延。然而联邦学习的鲁棒性问题给这项技术的应用带来了新的挑战。鲁棒性问题产生于训练的模型汇聚和样本收集过程,且由汇聚结果和样本信息的不准确所导致的。该问题对联邦学习造成难以忽略的影响,包括降低训练结果的性能和减小模型训练的速度等。因此如何解决联邦学习中的鲁棒性
新世纪以来,世界各国的课程改革都以核心素养的培育为目标,进入了素养时代。传统的基于"课时""知识点"的教学设计难以匹配新的目标体系,素养目标需要与之相匹配的单元设计。"单元"不是新词,但时代赋予它新的内涵。课程视角、学习立场下的"单元"是指,依据统摄中心,按学习的逻辑组织起来的结构化的学习单位,是实现素养目标的一种微型课程计划。单元设计在国际上主要包括教育技术、建构主义以及将二者相整合的三种思路,
检索和整理2018—2022年中国知网教育信息化2.0主题核心期刊文献,采用文献计量法,运用WPS Office绘图工具和Cite Space软件,对文献发表的年份、数量、期刊以及文献的重要关键词等信息开展可视化分析研究。研究结果有助于了解国内学者对教育信息化2.0的研究方向,以期为关注该主题的研究者提供一些启示。
针对北方某缺水城市排水系统存在的污水溢流、雨天污水厂进水浓度波动等现状,分析系统可能存在的河水入渗、雨污分流改造不彻底、市政雨污混错接等问题。结合水质水量监测与现场调查等手段、兼顾旱天和雨天开展分析,以水质水量的异常变化为主要依据,从下游到上游追溯、从干管到支管排查,对问题进行定位。结果表明,城区六大污水系统中,污水系统Ⅰ、Ⅳ主要受河水入渗问题影响,污水系统Ⅱ、Ⅲ受雨污分流改造不彻底、市政雨污混错
为探究电气工程中电气自动化技术的应用效果,提出用于水利工程电气接线故障控制的系统,以此探究出电气自动化技术在电气工程中的应用。为更好体现电气自动化技术在系统中的应用效果,将以灰色理论为基础构建故障监控系统模型,验证故障检测的数据的检测精准性。结果表明:基于电气自动化技术设计的水利工程电气接线故障控制系统具有较高故障数据识别能力,识别精度可达95%,证明基于电气自动化技术设计的故障检测系统具有良好的
从符号学视域审视学生社团的意识形态安全工作,将高校学生社团意识形态安全工作置换为一种主流意义秩序的维系与巩固。从学生个体的意义探寻、社团话语传播、信念固定的运行逻辑和内在规律来辨析当前的高校学生社团意识形态工作,以明晰主流意识形态话语秩序维系的现实困境,从鼓励真相范围内的有益探究、加强议程设置、发挥“意见领袖”导向作用、建立意识形态“把关人”制度四个方面提出了维系学生社团意识形态安全的现实路径,为
随着社会的发展,包括酒文化在内的“中国文化走出去”这样一个战略也不再只是一句口号,而是逐渐体现在中国优秀文学作品的外译之中。作为中国的文学瑰宝,《三国演义》蕴含着丰富的中国特色文化,详尽地反映三国时期的酒文化。书中有三百多处提到“酒”,塑造的1200多名人物几乎人人饮酒,并且还有许多脍炙人口的饮酒的场景与饮酒典故,由此可见,酒文化在《三国演义》中的位置是不容忽视的。然而,在众多《三国演义》的英译研