限定模型的隐私机器学习推理

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:alyue_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习技术应用快速发展,“机器学习即服务”这个概念应运而生。在该模式中,服务方拥有大规模数据以及专家级的训练算法,进而可以得到高质量模型为用户提供可靠的数据推理预测服务。已有的研究主要专注于“机器学习即服务”过程中的隐私问题,实现对数据模型生成、用户数据、推理结果以及推理过程的机密性保护。然而,在“机器学习即服务”的过程中,出于某些特定的原因,恶意服务提供商可能提供一个低质量的模型,导致用户推理预测结果出现偏差。值得注意的是,现有的恶意模型安全计算并不对输入真实性做检查,为此需要设计一个轻量级的支持输入真实性核验的机器学习推理隐私保护方案。为了解决上述问题,本文做了以下几个贡献:1.提出了SPDZ友好的输入一致性检验方案。SPDZ是目前使用最为广泛的恶意模型安全计算算法。所提出的方案采用Pedersen承诺绑定两方SPDZ安全计算的输入,结合SPDZ的输入的同态MAC码,构造零知识证明,实现承诺绑定输入与MAC码输入的一致性检验。2.将SPDZ友好的输入一致性方案应用到“机器学习即服务”中,提出了限定模型的隐私机器学习推理方案。限定模型指利用承诺以及MAC码对模型参数进行限定,使其不能被更改。具体来说,计算模型参数的每一维度数据对应的Pedersen承诺,利用承诺将模型与服务进行限定,并将承诺结果作为服务标签公开。构造基于SPDZ的恶意安全模型机器学习推理协议,结合上述输入一致性检测机制,确保模型参数输入与公开标签的一致性并实现恶意安全模型下的隐私推理服务。3.对上述输入一致性检测方案给出了严格的安全证明,包括正确性、健壮性以及零知识性;证明文中所提出的输入模型限定的机器学习推理协议是恶意模型安全的。并分别对输入一致性检测方案和限定模型的机器学习推理方案进行了实验测试,验证其可用性。
其他文献
在国家政策的鼓励支持下,集成电路(IC)行业进入快速发展阶段。正是由于IC的快速发展,使得模拟芯片也在近几年有了更加广阔的应用领域。其中逐次逼近型模数转换器(SAR ADC)作为一种常用的模数混合芯片,它具有低功耗,易制造,利于集成等优点,且在实际设计中,可以很好的适应工艺转变的需求,这些优点使它在工业控制,生物医疗,传感器网络等需要中等工作速度以及转换精度的领域受到了极大的青睐。随着这些领域对使
学位
随着科学技术的发展,特别是人工智能技术的兴起,任务型多轮对话系统逐渐成为学术界和工业界的研究热点。任务型多轮对话系统针对具体任务场景进行设计,通过与用户之间进行对话交互,收集所需信息,帮助用户完成特定任务。目前,任务型多轮对话系统主要有基于管道和基于端到端两种构建方式。基于端到端的方法由于存在对数据需求量较大、可解释性差和对话流程难以控制等问题。因此目前主流的做法是通过管道的方式构建任务型多轮对话
学位
为了尽可能的减少执法安全事故,提升公安机关的执法形象与执法公信力,以及执法办案效率,大力的推进公安大数据智能化建设成为了行业发展的迫切需要。依托于此需求,近年来,执法办案中心的人员定位管理系统逐步发展,智能手环的应用也趋于成熟,但始终摆脱不了嫌疑人员的行为无法记录,执法办案流程以及执法行为无法监管等行业痛点,且智能手环自身也存在成本过高、续航不理想、个人信息易泄露等缺点,如何在减少甚至不使用智能手
学位
随着信息技术和互联网的发展,数据库管理系统作为基础平台软件,在信息系统中扮演日益关键的角色。目前,国内多个核心行业仍大量使用国外的数据库产品,存在重大的安全隐患。因此,在国际形势日趋复杂的今天,发展国产数据库,让更多应用运行在国产数据库产品之上已是当务之急。数据迁移是数据库国产化的重要举措,然而现有的数据迁移项目大多采用直接迁移的方法,未全面了解源数据库并根据迁移数据库间的差异完成迁移,这导致数据
学位
现代电力系统中部署了大量的智能硬件设备,如智能电表等。智能设备在提供更多先进技术的同时,也给电力系统带来了很多漏洞,导致恶意窃电用户可以随时随地发动各种网络/物理攻击来窃取电力。窃电不仅给公共事业公司带来了巨大的经济损失,还可能引发火灾等事故,危害公共安全。所以,智能电网邻域网中窃电行为检测的研究目的就是及时发现邻域网中的窃电行为,并识别出所有的窃电用户。窃电用户识别的主要难点和挑战在于:如何设计
学位
近些年来,随着区块链的技术越来越成熟、去中心化的思想被越来越多的人认可,出现了各种各样新且广为人知的场景,如:非同质化代币等等。未来区块链不仅仅只是一个去中心化的加密货币的载体,它也变成越来越多应用的载体。未来区块链承载的价值会越来越大,相应而来的,区块链上需要存储更多的数据来支撑它的价值。但是现有的区块链方案大多数都是针对于小型数据以及大型数据上链的解决方案。随着区块链在非交易场景以及其他场景中
学位
区块链是在加密虚拟货币的应用基础之上兴起的一种分布式数据共享技术,在智慧城市、税务审计、金融科技等领域具有广阔的应用前景,为生产生活提供了弱中心化、高透明度、强公信力的统一数据平台。随着区块链应用场景的不断丰富,区块链的数据规模不断膨胀、检索需求持续增加且趋于复杂化。然而,现有的区块链平台往往只考虑单一的应用场景,采用粗粒度数据组织方式,普遍存在数据可用性差、可搜索性差、检索效率低等问题,已较难对
学位
区块链技术作为推动信息互联网向价值互联网转变的核心技术,广泛应用于金融、供应链和电子政务等重点行业。垂直行业信息融合与价值传递是充分激活区块链内生价值属性和潜力的重要一环。目前,区块链呈现布局碎片化、数据隔离化特征,难以实现垂直行业信息融合需求,使得信息价值阻塞,造成数据孤岛问题严重。然而,各行业区块链系统呈现差异化需求、定制化设计和异构化平台等特征,使得跨链数据交互与价值传递难以实现。现有区块链
学位
知识图谱是一种采用图结构化的方式存储现实世界中代表事物的实体以及实体之间的关系,为海量的非结构化互联网信息数据提供了一种行之有效的处理方式。以知识图谱作为数据来源的问答技术成为当今AI领域的热门研究方向,但目前基于知识图谱的智能问答技术在简单问题上的问答效果较好,却难以应对包含多个关系的复杂问题,缺乏复杂问题在知识图谱上的推理能力,大大降低了实际问答效果。本文对基于知识图谱的多跳推理问答技术进行研
学位
随着数据的爆发式增长以及计算机硬件的快速发展,基于数据驱动的深度学习技术得到了迅速发展,近年来已经在机器学习领域占据主导地位。深度学习被广泛应用于各个领域,如自动驾驶、机器翻译、目标检测、医疗诊断等,并且取得了巨大的成功。但模型的训练需要大量的数据资源和计算资源,因而用户往往会将训练过程外包给第三方,或者从不完全可信的服务提供商处获得预训练模型。由于深度学习模型缺乏可解释性,深度学习模型在其生命周
学位