基于本地差分隐私的数据扰动技术研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:fatcat120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习技术的不断深入研究发展使其在各个领域中都获得了巨大的成功,如语音识别、图像处理以及个性化推荐等。为了提供更加精确和多样化的服务,机器学习技术需要进行海量的数据收集与训练。然而,这些用来训练的用户数据通常涉及个人的敏感信息,直接将用户数据用于模型训练将存在泄露用户隐私的风险。因此,亟需一种有效的隐私保护方案使得数据隐私得到保障。本地差分隐私作为一种新兴的隐私保护方法,与传统差分隐私不同,它假设第三方是不可信的,并在数据拥有方完成对数据的扰动,以提供更加严格可靠的隐私保护。同时,对比于加密算法,该隐私保护方案计算成本更小,因此更适用于大量数据收集和分析的场景。然而,数据使用本地差分隐私方案进行扰动后具有较低的效用性,如将其用在深度学习等需扰动数据较多的场景中得到的模型准确率较低。针对上述已有本地差分隐私方案中存在的数据准确性较低问题,本文针对连续型数值数据,提出了一种满足本地差分隐私的分类变换扰动机制NTC。跟已有方法中直接对所属数据类型使用对应的扰动方法进行扰动不同,本文提出的机制首先将数据类型进行了转换,将数值型数据转换成了一维二元分类数据并对分类数据进行扰动。扰动完成后,再将分类数据逆变换为数值型数据。在真实的数据集以及合成的数据集上的实验结果表明,本文提出的扰动机制不论是用于均值估计还是经验最小化任务得到的结果误差均小于已有的方法,能够在保障用户隐私的同时进一步提高数据的效用性。为了解决本地差分隐私机制在深度学习等需扰动参数较多场景中可用性较差的问题,本文综合利用了加密算法以及扰动机制的优点,提出了一种同态加密及本地差分隐私混合机制P-LDP。为了更贴合实际中的用户隐私需求,该混合机制除了使用NTC机制对模型参数进行加密之外,还根据用户的分类,对部分有需求的数据进行加密。本文采用联邦学习技术在三种图像数据集上进行了实验和对比,通过对比不同隐私保护方案的图像分类结果进一步验证了本文提出的隐私保护方案的正确性和可用性。
其他文献
语音是人与人之间交流的主要方式,但是生活环境中会存在各种各样的噪声,影响语音信号的清晰度和可懂度,降低语音质量。为了保证语音信号传送的准确性,必须对这些噪声进行抑制。噪声分稳态噪声和非稳态噪声,非稳态噪声又分为瞬态噪声和其他噪声。稳态噪声的抑制相对于瞬态噪声来说比较成熟,瞬态噪声由于存在随机性和非线性特性抑制或消除起来较比较困难,目前也是含噪信号的研究难点和技术瓶颈。比如人机语音交互过程中突然产生
学位
川崎病(Kawasaki disease,KD)是一种以血管炎为病理基础的发热出疹性疾病,是发达国家中儿童获得性心脏病的最常见原因,该病的主要症状均无特异性,因此容易与其他发热性疾病混淆,导致误诊。因此,KD的鉴别诊断非常重要,以减少心血管疾病并发症的发病率。本研究拟通过基于NMR和UPLC-MS的代谢组学技术来鉴别和确证川崎病的诊断生物标志物。主要研究内容如下:共有194例川崎病患者(Kawas
学位
近年来,高理论容量、低生产成本以及高安全性的水系镁离子电池体系受到越来越多的关注。其中高性能正极材料的开发是促进水系镁离子电池实际应用的关键。钠锰氧化物常用作锂离子电池和钠离子电池正极材料,目前作为镁离子电池正极材料的报道较少。研究中发现,钠锰氧化物存在着存储空间少、结构稳定性差等问题,导致其比容量低和循环稳定性差。为解决上述问题,本工作通过控制水热合成时间和掺杂钛元素实现材料相结构和微观形貌的有
学位
睡眠质量的好坏对于人体的机体恢复和整合起着重要的作用,而睡眠分期是睡眠质量评估的基础,也是诊断睡眠相关疾病的关键一步。目前,医学上对于睡眠状态的分析主要是通过专业医师通过读取多导睡眠图信息进行睡眠阶段的判读,这一过程会夹杂着主观性因素从而导致判读结果会相对缺少客观性,而且这一过程也会耗费时间,因此自动睡眠分期算法的研究具有极高的研究价值和临床应用价值。本文正是在此背景下进行研究的,对现阶段在信号分
学位
文物的数字化保护与分类识别是当前的研究热点之一。由于受到客观条件等不可控因素的限制,在现实环境中,得到的文物图像分辨率往往会受到影响,阻碍了文物数字化处理的发展。文物图像超分辨率技术,可以提高文物图像分辨率,增强视觉效果,在文物数字化领域有着重要研究价值。本文在对基础生成对抗网络及常规算法进行研究分析后,提出改进的文物图像超分辨率算法。本文的主要工作如下:(1)本文首先详细介绍图像超分辨率领域和深
学位
漫反射率是表征探测目标反射特性的关键光学参数,携带有丰富的物质结构和组成信息。传统漫反射率测量方法只能进行单点测量或接触测量,且测量设备昂贵。而空间频域成像法(SFDI)是一种新兴的兼具低成本、大范围等特点的非接触成像技术,在学术领域和业界备受青睐。但通过SFDI技术只能实现漫反射率二维成像,缺失了三维信息,无法满足需要更加丰富的空间信息的需求。本文将SFDI技术与结构光三维测量技术相结合,同时获
学位
SF6因具有优越的灭弧和绝缘性能大量应用在绝缘领域中,但在长期工作的气体绝缘设备中可能会发生局部放电等故障,引起SF6的分解产生SO2F2、SOF2、SO2、H2S和HF等特征气体,进一步导致绝缘性能下降。利用沸石多孔材料对SF6分解气体的气敏性响应,可以实现对SF6气体绝缘设备的在线监测;同时还可以利用沸石材料对SF6分解气体的选择性吸附分离和膜分离实现对SF6绝缘气体的净化。选取了全硅型MER
学位
目的 分析2015—2019年北京市食源性致泻大肠埃希氏菌(diarrheagenic Escherichia coli, DEC)感染病例的流行病学特征和发病规律,为制定相应的防控策略与措施提供科学依据。方法 收集2015—2019年北京市36家食源性疾病主动监测医院腹泻病例的粪便或肛拭子标本及其个人信息,采用χ~2检验对率或构成比进行比较。结果 共收集27 619份病例标本,其中有2 485份
期刊
主给水泵驱动电机作为核电站主给水系统的核心,具有高效率、高功率密度的特点,而电机的高功率密度往往伴随着振动大、温升高等问题,本文主要围绕此类问题展开了研究,主要工作内容如下:首先,针对电机高功率密度带来的电磁振动问题,以一台11.5MW核电站主给水泵驱动电机为研究对象,分析电机电磁振动产生的原因,论述抑制电磁振动的措施。根据不同槽配合对电磁振动的影响,提出四种槽配合方案,运用解析法推导四种方案下径
学位
开绕组永磁同步电机具备可大功率场合运行、电压利用率高、容错控制好等优势成为目前研究的热点,但是开绕组永磁同步电机结构复杂,在电机功能性测试中,成本高、能耗多。再考虑到独立电源供电时,开绕组永磁同步电机存在零序电流,影响系统性能。因此替代实体电机完成功率级测试以及有效的抑制零序电流的产生是本课题研究的意义所在。建立在开绕组永磁同步电机数学模型基础上,对独立电源供电的双逆变器结构存在零序特性等问题进行
学位