基于差分隐私保护的分类和推荐算法研究

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:sxdinfo958
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,各种信息采集工具将每个人都数据化,在浩瀚的信息网络中,人的一些行为和特征可以用数据表示。以数据为基础产生的各种应用在给人们带来更好服务体验的同时,也存在严重的隐私泄露隐患。层出不穷的隐私泄露案例不断刺激着人们的神经,事实上隐私安全问题已成为社会发展的隐患。因此在进行数据挖掘时,应该不断加强对个人隐私的保护,只有这样才能促进大数据应用健康发展。隐私保护计算能够实现隐私与效益之间的平衡,化解数据价值挖掘与隐私保护之间的矛盾。本文分析对比了常用的隐私保护计算方法,在此基础上引出并介绍了差分隐私技术。差分隐私是一个严谨的隐私保护理论框架,它对攻击者的背景知识做出了最大化的假设,并且能够提供可证明、可量化的隐私保护机制,因而成为当前隐私保护技术研究的热点。本文针对分类和推荐任务中存在的隐私保护问题,从隐私保护要点、实现机制和隐私预算分配策略等方面研究了如何将差分隐私技术应用于相应的算法。对于分类问题,本文将差分隐私保护技术应用于随机森林算法,目的是实现分类准确率与数据隐私性的有效平衡。对于推荐算法,本文在提出一种融合显隐式反馈协同过滤算法的基础上,将差分隐私技术引入该算法,目的是在保证数据隐私的前提下实现有效推荐。全文的主要工作总结如下:(1)针对分类算法中的隐私安全问题,本文首先分析了决策树的隐私保护要点,在此基础上提出一种基于差分隐私保护的随机森林算法。该算法从数据集的相关性和数据量的大小两个维度出发设计了一种隐私预算分配方案,该方案能够实现信噪比的动态平衡,并且可以节约隐私预算。在构造隐私保护决策树的过程中,为了减少噪声量,该算法将分支节点的信息增益作为质量评分函数,采用指数机制实现隐私保护;对于叶节点,采用Laplace机制进行扰动以实现隐私保护。为了提高算法的准确率和稳定性,该算法采用Bagging策略构造多棵隐私保护决策树并进行集成。最后给出了算法的隐私性分析,并且通过实验证明了该算法能够在满足差分隐私保护的前提下,保证分类的准确率。(2)针对推荐算法,本文提出一种融合显式反馈和隐式反馈的协同过滤算法。该算法分为两个阶段,第一阶段为隐式反馈数据处理阶段,该阶段首先通过数据转化和采集负样本构建隐式反馈训练数据集,在此基础上根据训练模型求解得到用户和物品的隐式特征向量。第二阶段为融合显隐式反馈数据处理阶段,该阶段首先构建显式反馈训练数据,然后将第一阶段得到的隐式特征向量融入到显式数据求解模型中,训练获得模型参数。实验表明该算法能够有效提高推荐准确率。(3)针对推荐算法中的隐私安全问题,本文将差分隐私保护技术与工作2中提出的算法相结合,通过在求解过程中添加均值扰动和梯度扰动来使算法满足差分隐私保护。实验结果表明,该算法能以损失较小的推荐精度为代价实现差分隐私保护。
其他文献
抗沉默因子1(Anti-Silencing Factor 1,ASF1)是组蛋白H3和H4的分子伴侣,通过组装和拆解核小体,调节染色质动态,参与DNA复制修复、基因组重编程、细胞增殖以及细胞衰老等多种重要的生物学过程。在哺乳动物中ASF1有两个亚型ASF1A和ASF1B。研究表明ASF1B在小鼠早期胚胎发育过程中主要调控细胞增殖。但是ASF1A在小鼠卵子成熟和早期胚胎发育过程中的功能及其机理尚未完
经过40年高速的发展的星巴克,从密集开店取得巨额营业额到品牌的全球性扩张,在股市上的表现也一路狂飙,经历了种种市场上的困难和挑战,至今已成为全球咖啡巨头。总结星巴克的发展特点:明确定位,塑造品牌,专注品牌。星巴克的成功案例,有许多值得茶饮行业借鉴的经验,本文将深入分析星巴克的品牌定位,以4P角度分析星巴克的竞争力,以及对星巴克未来的发展进行预测和提出相关建议。
学位
学位
学位
学位
学位
学位
学位
在分组密码分析中,yoyo攻击是一类既可以用于密码结构分析,又可以用于密钥恢复的攻击方法,该方法最为突出的特点是具有低数据和计算复杂度,因此近年来吸引了大量学者研究兴趣。至今,yoyo攻击已成为评估密码算法安全性的重要工具之一。本文对yoyo攻击方法展开研究,将该方法用于密码结构分析及具体算法密钥恢复,取得下列研究成果:给出适用于第二类广义Feistel结构(Type-II结构)的yoyo攻击:本