MapReduce模型下数据隐私保护机制研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hema5177
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对海量数据进行分析和处理的过程中,敏感信息的隐私保护显得尤为重要。针对统计类型数据分析服务的效率和安全问题,在Map-Reduce计算模型的基础上引入差别隐私保护机制。在该模型上提出一种带有隐私保护的决策树生成算法,并证明其满足ε-差别隐私。实验表明,该算法具有良好的分类精度和满意的计算效率。
其他文献
通过分析Web-Harvest数据提取规则的设计原理,设计实现了一个xScraper系统。该系统的主要功能有:(1)定制设计满足不同需求的Web数据提取规则模板,驱动Web-Harvest内核进行无结构
为了提高现行模糊辨识方法的有效性,提出了基于移动率的T-S模糊模型的结构辨识方法。主要工作如下:首先,定义T-S模糊模型的S型、Z型和梯形隶属函数的移动率,将此移动率与现行
用户评分数据极端稀疏的情况下,传统相似性度量方法存在弊端,导致推荐系统的推荐质量急剧下降。针对此问题,提出了一种基于项目聚类的全局最近邻的协同过滤算法。该算法根据
分布式一致性算法可用于解决分布式协作参数估计等许多问题,但在无线传感器网络的应用中还要满足低能耗、高可靠性、实时性的要求。为加快一致性算法的收敛速率,以降低通信能
对于移动对象历史轨迹索引,现有的方案绝大多数都基于室外空间,难以直接应用于室内空间中;同时,未将对象本身作为一个独立的维度加以索引,无法提供高效的对象轨迹查询方式。
针对文献[1]中提出的MSP问题(定义见正文),从SAT问题出发,给出SAT问题到MSP问题的多项式归结,进而给出MSP问题NP完全性质的另一种证明。
失真度是评价数字合成波形质量的重要指标,主要取决于正弦波在一个周期内总的离散点数和数模转换器的位数。从频谱的角度分析DDS输出最高频率时每周期点数对失真度的影响,得
随着网络技术不断飞速发展,人们的信息需求也随之增长。用户不再满足基于关键字的检索,而是希望网络能够实现以用户所关心的信息为中心、以用户需求为导向,将所有与中心相关