论文部分内容阅读
为解决大数据中个性化检索技术所潜在的用户隐私安全和提升个性化信息检索性能之间的矛盾,提出了基于差分隐私与p-link技术相结合的用户兴趣模型匿名化方法。首先对用户的准标示符进行泛化并添加噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率;其次根据用户兴趣之间的相似性将其微聚为满足p-link的等价组,并计算微聚后等价组兴趣条目的权值和等价组质心;最后发布匿名化的数据。大量实验证明:该方法结合差分隐私与p-link两者的特性,实现用户兴趣模型匿名化且用户兴趣基本不发生改变