面向多敏感属性数据发布的隐私保护研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zjubaoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展促进了数据挖掘、人工智能等技术的发展,并深化了这些技术在日常生活中应用的深度以及广度,为日常生产生活提供了无尽的便利。近两年来,随着数据共享交互活动的日益增长,隐私信息泄露等问题频繁发生。如何保证发布后数据的安全性以及可挖掘性,针对该问题,近些年学术界展开了各种研究。本文对隐私保护技术的发展历史、基础知识、研究进展、经典模型以及算法进行介绍后,提出了一种多敏感数据隐私发布算法以及三种聚类改进算法,具体工作如下文所述:首先,文简介了近些年来基于聚类技术的多敏感属性隐私保护算法,并指出聚类部分算法的选取会严重影响隐私保护算法的精度的问题,而当前基于聚类技术的匿名算法在聚类部分通常采用k均值算法以及其改进算法,这些算法都具有容易陷入局部最优以及严重依赖k值的问题,为解决该问题,在对k均值算法以及其改进算法进行详细介绍后,本文基于其中的二分k均值算法提出了三种改进算法:中心重规划算法(Centroid Redivision Bisecting k-means,CRBK)、记录重规划算法(Record Redivision Bisecting k-means,RRBK)以及自适应记录重规划算法(Self-adaption Record Redivision Bisecting k-means,SRRBK)。并对这三种算法进行了仿真实验,实验结果表明改进算法在聚类准确率、稳定性以及信息损失均有良好变现。其次,针对当前多敏感属性隐私发布模型无法解决敏感属性集多样性差异过大情况下数据发布问题,提出了(l,x,w)多样性模型,该模型引入信息熵概念,通过约束等价组在敏感属性上的多样性以及均匀性来实现对敏感属性的安全保护。同时针对有损连接容易破坏发布后数据可挖掘性的缺陷,提出了使用无损连接发布策略的基于熵的l多样性聚类匿名(Entropy based l-Diversity Clustering,EBLC)算法,该算法基于聚类技术,依据非敏感属性对记录进行聚类,在同簇中依照其敏感属性生成满足(l,x,w)多样性的等价组,泛化所有等价组得到发布数据。同时对EBLC算法进行了仿真对比实验,分别从信息损失、运行效率以及抗攻击性等对算法进行验证,实验结果表明该算法在信息损失以及数据可挖掘性方面都有良好表现。
其他文献
目的 测定环翠楼高丽红参与韩国产高丽红参中人参皂苷的含量。方法 采用HPLC色谱法和比色法。结果 人参皂苷的含量分别为环翠楼高丽红参:人参皂苷-Rg3含量为0.039 6 mg/g,人参
中浙优8号是我国近年来种植比较广泛的杂交水稻之一,具有较为显著的优势。本文阐述了中浙优8号水稻的特征特性,并提出其高产栽培技术,以期为该品种的推广种植提供参考。
大数据挖掘技术主要是指从海量的数据中找出具有联系意义信息的技术,目前已经被广泛应用于教育、金融与零售等行业,但由于其在教育行业的应用存在较多短期行为,所以需要进一
理财业务是商业银行经营过程中一项重要的业务,它对商业银行的经营发展带来了比较大的经济效益,但是在理财业务发展的过程中也产生了很多的经营风险,包括市场风险、信用风险
针对“十八反”中涉及的相反药对的药理毒理研究进行了概述和评析。 Pharmacological and toxicological studies on the opposite drugs involved in the “18 Anti” were
十载奋进路,磨砺著华章。走过困惑迷茫,走向自强超越的吉林省电力有限公司培训中心,以国家电网公司高技能人才培训基地的名义,为其合并重组十周年献上了一份厚礼。 Ten proa
在大数据时代, 随着信息经济的飞速发展, 数据处理技术逐渐发挥越来越重要的作用. 然而, 由此带来的隐私信息安全等问题变得越来越严峻. 本文对大数据时代信息经济的概念、
2015年,我国制定了“互联网+”战略行动计划,象征着我国进入大数据时代。大数据的四大显著特征为大量化、多样化、快速化、价值密度低。这项技术变革对我们生活方式的改善作用不容质疑,它改善了人们的生活方式,拓宽了人们获取信息的渠道。但是,所有的技术变革都是双刃剑,大数据呈现给我们的是一幅让人喜忧参半的图景。一方面,它开启了一次重大的时代转型,如同望远镜让我们能感受宇宙一般,大数据开拓了一片浩瀚的天地,
人民群众是社会的主体,发展群众文化对于社会文化来说是非常重要的。而在群众文化活动的开展过程中,文化馆是不可缺少的,因为文化馆是政府和社会组建的主要是为人民群众服务
论文首先利用出口产品结构对中国台湾地区与韩国在中国大陆市场上的货物贸易关系进行了分析,然后基于VECM框架研究韩国向中国大陆出口和台湾向中国大陆出口之间的动态关系。