基于匿名化的数据发布隐私保护技术研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:civili1844
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,数据爆发式地增长。人们通过收集、分析这些数据来获得对自己有用的信息,享受大数据带来的利益。但是,个人的隐私问题也面临着巨大的挑战。由于许多被收集的数据都包含着个人的敏感信息,若不对这些数据处理极大可能会造成个人隐私的泄露。因此,如何在保护数据的隐私前提下,保留数据的一定可用性,是当下数据发布领域的一个研究热点。匿名化技术对比其他隐私保护技术,它有着高保护低信息损失的特点,能在数据安全性和可用性之间达到一个平衡,因此受到了研究者的极大关注。本文基于匿名化技术对单敏感属性和多敏感属性数据的隐私保护展开了研究。本文的主要研究工作如下:(1)综述了匿名化技术的国内外研究现状,通过对比其他的隐私保护技术,说明了匿名化的优越性,同时也介绍了匿名化的相关技术,分析了数据发布中常见的攻击类型和匿名化模型。(2)针对单一敏感属性数据的相似攻击和个性化匿名问题,根据敏感值的敏感性,为不同的敏感值设置频率约束,限制它们在等价类中出现的概率,以此达到个性化匿名需求。同时,通过语义层次树考量了敏感值间的语义关系,并限制相同语义敏感值在等价类中出现的个数,以此来抵御敏感属性的相似攻击。分析了该方法的安全性,并与其他方法进行了实验对比。(3)针对多敏感属性数据的相似攻击和关联攻击问题,运用数据挖掘算法挖掘准标识符属性与敏感属性间的关联规则,确定它们的关联性。将无关联的准标识符属性单独划分,泛化和聚类时不需考虑它们,因此降低了数据的信息损失。同时将敏感属性划分到不同的属性组里,解决了敏感属性间关联攻击问题。并通过分析各个敏感属性值的语义,建立多维语义桶,限制各个属性相同语义敏感值在等价类中出现的个数,以此来抵御敏感属性的相似攻击。对该方法做了安全性分析,并与其他方法进行了实验对比。本文的创新点如下:(1)提出了一种可抵御相似攻击的个性化匿名方法。该方法不仅满足个性化匿名要求,而且解决了敏感属性相似攻击问题。在等价类划分过程中,运用了聚类思想,降低了数据在匿名过程中的信息损失。实验结果和安全性分析表明,该方法信息损失低,安全性高,能抵御更多的攻击类型。(2)提出了一种基于关联规则切片的多敏感属性隐私保护方法。该方法通过关联规则划分属性,不仅解决了敏感属性间的关联攻击问题,而且也降低了匿名数据的信息损失。同时,该方法也对多敏感属性的相似攻击进行了分析,能抵御更多的攻击类型。实验结果表明,该方法以更低的信息损失达到了隐私保护目的。
其他文献
介绍了纯低温余热发电技术在蓝田尧柏水泥厂的应用。利用两条2500t/d新型干法水泥生产线窑尾预热器排出的废气设置窑尾余热锅炉,利用窑头熟料冷却机排出的废气设置窑头余热锅
有机物结构-活性定量关系研究(QSAR,Quantitative Structure-Activity Relationship)用于环境化学和环境毒理学领域取得了引人注目的成功。有机污染物在环境中的行为,尤其在生
改革开放以来,随着工业化和城市化进程的加快,大量农村劳动力离开土地,迁移至城市从事非农业工作。在这种背景下,催生了“务工人员”这样一个新群体。根据《2018年农民工监测
新疆水泥厂2000t/d新型干法生产线的设备安装调试工作量大且复杂,电气设备、生料磨、窑、水泥磨系都存在各种问题。该厂职工认真分析问题的症结,摸索出一套合理的操作参数,取得了日产20741t烧
人造板材在室内装饰装修中应用非常普遍,其释放的甲醛严重威胁人体健康,因此对于人造板材甲醛释放的研究显得尤为重要.本文针对人造板材的甲醛释放问题进行了解析,分别讨论了
近年来,供应链金融已经被广泛重视和认同,电子商务与供应链金融的融合更是发展趋势,也是普惠金融的解决思路。商业银行的业务模式和融资流程还有提升的空间。基于这样的背景,
螺旋板换热器由于其结构紧凑,换热效率高,被广泛应用于机械制造、化工生产等各个领域。螺旋板换热器的强化换热研究一般从换热器定距柱着手,定距柱的几何形状,尺寸,在换热通
早在1990年,我厂就引进了原美国Bailey 公司的 Network-90 集散型控制系统,对我厂的两窑两磨实现实时监控,运行过程中分别实现了达标达产.近年来,自控网络中的MCS(管理命令系
目的通过检测缺血性脑小血管病(Cerebral Small Vessel Disease,CSVD)患者血浆炎性分子标志物基质金属蛋白酶9(Matrix Metalloproteinases 9,MMP-9)、磷脂酶A2(Phospholipase