基于敏感隐私保护度的K-匿名算法研究

来源 :天津财经大学 | 被引量 : 2次 | 上传用户:sbisk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算的出现也就意味着大数据时代已经到来,未来的时代不仅仅是信息化的时代,更是大数据的时代。正是因为海量数据的存在,大量的潜在信息可以被挖掘,数据成为了信息时代中巨大的财富,可以为企业、国家带来更多的利益。与此同时伴随的是大量的个人隐私数据被发现,使得敏感数据泄露。大数据时代的隐私保护问题是不容忽视的,保护敏感数据不被泄露已经成为当前一个亟待解决的问题。当数据表发布或共享时,对发布的数据实施隐私保护技术需要考虑以下两个方面:(1)首先要确保发布的数据隐私不会泄露;(2)发布后的匿名数据在进行数据挖掘操作时具有高效的实用价值。因此,在避免隐私泄露的同时保证数据的真实性、高效性,是隐私保护匿名技术亟待解决的一个问题。K-匿名隐私保护技术的基本思想就是通过一系列的匿名化操作,将原始数据集泛化为匿名化的数据集,满足敏感数据不被发现的同时可以用于发布。由于K-匿名模型容易受到背景知识攻击、链接攻击、同质性攻击和相似性攻击等,本文在此基础上提出一种基于敏感隐私保护度的K-匿名模型。为了尽量减少信息的损失,本算法首先以最小的信息损失为原则进行聚类。由于准标识符对敏感属性的影响,使得聚类结果等价类中敏感属性具有单一性,攻击者有很高的置信度去推断用户的敏感数据,造成隐私数据泄露。因此,在此基础上提出了再一次聚类的思想,即基于敏感隐私保护度的聚类算法。首先,定义了敏感属性隐私保护度,并计算等价类中敏感属性隐私保护度的标准差和距离。等价类中敏感属性隐私保护度的标准差越小,说明敏感属性隐私保护度越接近。在尽量减少信息损失的基础上,将等价类中敏感属性隐私保护度距离最小的等价类进行泛化为同一等价类,保证了等价类中敏感属性的多样性,抵制了同质性攻击、相似性攻击,更好的确保了隐私数据不被泄露。本算法和基本K-匿名算法通过实验在运行时间和信息损失两方面进行了对比分析研究,得出本算法有更少的运行时间。虽存在略高的信息损失,但是使得数据得到了更好的保护,因此是可以接受的。
其他文献
目的探讨护理干预对胃癌术后早期肠内营养患者生存质量的影响。方法选择2010年1月~2011年7月入住我院治疗的38例符合纳入条件的胃癌术后患者为研究对象,护理干预后应用生存质
遵义会议确立了毛泽东在党和红军中的领导地位,在极端危急的时刻,挽救了党,挽救了红军,挽救了中国革命,是党的历史上一个生死攸关的转折点,在遵义会议前后,周恩来苦撑危局,坚
新概念英语是一套经典教材,对于大学生的英语学习也具有指导意义,如何利用这个系列教材应对考试,是值得研究的问题。
南水北调工程经过50多年的研究论证,终于随着新世纪的到来,露出了开工建设的希望曙光.2001年11月14日,国务院新闻办公室召开了记者招待会,水利部向社会各界介绍了南水北调工
期刊
1995年我国举行了首届跆拳道锦标赛,在近20年时间内,跆拳道竞赛规则进行了10次修改。修改完善的动力来源于项目自身发展的要求和奥运瘦身的危机感。跆拳道规则和裁判法的修改完
目的:刚果红-阿利新蓝联合染色和半定量粘附实验检测大肠埃希菌生物膜的敏感性和特异性比较。方法:对临床分离的83株大肠埃希菌进行生物膜形成实验,分别经刚果红-阿利新蓝联合
中医学与中国传统文化有着密切关系。陈修园《医学三字经》巧妙地将中医和儒家思想结合起来,在中医药学术传播中凸显了鲜明的传统文化特性。文章从儒家的“仁”、文韵和尊崇
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
于丹主编写中国字懂中国心定价:88.00元出版时间:2018年10月ISBN:978-7-303-23975-7汉字是握在中华民族掌心里的纹路,循着它的指事象形,可以触摸到所有观念由来的秘密。《汉
期刊
随着中国经济的发展,国际地位的提升,来华留学的学生越来越多。在留学生管理与中国学生趋同化趋势下,还需要对留学生进行有针对性的管理。与建构主义理论相吻合的牛津大学的