基于乘法扰动的数据挖掘隐私保护算法研究

来源 :广东工业大学 | 被引量 : 6次 | 上传用户:shunniu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今数据挖掘技术已成为管理与商务信息智能分析的主要工具。但在其应用的同时,用户隐私数据泄露问题时常发生。所以数据挖掘中的隐私保护算法成为当今的一大研究热点,即在获得高质量数据挖掘结果的同时,如何保护用户隐私数据。不同的数据挖掘算法对应着不同的隐私保护方法,如建立决策树模型只需要知道数据的分布,所以应用加法扰动方法比较有效。建立Apriori关联规则模型只需要了解每个事务项出现的概率,所以应用随机应答方法比较有效。还有一类数据挖掘算法,如K-means聚类算法,支持向量机分类算法等,这类算法的主要特点是只需要根据数据集之间的距离或点积便能建立模型,所以应用乘法扰动方法比较有效,这也是本文的研究重点。现在已研究的基于乘法扰动的数据挖掘隐私保护算法主要有旋转扰动方法(RP)和投影扰动方法(PP),它们分别将数据以同一角度旋转或将数据从高维空间映射到低维空间。独立分量分析(ICA)作为一种从混合数据分离恢复源数据的有效工具,也可以被用来从旋转扰动数据估计得到用户数据,这极大地降低了RP方法的隐私安全水平。本文研究出了已知信息独立分量分析(KK-ICA),攻击者利用它可以从投影扰动数据估计出用户数据的近似值,这也很大程度上破坏了PP的隐私安全性。因此,本文提出了新的乘法扰动隐私保护算法——局部旋转扰动方法(PRP),它将原始数据分割成若干个独立的部分,使用不同的随机正交矩阵对各部分局部旋转扰动,从而用KK-ICA不能从局部扰动数据中准确地估计得到所有用户数据。所以,PRP相比其他乘法扰动隐私保护算法具有更高的隐私安全性,而且准确性不低于以前的算法。在实验部分,本文引入了相对误差(RE)和Frobenius相对误差(F-RE)作为度量方法,通过多组实验对比了PP和RP的准确性和隐私安全性,验证了PRP的优越性。由于PRP是专门针对基于距离和点积的数据挖掘算法提出的,所以本文在最后部分,将该方法分别应要到聚类挖掘和分类挖掘中,更为直观地说明了局部旋转扰动方法在数据挖掘中的实际应用。
其他文献
爱是育人的核心。一名教师要做到爱学生并不难,难得的是能全心全意爱班里的每一个学生。工作中,班主任要抓住每一个学生身上的优点和可爱之处,时刻想着如果他是我的孩子,我会怎么去教育他;要平等地对待每一位学生,让每个孩子都能分享到教师的关爱。  一、平等是诚心的爱  每个班里总有一些让教师特别关注的孩子,他们要么是调皮好动,要么是不自信。作为教师,绝对不能忽视这一部分学生,相反,应该给予他们更多的爱,将教
期刊
多年的班主任工作实践,使笔者清晰地意识到,班主任工作是一门爱的艺术,需要我们付出真心,付出真诚,用爱与学生一起成长,不断放大学生的闪光点,于细微处见真情。  一、真爱浇灌,坦诚以待  实际上,教育就其本身的实质而言,是教师用爱心去浇灌学生的灵魂,是一朵云推动另一朵云,一个灵魂催唤另一个灵魂的艺术。人们把教师尊称为“人类灵魂的工程师”,就是对“教师”职业崇高的诠释。  人的感情色彩对于认识事物具有非
期刊
传统的德育注重于语言的说教能力,把外在的教育放在了过高的地位,忽略了学生的生活经验与情感体验,在很大程度上放弃了学生自我教育的功能,违背了“内因是关键”的规律。当前,时代赋予教师的使命与职责是强化人文书香,创建和谐德育,这也成了当前德育的主题与难题。人文书香,使孩子们感受书香之气,发现书中的宝藏,形成更伟大的思想,同时引领孩子们畅游书香海洋,体验不一样的乐趣。与书为友,与书结伴,营造一种氛围,创造
期刊
随着中国电信、中国移动和中国联通三大运营商开始全业务的经营,竞争也随之加剧。当前运营商的用户关系管理中心已经从业务受理、营业、收费、投诉等基本功能转向对用户流失的
随着全球化和建筑市场的飞速发展,EPC总承包模式已经成为国际上流行的承发包模式之一,也是推动我国建筑企业走向国际化的重要力量。近年来,我国建筑企业在 EPC总承包方面进行
摘要:语料库是语言学研究的基础,对高中学生的写作水平提升具有一定的促进作用。写作教学一直是困扰高中英语教师及学生的一大难题,研究发现基于语料库的教学方式,在写作理论、学生自主学习和自我评估等方面,具有传统写作教学无法比拟的优越性。区域性语料库相对规模较小,指向性更强,且直接指向学生的写作能力。  关键词:英语写作 区域性语料库 途径  近年来,通过研究发现语料库尤其是区域性语料库的分析,对高中
质量问题一直是建筑业领域的研究热点也是研究重点,每年质量事故造成的人员伤亡不胜枚举。近年来,国外许多学者将质量问题引入到危机管理中研究,呈现出许多新的特点。因此,加强对
随着Web2.0时代的到来,Web使用挖掘受到越来越多的关注。大规模的互联网用户访问行为产生了海量的数据。从用户使用行为中发掘出用户感兴趣的模式给研究人员也带来了挑战。找
能源是人类赖以生存和发展不可缺少的生产、生活资料,在国民经济中具有特别重要的战略地位,科学合理的利用能源是经济平稳增长的重要保障。改革开放以来,我国能源消费逐年递
目前,我国各个城市的机动车保有量呈逐年增加的趋势,而相应的城市基础设施建设发展缓慢,停车难的问题在各个城市都表现得越来越严重,上海、北京、天津等大城市的中心商业区尤为突