基于隐私保护的数据挖掘

被引量 : 0次 | 上传用户:edisonlin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘目前是数据库研究中最活跃的分支之一,不论科学研究还是商业应用,数据挖掘都取得了可喜的成果。但与此同时,数据挖掘也面临着很多问题的挑战。其中,数据挖掘的个人隐私与信息安全问题尤其得到关注。误用、滥用数据挖掘可能导致用户数据特别是敏感信息的泄漏,越来越多的人们对此表示担忧,甚至拒绝提供真实的数据。如何在不暴露用户隐私的前提下进行数据挖掘,也就成了人们非常感兴趣的课题。本文首先综述了国内外隐私保护研究的成果,并从数据分布角度分析了现有典型的隐私保护算法。接着是本文研究的主要内容:1.在关联规则挖掘中引入随机化技术对隐私信息进行保护:首先是将随机响应技术与关联规则结合,并用实验对相关算法进行了仿真,然后是将随机扰动技术应用到隐私保护挖掘中来,并对传统的随机扰动隐私保护算法进行了改进,接着用实验分析了算法的正确与有效性。2.在聚类中分析了基于矩阵变换的隐私保护技术。对相关矩阵变换隐私保护算法进行改进,提出了基于等距变换的隐私保护算法,之后利用相关试验进行仿真,并对相关结果进行分析,验证了提出的算法能在保护隐私的同时聚类结果不会发生改变。本文最后是对工作的总结与展望,今后将在正交变换基础上实现隐私保护、适应多种数据集及加密部分数据等方面做进一步研究,最终形成完整的隐私保护数据分析模型。
其他文献
目的分析儿童肺炎的肺脏超声表现,探讨肺脏超声在儿童肺炎诊断和病情监测中的应用价值。方法分析50例普通肺炎、50例重症肺炎患儿的肺脏超声影像,并与50例无肺脏疾病患儿作对
为更好地利用振动信号对枪械自动机的裂纹故障进行诊断,提出基于振动信号多分形特征的故障诊断方法。该方法利用Wavelet Leader来估计振动信号的多分形谱,通过6个特征量描述
采用盆栽试验法,分析接种AM菌对短序润楠(Machilus breviflora)幼苗生长发育和叶片光合作用的影响,拟为短序润楠苗木的快速繁育提供技术支撑。分别对接菌90 d,180 d和270 d后
均质压燃燃烧作为汽油机全新的燃烧方式,具有燃烧速度快、泵吸损失小、热效率高及低NOx排放的特点,但是其着火时刻和燃烧放热率难以控制。从应用的角度,对目前3种主流的均质
运用文献资料法,揭示凉州攻鼓子由来、传承和发展,分析了攻鼓子鲜明的古代乐舞、特有的服饰装扮、独特的表演形式、深厚的文化底蕴、浓厚的民俗文化的特点,挖掘攻鼓子的表演
随着素质教育和新课程改革的不断推进,小学数学教学方法、教学目标、教学理念等都有了巨大的改观。然而在教学实践过程中,却突显出愈来愈多的问题,严重影响着教学目标的实现
有氧运动具有明确的血管新生效应,包括缺血心脏,但其机制尚未完全阐明。心肌梗死( MI)后冠脉微血管新生是心脏修复的前提。新近研究表明,血管新生来源于体内干/祖细胞的动员与参与
<正>食品的安全对人们的生命安全会产生重要影响,因此应当注重食品的质量和安全性。但是近些年三鹿奶粉等一系列食品安全事件时有发生,对人们的身心健康和国民经济的发展都造
抗辐射药物的研究和开发正在寻找新化合物和开发新的临床用途两方面展开。较新的化合物属甲基硫羰基类化合物和氨基硫醇类的磷酰化衍生物。本文简述了此类化合物的构效关系及
在我国的高中英语教学中,英语写作是学习英语的一大难点,也是当今英语教学的薄弱环节。许多学生经过长时间的英语学习,仍然写不出完整、得体且表意清楚的英语短文。透视日常