聚类及数据的隐私保护算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:gxb396104807
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今这个信息爆炸的时代,随着信息的数字化处理程度的提高,从大量数据中挖掘有用信息的需求日益增加,从而大大推动了数据挖掘的发展。然而,任何事情都有其两面性,在数据挖掘领域也不例外,随之产生的就是信息安全和隐私保护的问题。 聚类是数据挖掘中的一个重要分支。本文主要的研究目的是在聚类挖掘中深入探讨隐私保护的有关问题,提出有效的聚类挖掘的隐私保护的技术和算法。 首先研究一种保护原始数据的聚类挖掘算法。该算法是在儿何数据转换方法的基础上,提出的基于二次反射的转换算法(DRDP算法)。DRDP不是对某一属性进行简单的加法运算,而是采用沿对称轴反射的方法,得到点的新坐标。对于DRDP算法可能存在的问题,本文也提出了相应的改进算法,即使用数据抽样的思想计算对称轴。实验表明,该算法是有效可行的,操作也比较简单。 本文又对垂直分布式数据库的聚类挖掘的隐私保护提出了新方法-聚类-反射-干扰-集中聚类方法(CRDC方法)。该方法的关键技术是利用各节点的聚类结果计算得到对称轴和添加干扰信息;并在聚类结果的正确性和隐私保护程度之间的平衡作了分析。实验表明,可在聚类结果的正确性和隐私保护程度之间达到一个合理的平衡。
其他文献
近年来,随着信息技术在现代企业和政府中的广泛应用,许多工作已越来越多地依赖计算机而得以完成,相应的随着信息系统的广泛使用,系统安全问题受到用户越来越多的关注。访问控制作
随着科学技术的进步,电子设备的发展,特别是携带照相功能智能手机的普及和互联网的应用,视觉数据数量迅猛增长,有效的图像分类、检索技术成为人们的迫切需求。传统的基于文本的图
随着计算机科学技术的发展,教育的方式方法也不断产生着变化。本文论述了基于面向对象技术的计算机辅助考试系统较之以往的纸笔考试系统能大大提高考试过程中的自动化和科学化
学位
数据挖掘是数据库研究、开发和应用最活跃的分支之一,它通过对大型数据库进行清理、集成以及选择变换等处理,获得其中隐藏的潜在有用的规则,但随之产生的就是隐私和信息安全问题
随着瓦联网应用的普及,人们希望能够使用更为丰富和先进的即时通信技术,来改进通信效率,提高协作能力。其中将多媒体通信引入即时通信是主要的应用之一。本文主要探讨了基于XMPP
多年的信息化建设使组织机构内部同时运行了众多异构的OLTP系统,并积累了大量历史数据。为能向管理者提供全局一致的信息视图,并满足不同层次用户的分析需求,出现了DB-ODS-DW三
本文针对无线网络的语音、视频传输业务中,时延、带宽、丢包率等问题,以及主干网带宽变大后,接入部分的无线网络带宽资源相对较小,造成的无线接入部分成为整个网络中端到端连接服
在过去的二十年中,计算机网络经历了爆炸式的增长,随之而来的是越来越严重的拥塞问题。拥塞控制是确保Internet鲁棒性的关键因素,也是其它服务质量机制正常工作的必要前提,因
网格技术发源于科学研究领域,主要通过计算资源协同、数据资源协同及信息资源协同,构建网格虚拟环境,解决科学计算中的各种问题。随着网格技术与Web服务技术的融合,网格上的资源