【摘 要】
:
随着信息技术、网络技术、数据存储技术和高性能处理器技术的进步,数据资料的规模急速膨胀,从而促进了数据挖掘(Data Mining,DM)技术的产生和飞速发展。数据挖掘在不断的挖掘
论文部分内容阅读
随着信息技术、网络技术、数据存储技术和高性能处理器技术的进步,数据资料的规模急速膨胀,从而促进了数据挖掘(Data Mining,DM)技术的产生和飞速发展。数据挖掘在不断的挖掘出知识和规律,为政府、企业和个人带来便利的同时,也不可避免的涉及到人们的隐私问题。同时,随着社会的进步,人们对隐私的重视程度也越来越高,这也给数据挖掘带来了新的困难。隐私保护数据挖掘就是为了解决隐私保护和数据挖掘之间的矛盾而产生和发展的。本文首先阐述了数据挖掘、关联规则挖掘的基本理论和隐私保护数据挖掘的主要技术。在此基础上,对隐私保护关联规则挖掘的经典算法MASK算法进行了深入浅出的介绍和分析,并对多参数扰动算法做了详细的研究。与MASK算法相比,多参数扰动算法提高了隐私保护度和数据挖掘的准确度,但多参数扰动算法的频繁项集还原部分仍存在时间效率不高的问题,尤其是随着项集的增大,这个问题变的越来越严重。针对这个问题,本文对多参数随机扰动算法进行了较深入的研究,并根据该算法频繁项集还原模型的特点提出了两个改进的方法。方法一把求解转换矩阵逆矩阵的过程由两步变为一步,从而提高了时间效率。方法二由要求出转换矩阵逆矩阵的所有元素变为只求出转换矩阵逆矩阵的首行元素,从而又进一步提高了时间效率。最后通过理论分析和实验结果,表明方法一改进后的算法的时间效率高于原算法的时间效率,方法二改进后的算法的时间效率高于方法一改进后的算法的时间效率。另外,方法二改进后的算法在空间效率方面比原算法也有一定的改进。因为各种多参数扰动算法的频繁项集还原模型是一样的,所以对多参数随机扰动算法的改进也可以应用到别的多参数扰动算法上。
其他文献
随着计算机应用的普及和互联网络的发展,人们对网络安全越来越重视,作为网络安全技术之一的防火墙与此同时得到了很好的发展。但传统的边界防火墙只在网络边界进行保护,不能
随着科技的发展,人们安全意识的不断提高,监控系统已广泛部署于各种不同的场所。其中嵌入式网络监控系统,即插即用、性能稳定,能够实现恶劣环境下的视频监控,成为目前监控系统研究
随着嵌入式系统的发展,越来越多的系统选择了在LinuX上开发具有特定功能的小型系统。如今在无线网络世界中,无线电信网络无疑是覆盖范围最广,使用量最大,数据通讯也相对廉价
随着互联网的迅速发展和普及,网络资源的需求也迅速增加;与此同时网络中也包含大量的网络攻击,其对网络性能的影响越来越大。网络攻击的直接表现是网络流量异常,这就要求必须
随着计算机网络的广泛普及,计算机的辅助应用已经普遍运用与各行各业,为经济、政治、军事、文化的发展做出了巨大贡献,包括在教育测量方面。教育测量是在20世纪二三十年代首
按照民航局空管体制改革有关优化空管系统资源配置、提高空管系统运行整体效率的要求,建立贯穿于全系统的新型运行保障服务模式,民航空管系统提出建立空管系统“三横三纵”运
语音库的自动建设在可训练的语音合成中占有很重要的地位,它要求对输入的音频进行类别的区分来进行不同的处理,并将处理后的音频分割为句子作为后续的音段切分系统的输入。音
内容分发系统能够在多用户之间快速的传输大型文件,已经成为应用最为广泛的P2P技术。网络编码技术作为通信领域的新兴技术,已经得到学术界的普遍关注,如何将网络编码技术应用
本文依托四川省科技厅科技攻关项目《多参数非接触测量在线系统研制》和西南科技大学省级机器人重点实验室实际项目的需求,重点研究了视觉测量在工件形面测量应用中的几个关键
随着Web服务标准的持续完善和支持Web服务的企业级软件平台的不断成熟,越来越多的企业和商业组织参与到软件服务化(Software as a Services, SaaS)的行列中来,纷纷将其业务功