数据发布中隐私保护算法的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:haoxuexi0825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的高速发展,越来越多的数据被人们共享使用。在各种网络上,人们可以轻易地搜集到许多发布出来的信息,甚至有很多信息未经过隐私保护便被发布出来,从而侵犯了个人的隐私。这些问题越来越受到人们的重视。如何能使发布的数据既能隐藏个人隐私,又能保证数据的可使用性,使得搜索数据的人员能从得到的数据中挖掘出自己需要的知识便成为很多专家学者研究的目标。  本文对基于聚集的k-匿名算法的实现和k-匿名模型进行了研究。对现有的微聚集算法进行分析研究,具体对性能较好的定长微聚集算法MDAV算法进行研究。为了实现l-diversity规则的k-匿名算法,提出了l-diversity-MDAV算法。实验结果表明,该算法能降低泄密风险,使得攻击者从得到的数据表中推导出原数据表中数据的风险降低。针对l-diversity-MDAV算法执行时间长的缺点,将c-modes算法引入进来。将c-modes算法与MDAV算法相结合,提出了CLM算法。该算法对数据集进行两次聚类,利用分治法(Divide and conquer)的思想将大规模数据集划分为几个较小规模数据集进行k-匿名运算。该算法能有效降低执行时间,并能降低泄密风险。分析MDAV算法,在划分等价组时是通过元组间的距离来划分。该方法虽然简单,但是没有注意到记录元组之间的密集度。在MDAV算法的基础上,提出了改进算法。改进算法利用贪心算法的思想,根据元组的邻域密度为参数计算每个等价组的中心元组。改进后的算法能有效降低信息损失量。本文提出的三个改进算法从三个方面对传统k-匿名算法进行了改进:l-diversity-MDAV算法有效实现了l-diversity规则,CLM算法有效改进了k-匿名算法的效率,改进的MDAV算法则大大降低了k-匿名化的信息损失量。
其他文献
随着多媒体通信和信息处理技术的发展,人们对图像质量的要求越来越高。然而,受通信带宽的限制(如无线条件下),获得的图像的质量往往很低,难以满足人们的需要。图像插值技术能
在虚拟社区中,用户可以依据自己的兴趣爱好创建群组或者社区,在这些社区中,用户可以互相交流、获取自己所感兴趣的信息。用户也可以加入到别人已经创建的社区中去。如今,互联
软件定义网(SDN)为传统网络的发展瓶颈提供了一种解决方案,其最大的改变在于将数据面与控制面相分离,通过SDN协议来连接网络应用与基础设备,通过控制器(Controller)对网络进
移动云计算是一种将移动互联网与云计算相结合的新技术,其典型的应用场景就是移动端数据分流。用户可以通过数据分流将移动端的计算密集型任务迁移到云端来改善其移动端的CPU
在第三代移动通信系统中,MIMO系统采用多天线多接收技术能够在不增加系统平均功率和带宽的情况下成倍的增加系统的信道容量,并且与传统的SISO系统相比,在使用相同的总功率和
金属焊接过程中,由于不均匀温度场的存在,导致焊件不均匀膨胀与收缩,从而使焊件内部产生焊接变形并产生焊接应力。焊接应力的存在直接影响金属构件的承载能力、降低焊接接头及整
LTE网络下的D2D通信是一种邻近用户无需经过基站或核心网而直接通信的新型通信技术。D2D通信技术的优势在于可以增强网络性能,如提高频谱效率、减少通信时延、增大系统吞吐量
随着计算机和网络技术的飞速发展,它给人们带来各种便利的同时,各种网络安全问题也应运而生。针对这些网络安全问题,人们采取了各种措施如防火墙技术、入侵检测技术、数据加密、
网位仪是一种新型的现代化助渔设备,能够准确测量鱼群和渔网的位置信息,提高捕捞的准确性,并且可以实时获取渔网相对于水面、水底和前方障碍物的位置信息,减小渔网触底和触碰障碍
认知无线电是解决频谱利用率低和频谱资源短缺的一个潜在的解决方案。它是下一代网络的核心技术,采用伺机方式利用和共享频谱资源,已经受到广泛的关注。而频谱感知是认知无线