用于k-匿名数据的关联规则集化简与可视化技术

来源 :东华大学 | 被引量 : 2次 | 上传用户:chenxiaoyi1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络逐渐成为人们日常生活中不可或缺的一部分。人们在享受网络带来便利的同时,也在网络应用的服务器上留下了大量的个人生活、消费、习惯等信息,而这些信息极有可能包含那些人们不愿意泄露的个人隐私信息。随着人们隐私保护意识的提高,隐私泄露问题也越来越受到人们的重视。通过不断的发展和完善,k-匿名隐私保护模型已经逐渐成为数据发布者可信赖的隐私保护模型,网络上也将会涌现出越来越多的k-匿名数据。k-匿名数据作为一种特殊的不确定性数据,是通过泛化树对精确数据进行泛化而得到的,因此使得k-匿名数据的关联规则挖掘结果集不同于传统的确定数据的关联规则集。k-匿名数据关联规则的挖掘无论是基于等概率展开等概率可能世界,还是通过了解泛化值的特征直接进行关联规则挖掘,得到的关联规则结果集均包含与k-匿名数据形式相同的关联项。若将关联规则的泛化值还原到确定的值域空间,需要通过大量的计算实现,会导致用户的等待时间增加,极其不利于用户的体验。与此同时,如若原始数据量增加,则关联规则结果集也将随之逐渐增大;且由于关联规则自身复杂的特性,即生成的关联规则包含项目的个数不确定,每条关联规则还有两个重要参数支持度和置信度,从而使得用户想要在大量关联规则集中探索发现自己感兴趣的关联规则变得越来越困难。因此,如何帮助用户有效的探索和研究关联规则结果集是一个亟待解决的问题。目前,经过众多学者研究发现,在人类的视觉神经系统的帮助下,信息图形化的表达能够给人们提供一种更好的获取和寻找信息的方式。因此,运用可视化技术对庞大而复杂的关联规则进行可视化将是帮助用户实现对关联规则结果集研究和学习的有效方法之一。本文通过学习k-匿名数据的关联规则集和可视化技术,提出并实现了基于矩阵的关联规则3d可视化系统,用于帮助用户探索和研究确定化后的k-匿名数据关联规则。该系统所使用的可视化技术采用的是新型的基于矩阵的可视化技术,该技术使用规则-项目的映射代替了传统的项目-项目的映射,通过规则-项目映射将原始的关联规则结果集转化为能够直接进行可视化表达的数据形式,该技术可以有效的解决含有多个前项的关联规则的可视化重叠问题;同时,基于对蕴含相同右边项集的关联规则的左边不同项目的重要性的考虑,本文提出一种应用于确定化后的k-匿名数据关联规则集的化简的方法。该方法通过研究确定化后的k-匿名数据关联规则的右边项集,将属于同一组的关联规则进行归并,同时为新生成的关联规则的项目指派权重。实验证明,通过这种归并方法可以有效的化简确定化后的k-匿名数据关联规则结果集,并且可以帮助用户比较确定化后的k-匿名数据关联规则左边项目的重要性。此外,本文研究的基于矩阵的关联规则3d可视化系统提供了简单实用的交互功能,包括对确定化后的k-匿名数据关联规则的支持度、置信度和权重的排序和过滤,对三维矩阵可视化图形的缩放和旋转以及与可视化图形实时交互并展示更详细的信息等。这些交互功能的实现帮助用户从不同的角度深入的探索确定化后的k-匿名数据关联规则结果集。最后,通过参考可视化系统的评估和软件测试的方法,对整个系统的功能进行讨论。结果表明,本系统可以有效的解决可视化技术导致的图形重叠问题,并且能够清晰的解释确定化后的k-匿名数据关联规则包含的全部项目之间的关系,以及两个重要参数支持度和置信度。
其他文献
随着教育信息技术的发展,互联网辅助教学的推广深入,网络教学在护理教育中的应用也日益广泛。传统的教学模式难以满足现代教育观念的发展,网络教学作为一种新兴的教学模式,被
以L-天冬氨酸、PVP等为结构导向剂,利用SnCl2的水解氧化反应,制备出带凹槽的半管状SnO2微结构。所得样品用XRD和SEM等技术进行表征,考察了反应条件对样品形貌的影响。结果表
当今"国学"的炽热,反映了国人对我国传统文化精神的自觉。在世界经济一体化下,要坚持自己的"文化主体论",并且要善于从整理"国故"中挖掘本国特色的传统文化;探究"国学"的精髓
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
台湾影戏为潮州影系的一支,与属同一流派的福建、广东地区相较,其手抄剧本保存得最为完善,目前可供参考的剧目大约有两百多种。我们可以从这些剧本内容看出当地老百姓的宗教
<正> 碟形弹簧国家标准(GB1972-80)中,规定了碟簧的制造公差及验收时的负荷偏差值,为防止按制造公差加工而出现负荷偏差超差的现象,标准注明了可适当调整厚度偏差。可见,标准
期刊
目的观察PF方案同步放射治疗鼻咽癌的近期毒副反应。方法 76例鼻咽癌患者进入放化疗同步治疗组,分别在放疗期间的第1、22、43天始接受连续5天的化疗,所用化疗方案:顺铂20mg/m2
一浪子与孝子每个人来到世界上都是很偶然的事,所以,人自己给自己的生命赋予意义。文学之于我,是生命意义的主体构成。没多大文学成就,但文学已成为我的生活方式,对之,我坦然
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技