面向关联规则挖掘的分布式隐私保护算法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:whiterain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘在电子商务、医疗等的应用越来越广泛,由数据挖掘产生的隐私泄露问题也越来越引起人们的重视。在数据遍布各地的分布式环境下,如何合作进行隐私保护的数据挖掘成为当前研究的热点。目前存在的分布式隐私保护数据挖掘算法在一定程度上保护了隐私,却以较高的计算复杂度为代价。如何在隐私保护度与计算效率上达到较好的平衡,仍然是当前研究的目标。本文通过对隐私保护关联规则挖掘算法的国内外研究与分析,分别设计了水平分布式与垂直分布式环境下的隐私保护关联规则挖掘算法。对于水平分布式环境,针对目前主要采用的基于加密的方法,计算代价高的缺点,提出基于多参数的随机干扰与同态加密相结合的水平分布式隐私保护关联规则挖掘算法(ARPRD)。算法的思想是各站点利用具有高效率与高隐私性优点的多参数的随机干扰技术对原始数据进行扰乱,然后利用常数复杂度的paillier同态加密方法加密局部支持度后发送给数据中心,再由数据中心利用paillier同态加密的性质精确求出全局支持度,最后数据中心根据最小支持度得出全局频繁项集,进而产生关联规则。从理论上分析了ARPRD算法是安全的并具有较好的准确性,并通过实验证明该算法在保护隐私的前提下能提高挖掘精确度及计算效率。对于垂直分布式环境,关键在于如何安全地计算项集的全局支持度。针对目前的安全多方求全局支持度的协议多数只适用于两方参与的情况下,且需要产生大量的随机数与复杂的运算,计算效率不高的缺点,设计了一个利用加法同态加密的简单求和的安全多方求全局支持度协议(SMGSP),并提出基于该协议的实现垂直分布式环境下隐私保护的关联规则挖掘算法(PPVDR)。理论分析表明PPVDR算法保持了挖掘结果的准确性与安全性,并在一定程度上提高了性能。最后通过实验证明了PPVDR算法在保证挖掘结果正确的前提下提高了计算效率。
其他文献
甲状腺癌有明显的区域淋巴结和远处转移倾向,PTEN是新近发现的抑癌基因,本文旨在观察PTEN在甲状腺肿瘤中的表达情况,探讨PTEN的表达和甲状腺癌转移的相关性.
随着经济的快速发展,我国的大气污染越来越严重,尤其是SO2污染,它不但给生态环境和人类的健康带来了危害,而且也造成了巨大的经济损失;与此同时,我国却存在着严重的硫资源短缺
现阶段,地铁多数岗位专业人才缺口较大,专业类院校培养人才周期长,运营服务过程中制订合理的人才培训计划、岗位能力综合评定和择优任用适宜的岗位,最大程度上发挥每一名地铁
2011-2014年,对蒙自地区枣树根际寄生线虫进行了调查,通过形态特征和测量数据,鉴定出3种矮化线虫:分别为甘蓝矮化线虫(Tylenchorhynchus brassicae,Siddiqi 1961)、圆筒矮化线虫
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
期刊
《花卉》杂志原由广东省花卉协会主办,现由广东省农业科学院环境园艺研究所主办,经广东省新闻出版广电局审批,从2015年下半年开始由原来的月刊变更为半月刊(下半月刊自办发行)。《
临床上建立人工气道的方法有三种:经鼻或口插管及气管切开后插管。人工气道的建立,减少了生理无效腔,改善了通气,但同时也使部分上呼吸道的正常生理功能(如呼吸道对吸入气体的加湿
10月7日,第九届中国花卉博览会闭幕式在银川举行。国家林业局副局长刘东生出席并宣布第九届中国花卉博览会闭幕。中国花卉协会秘书长刘红作第九届中国花卉博览会总结。她说,
心力衰竭是急性心肌梗死的严重并发症,是心肌梗死最主要的死因之一。急性心力衰竭(AHF)是指由于急性心脏病变引起心排血量显著、急骤降低导致的组织器官灌注不足和急性淤血综合
西南秦岭摩天岭地区关家沟组的时代、沉积环境及构造背景一直是争论的焦点。对关家沟组粉砂岩、板岩进行了常量、微量及稀土元素地球化学分析表明关家沟组物源主要来自活动大