面向聚类算法的隐私保护技术研究

被引量 : 0次 | 上传用户:InsideADONET
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的迅猛发展,人们进入到一个信息量激增的时代,海量数据的多样性与复杂性向数据挖掘技术提出更高的需求。在实际应用时,由于数据量大且繁杂,很难存在存储能力和计算能力都符合的用户,因此,数据集会经常分布于多方用户之间,这就需要多方用户联合数据资料,共同挖掘得出期望知识。然而,基于隐私保护的考虑,人们惧怕对数据挖掘技术的误用、滥用会导致私有数据特别是敏感信息的泄漏。因此,在这种场景下,人们甚至会拒绝提供真实的个人数据信息。这就制约了数据挖掘技术的发展,而基于隐私保护的数据挖掘技术(Privacy-Preserving Data Mining,PPDM)的出现可以解决这一问题。作为数据挖掘技术的一种,聚类算法应用广泛。但是基于隐私保护的安全聚类协议并不多,并且多是集中于对经典K-均值(K-means)聚类算法的安全协议研究。由于亲和传播(Affinity Propagation, AP)聚类算法具有K-means无法比拟的优势,但目前却没有可用的协议涉及其安全应用方面,因此,本文将提出一种解决方案,并以此为重点展开讨论。本文主要内容如下:(1)分析了数据挖掘技术的研究背景以及国内外发展现状,详细介绍数据挖掘的相关知识与主要技术,其中重点研究不同类型的聚类分析算法,并对影响聚类结果的主要因素展开讨论。(2)介绍PPDM的相关技术理论,研究数据处于不同分布环境下的隐私保护技术,并重点探讨了分布式环境下的安全多方计算协议。结合隐私保护技术与挖掘算法即可形成特定的隐私保护方案,本文讨论了隐私保护技术在PPDM方案中的实施过程,并给出评价隐私保护方案的重要标准,最后分析了PPDM在未来所要面临的问题与挑战。(3)本文介绍一种新型高效的聚类算法—AP聚类,基于对AP聚类算法的研究及其特性分析,提出一种在数据垂直分布环境下的AP安全聚类协议。在半诚实模型下对其进行安全性讨论,并估算给出通信代价,以证明该协议不仅能实现高效的聚类挖掘,并且保证各站点的隐私数据得到安全保护,即实现了数据挖掘的要求,又达到了隐私保护目的,从而做到了双赢。
其他文献
智能电网是未来电网发展趋势,智能变电站作为其关键基础部分,必将成为主流方向。智能变电站主要依靠信息的网络交互及各种智能化一、二次设备的应用来实现,无论在设备构成还
龙门山造山带被地质学家誉为“地质百慕大”,以发育典型的逆冲推覆构造和飞来峰为国内外地质学者所瞩目。前辈地质学家对龙门山地质构造进行了深入的研究,并取得了卓越的成果。
随着物质文明的发展,人们对精神、文化和审美方面的要求也日渐增高。一直以服装点缀形式出现在大家视野中的围巾,逐渐在服饰这个五彩缤纷的舞台上崭露头角,为无数时尚消费者所追
实现党规与国法衔接协调,是坚持依法治国与依规治党统筹推进、一体建设的重大理论创新与实践命题,也是确保党规与国法形成相辅相成、相互促进、相互保障格局的必由之路。党规
风水信仰是中国社会特殊的民间信仰形态,是民众日常生活中不可或缺的精神文化现象。本文以明清时期佛教的风水理论与实践为研究对象,以闽浙赣粤为研究中心,以历史学、宗教学
目的:通过电针刺激乳腺癌骨转移大鼠,观察电针对骨癌痛的影响,讨论其可行性,并探讨电针治疗骨癌痛的作用机理,以指导临床运用方法:1、将24只体重180-220g的SD雌性大鼠,随机分为
通过对清代医家治疗虚劳的方剂文献整理与统计学分析相结合的方法,总结出其治疗的组方用药特点,探求中医虚劳的病因病机及防治原则,以期为临床提供更多借鉴和辨证的新思路。
在经济、社会、文化不断快速发展,以及近些年来各种生态问题接连出现的时代背景下,人们对与生态相关各种问题的研究开始感兴趣,本文以满足人的生态需求为基础来讨论生态景观的内
股权分置改革之前,众多学者认为我国上市公司热衷于大规模股权融资的根源在于我国的股权分置。为了规范上市公司的股权融资行为,我国于2005年正式开启股权分置改革,2006年底
目的探讨肝脏淋巴瘤的CT表现、血液动力学特征及其病理基础。资料与方法搜集经手术病理证实的11例肝脏淋巴瘤患者的CT与病理资料,复习CT结果并与病理作回顾性对照分析。结果1