基于异构分布数据的保护隐私贝叶斯网络结构学习

来源 :天津大学 | 被引量 : 0次 | 上传用户:haibolovemj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘一直是数据库研究、开发和应用最活跃的分支之一。无论在研究领域还是商业应用,数据挖掘都取得了可喜的成果。但与此同时,数据挖掘也面临着许多问题的挑战。其中,数据挖掘的个人隐私与信息安全问题尤其得到关注。误用、滥用数据挖掘可能导致用户敏感信息泄漏,越来越多的人们表示担忧,甚至拒绝提供真实的数据。保护隐私的数据挖掘提供了一种分布式的数据挖掘方法,从而防止重要数据的泄漏。这篇论文主要致力于研究:基于异构分布数据的保护隐私贝叶斯网络结构的学习。在此场景下,三个或更多的数据提供者希望在联合数据的基础上进行贝叶斯网络结构的学习,同时并不把自己的数据泄漏给任意其他数据提供者。在这篇论文中,主要基于最小描述长度(MDL)的准则来进行贝叶斯置信网络的学习。实现了两种算法:MDL穷尽算法(EX_MDL)和分枝限界MDL算法(B&B_MDL)来求得最佳的贝叶斯网络结构。结合了保护隐私的多向量点积份额协议SSP以及Bresson同态公钥密码算法,文章最终提出并实现了分布式的基于MDL穷尽算法的PP_EXMDL方法和基于B&B_MDL算法的PP_BBMDL方法,用于从完整的异构分布数据学习贝叶斯网络结构。经过实验验证,这两种方法均能生成高精度的贝叶斯网络结构,并且与已有WY算法(由Wright,Yang于2004提出)相比,具有更高的安全性、适用性、精确性。
其他文献
水位测试系统是为了动态跟踪高精度测量河流模型中的水位变化而设计的实时测控系统,河流模型是为了研究河道再造河床过程、不同时期的洪水演进过程、江湖关系变化及防洪对策而
Internet在世界范围内的迅猛发展使得网络上聚集了越来越多的信息,而这些信息90%以上是以文本的形式表现的,这极大地推动了自然语言处理技术的发展。目前,自然语言的处理技术
大规模定制生产模式被誉为21世纪企业竞争的新前沿,对个性化的客户订单实施有效的大规模生产,是成功实施大规模定制生产模式的关键。目前,各国学者对大规模定制生产方法已经开展
Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介,是一种崭新的信息传播和交互方式。与传统的网络信息相比,Blog领域链接关系更加丰富,Blo
移动机器人有广阔的应用领域和发展前景,它所具有的优势越来越受到世界各国研究人员的普遍关注和重视。自主载体是移动机器人的简化形式,在此平台上进行驱动伺服方法的研究具有
安全空间数据库是当前信息安全研究的一个重要分支,具有广泛的应用前景。该领域的研究具有较强的保密性,信息技术发达国家对我国一直施行尖端安全产品禁止输出策略,数据库安全产
最佳离散信号已在现代通信、雷达、声纳、制导、空间测控、以及电子对抗等方面得到了广泛地应用,结构优良的信号可以提高系统的抗干扰、抗截获、抗衰落等性能,可以增加系统的
学位
本文针对Netcool系列网管产品在ICBC网管升级项目中的实施,提出了基于Netcool事件机制的网元监控规划思想,简化了网管产品的实施部署难度,减轻了网管监控人员的定制负担,并且
无线传感器网络是在传感器技术、通信技术和计算机技术三者的基础发展起来的,是当今计算机领域的研究热点之一。拓扑控制是无线传感器网络研究的关键技术之一,而作为拓扑控制的