支持隐私保护的极限学习机研究

来源 :东北大学 | 被引量 : 2次 | 上传用户:soundbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,人们在要求获得信息服务的同时,对隐私信息的保护也越来越重视。特别是在针对数据库中大规模数据的统计分析与分类的过程中,保护个人的隐私的同时发布数据库整体的统计量信息具有重要的现实意义,也是一项重大的技术挑战。差分隐私是目前统计查询处理领域最有前景的隐私保护技术之一。它通过向每个查询中注入噪声,防止攻击者推断出数据库中任何个体的数据纪录是否在该数据库中。极限学习机是一个主要用于分类、回归问题的机器学习算法,它获得了比支持向量机这一目前使用最为广泛的分类技术更好的泛化性能和更快的学习速度。因此,本文重点研究支持隐私保护的极限学习机技术,以兼顾统计信息的发布与个体信息的隐私保护。本文综述了用于构建支持隐私保护分类器的隐私保护技术和分类器技术,并研究了支持隐私保护的极限学习机的构建。为了解决分类器存在的隐私泄露问题,本文首先给出了一个背景知识很强的隐私攻击模型,并给出了衡量分类器的隐私保护能力的度量用于对支持不同隐私保护技术的分类器进行比较。然后分析得到极限学习机具有类似支持向量机的等价经验风险最小化形式,利用支持差分隐私的经验风险最小化的隐私保护能力的证明,给出支持差分隐私的极限学习机的隐私保护能力的证明。为了保留极限学习机极快的学习速度、宽松的约束条件、良好的泛化性能,本文建立了两种支持差分隐私极限学习机,即支持基于输出扰动差分隐私的极限学习机和支持基于目标扰动差分隐私的极限学习机。最后,本文在真实数据集上进行了广泛的实验。验证了线性系统求解极限学习机和求解与其等价的经验风险最小化形式得到的分类器的等价性;比较了支持隐私保护技术的极限学习机的隐私保护能力;验证了本文建立的支持差分隐私的极限学习机具有极快的学习速度,同时保留了极限学习机相对于支持向量机的泛化性能的优越性,并且在相同的隐私保护要求下相对支持差分隐私的支持向量机具有更稳定的泛化性能。
其他文献
森林火灾对森林造成的影响非常严重,它破坏森林资源,降低森林质量,引起水土流失,造成野生物种减少,迫使鸟兽迁移。同时,森林大火产生的大量烟尘,既污染大气环境,又危害人类健康。而我
虚拟现实技术是以计算机技术为核心,基于可计算信息的沉浸式交互环境,综合视、听、触觉为一体,模仿现实三维空间的再现技术,应用于多个现代技术领域,其最重要的目标就是真实的体验
传统移动业务接入方式是通过业务引擎接口协议直接接入通信网元的,这样做的坏处有两点:首先业务开发门槛高,不便于CP/SP开发业务,从而导致了运营商提供业务的单一性。其次是不便于
软件实验对于计算机专业教学而言是一个重要的实践环节,不但检查了学生对算法理论的掌握程度,而且还可以考核学生在规定时间内编写代码的能力。但目前从实验题目的发布、实验过
生物阻抗是反映人体或其构成部分,即人体组织、器官、细胞等电学性质的物理量,通过人体阻抗我们可以了解人体组织的生理状态和临床状态。但目前现有的生物阻抗测量系统往往造价
烧结图像中火焰区、充分燃烧区、物料区与黑把子区的分割是工业图像处理的难点之一,自动提取这些区域的灰度与形状特征,有利于客观地诊断的烧结状态,为看火工提供烧结状态的定量
科学计算可视化是计算机图形学的一个重要研究方向,它在各个领域都有着广泛的应用。在医学领域,人们利用可视化技术由二维医学断层图像序列构建特定组织或器官的三维模型,以
随着社会信息化发展步伐的加快,越来越多的企业,政府部门的日常办公、日常管理都离不开应用系统软件的支撑,而针对特定行业的应用系统的开发已经离不开工作流技术的支撑。现
一张完全空白的磁盘介质是无法使用的,需要写入伺服信号后,磁头才能通过伺服信号进行定位。尤其是今天对于高存储容量的磁盘的需求已经成为一种趋势,同时希望减小磁盘的尺寸
“软件产品线”是一个以软件工程学为基础发展起来的新兴多学科交叉的研究领域,现已成为软件工程和软件复用领域研究与实践的前沿。软件产品线体系结构描述了产品线内所有成员