论文部分内容阅读
随着信息技术的不断发展,人们在要求获得信息服务的同时,对隐私信息的保护也越来越重视。特别是在针对数据库中大规模数据的统计分析与分类的过程中,保护个人的隐私的同时发布数据库整体的统计量信息具有重要的现实意义,也是一项重大的技术挑战。差分隐私是目前统计查询处理领域最有前景的隐私保护技术之一。它通过向每个查询中注入噪声,防止攻击者推断出数据库中任何个体的数据纪录是否在该数据库中。极限学习机是一个主要用于分类、回归问题的机器学习算法,它获得了比支持向量机这一目前使用最为广泛的分类技术更好的泛化性能和更快的学习速度。因此,本文重点研究支持隐私保护的极限学习机技术,以兼顾统计信息的发布与个体信息的隐私保护。本文综述了用于构建支持隐私保护分类器的隐私保护技术和分类器技术,并研究了支持隐私保护的极限学习机的构建。为了解决分类器存在的隐私泄露问题,本文首先给出了一个背景知识很强的隐私攻击模型,并给出了衡量分类器的隐私保护能力的度量用于对支持不同隐私保护技术的分类器进行比较。然后分析得到极限学习机具有类似支持向量机的等价经验风险最小化形式,利用支持差分隐私的经验风险最小化的隐私保护能力的证明,给出支持差分隐私的极限学习机的隐私保护能力的证明。为了保留极限学习机极快的学习速度、宽松的约束条件、良好的泛化性能,本文建立了两种支持差分隐私极限学习机,即支持基于输出扰动差分隐私的极限学习机和支持基于目标扰动差分隐私的极限学习机。最后,本文在真实数据集上进行了广泛的实验。验证了线性系统求解极限学习机和求解与其等价的经验风险最小化形式得到的分类器的等价性;比较了支持隐私保护技术的极限学习机的隐私保护能力;验证了本文建立的支持差分隐私的极限学习机具有极快的学习速度,同时保留了极限学习机相对于支持向量机的泛化性能的优越性,并且在相同的隐私保护要求下相对支持差分隐私的支持向量机具有更稳定的泛化性能。