基于本地化差分隐私保护的k-means聚类算法研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:baiyomkg02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘的快速发展使其在医疗保健、金融服务、安防领域等方面得到了广泛应用,k-means聚类算法是数据挖掘中经典且常用的算法之一,具有简单易于实现、可高效处理海量数据等特点。但用户进行k-means聚类时可能会泄露自己的敏感信息,隐私保护k-means聚类可以在保护数据隐私的同时进行k-means聚类。然而,现有的差分隐私保护k-means聚类方案存在迭代效率低、服务器返回错误聚类结果的问题。此外,现存共同隐私保护k-means聚类方案参与方合谋导致聚类中心的隐私泄露,方案通信复杂度较高。针对上述问题,本文基于本地化差分隐私技术提出两种隐私保护k-means聚类方案。(1)针对现有中心化差分隐私保护k-means聚类方案中存在服务器会遭受攻击,以及本地化差分隐私保护k-means聚类方案中服务器返回错误聚类结果的问题,提出一种区块链环境下的本地化差分隐私保护k-means聚类方案。首先,方案设计的多方k-means聚类中心初始化算法,去除了多用户初始聚类中心选择的随机性,使用本地化差分隐私技术,在保护用户隐私的同时提高k-means聚类的迭代效率,并结合区块链公开透明、不可篡改的特性,确保多用户联合产生初始聚类中心的正确性。然后,构建聚类中心更新算法的智能合约,根据用户上传扰动后的数据,在区块链上公开透明地迭代更新聚类中心,保证各个用户都能得到正确的聚类结果。(2)针对现存共同隐私保护k-means聚类方案中参与方合谋导致聚类中心隐私泄露,以及参与方与数据分析师交互导致通信复杂度较高的问题,提出了一种抗合谋的共同隐私保护k-means聚类方案。首先,通过设计的最近聚类中心算法,利用本地化差分隐私技术保护参与方的隐私数据,避免了参与方与数据分析师的大量交互,此阶段的通信复杂度为O(lm)。其次,本方案设计的聚类中心更新算法中,各参与方生成随机数,并使用同态加密技术,避免参与方之间复杂的分块操作,此阶段的通信复杂度为O(km)。通过抗合谋分析,方案在参与方合谋以及参与方与数据分析师合谋的情况下,仍能有效保护参与方数据和聚类中心的隐私。最后,分别对以上设计的两个隐私保护k-means聚类方案进行安全分析,同时,将两个方案与现有隐私保护k-means聚类方案进行功能与性能比较,结果表明两种方案是有效且安全的。
其他文献
古建筑作为人类历史文明的一项文化标志,凝聚了各民族的历史文化精髓。在乡村振兴战略背景下,我国古建筑行业正处于一个大范围历史性的建设窗口期。DX砖雕古建有限公司经过十多年的发展,已成为集设计、生产、施工、咨询服务等于一体的知名砖雕公司,在引领地方企业创新、发挥经济带动作用、保护非遗文化上成为一支不可或缺的力量。由于砖雕是一种典型的建筑构件,属于大件耐用消费品,用户关注度较低、单价高、复购率低、运输成
学位
公司在分配公平和程序公平方面存在的问题,会影响员工的心理所有权和职业承诺,甚至诱发员工越轨行为、产生离职倾向。在公司的KPI考核、薪资发放、岗位变动等环节中,一旦某一环节出现不公平现象,会直接影响员工工作满意度。R保险W分公司是集团人寿保险公司所属二级分公司,主营寿险产品。本文对R保险W分公司缺乏有效激励策略的原因进行了研究,发现如何提高激励方式的公平性是R保险W分公司可持续发展路上亟待解决的重要
学位
随着农业现代化的快速推进,国家愈加重视农业经营体制的改革,而农业经营方式是农业经营体制的核心。为构建起现代农业可持续发展的长效运行机制,需要积极探索适合我国国情的农业经营方式。在当前制度环境下,对农业经营方式变革动力机制的分析,有助于厘清不同发展阶段农业经营方式变革的学理逻辑,从实践经验出发提出契合当前农业经营所需的可行路径,有着一定的理论和实践价值。本文通过对安徽省F县农业经营方式的两次变迁历程
学位
随着消费金融在我国快速的发展,客户的逾期率和消费金融公司的不良贷款率稳步上升,催收作为贷后风险控制不可或缺的一环,在降低客户逾期率和不良贷款率方面发挥着越来越重要的作用。在银保监会对于消费金融公司催收的监管力度愈发严格,同时受媒体“暴力催收”的舆论影响,以及催收行业对于从业人员个人能力的高要求的背景下,外访催收人员工作压力也愈发严重。本文研究的目的是希望通过对J消费金融公司外访催收人员工作压力的研
学位
近年来信息技术蓬勃发展,随之而来的是数据量暴增。在日常生产生活中,越来越多的数据被获取并存储。然而一些数据对于分类任务来说是不相关或冗余的,且这些冗余数据对做出正确的决策会产生影响。因此,如何有效地处理冗余数据已然迫在眉睫。虽然特征选择方法已被广泛应用,但大多数的特征选择算法仅考虑决策下近似所包含的分类信息,忽略了决策分歧的样本所提供的分类信息,从而可能导致部分信息的丢失。本研究以模糊邻域粗糙集模
学位
纵观我国的国有天然气公司,可以发现人力资源管理在这些公司都发挥着重要的作用,而在该体系中,绩效管理更是其中尤为重要的内容,可以帮助天然气公司创造更多效益,实现发展目标。尤其是改革减员增效对国有企业的发展很重要,X公司面临国企改革的环境,必须要不断提升自己的发展动力,其重要的手段就是应用强制分布法对绩效管理体系进行优化,然而在实施过程中遇到一系列问题,如何更好地应用强制分布法,起到激励员工的积极作用
学位
随着现代社会的快速发展,亟需解决的优化问题呈现出复杂化和多样化的发展趋势。机械工程设计问题是重要的优化问题之一,该问题的主要目标是在满足一定约束条件的情况下,寻找机械工程产品的一组最优参数值。传统的优化方法在解决这类问题时常面临陷入局部最优的困境,不能找到最优解,许多研究者开始采用元启发式算法(Meta-heuristic algorithms,MAs)来解决机械工程设计问题。单个MA都有自己的优
学位
随着科学和技术的进步,亟需解决的优化问题越来越多,且其复杂性大幅增加,用传统基于数学的优化方法,如梯度下降、牛顿法等,几乎不可能解决这些复杂问题。因此,越来越多的智能优化算法(Intelligent Optimization Algorithms,IOAs)被提出。为了更好地解决复杂优化问题,提出了分组结构的IOA。本文主要讨论分组结构的IOAs,如同步热传递搜索算法(Simultaneous H
学位
在互联网时代信息爆炸及地勘单位改革的背景下,媒体格局深刻变化,舆论生态更加复杂,地勘单位青年职工思想状态的波动变化更加活跃,也令地勘单位青年职工思想政治工作面对着更多的新挑战。文章简要分析了当前地勘单位青年职工思想特点,并对地勘单位青年职工思想政治工作面临的问题及其实施策略进行了论述。
期刊
随着自媒体平台的出现和高速发展,人们越来越多地关注自媒体平台上的新闻信息,观看电视节目已不再是人们茶余饭后休闲的首选,湖北电视台《新闻360》节目更是面临着前所未有的挑战。本研究以传播分众化理论与拉斯韦尔5W理论为理论基础,以湖北电视台《新闻360》节目作为研究案例,运用调查研究的方法对自媒体发展环境下湖北电视台《新闻360》节目面临的困境及原因进行深入分析,并根据分析结果提出相应的对策建议。通过
学位