基于同态加密的隐私保护支持向量机分类预测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:darfehost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习技术的成熟与发展,大数据与机器学习结合下的数据挖掘变得更加普及,从电商行业到金融服务业,从科学研究到百姓生活,从宏观建模到微观分析都有着重要的应用。伴随着5G技术的全面推广,结合物联网等相关产业,机器学习在未来的智慧生活中的应用会是无处不在的。支持向量机作为一种分类器被广泛应用于机器学习、模式识别和数据挖掘等领域,其用统计学习理论从数学上解释了机器学习的核心问题,奠定了有限样本情况下的机器学习方法的基础。而随着机器学习的广泛应用,巨大的数据交互量使得隐私保护问题越来越重要。尤其针对医院病历、消费记录、地理位置等敏感数据的机器学习和数据挖掘,数据拥有者既不希望泄露具体信息又想通过服务提供者对拥有的数据进行预测分析。因此,设计一个安全高效的隐私保护支持向量机分类预测方案是十分有必要的,一方面实现支持向量机的精准分类预测功能,另一方面保护了数据拥有者的隐私。本文所做的主要工作如下:1、提出了一种高效的隐私保护非线性支持向量机数据分类预测方案。目前,针对支持向量机的主流的隐私保护方法有两种:干扰和加密。干扰是保证数据的全局统计特性不变,对具体数据进行模糊化处理,比如K匿名、L多样化。干扰追求的是统计数据的准确性与隐私保护程度之间的均衡。但是涉及到医疗数据、地理位置等需要保证数据准确性的情况下,加密方案显然要优于干扰方案。同态加密是支持向量机隐私保护领域的主要研究方向,我们的方案利用BCP同态加密算法的一个变种:DT-PKC加密算法,对用户数据和支持向量进行同态加密和计算,既保证了分类预测数据的准确性,又保护了用户数据和支持向量机服务提供方的敏感数据。当前主流的研究方案采用对所有数据加密在密文下计算支持向量机分类预测结果的思路,我们的方案与之相比减少加密数据,简化同态计算过程,计算效率更高。非线性支持向量机使用的核函数种类很多,目前很多的研究只针对其中一种核函数构造方案,而我们的方案可以用于不同核函数情况下的非线性支持向量机分类预测,具有较高的扩展性。方案引入了第三方云服务器,用户端只需要加密数据而不参与中间计算,减轻了用户端的数据交互量,减少了对用户端的计算能力需求,实现了用户可离线功能,可以推广到智能穿戴设备等领域。我们实验验证了方案的正确性,并对方案的安全性、准确性和运行效率进行了分析。2、提出了一种隐私保护的多分类支持向量机预测方案。支持向量机本身是一种二分类的的分类算法,当处理多类问题时,通过多个二分类器的组合来实现多分类器的构造。目前的相关研究是采用OU加密算法实现了一个隐私保护的多分类线性支持向量机的医疗诊断模型。线性支持向量机适用于分类预测数据线性可分或者近似线性可分的情况,然而大多数情况下用于医疗诊断的数据是线性不可分的,处理线性不可分的数据需要使用非线性支持向量机。我们针对上述方案的局限性提出了隐私保护的多分类非线性支持向量机医疗诊断方案。方案加入用户注册过程,一定程度上防止了针对诊断模型的询问攻击。我们对方案的正确性进行了实验验证。
其他文献
协作通信作为物理层安全中的重要技术,已经成为目前解决无线通信安全问题的有效手段之一。同时随着社交网站和社交应用的蓬勃发展,物理通讯设备的拥有者之间存在着不同的社会关系无疑会对协作通信中参与者的策略造成影响。因此,将社交属性引入协作通信技术中对于提高系统的安全性能具有重要的应用意义。尽管已经有许多学者结合社交属性和物理层安全技术,给出具有社交意识的协作方案。但是这些方案中节点选择策略的理由不充分,且
学位
随着信息化的高速发展和智能终端设备的全面普及,传统的身份认证方式已经无法满足人们对易用性和可扩展性的需求。与此同时,在人工智能和生物识别技术的不断进步下,基于生物特征的身份认证方式逐渐成为主流。其中基于声纹的身份认证系统在诸多特殊的应用场景下为用户带来了极大的便利。然而,由于声音易被复制和模仿,因此声纹认证系统仍然遭受着欺骗攻击的威胁,导致系统的安全性得不到保障,这无疑不利于声纹认证系统的更广泛应
学位
云计算、物联网等信息技术的持续不断发展使得人们的生活变得更加方便快捷。然而,为了享受物联网带来的便利服务,人们需要相应地提供某些个人信息。因此,在互联网开放的时代下,由于某些原因,如未授权访问,用户信息泄露的风险日趋严重。大多应用场景一般基于公共的网络环境,各种实体如用户、攻击者等都参与其中,为了保证服务或信息的正确授权访问,验证实体的合法性是要实现的必需安全目标之一,而身份认证是实现该目标的重要
学位
K均值(K-means)算法是一种研究如何将具有相似特征值的数据划分到相同组内的典型基于中心的聚类分析算法。它在模式识别、智能商业、图像分割和生物信息检索等诸多领域都发挥着巨大的作用。随着近年K-means算法在单数据集聚类中的成功应用,专家学者开始将关注点转移到如何将协议扩展到分布式多数据集下进行联合K-means聚类。多数据集下的联合聚类作为一种分布式下的机器学习范式,它的出现和发展为分布式数
学位
随着互联网技术的发展和智能设备的普及,以微博为代表的社交应用不断涌现,越来越多的用户习惯于用社交网络发布或者获取信息。在使用社交网络的过程中,用户所共享的数据包含了丰富的信息量,包括个人身份、人际关系、位置轨迹、兴趣爱好、经济状况等,这些信息和用户的个人隐私安全问题密切相关。层出不尽的隐私泄露事件也证明了社交网络的确存在巨大的隐私安全问题。然而,社交网络中数据形式复杂,用户节点数量庞大,导致传统的
学位
由于无线通信信道的开放性,物联网(Internet-of-Things,Io T)的传输媒介存在被窃听、截获甚至恶意攻击的安全隐患。传统基于密码学的加密技术因其复杂的运算机制和高昂的管理成本,在未来海量部署且性能受限的Io T场景下难以适从。而物理层安全作为基于信息论的安全手段,无需加密算法与密钥管理,利用合法信道和窃听信道的差异性设计编码方案,能在信号层面确保信息的安全传输。论文以毫米波大规模多
学位
复杂网络的相关研究日新月异,不仅推动了自然科学的变革,还在社会科学领域崭露头角。但是从现实视角来看,发生在复杂网络中的传播现象也是利弊兼备的。从利的角度分析,Wechat、Ins、Tik Tok等新兴媒体平台已逐渐超越传统媒介成为了主流的沟通方式,使信息传播在多样性和快捷性上都有了质的飞跃,提高了人们的生活水准和生产效率;从弊的角度分析,传染病在人群中爆发、病毒在因特网上传播以及谣言在社交网络中散
学位
随着智能设备技术的迅猛发展,无人机的软硬件和功能种类日益多样,其飞行控制程序的代码量和系统复杂度随之增加。为满足任务和硬件兼容需要,飞控程序使用控制参数机制来调整无人机的飞行性能,并提供远程控制接口供用户在机体飞行过程中更改设置。然而,现有无人机飞控参数机制存在输入验证漏洞,致使攻击者可以恶意篡改控制参数,导致无人机出现飞行异常甚至坠毁等问题。模糊测试方法可以自动生成测试样例,实现对输入验证漏洞的
学位
近年来,随着物联网、智慧城市、边缘计算的快速发展,嵌入式系统将会获得更加广泛的应用,与此同时,其产生的大量数据也需要得到合适的管理、组织,数据库技术就是其中的一种解决方案,但是由于嵌入式系统计算资源及存储容量受限,传统的数据库如My SQL、Oracle等并不适用于该环境,因此嵌入式数据库成为一种替代品而得到非常广泛的应用。其中,开源SQLite数据库以其高可靠、快速、简单等优点成为全世界应用最为
学位
随着4G、5G技术深入生活,MIMO-OFDM技术得到广泛应用,使得无线传输速率极大提高,下行峰值速率从3G时代不到10Mbps提高到5G的1Gbps。MIMOOFDM技术为人们生活带来便捷的同时,也为无线物理层安全的研究提供了新的平台。基于信道特征的无线物理层密钥协商是无线物理层安全研究中的一个重要方向,能够在满足信息论安全的条件下完成密钥共享。如何利用MIMO-OFDM技术多天线、多载波的信道
学位