提供差分隐私保护的分类方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zwj306041732
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,如何从数据中挖掘出有价值的信息是数据研究人员们研究的重点。其中分类是数据挖掘的重要领域,支持向量机分类方法是目前应用最广泛的方法之一。虽然支持向量机分类方法有坚实的理论基础和新颖的小样本学习方法,是目前最高效的分类方法之一,但是传统的支持向量机方法仍然存在着一定的局限性。第一,分类太过于粗糙,笼统地根据属性将待测目标二分,却没有对待测目标的定量分析,无法处理需要细分的数据。第二,没有考虑到训练集中的样本的泄露风险,当训练集中包含敏感属性时,不能保护到训练集的隐私。这可能造成两个后果:其一,无法通过分类模型比较多个待测目标之间的差异性。其二,训练集的泄露不仅仅会造成经济财产损失,更会阻碍研究工作的发展进程。本文针对上述问题对支持向量机分类方法进行研究,主要的研究内容如下:针对训练集中样本泄露的隐患,本文将支持向量机分类方法同差分隐私保护模型有机地相结合。针对不同的情况,提出了两种分类方法,分别为MDP-SVM分类方法和ODP-SVM分类方法。MDP-SVM分类方法通过对分类模型添加扰动的方式来实现保护训练集隐私的目的,这种方法在样本数量较少时可用性更高;ODP-SVM分类方法通过对样本添加扰动的方式来实现保护训练集隐私的目的,这种方法在样本数量较多时可用性更高。此外,这两种分类方法还根据分类模型定义了一个打分函数,通过这个打分函数可以判断待测目标的类别以及分类置信度,可以比较相同类别不同待测目标之间的差异性,有助于对数据进行细分。分别对MDP-SVM分类方法和ODP-SVM分类方法的隐私性和可用性从理论上进行了证明。证明了这两种分类方法在能够解决训练集中样本隐私泄露问题的前提下,仍然保持很高的可用性。通过真实的数据集,将本文提出的MDP-SVM分类方法和ODP-SVM分类方法与现有的SVM分类方法进行对比实验。验证MDP-SVM分类方法和ODP-SVM分类方法的有效性。并且比较两种方法各自的优势。
其他文献
在激烈的市场竞争中,作为市场主体的企业必须在产品上有竞争力,在技术上有开发力。在市场上有应变能力,在资产上有保值增值的能力。为了适应如此的经济形势.如何控制国有资产的流
社区护理是医疗体系中的重要内容,本文综述了近十年国内社区护理的现状及致使其现状的影响因素,指出社区护理
在整个电网系统之中,水电站是一个非常重要的组成部分,水电站对于人们的生产生活有着非常重要的影响。水电站所采用的设备检修体制以及检修方法并不能够有效地满足当前市场发
日前,在株洲举行了2017中国(湖南)国际轨道交通产业博览会暨高峰论坛,得益于“一带一路”倡议.目前为止中国中车在全球26个国家和地区设立了75家境外子公司,13家境外研发中心,海外市
如何建设现代企业制度.增加企业的生机与活力,许多人都自然想到必须深化经济体制改革,优化企业经营生产管理机制,不断投入新的科学技术等等。这些固然都非常重要,但进一步看,靠什么
TFT-LCD的运用越来越广泛,生产中心也由原来的日韩、台湾向中国大陆全面转移。因此,对其表面缺陷的分类和检测方法的研究在实际批量生产中有实质性的指导意义。科学实用的检测
发展学生的空间观念是几何图形教学的主要目标。要有效实现此目标,一线教师应践行"先学后教、顺学而导"的教育理念。在"四边形的认识"教学中,教师首先应引导学生"先学",归纳
以"一套职责、一套流程、一套制度、一套标准、一套指标"为原则,建设物资计划辅助审查信息化工具为载体,将物资计划审查相关的管理体系融入贯穿落实到流程环节和岗位职责,促进物资
伴随着科学的进步与经济的迅速发展,人们对能源的强烈要求,矿山工程的规模也不断扩大。可是在进行矿山开采过程中工作人员主要都是在人迹罕至、山高险峻的环境工作,这使得工作人
摘要:电费是国家重要的税收来源,关系国计民生的大事,同时也是电力企业赖以生存的根本收入。2007年以前,我国电力企业大多采用手抄表的形式进行电费的收取,一方面准确性难以保证,另一方面难以对人员进行有效的配置,工作量大,账目繁杂,造成人力成本居高不下。电力企业账务管理改革的必然性主要表现在其收费账目繁多,包括应收电费、实收电费、预付电费、欠费金额以及预付费余额等。尽管在2009年以后,我国多数电力企