面向大数据发布的保留格式加密技术研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:mn6543210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现今大数据环境下,结构化隐私数据的保护有着数据量大、数据格式类型复杂、加密后需保留可供分析能力等不同于传统隐私保护的特殊需求。为了解决上述问题,本课题针对面向大数据发布的保留格式加密(FPE)技术展开研究。通过保留格式加密技术,加密后的海量数据既能够保留原有的数据格式,使其密文依然能够满足原有的格式约束,并且经过脱敏的数据还能通过解密还原为明文格式数据,保留并隐藏了明文的全部信息量。本课题首先提出基于二分段高伪随机置换的基础FPE方案,并利用该方案设计了多种结构化数据的FPE方案,将其他结构化数据明文向基础FPE方案的消息空间进行转换和映射进行保留格式加密,再向原始明文空间进行逆映射,实现数据库中常用数据类型FPE方案的设计。随后对具有多种强格式数据类型的数据的保留格式加密流程进行了设计,提出强格式数据的保留格式加密通用模型,适用于包含多种类型的数据及复合型数据的保留格式加密。对于数据加密后需要安全提供给第三方进行数据挖掘的应用场景,本课题提出保留段区间属性的大数据保留格式加密方案。面向大数据的FPE方案分为均衡段区间以及非均衡段区间两种,能够实现密文在保留格式的基础上还保留明文所属的段区间属性,大大减小了加密后的密文进行挖掘分析的准确度的影响。另一方面为了提高对海量数据执行保留格式加密的效率,本文基于Spark平台以及HDFS系统设计了基于大数据框架的保留格式加密技术,通过并行计算的方式应对海量数据的加密需求。最后本文为了对面向大数据发布的保留格式加密方案进行验证,搭建了一个基于Spark平台的分布式原型系统,在系统上实现了面向大数据的保留格式加密应用。该原型系统支持对文件夹、TXT文件、CSV文件以及Excel文件执行FPE,根据用户指定的加密方案以及输入的密钥执行保留格式加密。经验证该面向大数据的FPE原型系统有效提升了加密的效率。通过选取公开数据集分别对明文与密文进行挖掘分析后的准确度进行比较,证明保留段区间属性的FPE方案对于类目型数据能够保留原有全部属性,对于数值型属性能够保留一定的特征,减少了传统保留格式方案对属性特征的影响。
其他文献
近年来国产电视剧中往往充满纷繁复杂的斗争,职场剧、宫斗剧、谍战剧大为流行,甚至都市生活剧和家庭伦理剧也乐于拿相互争斗作为宣传噱头,似乎无争不戏无斗不剧。在相当热闹
根据特大型会展建筑的特点,结合工程案例分析总结会展建筑的供配电设计要点,对负荷分类、负荷计算、供电部门确定的供电模式、10kV供电系统和变压器的设置,以及展厅内展沟配
庭前证据的移送方式决定着审判人员庭前审查的范围以及能否对案件产生庭前预断的效果.我国庭前证据移送方式改革经历了一个螺旋式上升的发展过程.庭前证据全案移送方式的重新
其实我们自从工业革命开始,人类对于资源还有能源的开采力度也在随之时间还有生产力的提高而逐步的提升。生产力的提升带来的是对于能源的需求力度也在逐步的扩大之中,但是现
本刊已许可万方数据、重庆维普、中国学术期刊(光盘版)电子杂志社、北京世纪超星信息技术发展有限责任公司在其网站及其系列数据库产品中以数字化方式复制、汇编、发行、信息
口腔粘膜炎是大部分肿瘤患者在接受放化疗过程中极易出现的一种并发症,它常常给患者造成很大的身心痛苦,护理人员应该采取有效措施预防、减轻及消除它的严重性和后遗症,提高
随着公立医院规模的逐步扩大和我国加入GPA(政府采购协议)时间的逐步临近,我国医用设备的采购和管理工作也面临着越来越多的考验。本文通过2006-2008年江苏省进口、国产医用
本论文系统地研究了GH商业银行信贷文化建设这一课题。本论文的展开,主要沿着我国国有商业银行企业文化和信贷文化发展、建设的历程以及当前的现状这条主线,系统性地研究和探讨
<正>山西省是在6月14日召开的全国文化体制改革工作座谈会上作经验介绍的两个省份之一。"要像挖煤一样挖文化,像抓煤炭资源整合一样抓文化资源整合",将文化产业作为经济结构
大量教学实践表明,只有进行目的语文化与本族语文化的比较教学,才能进一步提高学生的文化敏感度,以本族语者的视角构建文化框架,提高异域文化包容度,达到文化习得的最高境界,