大数据环境下隐私索引方法的研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhangzjc1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据挖掘和分析是实现大数据价值的基础,而大数据查询则是大数据分析的基础,所有大数据挖掘和分析技术都需要通过大数据查询来实现。然而,在大数据时代,数据的存储结构、内在关系及访问方式均发生了较大变化。数据主要以KV键值对模式存储,而大多数查询索引结构是以key为关键字进行查找,无法高效地支持非key查找方式。因此,为了满足用户的多样化查询需求,同时提高数据查询处理的效率,在大数据管理系统中建立以非key为关键字的索引结构是必要的。但是,非key属性常常包含了数据的敏感信息,防范敏感信息泄露是数据查询及分析的基本要求,然而在大数据查询中,现有的数据隐私保护技术往往难以有效应用。本文基于大数据环境的典型特征,针对以敏感信息查询过程中的用户查询隐私泄露问题和数据拥有者的数据隐私泄露问题,对大数据的存储结构和查询方式等进行分析和建模,利用信息加密算法设计了一种敏感信息存储结构SILL。并结合SILL结构提出了 一种新的以非key为查询关键字的具有敏感信息保护的PP-Tree索引结构,同时设计基于PP-Tree的数据查询方法,实现对数据隐私保护和用户查询隐私保护的目标。本文的研究,在保护敏感信息不被泄露的情况下,实现了针对非key的快速查询,提升了对敏感信息查询的效率。理论分析与测试结果表明本文提出的PP-Tree索引结构能够在保护敏感信息不被泄露的前提下,有效地提升针对非key的查询效率,准确率达98%。该索引的研究为保障大数据查询中隐私保护提供了理论方法和技术手段,对推动大数据产业健康快速发展具有重要意义。
其他文献
随着科技的发展及生产需要,高速、超高速、大容量的电力驱动得到了越来越广泛的应用,但随着转速的升高转子的离心力也随之升高。传统转子永磁型电机的永磁体的固定变的越发困
随着移动设备的广泛普及和移动互联网的快速发展,传统的互联网应用向移动互联网方向转变。由于移动端本身资源和网络条件的限制,其各方面处理能力较弱,所以减少冗余数据,节省
并联机器人机构自上世纪30年代出现至今,已经发展了几十年,其具有承重能力强、刚度大、动态特性好等特点,使得应用领域逐渐拓展。在不同的使用领域,并联机器人的驱动方法和材
本文以虎龙斑幼鱼为实验对象,分别通过转录组学技术和细胞学技术来研究精氨酸促虎龙斑生长、免疫机制及虎龙斑中谷氨酸是否能合成精氨酸。1.虎龙斑中谷氨酸-精氨酸合成研究本实验设计了4个细胞培养实验,将虎龙斑肠道、体肾细胞加入不同的培养基中孵育,检测细胞和培养基中游离谷氨酸、鸟氨酸、瓜氨酸和精氨酸含量。基础培养基为含有双抗(100 IU mL_1 penicillin,100 μg mL_1 strept
近年来,随着石油等化石能源的日益匮乏以及汽车尾气排放导致环境日益恶化等问题愈发严重,包括中国在内的世界各国相继出台了适用于本国国情的油耗法规,以实现对汽车油耗量的限制。在此背景下,能够实现节能减排目标的汽车48V电源系统成为当今的研究热点。汽车48V系统由原来12V电气网络和新型48V电气网络共同构成,双向DC-DC变换器作为连接两个网络的桥梁,对整个系统的体积、重量、成本以及性能都有非常大的影响
近年来,智能手机普及率的增长加快了移动互联网技术的发展,传统互联网服务模式正朝着移动互联网方向迅速发展,数字校园服务就是其中之一,移动数字校园凭借智能手机终端的高普
电力系统中,能量转换电路的开关控制问题很重要,可通过电力电子变换器的各种不断改进的控制理论来解决。直流-直流变换器的控制理论包括滑模控制理论、线性平均控制理论、反
随着我国经济和社会的发展,人们对建筑空间需求越来越大,大跨度结构建筑得到了飞速的发展及应用。传统的钢筋混凝土梁结构和钢结构,都有其局限性,随着不断深入的研究工作,为了实现
随着移动互联网技术的发展,移动智能设备迅速普及。Android系统是全球市场份额最多的移动操作系统,而由于其系统的开源性和应用易获性,使得攻击者通过逆向和重打包技术很容易
20世纪30年代世界经济大萧条后,产出稳定作为一国经济持续增长的重要前提的观点被广泛接受。产出的剧烈波动对国家稳定和社会福利也有着十分不利的影响。学界对于产出波动决