基于中文关键字的密文模糊检索技术研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:yudanlei198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前这个信息网络飞速发展的时代,全球范围内信息数据正朝着网络化平台发展,用户间的数据共享交流变得更为实时和便捷。随着行业领域的不断发展和变革,产生的数据越来越多,数据量正呈指数级增长。传统的数据存储和使用方式已经无法满足用户的需求,越来越多的数据被迁往云服务器,然而由于云服务器和用户处于不同的可信域中,存在一定的风险。为了保护用户数据的安全和完备,防止敏感信息的泄露和抵挡恶意攻击者的攻击,一般选择将数据加密后以密文的形式保存到云服务器。利用云服务器庞大的存储空间和强大的运算能力,可以实现数据快速检索。传统的密文检索方案是通过对关键字的精确匹配来实现的,其没有容错性,错误的输入导致错误的输出。而在实际检索过程中,难免会遇到用户输入的检索请求存在错误的情况,如何在保证高效检索的前提下,提高检索的查全率和查准率是密文模糊检索研究的方向之一。本文旨在解决中文关键字的密文模糊检索问题。首先,分析了使用现有的模糊集构造方法对中文关键字构造模糊集时可能存在的问题。结合中文汉字的音形表意特性,提出了基于中文关键字的易混淆拼音模糊集和形近字模糊集构造方法,从而提高了模糊集的容错性。然后通过分析传统的明文倒排索引结构,结合改进后的关键字权重计算方法,设计了一种能抵抗语义分析的索引结构。在索引加密时,采用保序加密的方式进行加密,既能抵抗统计分析又能提高检索准确度。其次,对密文模糊检索方案进行了研究,在本文提出的索引结构的基础上,给出了相应的加密机制和密钥管理方法。使用特征多叉树的形式来实现密文索引并完成检索,使得具有相同前缀的序列位于同一节点下,缩小了索引存储空间的同时提升了检索性能。在结果集排序时,结合模糊集中关键字的模糊度和权重值对结果进行排序。最后,根据关键字模糊集构造方法和密文模糊检索方案,设计了一套支持中文关键字的密文模糊检索原型系统,分析了系统的检索效率和性能,并对模糊集和索引的规模及构造时间等进行了测试分析。
其他文献
本文全面阐述了“基于多视点采集物体图像以实现三维重建”步骤中的特征点提取以及立体匹配问题的研究与实验。特征提取是利用计算机视觉算法,从图像中提取计算机可以识别的
单片智能功率芯片将逻辑电路、信号处理电路、驱动电路、保护电路及功率器件等集成在一块芯片上,可实现对电机的高效、快速、准确及可靠控制,应用前景非常广泛。绝缘体上硅横
随着我国城镇化步伐不断加快,农村大量剩余劳动力转移到城市,在农村不少土地因无人耕种而被撂荒。为推动土地集约化使用,提高土地经济效益,作为实现农村土地规模化经营和效益
企业的长足发展,需要内部各个环节的良好组合,尤其是人力资源的潜能发挥。要达到人力资源的优质使用,人与岗位的相互匹配是其中首要环节。通过研究国内外人岗匹配的先进经验,
定位技术是近年来热门的研究领域。通过各种定位方法,研究者可以收集到用户的定位地点以及运动轨迹。这为我们深入挖掘用户的行为模式并分析出用户可能的兴趣选择提供了新的
高速公路小修保养工作绩效考核可为公路管养部门的养护质量和管理效率的定量化考评提供科学性手段,是公路管养部门实现“十三五”公路养护管理发展纲要目标的关键环节之一,也是推动我国公路养护管理现代化发展建设的重要保障。同时,对优化养护投入资源配置、加强养护质量、提升养护管理水平具有重要意义。本文针对目前我国高速公路小修保养养护现状,深入分析陕西省交通建设集团所辖高速公路的养护管理模式,通过探索大量国内外已
由于移动互联网的持续发展,移动应用越来越多地渗透进我们的生活,随之而来的是无法避免的移动用户隐私泄露问题。用户真实位置隐私泄露问题更是引起了较为广泛的关注,很多移
自噬是细胞在各种代谢压力下的一种应激性反应,自噬发生以后,细胞内的蛋白、细胞器被双层膜结构的自噬体膜包裹后形成自噬体。随后,自噬体与溶酶体融合、被包裹物在各种酶的
在当今知识经济、全球制造的新形势下,客户对产品质量和制造周期要求越来越严格,产品“批量小、品种多、周期短”的特点在市场中凸现的愈加明显。要求企业快速的调整市场策略
近几年来,市场竞争日趋激烈。企业在谋取生存求发展的竞争环境下,只有尽量缩短产品的交货时间或尽量提早新产品的上市时间(T)、提高产品的质量(Q)、降低产品的成本(C)和提高