外包数据库模式下中文文档密文检索研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
外包数据库模式下,文档数据存放在不可信远程数据库服务器端,由于文档数据的敏感性,需要对明文文档数据加密,但加密后的数据失去了明文所具有的特征,不能像操作明文文档数据那样操作密文文档数据。数据库中大多数操作是以检索为基础的,因此如何对密文文档数据进行准确的检索成为了研究热点。针对两种不同的索引,分别设计了两种密文文档检索子系统:基于逐字索引的密文文档检索子系统与基于关键词索引的密文文档检索子系统。基于逐字索引的密文文档检索子系统通过建立逐字索引来保存明文字符串中出现的字符特征及其相对位置特征信息,在整个检索过程中进行两次检索;基于关键词索引的密文文档检索子系统则是根据汉语的本身特点,将现今发展成熟的分词技术应用到了中文文档的密文检索中,在对明文文档数据加密前对明文文档进行分词并建立关键词索引,当用户基于关键词索引检索时,提取其中的关键词进行检索。用户基于关键词索引检索时,可以检索包含若干关键词的文档而不需要记忆过多的内容,从而改变了传统外包数据库模式下密文检索的方式。通过基于逐字索引的中文文档密文检索方法与文献[18]中的密文检索方法以及本文中两种检索方法的实验对比,结果表明,基于逐字索引的密文文档检索子系统在保证查全率的同时,具有较高的伪精确度和查询性能;基于关键词索引的密文文档检索子系统的伪精确度、查全率与分词算法的准确率有密切关系,在分词算法准确分词的情况下,其伪精确度与查询性能是各种密文文档检索方法中最好的。
其他文献
随着计算机科学技术的高速发展和数字化进程的加快,社会总数据量以指数形式增长。图灵奖获得者Jim Gray提出了一条经验定律:网络环境下每18个月产生的数据量等于有史以来数据
多属性决策是决策科学领域里一个重要的研究课题,已广泛应用于投资决策、项目评估、方案优选、工厂选址、资源分配、投标招标、经济效益综合评价等领域,因此研究多属性决策理
随着自动化测试技术的不断发展,虚拟仪器的应用越来越广泛。虚拟仪器软件结构(VISA,Virtual Instrumentation Software Architecture)是标准化的I/O函数库及相关规范的总称,是计
入侵检测系统是继数据加密、访问控制和防火墙等传统安全保护措施之后的新一代安全保障技术,作为一种积极主动的动态防护技术已成为近年来的研究热点。入侵检测系统在计算机
人类的动作识别作为行为理解的一个方面,逐渐成为计算机视觉研究中一个比较热点的课题之一。同时由于动作识别的复杂性,因此对其的研究还尚在起步阶段。目前已有的一些方法主
随着社会的发展,越来越多的嵌入式电子产品进入人们的生活。对于开发人员来说,在嵌入式系统开发的整个周期,图形界面的开发越来越重要。随着现代电子设备功能的增多和操作方
Symbian作为一种智能手机平台目前得到广泛应用。Symbian编程具有多任务和内存保护的特性。软件的重构和进化是当前软件工程中的重要内容。本文研究了在Symbian编程环境中应
随着传感器技术、微系统技术、无线通信技术以及计算机技术的蓬勃发展,具有现代意义的无线传感网络技术20世纪90年代末首次在美国出现。无线传感网络提供一种新的信息获取模
随着嵌入式技术和计算机网络的飞速发展,人们的生活水平不断提高,人们对家居环境的舒适、便捷及效率要求也越来越高。为了满足人们生活日益发展的需要,智能家居逐渐发展起来
随着互联网技术的迅速发展和普及,各高校、企事业单位以及政府部门都已经拥有自己的门户网站,并逐步开始将其下属的院系、部门网站纳入其主页中,希望实现集群化管理。然而,这些网
学位