论文部分内容阅读
随着我国信息化产业的高速发展,信息资源日益膨胀。全社会各行业在信息化进程中积累了大量的文献资源和电子文档,这些数字化的信息资源需要高效的管理和利用,特别是从海量数据中快速定位和查找指定信息的需求变得越来越重要。全文检索技术为信息资源的检索利用提供了一种高效的手段,但随之而来的信息安全问题也日益凸显,特别是在电子政务和电子商务等涉密领域中,对安全性有很高的要求,具体表现在:1)电子文献是以密文形式存储的,因此必须提供支持密文的全文检索功能。2)索引本身必须是安全的,不能泄露文档信息。为了提高全文检索效率,索引本身往往存储了大量相关信息,因此索引数据必须要进行加密保护,要求在不损失查询能力的前提下,提高索引本身的抗攻击能力,同时要尽量减小对查询速度的影响。3)在支持多用户的信息检索系统中,拥有不同权限的多个用户都可以对共享文档或网络资源进行搜索,但由于用户权限不同,即使输入相同的查询条件,返回的查询结果也应该不同。所以需要在索引中集成访问控制的功能。4)索引加密以后,对索引的动态更新提出了更高的要求,特别是密文索引的更新性能亟待改进。针对索引的安全问题,提出了一种基于物理分块的索引加密方法,该方法对物理磁盘块进行整体加密,混淆了索引的逻辑结构,避免了传统基于逻辑数据加密容易遭受统计攻击和选择明文攻击的缺点,大大提高了索引的安全性。根据查询检索路径,采用对索引数据流按需解密的策略,缩小了解密范围,实现了加、解密过程对索引构造、查询处理完全透明,因此在保证安全性的同时,不会损失任何查询能力。此外,通过利用环形缓冲区和异步流水线技术,并根据磁盘和文件系统的物理特征,选择适当的加密块大小和密钥更新周期,实现了安全和查询效率的良好平衡。为了解决对用户查询请求的访问控制问题,给出了一种基于角色和文档密级的访问控制安全模型。该模型在保证对查询效率影响很小的同时,能实现对查询的安全灵活的访问控制。当用户或角色权限改变时,查询结果能实时的反映这些权限变化;同时,由于引入了角色的概念,用户权限的变更对索引的影响不大,在很大程度上减小了管理和维护索引的负担。为了提高索引维护效率,改进了基于原地更新的索引动态更新方法,该方法为倒排表分配的存储磁盘块不再是“任意”大小,避免了磁盘碎片问题,同时空闲空间不再需要按磁盘地址排序,从而实现了近常数时间复杂度的磁盘空间管理开销。此外,索引更新时保证按照倒排表在磁盘上的物理存储顺序进行更新,避免了大量的随机磁盘寻道操作,大大提高了索引更新效率。最后,在上述研究成果的基础上设计并实现了一个密文全文检索系统原型Mimir,其核心模块基于开源全文检索引擎工具包Lucene编写。并且基于Mimir系统这样一个实验环境进行了密文全文索引构建和检索的性能测试,验证了其效率和安全之间的良好平衡。