论文部分内容阅读
国家电网数据中心“SG186”工程是国家电网公司“十一五”信息化建设的主要内容,其目标是建设“一个系统、二级中心、三层应用”。一个系统是指构建一体化企业及信息系统,实现信息纵向贯通横向集成,支撑集团化运作;二级中心就是建设公司总部、网省公司两级数据中心,共享数据资源,促进集约化发展;三层应用就是部署总部、网省公司、地市公司三层业务应用,优化业务流程,实现精细化管理。电网数据中心的安全问题是该工程面对的主要挑战。为了解决电网数据中心的安全问题,本文进行了如下研究工作:首先,通过分析电网数据中心的体系结构和数据特征,确定出影响电网数据中心数据安全的3个关键问题,即敏感数据的存储问题、密文数据的查询问题及文本的完整性检测问题。其次,分析了现有元组粒度加密的不足之处,提出了一种支持属性粒度的综合加密方案,分析了该方案的有效性和安全性,给出了综合加密方案在电网数据中心中的密文查询策略和实验验证。再次,针对密文查询问题,分别从不同角度提出了3种适用于电网数据中心密文数据的索引技术,即(1)从数据的查询频率角度提出了适用于电网数据中心的基于非等概率查询的密文索引技术,提高了查询命中率;(2)将方法(1)与等深桶划分索引技术相结合,提出了复合桶划分密文索引技术,使该方法进一步适用于范围查询;(3)从存储的数据类型的角度,提出了MCOP综合密文索引技术,该方法结合了支持模糊查询和关键字查询的映射字符建立密文索引方法和支持等号查询和范围查询的保序加密方法建立密文索引技术,同时分析了该方法的有效性。然后,对于这类普通加密方法下的密文索引技术,给出了电网数据中心的查询和查询优化方法,并进行了实例验证。最后,针对电网数据中心的文本数据的完整性检测问题,选取DAS模型中基于指纹的中文文档完整性监测方法为解决方案。设定了监测粒度参数和噪声粒度参数,采用Hash函数把已经消解噪声的两种检测粒度文本块映射成相应的数值,设计基于窗口的算法从数值序列中提取指纹,并利用定义的公式度量查询文档与数据库中多篇文档之间的重叠度,进而判断查询文档是否为原始文档。在省级电网数据中心的真实环境下,对上述研究工作的成果进行了验证,通过实验结果说明所提出的密文索引技术、综合加密方案及文本数据完整性检测方法的正确性和有效性。