数据库服务模式下的数据安全管理研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:zdp1888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的数据管理模式下,用户自己购买硬件软件,自己管理数据。在经济全球化的今天,一方面,用户的数据量急剧增长;另一方面,用户对数据管理的要求越来越高。这使得传统的数据管理模式下用户自己管理数据的代价越来越高,数据管理的质量也难以保证。随着网络技术的飞速发展和SOA(ServiceOriented Architecture)架构的日益盛行,诞生了一种新的数据管理模式:数据库服务模式(Database-as-Service,简称DAS)。数据库服务模式的提出有效地解决了上述问题。在数据库服务模式下,用户将自己的数据托管给专业的第三方:服务提供商(Service Provider),由服务提供商负责数据的管理。在数据库服务模式下,规模经济降低了用户和服务提供商的数据管理成本,基于Web的数据访问和数据备份方式提高了数据的可用性和可靠性。而且,数据托管方式将用户从繁重的数据管理任务中解脱出来,从而专心于自身核心业务系统的构建。  数据是用户的宝贵财产,尤其是对于金融、保险、电信等大型数据用户。用户虽然将数据托管给服务提供商,但并不信任服务提供商。服务提供商的不可信使用户在数据托管之前心存顾虑。如何保证托管数据的安全性,成为数据库服务模式真正被用户接受的必要条件之一。总的来说,数据的安全管理包括以下两方面:  (1)数据的保密管理。为了防止数据被非法访问,用户在数据托管之前首先将数据进行加密。传统数据管理模式下对明文的数据管理问题转变为数据库服务模式下对密文的数据管理问题。密文的数据管理主要包括:密文检索、密文存储、基于密文的访问控制和密文审计。其中,密文检索是一个十分费时的操作,密文检索将成为整个系统的性能瓶颈。  (2)数据的可信性管理。为了防止数据被非法篡改,查询结果集在返回给用户之前必须进行可信性验证。数据的可信性验证包括三个方面:真实性、完整性和最新性。真实性指的是数据确实来源于数据所有者且未被篡改过。完整性指的是所有满足查询条件的数据都包含在结果集中。最新性指的是数据必须体现最新的用户修改。一个完备的数据验证方法必须能够同时验证上述三个方面。同时,高效的数据验证方法还需要尽可能的降低验证代价。  针对数据安全管理的上述两类问题,现有研究提出了大量的密文检索方法和数据验证方法,在数据的安全管理方面作出了有益的探索。但是现有研究也存在以下不足:在密文检索方面主要集中在一维范围查询上,提出了大量的密文检索方法,这些方法要么不能应用于多维范围查询,如保序的加密算法,要么会带来信息泄密的大大增长,如基于一维分组的密文索引;在数据验证方面,主要集中在静态环境下的数据验证和明文数据验证上。同时,验证主要集中在一维范围查询上。验证效率也需要进一步提高。针对现有研究的上述不足,提出改进的一维分组方法和三类多维分组方法,提高了一维范围查询和多维范围查询的检索效率;提出了两类新的验证数据结构,有效提高了动态环境下的密文验证效率。具体来讲,本文的主要贡献如下:  (1)提出了对分组安全性和分组效率的评价指标。在衡量分组安全性时,既考虑到分组内的元组数和分组在多维空间的覆盖度,又考虑到分组内的数据分布。在衡量分组效率时,既考虑了查询误报率,又考虑了分组之间的空间位置关系。  (2)提出了局部重叠的一维分组方法。在已有的一维分组研究中,分组与分组之间通常是不相交的,而研究表明分组之间的局部重叠度可以在保证分组效率的同时提高分组安全性。整个分组算法包括两个阶段:第一阶段采用不相交的分组方式,如等深分组,进行数据划分,分组方式的选择必须能够保证组间安全性;第二阶段针对不满足安全评价指标的分组,选择合适的分组进行局部重叠的分组划分。因为局部重叠的最优分组划分是一个NP-hard问题,提出基于启发式规则的近似最优算法。实验结果表明,算法在不同的数据分布和分组大小下均可取得较好的效果。  (3)提出三类多维分组方法:自底向上的多维分组方法、基于聚类的多维分组方法和基于分层的多维分组方法。其中,自底向上的多维分组方法中,首先将多维空间划分成单元格,然后按照一定规律扫描单元格,并通过单元格合并的方式实现局部最优分组。基于聚类的多维分组方法针对数据在多维空间分布的整体稀疏性和局部密集性,首先将多维空间的数据进行聚类,然后在每一个聚类内选择单元格进行分组。由于单元格的选择顺序对分组效果的影响很大,在随机选择方法的基础上,提出了两类改进的方法:基于距离的方法和基于Hilbert曲线的方法。实验结果表明,基于距离的方法能够同时减少分组内的元组数和分组覆盖度。基于分层的多维分组方法是一种自顶向下和自底向上相结合的多维分组方法。首先将多维空间进行自外层向内层的逐层划分,然后在每一层内采取自底向上的方法进行分组。实验结果表明,分层方法的分组重叠度和查询误报率都低于单纯的自顶向下方法和自底向上方法。  (4)提出基于Skip list的验证数据结构,支持对明文数据的一维范围查询验证。Skip list是一个基于概率平衡树的内存索引结构。已有的基于MHT的验证数据结构适用于静态环境下的数据验证,在动态环境下的维护代价很高。而提出的基于Skip List的验证数据结构方法维护代价低,验证效率高,适用于频繁更新的应用环境。实验结果表明,基于Skip List验证数据结构的构建代价和维护代价都大大低于MHT;验证代价和Skip List中每一层结点向上跳的概率密切相关。当选择合适的概率时,方法的验证效率略高于MHT。  (5)提出基于分组的结果集验证方法。通过引入分组验证码,支持对密文数据的多维范围查询和聚集函数查询验证。其中,支持的聚集函数包括SUM、COUNT、MIN和MAX。从验证效率上看,该方法一次验证一个分组的数据(一个分组包含多条元组);而传统的验证方法一次只能验证一条元组。为了提高聚集函数查询的验证效率,提出基于分组空间位置关系的剪枝策略。实验结果表明,剪枝策略能够大大减少需要验证的分组数。此外,通过对分组验证码的增量式维护,提高了动态环境下的验证效率。
其他文献
新传感网产业物联网(The Internet of Things)的再一次盛行和IBM“智慧地球”的提出,将再一次把无线传感器网络(Wireless Sensor Network)的发展推向新的高潮。良好的WSN仿真
基于质谱技术的蛋白质鉴定方法已经成为蛋白质组学研究中的主流方法,而分析质谱数据的常用方法主要是数据库搜索技术。在数据库搜索中,肽段母离子信息的准确性决定着鉴定结果的
人们越来越认识到,现实世界的经济、金融、社会、生态等复杂动态系统的一些关键特征往往潜伏在系统中,它们只能够被直接在定性层面上建模,进而被理解和预测。因此,为了分析这些系
学位
本论文的课题背景来源于“宁夏电子图库综合决策支持系统(NXDSS)”。研究的主旨是利用微软基于SOA软件体系结构的开发技术——WCF设计实现面向服务的软件体系架构的决策支持
本论文以一套鞋服DRP系统的开发为例,探讨如何将DRP(分销资源计划)管理理论应用到鞋服分销的实际管理中以实现分销管理的信息化、科学化、智能化,并阐述了基于.NET构建多层体
学位
保护内核的完整性是构建可信操作系统的最根本的安全目标之一。至今通用操作系统仍因其自身的安全漏洞而频繁受到恶意攻击。内核模块的安全漏洞给了攻击者可以控制或破坏整个
排课问题是一个有约束的、多目标的组合优化问题,并且已经被证明为一个NP完全问题。运用计算机进行自动排课既是高校教务管理的迫切需要,同时也有重要的理论意义。   遗传
学位
随着计算机网络技术的发展,人们的生活也越来越依赖计算机网络。由于计算机网络本身的设计缺陷和开放性特点,网络安全问题变得日益严重。入侵检测技术是继“防火墙”、“身份认
近年来,随着互联网的快速发展,人们所面临的信息量呈爆炸式增长,传统的信息处理方式受到了极大的挑战。在此背景下,推荐技术作为目前最有效的信息过滤手段之—受到了越来越多的关
本论文基于深度学习的方法对问答领域的两个重要的问题进行了相关的探索与研究。第一个研究问题是问题意图层次分类,对于类别为层次结构的问题意图,设计模型充分利用类别间的层