论文部分内容阅读
随着数据仓库技术日趋成熟,数据仓库海量数据的分析与挖掘备受关注。一些用户出于其非法目的,希望获取隐藏于数据仓库中非授权的敏感数据,这成为制约当今数据仓库深层次应用的关键“瓶颈”。因此,数据仓库信息安全控制问题已逐渐成为数据仓库海量数据集成、处理与应用的核心问题之一。
在数据仓库安全体系中,数据仓库使用多维数据模型,而多维数据模型依据维度、层次、级别可以实施安全保护。尽管数据仓库安全模型的建立和访问控制策略的实施,也能够严格防止用户进行非授权访问,但是恶意用户可能通过单维度级别之间偏序关系或多维度之间聚集关系,从合法获得的已知数据中推导出受保护的、禁止访问的敏感数据,从而造成敏感数据的泄露。这种推理路径就称为“推理通道”(Inference Channel)。
目前,国内外在有关数据仓库推理控制研究方面,不但研究成果相对较少、研究切入点比较分散,而且也存在着一定的不足和缺陷,主要表现为:
1、仅将中心立方体视为敏感数据,而忽视细粒度汇总方体也可能是敏感信息;
2、仅针对一种或两种聚集查询(如:SUM或COUNT),而没有考虑其他OLAP聚集操作,例如MAX、MIN等操作可能导致的推理;
3、仅对推理控制方法进行研究,而很少结合访问控制机制对推理控制系统进行设计并实现。
本文在现有国内外研究成果基础上,研究一种基于数据立方体的推理控制方法。该方法采取了一种先预防多维推理,后清除一维推理的推理控制策略,有效地降低了传统推理控制策略(即先检测推理,后消除推理)的算法复杂度。
此外,本文在充分研究数据仓库推理控制方法的同时,也结合基于角色的数据仓库访问控制模型,对数据仓库推理控制系统中安全功能模块进行了分析和设计,构建了一种访问控制和推理控制相结合的数据仓库安全模型及实现原型。
经原型实验验证,本文算法能弥补仅采用访问控制安全机制的不足,所设计的数据仓库推理控制实现框架可为数据仓库安全控制体系的深层次研究与实现提供可靠的基础设施。