论文部分内容阅读
在储存海量数据的数据仓库中,由于其潜在的数据价值随着数据挖掘技术的发展与应用而被各研究领域所关注,包括商业、军事及科研等,涉及范围广泛,随着数据仓库安全性问题也得到越来越多的专家、学者的重视。访问控制机制已不满足数据仓库的安全需求,推理控制技术成为弥补访问控制机制自身安全性不足的关键技术,所以对数据仓库推理控制技术的研究具有重要意义。
近年来,数据仓库中推理控制技术是以基于格的推理控制技术为研究重点,主要研究方向表现在两方面,一是方法上从静态推理控制到动态推理控制方法的研究动各;二是推理粒度不断变细,即从方体推理粒度到单元推理粒度,再到切片推理粒度。其主要目的是提高在线联机分析系统的安全性、可靠性和实用性。但动态推理控制方法的研究只见于多级安全数据库,数据仓库中并未涉及,切片粒度的推理控制方法也未形成主流技术。
本文在研究格的推理控制原理基础,在方法上提出以方体为推理粒度的动态推理控制方法,并给出相应的算法及实验结果;在推理粒度上,进一步地将方体推理粒度细化到切片推理粒度,提出以切片为推理粒度的动态推理控制方法,并区分其与方体为推理粒度的不同;最后提出格间存在推理通道的问题,并证明其存在的威胁,针对这些威胁给出相应的格间推理控制算法。文中对这三种算法都做了相应的形式化描述,及给出其推理控制的典型例子,结果证明它们很好地解决了数据仓库中存在的推理问题。
最后,为验证算法的正确性,利用某高校的教务数据构建数据仓库,开发一套小型的推理控制应用系统,并结合访问控制技术与静态推理控制技术及文中提出的动态推理控制技术,应用到该推理系统并比较它们在安全性、有效性访问上的不同。实验结果表明,动态推理控制技术与静态推理控制技术都能确保数据仓库的安全性,前者在实际应用中更符合主体的访问需求,并能进一步提高主体的有效性访问。