论文部分内容阅读
云中存储着海量的含有隐私的、高价值的敏感信息。若是这些数据没有有效的手段来对其进行识别和保护,易受到攻击和泄漏。所以如何识别不同类别的智慧体的敏感信息,以及如何保证其安全性是亟待解决的问题。本文提出了基于模糊决策树的敏感信息预测方法来发现海量数据中的敏感信息和基于中国墙的虚拟隔离技术来实现对敏感信息的保护。主要研究内容有:1.基于模糊决策树的敏感信息预测方法。本文将模糊决策树算法引入到了对敏感信息的预测中。对于连续属性的模糊化,主要是通过FCM算法来对待分裂节点内的训练集进行聚类操作,从而形成几个分类区间,属于建树过程中的模糊化。对于分裂属性的选择,采用信息增益作为标准,选择其中值最大的属性当作下一次分裂的属性。对于决策树的规模控制,主要通过停止条件和剪枝算法来实现。最后,通过构建成功的模糊决策树来提炼预测规则,进而实现对敏感信息的预测。文中还通过仿真实验与其他的决策树算法进行了横向对比,可得本算法的错误率相对较低;但是由于其使用聚类算法来模糊化使得子节点数目相对较多。2.基于中国墙模型的虚拟隔离技术。本课题采用动态分集的中国墙模型来实现对云计算环境下敏感信息的隔离保护。在云中,由于资源的高度虚拟化,会使得主客体的身份对换。因此,文中通过引进分集的概念来模糊化主客体的身份,并用分集来包含所有的历史访问信息。首先,规定分集之间是冲突的。其次,对访问过程中的读写规则进行说明。分集可以按照读写规则动态的扩充虚拟资源。最后,通过实验对增加隔离机制前后进行了对比。实验结果表明,增加隔离机制前,敏感信息之间可以相互访问;增加后,敏感信息之间不可以相互访问。此外,分集中数目的变动进行了跟踪,实验结果也符合预期的预测结果。在对云的安全研究中,敏感信息的识别和保护已成为当前研究的热点。本文的主要贡献有:(1)可以在现有的样本空间上构建模糊决策树,获取预测规则,进而实现对敏感信息的预测。(2)在传统的中国墙的基础上,模糊主客、体的关系,可以动态的扩展访问域,实现对敏感信息的隔离保护。