论文部分内容阅读
网络技术的快速发展和信息共享系统的大量应用,为现实社会生活提供了许多基于网络信息传输和访问的增值服务,然而用户在享受便捷服务的同时,数据库中个人隐私数据泄漏的风险也随之不断增加,为此美国等国家发布了HIPAA和OECD等对隐私信息合理访问控制的规范。为在数据库中融合这些隐私控制规范,同时也考虑到现有的数据库访问控制技术在面对开放环境、动态应用场景以及突发紧急情况下的数据访问控制有其局限性,所以在VLDB2002会议上,IBM Almaden Research Center提出了隐私保护数据库(Hippocratic Database)的框架与概念,提出了基于访问目的(purpose)的隐私数据访问控制技术,在数据库中将数据访问目的(data_purpose)作为访问控制的元数据。但是随着实际应用场景的深入,由data_purpose元数据构建和融合过程而引起的隐私数据查询泄漏问题也逐渐暴露出来。本文主要针对基于访问目的(purpose)的访问控制机制存在的问题,围绕构建动态应用环境下隐私访问控制策略模型、构建应用系统整合后基于融合purpose的隐私访问控制机制、构建XML数据模式下基于purpose的访问控制,以及开放环境下构建对分布隐私数据的访问控制四个方面,对在不同应用环境下的隐私访问控制问题做了一些探索和研究,以构建在复杂应用和动态应用环境下的隐私数据访问控制机制。主要研究工作如下:1.构建动态应用环境下隐私访问控制策略模型。提出了一个关系数据库上的基于data_purpose概念分层的隐私数据访问控制机制R-PAACEE。R-PAACEE模型中data_purpose是一个表示隐私数据在何种情况下可访问的标签,data_purpose的层次数据模式作为隐私数据的一个属性,并以此生成多个data_purpose与一个隐私数据对应的元数据模式;同时将access_purpose作为元数据的一个属性,表示用户的一个最小查询需求,并以data_purpose与access_purpose的匹配来实现面向隐私的访问控制。实验表明在已加载隐私数据访问控制机制的数据库上作查询,能有效控制隐私数据查询泄漏,且查询时间开销并不大。2.构建应用系统整合后基于融合purpose的隐私访问控制机制。提出了data_purpose树的路径是隐私数据的传递通道,引入了显性隐私度和隐性隐私度的计算模型,评估一个基于purpose查询可能带来的隐私泄漏风险。首先提出合并后的data_purpose是一棵隐私泄漏风险树,给出了树结点隐私风险度的计算模型。其次将隐私泄漏风险树分解成一棵风险平衡树和一组风险路径。一个查询被改写为先对风险平衡data_purpose树的查询,再对风险路径查询,以此达到隐私泄漏风险最小的安全查询结果。实验证明机制的执行并没有在查询时间上带来更大的开销,并降低了由应用整合引起访问控制机制不平衡所带来的隐私数据泄漏风险。3.构建XML数据模式下基于purpose的隐私访问控制机制。提出了XML模式的隐私访问策略是一棵最小安全访问树。最小安全树是一组无冗余的以XPath片段表示的路径表达式,指向XML数据模式中一组隐私结点,它是隐私数据访问路径的约束。最小安全树冗余路径的计算采用了XPath片段包含判别技术。实验表明基于最小安全树的隐私访问控制,能解决XML模式下由数据层次关系带来的隐私数据查询泄漏问题,且最小安全访问树生成时间取决于XML树中隐私结点的标注时间和隐私路径冗余包含的判别时间。4.开放环境下构建基于purpose的对分布隐私数据的访问控制机制。提出从分布控制模式中挖掘集成访问控制模式,用熵计算相同控制度下一组集成模式的信息量,并以此信息量作为选择集成访问控制模式的依据。实验表明本文提出的基于完整路径约束和路径上边顺序约束的算法MSegMeta能快速发现分布隐私策略的集成访问控制模式,同时控制模式也可成为机构调整XML模式隐私数据组织的参考。