论文部分内容阅读
尽管关系数据模型为数据库提供的优势远超过其他数据模型,但它缺乏一种处理非确定性数据的综合方法,而数据的非确定性充满我们整个现实世界环境中,并愈来愈引起人们的注意,如数据整合、数据抽取、科学数据管理、多媒体应用以及知识学习等都有充斥着非确定性数据。目前,已经提出了几种非确定性数据库模型,但都没有建立起一种可接受的扩展关系模型。本文基于证据理论提出了一种关系模型的扩展方案,提出一种改进的关系结构和扩充的关系代数,能有效地处理非确定性数据。本文首先介绍了非确定性数据库的研究的背景和相关研究现状,介绍了非确定性数据的定义和分类。通过分析不同类型的非确定性数据,介绍了扩展关系数据库系统处理非确定性数据的挑战。并详细介绍了斯坦福大学提出的非确定性数据库模型ULDBs,描述了ULDBs如何表示非确定性数据,介绍了数据沿袭的概念,并与非确定性数据如何结合,ULDBs是非确定数据库模型的一个重大成果。在分析ULDBs非确定性数据库模型后,本文把证据理论引入关系数据库系统来处理非确定性数据。基于D-S证据理论,本文提出了DSRM非确定数据库模型,并把该模型定位于表示主观非确定性数据。该模型中共应用八种表示法来分别表示不同情形下非确定性数据,同时把不同情况下的空值当作证据统一到D-S证据理论来处理,解决了非确定性数据库中空值的处理。DSRM模型中提出元组置信度概念。在扩展关系代数的基础上统一了查询算法,提出新的D-S证据理论合成规则应用于DSRM数据更新。主要研究成果如下:在D-S证据理论的基础上,用八种表示法分别表示不同情形下非确定性数据,提出非确定性数据库模型DSRM。在分析关系数据库中空值存在的不足基础上,把空值划分为相对空和绝对空,去除了关系数据库系统中空值的概念,把空值纳入D-S证据理论统一处理。扩展关系代数。给出新的适合DSRM的证据合成规则,解决数据更新问题。给出统一数据查询算法,让非确定性数据的查询基于同一法则。