基于XML的概率数据模型研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:aa1bb1aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类认知存在的局限性、信息描述的差异、度量的误差以及数据的动态变化等等,往往会产生许多不确定的数据。而随着不确定性研究的深入,未来世界的不确定性特征逐渐得到现代学术界的普遍认可。但是传统的关系模型对不确定数据的表示与存储缺乏处理,因此,有关概率数据模型的研究受到了广泛关注,首先出现了基于关系的概率数据模型,但其结构化的特点决定了它不适用于存储和处理概率数据。网络技术的蓬勃发展,更加增加了数据的多样性和不确定性,这些数据往往有着不同的结构,不同的来源,以及不同的产生原因,所以各数据源之间的规模、可信度与可用度往往也存在较大的差距,因此需要有新的比结构化方式更适宜的存储方式。随着XML的出现及快速发展,XML已经普遍用于Web上的数据表示与交换,而且XML的半结构化、自描述性好及可扩展性高等许多优点,使其在概率数据表示上与关系概率模型相比较占优势。目前已有基于XML的概率数据模型的相关研究,但已有模型的查询操作多局限于单个数据源,对于多数据源情况下的概率数据的管理却缺乏研究。不同来源的数据,其规模、可信度,以及数据的有效时间,生成时间以及数据源被查询引用的次数等等,这些信息都应该对多数据源下概率数据的管理产生影响,而不应被忽略。本文在已有模型思想的基础上,提出了一种扩展的基于XML的概率数据模型。新模型使得概率查询操作不再局限于单个数据源,而是充分利用各数据源自身的信用度、规模等信息,支持多数据源情况下XML概率数据间的归并与查询操作,从而可以提供更加真实有效的信息。本文的主要工作如下:(1)讨论了不确定性数据的产生途径,并对概率数据模型的研究现状进行了分析,分别总结了基于关系与基于XML两大类概率数据模型的特点与不足。(2)根据已有模型的思想,提出了一种扩展的基于XML的概率数据模型,给出新模型的形式化定义及其所要满足的DTD描述,分析其单实例查询及多实例归并与查询的实现方案与算法。此外,新模型还解决了用XML表示概率数据所引入的数据依赖问题。(3)对新模型的性质进行分析,证明新模型的操作在该模型上的封闭性,兼容性与统一性等。(4)对模型的实现架构与实验环境进行讨论,通过实验,对新模型的查询归并等操作的性能进行了分析。
其他文献
面向对象模型是基于面向对象的设计方法而建立的模型,是面向对象的核心思想,它模拟人的思维方式,尽可能地使程序的结构和实现与其所描述的现实世界保持一致,亦即充分保证计算
随着互联网技术与应用的迅速发展,Web服务作为部署在互联网上的组件,展现出良好的封装性、松耦合性以及跨平台性。因此,Web服务迅速成为了人们关注的焦点。近年来,互联网上出
随着web的迅速发展,人们从互联网上可以获取资料变得越来越多。与此同时,互联网也以其巨大的信息量给人们带来了前所未有的冲击。在用户利用web搜索引擎查找信息的过程中,往往出
无线传感器网络是一种新型的、无基础设施的、自组织的无线网络。近年来随着微电子技术、传感器技术及通信技术的发展,无线传感器网络技术发展迅猛,进展很快,而且在军事与民
Web2.0作为新一代互联网时代有着比Web1.0时代更为鲜明的特征和更广泛的用户群。在Web2.0浪潮迅猛发展的过程中,数据库管理已经成为各大Web2.0公司的核心竞争力。因此,开发基
计算机辅助设计开始发展于20世纪60年代,在工业设计中扮演着非常重要的角色,已经广泛的应用于工业设计的各个方面。随着科技的发展与时代的进步,人们对产品外观造型的要求逐
随着Web的迅猛发展,因特网上的资源越来越丰富,已经成为一个巨大的全球化信息仓库。Web上的资源不仅包括传统的有严格数据模型的数据库,如关系数据库和面向对象的数据库,而且
迁移工作流技术是近年来基于移动agent技术提出的一种新的工作流研究方向,特别适合需要频繁地传递大量数据,以及需要大量调用远程服务的分布式并发处理过程。文献提出了一个
形式化方法(Formal Method)基于严格的数学理论,能产生精确、无二义性的形式规约,为软件开发提供了严格的数学基础,对提高软件的可靠性有着非常显著的作用。形式化方法要求开
语义网(Semantic Web)是对现有Web的扩展,其目标是使Web上的信息具有计算机可以理解的语义。而本体(Ontology)则描述了其中的语义,本体在语义网中起到了重要的作用。由于语义