XML不完全信息的动态发现

来源 :山东大学 | 被引量 : 0次 | 上传用户:Lucy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络时代的到来,数据越来越多地开始以网络在线的方式进行存储、集成、发布和交换。由于XML具有跨平台,简单易用等特性,在很短的时间内就获得了广泛认同,在众多应用领域中,已成为主要的数据表示和交换的标准。XML作为一种半结构化数据的表示模型,具有很强的信息表现力,它既可以表示结构化的数据又可以表示非结构的数据。但在现实世界中常常存在一些不完全的信息,特别是在数据交换过程中,经常会因为XML模式不同而产生不完全信息。这些不完全信息会对XML数据库中的连接、查询等操作造成不良影响。因此,如何及时的发现XML文档中出现的这些不完全信息,并进行相应处理就变得尤为重要。目前,国内外的研究者针对XML中不完全信息所展开的科研工作主要集中在理论研究上,重点是进行不完全信息函数依赖的规则推理。对于有效的发现有价值的函数依赖以及通过这些函数依赖来补全这些不完全信息,还没有深入的研究。基于目前的研究基础,本文将如何有效的发现及补全XML中的不完全信息作为了研究的重点。通过我们的这些研究,可以进一步增强XML文档表示现实世界的能力,进而推动理论和实际相结合,产生巨大的经济效益。本文通过对一个典型的例子展示了如何对XML文档本身进行分析,找出其中所包含的对于发现不完全信息有帮助的函数依赖,然后使用这些函数依赖发现XML数据中的不完全信息,并进行相应的补全。我们所做的主要工作如下:1.在XML中引入不完全信息的相关概念,即当树节点中存在一些节点的值为空值的情况下,形成一棵不完全信息树,并由此引入了树元组、元组类等一系列概念。2.比较了XML Schema与DTD的优劣,对于为何选择XML Schema作为研究的基础进行了重点阐述。3.针对如何发现有价值的函数依赖问题,本文提出了DiscoverFDs算法,这一算法关注于不完全信息,通过对于XML文档进行属性划分的比较,动态的发现有价值的函数依赖。DiscoverFDs算法是我们进行相关研究的有力工具,是本文进行论述的重点。4.利用上述有价值的XML函数依赖,在XML数据库中可以通过对其数据进行比较分析,使用XMLChase算法进行不完全信息的追赶补全。
其他文献
随着计算机网络的发展,电子文章逐渐繁荣。电子文章版权保护近年来也越来越受关注。电子文章版权保护的一个解决方案是,首先提取一个作者的写作特征,通过写作特征的比较来判
数字显微镜是现代虚拟仪器技术发展的一个体现,是现代虚拟仪器技术与传统光学显微镜的有机结合。随着计算技术与网络技术的发展,数字显微镜系统的开发,将会在以光学显微镜为基本手段的解剖学、组织学、病理学、法医学乃至临床诊断等相关学科领域率先得到应用。数字显微镜除在整合资源、节省资金等方面带来效益外,其最主要的优势体现在促进远程信息交流。数字显微镜技术,将解决现有远程病理诊断系统的弊端,促进远程医疗的发展。
数字信号处理器DSP(Digital Signal Processor)具有强大的数据处理能力和丰富的片内资源,在航空、军事、通信等多个领域得到广泛的应用。然而在恶劣的环境下DSP芯片会出现不
运动目标检测与分割技术是计算机视觉领域的研究热点,也是智能视频监控系统的重要组成部分,其目标提取结果直接关系到后续目标分类、跟踪识别和行为分析等高级视频处理的效果
虚拟植物器官建模是虚拟植物建模的一个重要的研究方向。植物叶片由于其表面纹理的不规则性及高度复杂性,成为了这一领域的研究难点。本课题是以分形理论为基础,结合叶脉的形态
XML(Extensible Markup Language),即可扩展的标记语言,是一套定义语义标记的规范,其目标是能够定义计算机和人都能方便识别的数据类型。随着网络应用的快速发展,尤其是电子
数据流具有数据密集,时效性高的特点,它广泛的应用于卫星定位导航、视频监控、金融业等领域。在数据流的模型中,数据像水管中的流动的水一样,在数据接收端会不停地收到新数据
多关系数据挖掘是近年来快速发展起来的重要的数据挖掘领域之一。多关系分类作为一种重要的数据挖掘技术得到了快速发展,并且被广泛的应用到许多方面,如财务决策、医学研究等
随着计算机图形学的发展,用点云模型作为三维物体在计算机内的表示形式越来越受到人们的重视。一方面点云模型获取简单方便。另一方面,点云模型相比网格模型所占的存储空间少
随着电子技术、计算机技术和软件工程的迅猛发展,航空软件系统在航空电子系统中所占的比例越来越大,并且逐渐成为决定航空电子系统安全和可靠性的重要因素。为了提高航空软件