语义驱动的XML规范化研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:shifujia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已经成为W3C制订的Web上的数据表示和数据交换的标准,需要通过Web交换和处理的XML数据在大幅度的增加,这就对XML的数据模式提出了更高的要求。设计一个好的Schema的中心目标之一就是减少数据冗余:冗余信息不仅仅浪费了我们的存储空间,增加了数据传输和维护操作的成本,更重要的是,这些数据冗余可能导致潜在的更新异常,引起数据库的不一致。由于Web的开放性,XML数据异常的危害性要远远大于关系数据异常的危害性。本文首先从语义的角度出发,对XML数据的语义约束进行深入的研究,并设计算法,对XML数据进行规范化处理,从而得到良好的XML数据模式,减少了数据冗余,保持了数据的一致性。因此,XML模式规范化的研究具有重要的理论意义和实用价值。本文的主要工作是在已有的XML Schema等规范基础上,从语义角度对XML数据进行规范化研究,主要研究成果如下:①研究形式化的XML文档定义,以及XML Schema中的语义约束,研究基于路径和树元组的XML函数依赖、间接函数依赖和传递函数依赖的概念,并定义了XML函数依赖的逻辑蕴涵与覆盖,证明其有效性和完备性。②基于XML函数依赖的形式化定义,研究并给出XML不同级别范式的定义,即确定XML文档规范化的标准,以达到消除语义二义性、最小化冗余及保持数据一致性和可维护性等目标。③基于以上研究,提出一种基于函数依赖的XML冗余检测算法,以有效地检测文档中存在的冗余数据,并对算法的复杂度进行分析。
其他文献
税控收款机作为税收电子化的“咽喉要道”,是最重要的税收工具,它的推广和应用关系到国计民生,对于帮助国家税收征收和稽查具有决定性的意义。我们研发的税控收款机在满足国标要求的前提下,采用“S3C44BOX CPU+μClinux"的方式来实现主要外设功能,降低了系统成本,具有较高的性价比和竞争优势。本文首先研究了国内外税控收款机发展状况,指出目前市场上流行的税控收款机的不足,结合我国税控收款机的国家标
基于OGSA体系结构的网格本质上是面向服务的网格结构,服务网格的提出为网格技术的发展提供了一种新思路,使用Web Service的技术标准实现网格内部以及网格之间的异构协作。但是W
随着多媒体技术和网络组播技术的飞速发展,越来越多的内容提供商选择组播网络作为多媒体内容的发布平台。而在组播环境下的数字产品的版权保护问题也变得越来越尖锐。组播指纹
线性辨别分析算法在目标识别、图像降维和特征抽取上已经得到了广泛的应用。近些年来,国内外的许多学者将特征抽取和模式识别的研究重点放在了流形学习领域,希望通过在目标空间
对等网络(P2P,peer-to-peer)因其独特优势逐渐成为Internet中最重要的应用系统之一,但其开放、匿名、以及节点之间松耦合的特性使得节点可以恣意散布非法内容,滥用网络资源,
由Kobliz和Miller提出的椭圆曲线密码学是密码学中一个具有重要意义的研究课题。椭圆曲线上的双线性对在椭圆曲线密码中起着重要意义。一方面,椭圆曲线上的双线性对被用来攻击
D.F.Specht提出的概率神经网络(Probabilistic Neural Network, PNN)是基于贝叶斯决策理论与Parzen窗概率密度估计方法而建立的一种分类网络。PNN的训练过程简单,算法容易设
随着网络带宽的不断提升,单台服务器远远不能达到高性能、高可用性、高伸缩性的性能标准,因此,利用负载均衡技术使多台服务器协调工作、为用户提供一个良好的高效的网络环境成为
随着计算机与网络技术的普及和推广,工作流技术的研究与开发成为了一个新的热潮。但是,由于工作流是新兴领域,现有的工作流的技术研究还不够成熟,所以工作流安全方面的研究,
传统的分类问题通过对大量有标记的训练样本进行学习,从而建立用于预测无类别标签的样本的模型。但在许多实际的分类问题中,如图像分析、网页分类、疾病检测、信用评级等,所得到