【摘 要】
:
XML自出现以来,就以其强大的跨平台交换的能力、数据表达能力以及简单、开放性、可扩展等优点而逐渐成为互联网上信息发布和交换的事实标准。由于XML数据的开放性,特别是网络
论文部分内容阅读
XML自出现以来,就以其强大的跨平台交换的能力、数据表达能力以及简单、开放性、可扩展等优点而逐渐成为互联网上信息发布和交换的事实标准。由于XML数据的开放性,特别是网络上海量的XML数据的出现,对XML数据进行有效地管理、查询等操作的要求也越来越迫切。与此同时,各种各样的XML包含的语义如何在不同的web环境和数据永久化存储模式下无损的交换,也是XML理论研究中提出的很现实的问题。对XML而言,一个公认的问题是只有语法意义而缺乏语义信息。为了解决这个问题,研究者们提出了各种各样的语义约束。虽然XML已经作为数据交换的主要格式和标准而应用于各行各业,但是在实际的应用中,为了有效地利用关系数据库成熟的数据管理功能来处理XML数据,并且能够利用基于关系数据库的应用系统,通常需要把XML数据存储在本地的关系数据库中。在提出XML语义约束后,当用关系数据库存储XML文档时,如何把这些语义约束信息映射到关系数据库中是一个重要的研究课题,具有较高的理论价值和现实意义。本文对上述几个方面的问题进行了相关的研究,具体地说,本文的主要贡献和创新之处在于:系统的介绍了XML的基本知识,理论和实际应用,介绍了XML具有的优势。通过比较关系数据库模式和XML模式,分析了现在XML模式在表现语义约束方面的缺陷,提出了理论研究的方向。介绍了研究XML语义约束和函数依赖的前提,通过介绍DTD和XML Schema来建立研究的基础,并且限定在DTD上进行相关的研究。建立了XML的函数依赖的理论系统,并给出形式化的定义,给出了研究XMLDTD的形象化的DTD结构图的建立方法。通过研究XML函数依赖的蕴含问题,使得XML的函数依赖可以通过最小化的覆盖进行研究,在保证相关函数依赖不损失的前提下,减少函数依赖处理的代价。在前面研究的基础上,提出了通过XML函数依赖来发现XML数据中的冗余并通过XFD的分类进行冗余的研究,在此基础上设计了XFD的发现算法,以有效的捕捉XML数据冗余,并在其后进行了复杂性分析和算法的实验分析。
其他文献
微粒群算法是上个世纪90年代提出的一种基于群体智能理论的优化算法,通过群体中粒子间的合作与竞争产生的群体智能指导优化搜索。相比于进化算法,微粒群算法保留了基于种群的
视景仿真系统目前在我国已经广泛应用于各种研究领域,如军事仿真、城市规划仿真系统、虚拟现实房产推销系统、大型工程漫游系统和模拟训练系统等。但是仿真技术在赛场上的应
随着大数据、物联网技术的快速发展,云制造作为一种新的生产模式,日益受到制造企业的重视和青睐。在云制造环境下,工业制造过程中所产生的数据不断累积且缺乏关联,如何构建数据间的关联关系成为有效发现隐藏在数据背后的价值的瓶颈问题。数据之间的这种逻辑关联关系更多的隐含在大量单调、离散的数据背后,很少有能够直观表现出来的逻辑关系,如果无法发现它们之间的关联关系,就导致无法从这些数据中抽取出有价值的信息以及无法
随着计算机科学与技术的发展,理论、实验和计算形成了当代科学研究的三大支柱。高性能计算已经成为支撑科学研究和高新技术发展的基础性交叉学科,越来越多的科学研究和重大工程
急性低血压症(Acute Hypotension Episodes,AHE)作为重症监护(Intensive Care Unit,ICU)中一种高死亡率、高突发率的术后并发症,严重威胁着患者术后的生命安全。生理信号时间序列
随着大数据时代的到来,如何快速处理数据并从中发掘有用的信息成为目前急需解决的问题。特征选择作为机器学习和数据挖掘领域的一个重要的预处理步骤,越来越受到学者们的关注
矩阵是数值代数中的一个基本概念,许多科学计算问题往往都可以归结为对矩阵的操作。在许多应用中,需要用到较长的矩阵链相乘,例如机器人,机器控制,以及计算机动画等。矩阵链
关联规则挖掘是数据挖掘的一个重要内容,计算频繁项集是关联规则挖掘中的关键技术和步骤。这方面的算法主要代表有两类:Apriori类算法、FP-Growth类算法。Apriori类算法缺陷之
随着互联网和电子商务的快速发展,各种商业活动和人们的日常生活越来越多的依靠网络来进行,如电子现金交易、电子拍卖、电子招标和电子合同的签署等。在复杂的网络环境下,如
在过去的数十年中,无论是商业企业、科研机构或者政府部门,MIS系统(Management Information System,管理信息系统)都被广泛地应用在信息管理上。以事务处理为主的MIS系统在方