基于XML Schema的文档验证技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:zxc473138
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML是可扩展标记语言的简称,它为Web上的结构化文档和数据提供了通用的格式。随着Internet的发展尤其是Web技术的广泛应用,越来越多的应用采用了XML技术作为信息表示和数据交换的标准,这使得通过数据库技术对XML数据进行管理变得越来越重要。 在关于XML的数据管理技术中,数据验证是比较重要、且使用比较频繁的组成部分,在维护数据安全和有效性方面扮演着十分重要的角色。XMLSchema作为描述XML的新的W3C推荐标准,以其丰富的数据类型和灵活的结构描述等优点,被许多系统所使用,越来越多的人开始研究基于XMLSchema的数据验证技术。 针对XMLSchema规范中规定的复杂数据类型的结构描述,本文提出了一种称为模式自动机(SchemaAutomaton)的数据结构,讨论了将XML模式结构转换成模式自动机的方法,设计并实现了一种自动机验证算法来验证实例XML文档的有效性,以解决XML结构正则表达式验证的问题。自动机验证算法可以在模式空间内高效地验证每一个获得的XML数据,因此具有很高的效率。
其他文献
如何对一个特征领域进行快速有效的软件再工程,是当前软件工程领域所关注的一个重要课题,本文主要通过对软件复用、软件构件和软件再工程的技术和方法的全面阐述,研究了一种
实体求交是实体造型领域最为重要也最为复杂的问题之一。本文主要针对实体造型系统中连续变化的等距曲面求交问题进行研究。通过分析连续变化等距曲面的特征信息,提取连续变
近年来,随着Web2.0的快速发展,社会网络越来越普及,Twitter和Weibo等微博客被广泛使用,并产生了巨大的社会影响力,改变了人们的生活方式。微博中有数以亿记的用户,用户的身份
论文简要介绍了电信管理网的发展和相关内容,并阐述了当前电信管理网统一网络管理平台进行自动化测试的必要性和可行性,通过吸收和借鉴当前国内外比较流行的几种测试工具来实
随着计算机技术的发展和Internet的普及,在各级网站的服务器中的WWW数据也飞速膨胀。而Web挖掘将数据挖掘技术应用于大规模Web数据,能够发现有关用户浏览行为的隐藏模式规则,
随着医疗信息技术的进一步发展、数字化医疗的逐渐普及,作为医学图像存储与传输标准的DICOM越来越受到医学界的重视。医学图像数据量巨大,对存储设备和传输设备的性能都提出了
近年来,计算机网络的迅速发展使得越来越多的信息被数据化。传统的存储系统已经不能满足企业对存储系统高可靠性,可扩展性和安全性的要求。在这种情况下,出现了存储区域网络(
嵌入式系统一般指非PC系统,包括硬件和软件两部分。硬件包括微处理器、存储器及I/O端口等。软件部分包括应用程序和嵌入式操作系统(EOS)。嵌入式操作系统一般要求实时和多任
随着基因测序技术和人类基因组计划的发展,人类已获得了大量的生物序列数据,并且其积累速度还在飞速增长。生物信息学作为一个新兴学科,对如何利用信息技术来分析生物数据,提供了
随着网络传真技术和OCR技术的发展,网络传真智能监测系统的研究有着广泛的应用价值和理论意义.而作为该系统关键技术部分的传真图像恢复,对于提高传真OCR识别率、丰富图像恢