论文部分内容阅读
XML(eXtensible Markup Language)已逐渐成为互联网信息的主要表示和交换工具.为了有效地加工、分析和处理XML数据,研究者们已经提出了各种XML数据的基本处理技术,其中,XML的存储、索引、查询等XML处理的基本技术受到了广泛的关注.然而,在一个完整的XML管理系统中涉及到的其他技术,例如检索、更新以及XML文档发布等却并未引起研究者们的足够广泛的重视.因此,对上述技术的研究面临了更多新的挑战.该文研究XML文档的检索、更新和文档发布技术;对XML数据保持健约束的更新、基于层次缓冲的XML数据检索技术以及从关系数据库中发布XML文档等方面进行了深入的研究和探讨,提出了有效的算法和新的技术,并且实现了部分原型系统,譬如更新系统和发布中间件PRATA,通过实验证明了该文所提出方法的有效性.研究成果将可直接用于XML数据库的项目开发和产品研制中,具有重要的理论和现实意义.该文内容具体包括:1)基于层次缓冲的XML检索技术.该文提出了一种新的XML搜索引擎架构CREX,相比原有的检索引擎,CREX通过优化检索项的方法使检索效率得到很大提高,并且是基于语义的.CREX对检索结果的评估方法根据XML元素的不同特点,进行分类打分.该文还提出了XML检索等技术在Web服务中的应用.2)基于XML键约束的概念,提出了XML文档在关系数据库中的规范化存储,极大地减少了冗余存储.通过把XML键约束映射为关系数据库中的函数依赖,该文实现了对XML文档的更新.在更新XML文档时,不但保持了XML文档本身的键约束,还使关系数据库和XML文档保持了一致.标注技术实现了对XML文档更新位置的快速定位,从而高效地实现了XML文档保持键约束的更新.更新技术使得XML成为真正表示与共享的统一格式.3)从关系数据库到XML数据的转换,即XML数据发布技术,完整实现了数据发布系统PRATA,该系统通过预定义的DTD,利用属性文法转换语言ATG将存储在关系数据库中的数据发布成XML格式的文档.此外,我们还开发了PRATA的网上演示系统.