论文部分内容阅读
虚拟数据库技术是近几年兴起的一种新型的数据集成技术,它是计算机网络和数据库技术交叉应用的结果。建立虚拟数据库的目的是为用户提供一个透明访问Internet站点和其他数据源的统一的关系视图。虚拟数据库将Internet和其他外部数据源看作是单个数据库,使之成为企业或Internet基础实施的一个组成部分。 针对虚拟数据库技术在实际应用中所出现的一些问题,论文提出了一种改进方案——基于移动Agent和XML的虚拟数据库框架。将移动Agent和XML技术强大的功能应用于虚拟数据库,不仅可以减少在网络上的数据传输量、降低响应时间以及允许网络的间断连接;还可以简化集成系统的实现,促进信息资源的传播与共享;进一步推动虚拟数据库技术的创新与发展。论文围绕虚拟数据库框架中的若干关键技术进行了深入的探讨。 查询处理是虚拟数据库管理系统(中介器)的核心问题。论文以查询处理为主线,对查询重写、查询优化技术进行了讨论和研究。基于虚拟数据库所采用的关系数据模型,着重探讨了该模型下的查询重写技术——利用视图重写查询以及基于其上的合取查询、包含映射等问题。查询优化是查询处理研究的一个主要问题,为此着重分析研究了查询优化所涉及的代价估计、查询规划和搜索空间等相关问题。 包装器是虚拟数据库系统的重要组成部分。在参考相关包装器生成技术的基础上,论文探讨和研究了一种基于样本实例的包装器生成方法。基于对相关Web数据源的实际观察,通过模仿用户的导航行为,在启发式规则的指导下学习如何获取结果页面。整个学习过程包括识别搜索表单,填充并提交表单,从返回页面中获取所需的结果页面。在获得结果页面后,采用了一种用于从结果页面中提取所需数据的算法——对象抽取算法。该算法视页面中的数据为包含属性且具有层次结构的复杂对象。通过抽取相关属性,然后将它们组装成数据对象,从而实现对所需数据的抽取。实验结果表明,该方法在有效性和表达性方面都达到了预期的目标。