分布异构数据源集成方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lhongbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多数据库系统是在不同成员系统之间实现数据共享和互操作的理想途径.在数据库系统中,数据都是结构化的;而在文件系统中,存在大量如web网页的半结构化数据.在充分吸收国内外数据集成领域研究成果的基础上,通过分析比较各类主流分布式对象技术、Agent技术和XML技术,提出了一种以多数据库系统为主要技术路线的分布异构数据集成方法——"CAX"方法.公共数据模型一直是多数据库系统研究的重点,由于数据源在数据格式和表达方式上的差异,使得各自的数据难于集成.通过比较各类数据模型特点,在XML标准的基础上,给出了一种面向XML Schema的扩展多数据库的公共数据模型XIDM,该模型是基于图结构的模型,适合表现结构化和半结构化数据,同时有丰富的数据类型和约束定义,满足了同其他数据模型转换的需要.各类数据源的描述方法一般可以用代数工具进行表达,这些描述方法彼此之间往往存在很大差异,当集成这些数据源时,这些差异可能会造成数据语义的丢失.针对异构数据源都需要提供对存储数据集合的查询和应答这一共同特性,借助泛代数和代数逻辑等数学工具,提出了一种对分布异构数据源代数结构的统形式化方法.由于文件系统中的数据多是半结构化数据,因此文件系统的集成是分布异构数据源集成中比较困难的问题.在分析文件系统集成中问题的基础上,提出采用CAX方法集成各类文件系统,即利用CORBA实现对文件系统的封装,减少开发中的工作量;采用文件系统的局部代理作为适配器来填补文件系统与传统数据库系统的差异,屏蔽文件系统在数据操作上的异构性;通过基于XML的数据模型来表达半结构化数据.研究了文件系统集成中的数据预处理问题,将此问题归结为数据抽取和结构化表达两个基本过程,并提供了具体实现的技术方法.基于上述方法,设计实现了一个名为"Panorama"的扩展多数据库原型系统.
其他文献
传统的网络安全技术,如防火墙、入侵检测、身份认证、访问控制等可以保护用户在一定程度上不受黑客侵害,但这些安全技术大都采用的是被动的安全策略,多数用户在财产和信息受
本文首先论述了IP Sec(Internet Protocol Security)安全特性和安全服务机制、支持IP Sec的密钥管理协议ISAKMP(Internet Security Association and Key Management Protocol
该论文针对静态配置ORB的不足,提出了一个基于代理的可配置ORB(CORB)框架模型.模型由四部分组成,在配置管理助手中我们给出了组件配置器的基本结构,描述了组件配置的步骤,讨
数据挖掘技术是一门近年来新兴的学科,它主要研究如何从大量数据中发掘出有用的知识,是利用统计学和机器学习技术创建预测模型。 客户关系管理系统(CRM)是指对企业和客户之间的
针对目前所有匿名通信系统中不能抵抗泛洪攻击的现状,该文提出了追踪洋葱包的高级标记方案,使得洋葱路由网络在不影响匿名性的前提下,在发生DDoS攻击时可以近似地追查出攻击
信息系统的安全问题是国家安全、国防安全的重要前提,作为信息系统“底座”的操作系统的安全性研究已被提高到了战略地位。本文首先介绍了计算机系统安全的基本概念,较为详细地
目前,基于ARM平台的嵌入式监管系统逐渐流行起来,无论在物流行业还是在仓储管理行业它都发挥了重要作用,尤其是带反馈机制和自我调节能力的智能化监管系统,成为当今追求的热点。
该文介绍了DL3000前置系统的总体设计,有所侧重地论述了双前置机容错机制的设计和实现.对前置系统特别是其中双前置机容错系统所涉及的下列主要实现技术进行了深入探讨,对系
随着现代化信息技术的飞速发展和电梯企业规模的迅速扩大,电梯企业在产品设计中的数据管理变得愈加重要,尤其是需求变更已逐渐成为产品设计中的关键一环。需求变更在信息系统
容迟网络指那些因为能量管理、节点移动、调度等原因而发生频繁中断、甚至长时间处于无法连接状态的一类网络,它涵盖了因为节点移动而处于间歇式连通的WSN、周期性连通的卫星