数据集成系统中信息源监视器的研究与实现

被引量 : 0次 | 上传用户:sdvfg4gf3fg3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet上的信息访问,以及大部分新兴的信息应用比如DSS、OLAP等分析型应用,都需要数据集成技术的支持。数据仓库是数据集成的一个典型应用。美国斯坦福大学的WHIPS项目在数据仓库联机维护方面进行了卓有成效的研究工作,提出了相关的体系结构,对其中的组件——监视器、集成器也作了比较完善的实现。但在这些相关的的研究工作中,并未深入地考虑如何让信息源发挥更为主动和有效的作用。 智能化持续信息支持是指信息服务系统随本身信息的变化,按预先定义好的需求,持续不断、主动地将新的信息内容提供给信息使用者。在数据集成系统中,如果数据源具备智能化持续信息支持能力,则可以充分满足集成端的复杂需求,提高数据传输和集成维护效率。 在数据集成系统中,监视器的作用是检测分析数据源的变化并报送给集成端。为使数据源具备智能化持续信息支持的能力,着手对已有监视器的实现做以下改进:1、将监视对象范围从基表扩大到源视图;避免报送那些不必要的数据源变化。2、提供可定义的监视规则,即监视器检测分析和报送数据源变化的执行规则;以满足集成端对监视周期等的复杂要求。 根据以上改进,我们提出了监视器的系统结构。相关的研究与实现工作包括以下三方面的内容: 首先是监视规则的表示和管理问题。我们设计了监视规则的库结构,给出了监视规则所包含的属性和意义。实现了管理监视规则的接口,并提供前端工具以方便用户对监视规则的管理。华南师范大学硕士学位论文 其次是检测分析数据源变化的问题,即检测分析器的实现。先是给出了检测分析器的软件结构,采用多线程并发工作的方式,有效保证了检测分析工作的效率和响应时问。重点是两种检测分析方法的研究和实现。对基于快照差分的检测分析方法,我们实现了三种快照差分算法:Sort Mefge算法、Partition Hash算法和Wndow算法;对基于日志的检测分析方法,讨论了 Oracle和 SQL Server两种关系数据库的日志分析方法。同时也描述了相关的功能组件和数据结构。 最后是数据源变化报送的问题,其关键是如何保证这一数据传输过程的健壮性。我们采用TCPny协议来保证该数据传输过程的可靠性;通过记录检查点的方法,保证了该数据传输过程的可恢复性。
其他文献
<正>笔者长期专注于主力行为研究,对于一般大众已掌握的基础分析方法极少谈及。近日收到读者来信,要求笔者公开发表介绍下日常利用哪些技术方法去研断大盘,以及预测未来走势
口头表达是语言输出的最基本、最主要的方式。培养外国留学生的口语表达能力是对外汉语教学的一个重要目标。本文将从对外汉语口语教学的历史和现状分析入手,就口语教学在各
少数民族文化遗产是我国文化遗产重要的组成部分,其如何保护和利用是摆在民族地区的现实问题。在旅游业迅速发展且无孔不入的今天,少数民族文化遗产理所当然的成为首选的优质
目的探讨腔隙性脑梗死的临床特点,并分析脑梗死发生的原因。方法对102例腔隙性脑梗死患者的临床资料进行回顾性分析。结果本组病例中,腔隙性脑梗死的发病年龄30~82岁,男女比例
目的:考查短期(15天)运动为主综合干预对学龄肥胖儿童自卑、自我意识及社交回避的影响,为制定少儿肥胖干预模式提供依据。方法:采用运动为主,饮食控制、生活习惯塑造、心理和
早期新加坡文社与新加坡第一次儒学运动关系紧密。新加坡文社最早有由中国驻新领事左秉隆创办的会贤社,后又有黄遵宪创办的图南社,继之以新加坡人创办的丽泽社、好学会等。文
以阿尔多.罗西著写的《城市建筑学》中对"类型学"的定义为理论基础,类比中国城市的发展现象,将城市类比建筑体,将历史建筑剥离为功能和形式进行分析,以期从类型学的角度理解
调查了宁波市某工业区某化肥厂的空气污染状况,测得该地区空气污染物主要为SO2和NOx,在调查期间晴天测得SO2和NO2的最高浓度分别为0.164 mg/m3和0.120 mg/m3,达到国家三级标
甘肃省河西地区是我国荒漠化发生最严重的地区之一,其荒漠化主要类型有风蚀荒漠化、水蚀荒漠化和土壤盐渍化.全区现有各类荒漠化土地213万km2,其中分布最广泛的沙质荒漠化土
对蛋鸡不同养殖阶段的饲养管理技术要点进行了介绍,为养殖场进行蛋鸡养殖提供参考。