异构数据源数据采集方法研究

来源 :中国纺织大学 东华大学 | 被引量 : 0次 | 上传用户:dragongreen2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
笔者开发一个数据采集原型系统--SEⅡECU DGS系统,该系统(1)实现了从Web数据源(HTML文本)中提取数据的方法,并且利用该方法从Internet网上提供的关于股票信息的HTML文本中提取出了各股信息;(2)提供了完善的元数据管理功能,将数据采集程序和元数据完全隔离,提出了一个"元数据驱动"的数据采集方法;(3)在系统的实现中,引入了数据源查询能力描述语言的概念.系统利用该描述语言来描述数据源所支持的查询,并且提出了一个完整的算法,利用数据源查询能力描述语言的描述,来判断用户提交的数据采集任务是否能够完成.在该文中,笔者对这个系统进行详细的介绍.首先,笔者通过分析当前数据仓库技术的研究热点,提出了该文的研究方向;随后,介绍了数据采集的基本概念,并通过对现有数据采集系统的分析,引出了笔者开发的SEⅡECU DGS系统;在随后的章节中,笔者对该系统的体系结构、系统中所使用到的关键技术以及系统的关键组件进行了详细的介绍;最后,对该文的工作进行了一个总结并提出了未来的研究方向.
其他文献
伴随着改革开放的春风,中国人不仅打开了国门,引进了世界的文明,同时还冲出大陆,把改革的音符谱写在了世界之极——冰冷的南极。20年前,经四川省委宣传部和四 Along with th
期刊
期刊
期刊
近年来,我国的医疗卫生事业发展迅速,随之产生的医疗卫生信息量也越来越庞大。但是众多的医疗卫生机构之间缺乏医疗卫生信息的交流和共享,导致众多的信息“烟囱”和“孤岛”。为
期刊
期刊
期刊
该文的主要目的是要以pSOSystem这种实时操作系统为实例,对板级支持包的开发步 骤和方法,作出系统的分析和设计,最终形成一个主要针对pSOSystem实时操作系统,不依 赖于任何硬
期刊