基于Agent的数据采集

被引量 : 0次 | 上传用户:xf1005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据采集是构建数据仓库和决策支持系统的基础。在医疗、金融等应用领域,由于不同医院、不同银行采用了不同的软件系统,使得这些领域存在大量的异构数据。异构数据采集需要解决对象识别、数据转换、数据整合等诸多问题,论文试图通过研究具有数据映射定义能力的采集代理,较好地解决“信息孤岛”问题,从而有效地实现数据共享。比较分析了通过使用专业数据采集工具进行数据采集、利用数据仓库方案供应商提供的采集工具进行数据采集等采集方式,针对现有的数据采集方式不能很好地解决针对用户级数据字典数据库数据采集的问题,引入了基于数据映射和Agent的数据采集策略。在数据采集过程中,根据用户的需要为使用用户级数据字典的数据库建立采集工程,通过数据映射将异构数据转换为同构数据,通过Agent之间的通信来协调各个Agent之间的工作,从而有效地实现异构数据获取、转换和存储任务。系统中,Agent与Agent间以客户端、服务器端的工作模式,建立安全的通信连接,一个服务器端Agent对应一个客户端Agent。客户端Agent基于描述数据映射的采集工程工作,根据采集工程定义,将数据从异构系统中提取出来,按照预先设计的规则对提取的数据进行转换,使本来异构的数据在格式上统一起来,以标准的XML (Extensible Markup Language,超文本标记语言)文档形式存储,传输到服务器端,服务器端Agent从XML文档中读出数据,进行对象识别后存储到服务器数据库中。设计并实现了基于Agent的数据采集系统,通过采集东风卫生系统数据库中的数据进行了验证实验。
其他文献
吸毒问题始终是困扰全世界的社会难题。在我国的吸毒人群中,又以阿片类毒品海洛因为主。虽然单乙酰吗啡的检测可作为吸食海洛因的依据,但很多吸食海洛因嫌疑人的尿样中只能检
1976年,穆罕默德·尤努斯把钱借给贫民开启了小额借贷之路;2005年,英国理查德·杜瓦等4人成立了Zopa网站,开创了P2P网贷模式;2006年,中国也出现了自己的P2P企业。近年来,P2P
简要综述了生物质快速热解设备研究的国内外现状,继而详述了喷动床和循环流化床,重点对喷动循环流化床作了较深入的探析,探讨了喷动循环流化床快速热解设备研究的发展方向。
在中国的法院判决书中,引证法律条文的次数能够反映出该法律条文的实际效力。为提高法律条文的实际效力,在立法过程中强调法律的可适用性十分必要。除了引证法律条文以外,在
子宫内膜癌发病率呈逐年上升趋势,且发病日趋年轻化,对于有适应证的患者选择保留生育功能的治疗显得尤为重要。文章就年轻子宫内膜癌患者保留生育功能的治疗进展作一综述。
现代银行竞争,体现在对客户资源的争夺上,而客户关系管理水平起着决定性的作用。对政策性银行之一的国家开发银行H省分行而言,市场份额的降低、资产利润率增幅的趋缓就是其客
社会工作以助人为宗旨,可以调节人与社会之间的关系,是实现社会和谐的一种不可或缺的制度构件。党的十六届六中全会指出:“造就一支结构合理、素质优良的社会工作人才队伍,是
危机管理作为一门学科于第二次世界大战后在美国开始萌芽,在中国,2003年“非典”后,政府危机管理才成为热门课题。政府危机意识的树立与中国社会进步有关,也与新媒体出现后传
1931年江淮大水作为民国救灾史的一个分水岭,出现了一些带有转折性的新变化。救灾主导权的国家化和救灾机制的社会化并行不悖,一方面中央政府成立了国民政府救济水灾委员会(
本文以南京区域金融中心为研究对象,选取CDI中国金融中心指数作为城市金融竞争力评价标准,运用经济地理学中的威尔逊模型和断裂点理论对南京区域金融中心辐射力进行度量,明确