论文部分内容阅读
异构数据是由于计算机体系结构差异、基础操作系统不同、数据格式和处理方式各异等性质而造成难以统一处理的差异性数据。而数据集成是指通过一定技术在物理上或逻辑上将各异构数据源进行统一,对上层提供无差别的视图,使用户可以对其进行统一管理和使用的过程。具体包括联邦数据库法、数据仓库和中介法[1]。而人口信息决策支持系统可以为用户提供详细智能的包括统计、分析等决策支持服务,其中所涉及的海量异构数据的集成,则存在数据量巨大、数据类型特殊等问题,单一的集成模式很难满足需求,因此设计和优化相应的集成策略意义重大。
本文深入研究和讨论了异构数据集成技术的发展趋势以及几种常用集成模式,指出了各自的结构特性。在对Web数据库访问技术和海量异构数据源集成技术进行了分析的同时,详细说明了“十一五”国家科技支撑项目“安全可信的电信级生殖健康服务运营支撑体系关键技术研究”中,人口信息决策支持系统的设计和其功能结构,分析了系统的主要功能,并给出了系统的工作流程和设计方法。并结合该决策支持系统的需求和具体问题,提出了适合本类系统的海量数据处理优化方案和数据仓库与中介法相结合的创新型异构数据集成策略。
针对人口信息决策支持系统对跨平台及开放信息管理的要求,并且根据已有技术基础和系统对数据库数据可延伸性等方面的需要,本系统采用struts+spring+hibernate的JAVA Web开发,后台数据库则采用MySQL系统,系统基于B/S模式实现。整个设计实现过程遵照软件工程的方法和步骤,并始终以海量异构数据集成策略和处理效率为主要目标。经过实际使用表明:本系统基本上满足了国家计生委下属各级单位的信息统计和决策支持需求,可迅速查到所需信息,用户界面人性化,系统的安全性、稳定性以及高效性都已经基本达到了设计要求。而其中的数据集成策略也较为成功,有效的弥补了各异构数据源因形态各异、操作各不相同带来的性能问题。