论文部分内容阅读
随着计算机技术的发展和计算机知识的普及,企业的信息化越来越普遍,但是信息化以部门为单位设计,缺乏统一规划,导致各部门之间的数据缺少沟通。为了统一数据,实现信息共享,需要对部门间的大数据量的数据进行集成。目前主要的数据集成技术包括联邦数据库、数据仓库以及中间件三种方式。本文基于此提出了一个添加了知识库的数据仓库集成系统,即个人信息融合系统。个人信息融合系统主要包括属性映射等数据准备、数据处理以及可视化分析三大部分。通过这三大步骤实现从多源异构数据中抽取个人基本信息和关系信息,并完成可视化分析。而将知识库引入到系统中,便可以利用名称相似度和结构相似度算法进行相似度计算,从而实现属性映射的推荐等功能,同时知识库也消除了集成过程中的难以解决的语义冲突问题等。而无论是数据集成中大数据量数据的处理,还是知识库中知识的管理,都需要以高效的计算能力作为基础。云计算作为一个新型的面向服务的计算模式,它具有资源高扩展、强大的计算和存储能力等特点。云计算平台将资源虚拟化,并进行有效且动态的资源划分以及分配,正是由于它的快速灵活等特性使得企业在信息化过程中的成本大大降低。为此,本文基于目前的云计算IaaS,PaaS以及SaaS的三层基础框架的思想来构建和部署个人信息融合系统的。首先,按照服务工程设计系统的步骤,利用Service Pipeline, Call-Return以及Service Agency服务建模思想来完成个人信息融合系统中各基础服务组件的构建以及服务组合。接着研究了云计算环境下,基础环境的构建以及服务的部署。最后,在对系统开发环境及系统开发关键技术分析的基础上,给出了云计算平台的个人信息融合系统的实现过程,并通过实验数据来验证云计算环境下数据处理的高效性。