论文部分内容阅读
伴随着企业信息化建设的不断推进以及信息化程度的不断提高,各种应用系统集成的需求越来越大。应用集成首先要面对的问题就是数据集成。如何有效地实现数据共享与集成,直接关系着企业应用系统集成的实施效果。
造船设计中的信息种类和形式多样,有结构化数据,如关系型数据库中的数据;有非结构化数据,如各种CAD系统产生的文件,Office软件数据等。由于这些信息来源于不同的信息系统,表示和存储形式各异,并在语法和语义上异构,难于共享和互操作,成为企业信息集成的难点。为了给数据的使用者提供一个统一的数据视图,从而隔离异种异构数据源之间的差异性,实现完全的信息共享,有必要把文件系统作为一个成员系统集成进数据库系统中。然而,文件系统并不具备传统数据库系统的一些特点,如模式定义,查询语言等。因此在集成过程中,必须对一些特殊的问题进行研究,包括文件系统的信息抽取、文件数据的结构化,文件系统到数据库系统的映射等等。
本论文以某造船厂建立物资集配管理系统为依托,研究了造船设计信息与物资集配管理系统集成涉及到的关键技术。针对常用的Office文档形式的数据,提出了基于元数据和XML的抽取与集成方法,把不同格式的文档转换为统一模式的XML文档。针对DWG格式的图纸文档,提出了预定义实体的图纸信息抽取方法,实现了最终文档的自动化生成,把不同样式的图纸信息转换为统一模式的XML文档。给出了统一模式的XML文档与关系型数据库的映射方法,实现信息集成。最后在提出的集成方案基础上开发了技术数据管理系统,实现了对非结构化数据的自动抽取与集成。目前,该系统已经正式运行,由于该系统结合了企业实际情况,满足了客户需求,获得了用户好评。