论文部分内容阅读
近年来,随着知识工程、人工智能等领域的理论与技术研究逐步成熟。获取领域文本中的知识,表示成计算机可以理解的形式,将其应用到软件的需求分析、模型设计、代码生成以及异构数据的集成与共享中,为解决软件工程中的需求分析不准确、不及时,软件开发效率低,重用性差,数据共享难等难题提供了一个可行的解决方案。
借鉴这种技术对解决土地管理领域GIS工程建设面临的实际困难,如土地管理业务政策性强,变化快;土地管理空间数据类型多,异构严重,共享困难;土地管理GIS系统维护工作量大等老问题有很强的现实意义。
文本知识获取主要基于自然语言处理技术,适合大规模的土地管理领域文本知识获取。本体以对象框架模型表示知识,有利于知识智能化应用的表示方式,是最合适的土地管理领域空间知识本体表示方法。
本文基于自然语言处理的文本知识获取理论与方法。首先利用汉语词法分析系统ICTCLAS和HC2007YLCL句法分析器,按“法律—>法规—>规章—>规范性文件”的顺序,对确定的31个土地管理法律法规源文本进行词法分析和句法分析。提取了土地管理源文本中包含的关键词和关系词;选择属性,识别出了其中包含的土地管理空间概念;枚举句法模式,获取了土地管理空间概念的关系和公理。检验并分析获得的知识,弥补遗漏的知识,分析知识反映的本质,梳理知识与业务的关系,完成知识获取工作。
随后基于本体知识表示的理论与方法。选择本体编辑器Protégé 3.4.1 构建土地管理领域空间知识本体,使用OWL 语言描述了构建的本体。按照构建本体的一般步骤,创建土地管理领域空间概念和属性,对土地管理领域空间概念的六类基本属性“区位”、“地形地貌”、“土地覆被”、“用地类型”、“经济区域”、“几何要素”等进行逐步推理,建立了实例空间对象在平面上全覆盖的“土地覆被”与“用地类型”相结合的最小关联度的土地管理空间概念分类体系。分类体系确定后,将概念对应的关系和公理,完成领域本体的构建。最后,将构建的土地管理空间知识本体描述为OWL 文本。
最后研究了文本知识获取方法和领域知识本体在土地管理GIS需求分析、数据库设计、空间数据管理与共享中的应用技术,开展了基于文本知识获取的土地管理GIS需求分析研究,基于本体的土地管理GIS数据库设计研究,基于知识对象的土地管理空间数据管理模型研究以及基于本体的土地管理空间数据共享研究。
文本研究基于文本的土地管理领域空间知识的获取与应用,从知识获取、知识表示、知识应用三个方面系统的开展了研究,获得了一些成果和创新,主要如下:
(1)成功的探索了一条基于自然语言处理技术获取土地管理领域文本中的空间知识,基于本体表示所获取的知识,以及基于文本知识获取和知识本体的土地管理空间知识智能化应用的技术路线和方法。
(2)分析了自然语言处理与本体构建技术的难点和重点,重点研究了自动分词、属性选择、概念识别、知识检验和分析、本体概念分类等关键技术,获取了土地管理领域文本中包含的空间概念和概念之间的关系,创建了土地管理领域空间知识本体。
(3)在词法分析的过程中,建立了一个较为完备的土地管理领域空间概念字典和土地管理文本表述空间知识的特有的句法模式集。
(4)通过知识检验和分析,挖掘了从文本中获取的土地管理空间知识中包含的隐性知识,建立了土地管理空间知识与业务的关系,为知识的应用准备了条件。
(5)利用本体的属性推理机制,对土地管理领域空间概念的六类基本属性“区位”、“地形地貌”、“土地覆被”、“用地类型”、“经济区域”、“几何要素”等进行逐步推理,建立了“土地覆被”与“用地类型”属性相结合的,区别于以往所有分类体系的土地管理空间概念分类体系。获得了空间实例对象在平面上全覆盖、无交叉、无重叠的,反映土地真实现状的土地管理空间概念集合,确定了土地管理的基本空间概念对象。
(6)将基于自然语言处理技术文本知识获取方法应用到一体化管理的土地管理空间数据管理系统的需求中应用,获到了一种基于文本知识获取的土地管理GIS需求分析方法,降低了需求分析对用户的依赖,提高了需求分析的效率,为快速获得原型系统提供了一个可行的方法。
(7)将土地管理空间知识本体中概念、属性等之间的关系模型直接应用到软件的概念模型设计、逻辑模型设计中,并用UML 进行表达,实现知识的本体表示与软件设计的无缝对接。
(8)从GIS的起源分析了对象关系型空间数据管理模型以地图制图和测绘业务的基本空间概念“点、线、面”“为基本管理和操作对象的理论依据。提出了依据获取的土地管理空间知识,开发土地管理空间知识对象,扩充对象关系型空间数据管理模型的空间对象类型,建立基于知识对象的土地管理空间数据管理模型。将空间概念和概念的关系、公理等封装在空间知识对象中,建立“用户—应用平台—空间知识对象—空间实例数据”的土地管理空间数据的管理、共享与操作模式,进一步降低空间对象实例的信息负载,使土地管理业务规范的变化对空间对象实例的影响降低,提高了空间数据稳定性。