论文部分内容阅读
空间在人类认知中扮演了基础性的角色。在任意日常场景中,空间通常被认为是由空间关系交织构成的结构体,而不是简单的承载相互独立的空间对象的容器。因此,空间关系一直以来都是许多学科的重要研究内容之一,包括人工智能、认知科学、心理学、语言学、地理学以及图形学等。在图像理解相关领域中,理解图像中各对象间的空间关系以及自动构建图像中对象间空间关系的自然语言描述都是极其重要的研究内容,这两方面内容构成了空间关系描述研究的两个层次。针对空间关系描述这一课题,论文对空间方向关系基础理论、空间方向关系形式化模型以及空间关系自然语言组合描述等理论和方法进行了深入的研究,本文的主要贡献有以下几个方面:(1)完善了空间方向关系的基础理论。首先,对空间方向关系、空间对象的类型、空间方向关系参考框架、观察角度以及基本方向等空间方向关系的基本概念进行了明确的定义,为空间方向关系研究打下了基础;其次,提出了第二类空间方向关系参考框架,与第一类参考框架一起为提出完备的空间方向关系形式化模型体系提供理论支持;然后,分析了空间方向关系的性质和特点,为空间方向关系形式化模型的建立提供了基本原则;最后,提出了两种空间方向关系分类方法,为提出基本方向关系和特殊方向关系的形式化模型以及基于细节空间关系的描述方法提供了相关依据。(2)提出了影响空间方向关系的因素并分析了现有的空间方向关系形式化模型。首先,通过建立空间方向关系图形库,提出并分析了影响空间方向关系的因素,为空间方向关系形式化模型的建立提供了理论基础;其次,根据空间方向关系的基础理论和影响空间方向关系的因素分析了现有的空间方向关系形式化模型的特点,经比较发现直方图模型充分考虑了方位角、形状和相对距离对空间方向关系的影响,并且具有描述准确性高、适用性强等特点,所以将直方图模型确立为空间方向关系形式化模型的基础模型。(3)提出了一种空间方向关系形式化模型体系。首先,提出了一种在观察者参考框架下的可视域直方图模型,该模型根据可视性理论采用对象间的可视域作为研究对象,以角直方图模型作为基础模型,有效地解决了观察者参考框架下的空间方向关系描述问题;其次,提出了一种新的四叉树直方图,该直方图针对以往直方图计算量大的缺点,考虑到图形综合理论,引入了图形综合为点的两个条件,采用四叉树算法对空间对象进行四叉树划分,在划分结果的基础上计算直方图,同时保证了较高的精确度和较低的计算量;然后,建立了一种新的基本方向关系模糊判定方法,该方法针对以往基本方向关系判定方法存在的问题,考虑到空间方向关系的削弱作用以及偏移性,有效地解决了判定结果多于两个方向以及狭长对象发生误判的问题;最后,提出了一种新的特殊方向关系模糊判定方法,有效地克服了现有特殊方向关系判定方法的缺陷。实验结果证明,可视域直方图模型和四叉树直方图模型较其他模型更符合人的空间方向认知,且具有更广泛的适用性。(4)提出了空间关系自然语言组合描述方法。首先,采用半自动的模式提取方法获取了空间方向关系描述的常用句法模式以及细粒度构词模式;然后,提出了基于直方图模型和模糊规则的空间关系词汇选取方法,自动生成空间方向词、距离词以及程度修饰词等;接着,在外部和内部参考框架下依照相应的句法模式和细粒度构词模式自动生成了空间关系自然语言组合描述;最后,提出了细节空间关系的概念以及不同参考框架下的细节空间关系自然语言组合描述方法,有效地解决了在某些空间拓扑关系条件下空间关系自然语言描述不够详细、准确的问题。实验结果证明,本文提出的空间关系自然语言组合描述方法,能够比较准确地生成符合人类日常空间关系交流习惯的空间关系自然语言组合描述语句。