【摘 要】
:
篇章或对话中大量出现的指代,是自然语言中常见的语言现象,它使得句子更加简明,主题更加突出,这也给计算机理解自然语言增加了难度。指代消解一直是自然语言理解中的核心问题
论文部分内容阅读
篇章或对话中大量出现的指代,是自然语言中常见的语言现象,它使得句子更加简明,主题更加突出,这也给计算机理解自然语言增加了难度。指代消解一直是自然语言理解中的核心问题,在机器翻译、信息抽取、自动文摘以及自动问答等领域中都有重要应用。对于代词消解,包含代词与候选先行词的句法分析树可以提供丰富的句法信息,但其结构复杂,不易表示,传统的方法都是基于语言学知识,人工地、启发式地选择与构建特征集合,如候选先行语的句法角色,候选先行语与指代语之间的绑定约束特征等。这类方法的局限性在于:过于依赖研究者的语言学背景;难以发现和有效利用句法结构中的潜在信息;对代词与候选先行词单独建模没有考虑上下文中其他成分的作用。本文着重研究怎样有效地利用句法信息支持代词消解。针对如何有效表示句法结构特征,如何利用句法发现上下文中其他有益信息等问题,提出了三种方案:一阶谓词逻辑能够表达个体间的关系的特点,将结构化的句法信息转化为句法路径上的结点属性与结点和结点之间的关系,将这些属性与关系用一组谓词来表示,结合归纳逻辑编程自动构建逻辑程序,以直接、显现的方式使用背景知识、学习假设来解决指代消解问题。将代词与候选线性词之间的句法分析树路径结构整体作为结构化的特征,利用Tree Kernel函数计算句法树结构之间的相似度,与一般特征结合来训练分类器进行消解。句法分析不仅仅给出一个句子的层次结构而且可以传递词语之间的关系。本文还利用依存句法分析找到分别找到代词与候选先行词的支配词,计算他们之间的词义相似、相关特征训练分类器来支持代词消解。本文的贡献即在于尝试有效的句法分析树的表示方法构造结构化句法特征;通过句法分析利用上下文中其它词汇的词义属性来支持代词消解。
其他文献
由于Web上海量的信息处于不断的变化中,通用搜索引擎已经很难再为用户提供一个准确并且更新及时的信息搜索服务,其局限性在于它试图索引全部Web并且试图服务于所有主题的查询请
随着用户对数据安全和数据有效利用的要求不断提高,备份系统对数据的处理已经不再是简单的数据拷贝,而是存在大量种类繁多、功能各异的数据处理。目前现有的备份系统虽然功能强
随着网络的普及,信息处理技术有了一些新的应用领域,例如,传感器网络,网上在线交易系统,股票行情实时监控。在这些应用中,数据不再是静态的,而是一种实时的、不稳定的流式数
随着信息技术的发展,彩色图像以及视频的应用更加广泛,由于图像的最终观察者是人,因此研究人眼的视觉特性,寻找一种模拟人眼视觉特性的显著区域提取无疑是一条重要的途径,如
随着计算机和互联网技术的发展,越来越多的信息被放在了互联网上,由于网络快速和便捷的特性,传统媒体和和交流社区还有企业都开始电子化,网络化,网络上的信息也越来越多的在
随着社会的不断发展,如何能够有力地保障人们的生命财产安全以及维护社会的持续稳定的发展,创建“平安城市”,建立起高效、科学的城市监控系统正在成为各级政府日益关注的建
移动机器人的研究和开发近年来受到了人们的高度重视。人们要求机器人在运动过程中能够根据周围环境的变化而自主的采取相应措施的能力也越来越强。因此,作为机器人智能的一
随着通信技术、宽带网络技术、音视频压缩技术以及计算机技术的发展,数字视频越来越广泛地融入于人们的生活空间中。由于视频数据自身内容的丰富性和多样性、结构的复杂性以及
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观
随着机电产品功能要求的日益复杂,机电系统的设计也变得越来越有挑战性。在整个设计过程中,模型已经取代文档成为了系统工程问题求解的媒介,模型验证成为了设计过程中的重要一步。模型验证可以帮助发现设计错误,降低开发成本,提高开发效率,并且提高系统可靠性。模型验证贯穿在整个设计过程中,和设计同步进行。先设计再验证的方法忽视了早期设计阶段的验证,直到设计后期才能发现设计缺陷。和这种方式相比,验证与设计同步可以