【摘 要】
:
近年来,自动文摘技术作为自然语言处理领域的一个重要分支,越来越受到学术界的高度关注,而事件的概念也逐渐被自然语言处理等相关领域所采用,将事件作为知识单元符合人类认识
论文部分内容阅读
近年来,自动文摘技术作为自然语言处理领域的一个重要分支,越来越受到学术界的高度关注,而事件的概念也逐渐被自然语言处理等相关领域所采用,将事件作为知识单元符合人类认识世界的规律。因此,本文主要研究面向事件的自动文摘,即结合面向事件的相关研究,利用自动文摘技术实现摘要抽取,主要研究工作由以下两部分组成。1)事件要素的识别研究。本文主要根据事件的六元组形式化定义,提出对事件中各要素进行识别。通过对文本的实际观察,发现可直接从文本中获取的事件要素主要有动作要素、对象要素、时间要素和环境要素。针对该四种事件要素语言表现规则的不同,本文分别提出相应的事件要素识别方法。如针对事件动作要素的识别,提出结合扩展触发词表和多特征融合的机器学习识别方法;针对事件对象要素的识别,提出首先对事件缺失对象进行补全,其次根据对象要素设定规则进行过滤,最后进行共指消解的识别方法;针对事件时间要素的识别,提出实现事件时间表达式的识别和事件时序关系的计算;针对事件环境要素的识别,提出结合最大熵模型和规则统计的识别方法。并用上述各事件要素的识别方法进行实验,结果表明,上述方法皆取得一定的效果。2)基于事件要素的摘要抽取研究。考虑到第一项研究虽取得一定的实验效果,但和标注好的CEC语料库相比,还存在一定的差距。为了避免错误级联,提高科学研究的严谨性,针对基于事件要素的摘要抽取研究,本文还是利用CEC语料库中已标注好的事件要素,并结合图论知识进行摘要抽取。首先通过标注好的CEC语料库来获取事件要素,构建事件要素-无向图,然后再对无向图的节点和无向边进行权值计算,最后根据压缩比选取出文摘句,并按照它们在原文本中的出现顺序输出,得到摘要。实验结果表明,本文提出的基于事件要素的摘要抽取方法,获得了理想的F值,达到了较好的实验效果。
其他文献
在情感表达中,人脸表情的变化是最为直观也是最为基础的一环。因而,也成为情感计算的重要一环。本文所论述的人脸表情识别研究就是基于这样原因,以人脸的不同表情为研究主体,
我国物流业目前急需解决的问题,是如何实现物流园区内各个相对独立的业务系统的无缝整合,避免重复建设,消除“信息孤岛”,发挥物流园区产业集约化经营优势。论文依托哈尔滨公
随着Internet网络的高速发展,信息爆炸时代也随之到来。由于Internet的开放性、动态性、异构性使得用户很难快速、准确的从WWW上获取所需的信息,因此如何有效的从网络上获取
Web服务作为分布在Internet的Web对象,是基于网络的、分布式的模块化组件,能够允许不同平台和不同实现技术的应用之间相互操作为客户提供服务。通常单个Web服务不能满足人们
随着电子信息技术进步,各种形态的数据不断指数级爆炸增长。当我们面对这些海量的高维数据,需要能够按照我们预期的目的进行有效的处理以及利用。从大量的信息当中挖掘出有用
AST3是将要安装于位于南极内陆冰穹A的昆仑站的三台口径50cm的施密特望远镜。图像相减变源测光是天文学测光的主要方法之一,除此之外还有PSF测光和孔径测光。本文针对AST3处于南极内陆,长期无人职守的特点,对它的测光软件的系统架构进行了探讨,特别考虑了程序的自动化处理和可靠性设计。通过Daemon程序调用,循环备份,配置参数,系统检测等方法,大幅提高了程序的灵活性和可用性,并最大程度上保证了程序
自组织映射网络(Self-Organizing Map,SOM)是芬兰学者Kohonen于1981年提出的一种特殊的神经网络方法。SOM网络采用与普通神经网络相似的权值调整方法,将高维数据拓扑有序地映射
随着我国海上交通、船舶运输等行业的迅速发展,海事局VTS系统(VesselTraffic Services)得到了广泛的应用,从而也对VTS系统服务器的可靠性提出了越来越高的要求,使之成为了研
在网络时代迅猛发展的今天,人们享受网络带来的方面快捷的同时,也面临着层出不穷的网络攻击的考验。因此,如何改进和完善防火墙系统正成为许多专家学者们研究的重点。IPv6是
结合当今社会对信息安全日益迫切的需求以及加密技术在信息安全中的重要地位,论文介绍了课题研究的意义、国内外研究现状、主要研究内容和论文的组织结构。围绕数据加密技术