论文部分内容阅读
事件事实性描述的是文本中事件的事实性状态,在问答系统、信息抽取和篇章语义分析等领域具有应用价值。目前,事件事实性识别的研究较少,特别是中文事件事实性识别还几乎是一片空白。本文将重点研究中文事件事实性识别方法,并将该方法应用于实践领域。本文的主要研究内容如下:(1)基于事实性信息的中文事件事实性识别方法针对如何从词汇语义信息中挖掘出事件事实性的问题,本文提出了一种基于事件句特征、词汇级特征、谓词级别特征、程度词属性特征、三维特征和事实性特征等多种特征的事件事实性识别方法。在中文事件事实性语料库上的实验证明,该方法比规则方法在宏平均和微平均F1值上分别提升了5.80%和3.35%。(2)基于卷积神经网络的中文事件事实性识别方法针对如何从未标注自然文本中识别事件事实性的问题,本文提出一种基于卷积神经网络的事件事实性识别方法。该方法首先从生文本中抽取事实性信息并进行特征转化,再将特征进行向量化,最后把向量化的特征输入卷积神经网络进行事实性识别。在中文事件事实性语料库上的实验表明,该方法比分类器方法在宏平均和微平均F1值上分别提升了12.59%和1.11%,验证了在处理类别不均衡问题上的优势。(3)基于事件事实性识别的股票评论分析系统本文将事件事实性识别方法应用于股票评论分析领域,并设计了一个股票评论事实性分析系统。该系统实现了五大功能模块,包括股票信息爬取与预处理、事实性信息抽取、词袋和事实性信息特征转化、个股和板块评论事实性分析以及系统性能分析。本文提出了两种有效的事件事实性识别方法,并将事件事实性识别方法应用于股票评论分析,具有良好的研究价值和应用价值。