论文部分内容阅读
主观性存在于人类语言之中,体现了人的态度,情感和评价,是准情态动词的重要语义特点之一。研究主观性对准情态的动词语义排歧的贡献度,可为多义词语义排歧提供有效的依据。形式概念分析方法在自然语言处理中,是一种有效的知识获取方法,为语义排歧、知识发现等研究提供了有效的工具。根据形式背景生成的属性偏序图,能够将形式背景进行可视化处理,从而提取有效的规则,以获得知识之间的关系。本文基于形式概念分析理论,利用属性偏序工具,分析了准情态动词形式背景中不同属性之间的互动关系,探究了主观性对英语准情态动词be going to语义排歧的贡献度。研究语料来自自建的250万字的自然语料库,该语料库涵盖法律、文学、新闻、科普读物、学术论文、口语、演讲、电影字幕和学术论坛九类体裁。依据前人研究,结合权威字典释义,be going to的语义划分为三类:(1)认识意义—预测(prediction),(2)根意义—打算(intention)和(3)道义意义—命令(directive),依照这三类语义,对语料库中的be going to做了词义标注。通过选择主观性特征、共现的3个句法特征以及互信息特征作为属性,be going to的语义为对象,生成了形式背景和对应的属性偏序图模型。该模型被用作be going to的语义排歧模型,排歧准确率达到86.92%。通过计算发现,主观性对准情态动词be going to语义排歧的贡献度高于说话者参与属性、谓语为静态动词属性以及有灵主语属性,但是低于语义属性。英语准情态动词语义排歧研究弥补了情态动词语义排歧中准情态动词研究的空白,主观性对语义排歧的贡献度研究为今后排歧研究的属性选择提供了依据,对语义排歧和知识发现研究具有重要的意义。