论文部分内容阅读
面向自然语言处理的汉语句子语义知识库的构建研究,不仅能够深化现代汉语语义研究,而且对推动自然语言处理的发展具有重要意义。本文在分析和总结国内外现有句子语义资源的基础上,根据中文信息处理的需要,本着适应自然语言处理的发展、面向应用和符合汉语本身特点的原则,提出了一个面向自然语言处理的汉语句子语义知识系统,以此为基础进行了汉语句子语义知识库构建的理论研究和建库实践探索。论文共分五章,各章节的内容安排如下:第一章绪论。从建库目标、方法论、标注内容、系统构成及成果应用等角度详细介绍了国内外构建的几个重要的句子语义资源,总结提出汉语句子语义资源建设中存在的问题,并且陈述了本研究的意义与价值,明确了研究思路。第二、三、四章是论文的主体内容。第二章自然语言处理需要的句子语义知识。分析自然语言处理对语言知识尤其是句子语义知识的要求,构拟出面向自然语言处理的汉语句子语义知识系统,该系统由句内语义知识系统和句间语义知识系统两个子系统构成,并介绍了这两个子系统的主要构成要素。第三章句内语义知识库。首先对句内语义知识库的核心要素——语义角色做了详细分析,讨论了语义角色精细等级、数量设置和分类等内容,提出语义角色体系的评价标准。然后介绍了汉语句法语义标注库构建的相关内容,如建库目标、原则、方法、流程、语料来源、标注信息等。最后对句法语义标注过程中的具体问题及解决策略作了说明。第四章句间语义知识库——文本蕴涵库。总结国外研究成果,提出汉语文本蕴涵的内涵和类型,详细介绍了汉语文本蕴涵库的建库目的、方法、流程、语料来源、标注信息、质量保证等,并在建成的汉语文本蕴涵库的基础上做了统计分析。第五章结语。总结本课题的研究成果和不足,并指出下一步的研究任务。本文的创新之处在于:着眼于自然语言处理的需要,在句子层面从句内和句间两个角度来构建汉语语义知识库,既有理论研究又有实践探索,能够为中文信息处理提供可用的知识系统,并为今后大规模句子语义知识库的构建积累经验、提供借鉴。