论文部分内容阅读
语义分析是自然语言处理领域中最重要也是最为困难的问题。如何对句子进行有效的、深入的自动语义分析,一直是国内外学者关注的主要目标之一。汉语句子的框架语义结构分析技术是以框架语义学为理论基础,借助山西大学的汉语框架网语义资源,针对汉语句子语义结构,展开了汉语句子框架语义结构建模、目标词识别、框架排歧和框架语义角色标注等核心技术研究,同时,对基于汉语框架语义分析的旅游问答系统进行了应用研究。主要研究成果如下:(1)针对汉语句子语义结构,系统地进行了汉语句子框架语义结构分析,提出了汉语框架语义依存图模型,包括单框架语义依存图、完全框架语义依存图、核心框架语义依存图,为汉语句子语义结构表示提供了新的方法。(2)针对目标词识别问题,提出了基于相似度计算、最大熵模型的未登录目标词识别方法,充分考虑了词义信息、依存特征及上下文语境,有效地解决了未登录目标词的识别,为实现准确的框架排歧提供了保障。(3)针对框架排歧问题,提出了基于T-CRF的框架排歧方法,通过加入依存特征中长距离的依存关系提升了汉语框架排歧的性能,同时与基于SVM和最大熵模型排歧方法进行了对比实验,验证了基于T-CRF框架排歧的有效性。(4)针对框架语义角色标注问题,在总结对比现有主流算法的基础上,提出了基于T-CRF模型的框架语义角色标注方法,并通过加入依存特征提升了标注准确率。其次,基于框架语义角色标注进行了句子相似度计算,从框架语义的角度出发,提出了基于多框架及其重要度的句子语义相似度计算方法,实验结果验证了框架语义角色对句子语义相似度计算的有效性。(5)针对汉语框架网语义资源与语义分析方法的应用研究,设计并实现了面向山西旅游领域的问答实验原型系统。系统以旅游景点五台山为例,针对每个景点的简介文本进行了全文框架语义角色标注。系统包括问题输入、问句分析及答案抽取,验证了基于框架语义分析进行问答系统应用的可行性。本文的研究成果进一步丰富了汉语句子框架语义结构分析理论与方法,为实现汉语句子深层语义分析提供了新的途径,为自然语言处理领域基于语义分析的应用系统提供了一种新的技术支撑。