论文部分内容阅读
汉语隐喻处理是自然语言处理的一个重要研究分支。目前人们越来越清楚的认识到隐喻在思维及语言中所处的中心地位,从计算语言学和自然语言处理的角度来考虑,汉语隐喻自动处理问题在某种程度上已经成为基于篇章处理的自动文摘、机器翻译、信息检索等的瓶颈。本文在分析现有国内外隐喻自动处理成果的基础上,从语义分析的角度出发构建了一个较为完整的汉语隐喻自动处理体系,并给出了自动处理模型。该体系将汉语隐喻的自动处理分为预处理,判别,理解三个阶段,论文对这三个阶段进行了较为深入的研究,所做的具体工作和取得的成果主要体现在以下几个方面。首先,本文在汉语隐喻处理领域首次提出了比较完整的隐喻自动处理的模型,并基于知网(Hownet)构造了一个汉语隐喻自动处理系统。该系统先对待处理语句进行分词、句法分析等预处理,然后判断该语句是否为隐喻句,并提取隐喻句的本喻体词,最后对隐喻语句本喻体词分别构建微本体并利用两个微本体间的语义映射进行汉语隐喻句自动理解。其次,基于图论的思想对汉语语句建模并提出了一种汉语隐喻句判别方法和分类体系。该方法首先按照本体描述语言的建模方法分析了汉语语句的成分和结构,然后对汉语语句进行语义建模(即构建汉语语句语义网),再通过隐喻弧判断语句是否为隐喻句,该方法可以判别出汉语隐喻语句并识别出隐喻句的类型及其本喻体,从而为后续的隐喻处理打下基础。最后,为了使Hownet能够应用于汉语隐喻理解,对Hownet进行了两个方面进行了优化改进,一是在语义计算公式中采用多义原处理,从而提高了基于Hownet的语义计算的精度;另一个是改进了Hownet的知识索引结构,提高了知网知识搜索的效率。以此为基础设计了用语义计算的方法构建隐喻句中本喻体的微本体的流程,并在此基础上通过本喻体微本体间的语义映射进行汉语隐喻句的自动理解。