基于知网的汉语隐喻自动处理

来源 :兰州大学 | 被引量 : 0次 | 上传用户:lianxirenll520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语隐喻处理是自然语言处理的一个重要研究分支。目前人们越来越清楚的认识到隐喻在思维及语言中所处的中心地位,从计算语言学和自然语言处理的角度来考虑,汉语隐喻自动处理问题在某种程度上已经成为基于篇章处理的自动文摘、机器翻译、信息检索等的瓶颈。本文在分析现有国内外隐喻自动处理成果的基础上,从语义分析的角度出发构建了一个较为完整的汉语隐喻自动处理体系,并给出了自动处理模型。该体系将汉语隐喻的自动处理分为预处理,判别,理解三个阶段,论文对这三个阶段进行了较为深入的研究,所做的具体工作和取得的成果主要体现在以下几个方面。首先,本文在汉语隐喻处理领域首次提出了比较完整的隐喻自动处理的模型,并基于知网(Hownet)构造了一个汉语隐喻自动处理系统。该系统先对待处理语句进行分词、句法分析等预处理,然后判断该语句是否为隐喻句,并提取隐喻句的本喻体词,最后对隐喻语句本喻体词分别构建微本体并利用两个微本体间的语义映射进行汉语隐喻句自动理解。其次,基于图论的思想对汉语语句建模并提出了一种汉语隐喻句判别方法和分类体系。该方法首先按照本体描述语言的建模方法分析了汉语语句的成分和结构,然后对汉语语句进行语义建模(即构建汉语语句语义网),再通过隐喻弧判断语句是否为隐喻句,该方法可以判别出汉语隐喻语句并识别出隐喻句的类型及其本喻体,从而为后续的隐喻处理打下基础。最后,为了使Hownet能够应用于汉语隐喻理解,对Hownet进行了两个方面进行了优化改进,一是在语义计算公式中采用多义原处理,从而提高了基于Hownet的语义计算的精度;另一个是改进了Hownet的知识索引结构,提高了知网知识搜索的效率。以此为基础设计了用语义计算的方法构建隐喻句中本喻体的微本体的流程,并在此基础上通过本喻体微本体间的语义映射进行汉语隐喻句的自动理解。
其他文献
本文研究专利信息检索系统的推送与数据挖掘的应用问题,目的是在当今网络信息资源迅速膨胀的情况下,改变用户传统的通过主动搜索来获取信息的方式,主动向其推送需要的信息,从
昆虫是动物界中一个十分庞大的类群,所包含的种数比所有动物类群的总和还要多,已经记载和命名的昆虫大约就有一百万种。将中国目前已经发现和命名的昆虫的分类资料数字化,建
当越来越多的企业将其核心业务搬上Web,以Web服务的形式部署之后,如何有效的自动组合Web服务来完成复杂的功能成为当前研究的热点。通过研究语义Web服务的自动组合技术,建立
计算机技术的飞速发展使嵌入式系统得到了广泛的应用,板级支持包(BSP:Board Support Packet)作为嵌入式系统开发和调试的重要工具,其通信功能尤其重要。随着板级支持包通信方
目前,电子商务最常用的身份认证方法是由权威认证中心CA(Certificate Authority)负责为客户颁发表明其身份的数字证书。然而,基于PKI(Public Key Infrastructure)的数字证书
多媒体实时教学系统是指在计算机网络环境下,借助现代化的多媒体技术进行教学的计算机辅助教学系统。在网络多媒体教学系统中,允许不同时空上的学生共享学习资源,通过协同对
近年来,分布式拒绝服务攻击(DDoS, Distributed Denial of Service)严重影响着Internet安全,给Internet的应用和发展带来了极大危害。目前,网络流量的自相似性、时间序列分析
学位
计算机网络技术的发展和应用便利了社会、生活的方方面面,而无纸化考试更作为一个具有广泛前景的应用领域变革了传统的考试方式。随着无纸化考试系统的研究与发展,以互联网技
信息技术的日新月异使得各个领域的数据量激增,在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段。序列模式发现是其中的一个重要研究课