基于Hownet和Verbnet的中文动词性隐喻识别

被引量 : 0次 | 上传用户:zhangqing1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻是语言和思维的中心问题,是人类语言中普遍存在的现象。现今,隐喻的机器识别问题已经成为自然语言领域研究的热门课题。目前,汉语隐喻识别的研究大部分都集中在对名词的识别上,然而,相对于其它类型的隐喻,动词性隐喻在实际文本中出现的频率最高,更应该受到中文隐喻的研究者们的重视。本文的研究目的,是把中文动词性隐喻识别问题转化为英文的隐喻识别问题,利用完善的英文动词知识库Verbnet,去更好的进行中文的动词性隐喻识别工作,从而弥补现有的中文隐喻知识库规模小的缺点。本文分析了知网、同义词词林和Wordnet的构建特点,提出了一种Hownet、同义词词林和Wordnet之间的语义映射方法。首先,把同义词词林中的义项转化为Hownet概念的集合,再根据概念的英文翻译,把同义词词林中同义词集转为英文的同义词集,最后,计算该英文同义词集与Wordnet中Synset的词汇相交度的最大值,从而建立起Hownet概念到Wordnet中Synset的映射关系。实验结果证明,该方法的映射准确率达到了90%以上,显示了映射方法的可行性。在成功的把中文词汇映射为英文词汇后,本文提出了一种基于Hownet和Verbnet的中文动词性隐喻识别方法,该方法利用Verbnet中动词的题元角色及其语义选择限制,判断语句中动作的施事者和受事者是否符合正常的搭配,从而识别出超常规的搭配。随后,从“读者”语料库中随机抽取了20个句子对方法进行测试,实验结果达到了预期,有力的证明了该方法对动词隐喻识别的有效性。综上所述,本文的研究给出了基于Hownet和Verbnet的中文动词性隐喻识别的思想和方法,为汉语隐喻识别的进一步研究,提供了一定的理论意义和参考价值。
其他文献
我国风电资源丰富,大力发展风电是我国调整能源结构、实现减排目标的重要能源发展战略。目前,我国风电已进入规模化快速发展阶段,取得了举世瞩目的发展成就,并呈现出广阔的发
最近几年,我国煤炭市场陷入低谷期,煤炭企业的外在发展形势不容乐观,从之前的卖方市场变成了买方市场,煤炭出现了滞销的情况,面对这种消极的煤炭销售市场,煤炭企业应该进行及
在我国民营资本快速成长的现实条件下,定性和定量地把握外商直接投资对民营资本的作用方向和大小,同时理清国内不同经济部门之间的动态关系是十分必要的,进一步地探究符合我
据国家汉办统计,目前全球学习汉语的人数已达到4000多万。随着汉语热的不断升温,越来越多的外国人对中国文化产生了浓厚的兴趣。与汉语文化热相伴而来的是,文化教材的迅猛发
乳铁蛋白(Lactoferrin, LF)是一种具有多重生理功能的天然铁结合性糖蛋白,近年来其成骨活性成为了研究热点,然而LF的作用机制尚不明确。本研究在细胞和分子层面,首次对牛LF作
针对励磁涌流具有间断角的尖顶波和故障电流以正弦波为主,充分利用两种不同波形下具有不同的电流能量熵值,提出了基于信息熵的变压器励磁涌流识别方法。该方法对变压器电流离
行为保全作为和财产保全并列的两种保全制度,其最终目的均是为了实现权利人的主张,但是基于其对象的特殊性,行为保全是要求被申请人作出或者禁止被申请人作出某种行为,并不存
目的:探讨中学生自杀意念现状及其相关因素,为中学生自杀预防和干预工作提供参考。方法:采用分层整群抽样方法,选择安徽省芜湖6所中学约4 572名学生进行无记名问卷调查。结果:中
传统产业分工与布局理论是在工业化框架下的产业"自选择",随着城市化发展,作为产业"环境"的城市功能正在不断分化,资源配置能力与结构也出现差异化,环境-产业协同演化要求产