基于语义资源和认知视角的隐喻识别与应用

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:sws1274
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻是用来描述和理解抽象概念的主要手段,它不但是一种语言现象,也是一种认知方式。隐喻普遍存在于人类语言中,每三句话中就可能出现一次隐喻表达。近年来,随着推特、微博、论坛等社交媒体的迅速崛起,隐喻文本出现在更加多元化的平台上,得到了更广泛的关注。因此,人们迫切需要自然语言处理海量的隐喻信息。隐喻识别研究旨在赋予计算机像人类一样分析隐喻的能力,是一项富有挑战的研究课题。针对目前国内外隐喻研究中语义资源稀缺、语义信息利用不足、应用研究缺乏等问题,本文在构建隐喻语料库的基础上,展开隐喻识别研究,并探索隐喻识别在不同场景中的应用模式和范例,即从“资源建设”到“识别”,再到“应用”的研究框架。主要研究成果如下:(1)在隐喻语义资源建设方面,设计了基于认知语言学理论的标注框架以及有效、规范、合理的质量监控体系;构建了大规模的中文隐喻语料库。提出了基于标注者画像的隐喻标注个性化方法,依据标注者的个性化特征和标注历史数据分配标注任务,同时采取“小众任务优先分配”策略,以保证“小众”任务的标注质量。实验结果表明所提出的标注方法可以有效地提高隐喻标注质量,为隐喻识别提供必要的语义资源。(2)在隐喻识别方面,提出了基于BERT与Transformer模型的名词隐喻识别方法,使用BERT模型替代词向量,在语义表示中同时包含词与词之间的位置关系等信息,利用Transformer模型进行特征提取并通过神经网络分类器进行识别。此外,提出了基于同义词林和注意力网络的动词隐喻识别方法,首先改进词向量,使其融合同义词词林的语义信息,包含词语抽象度等信息。构建了一种基于主谓宾句子结构信息的动词隐喻Attention网络,使得LSTM充分考虑到全局结构信息。实验结果表明所提出的隐喻识别方法超过了现有基于人工特征的分类模型及主流深度学习模型。(3)在隐喻应用研究方面,提出了基于隐喻的创造力与心理健康评估模型。首先,在隐喻识别的基础上,融合情感等特征,评估学生作文的创新性,在此基础上的写作自动评估系统可以更全面、更深入地评估写作质量,进而提高写作评估系统的有效性。其次,在识别出隐喻句的基础上,结合上下文特征和大学生心理测评报告结果,构建大学生心理健康问题预测模型,进而完成基于隐喻的大学生心理健康评估。实验结果表明所提出的方法能够有效地进行创造力和心理健康评估,本文对基于隐喻特征的写作自动评价和心理健康状态评测进行了有益地尝试。
其他文献
【正】 昆曲。原称昆山腔,简称昆腔,解放前后亦称昆剧。它是以昆山腔曲调演唱用南北曲文体撰写剧本的一个古老剧种,也是中国戏曲四大声腔(昆腔、弋腔、梆子腔,皮黄腔)之一。
期刊
<正>近日,得知自己获得"一师一优课"的市优和省优后,南昌市经开区新庐小学从教刚满一年的苏欣按捺不住心中的喜悦,马上给南昌师范学院的教授打电话,表达感谢。此前,苏欣从来
1978年,中国进入了改革开放的历史新时期。在改革开放过程中,珠三角和长三角先后成长为中国最大的两个经济体。两个区域的发展各具特色,其苏南模式、温州模式、顺德模式,都曾
数学一直以来都是我国小学教育阶段中非常重要的一门学科,这门学科既能够培养学生的逻辑思维能力,又能够帮助学生掌握解决问题的方法。随着我国素质教育理念的普及,小学数学
中央高度重视解决中小企业的融资难问题。习近平总书记在2018年召开的民营企业座谈会上强调,要优先解决民营企业,特别是中小企业融资难,甚至融不到资问题。在2020年7月份召开
目的分析在老年性脑梗死护理工作中采用优质护理服务的应用效果。方法选取本院2013年11月~2015年12月收治的老年性脑梗死患者80例作为研究对象,随机分为护理组和参照组,各40
胶体微球的自组装和向基于微球的光子晶体模板中填充高分子构筑复合材料是制备聚合物光子晶体结构生色材料的两种重要途径。糖基高分子具有生物相容性、廉价易得且环境友好的
教师的科研能力在很大程度上影响与制约着学校质量的整体"品质",也在更高层面上决定着学校的核心竞争力。教师科研能力建设是一个全方位的系统工程,文章从个人、学校、社会三
使用流速仪用精测法施测明渠流量,各次流量的测速垂线固定,各条测速垂线的平均流速与断面平均流速建立相关关系,分析各条垂线流速的代表性,并进行误差计算,找出代表性最好,推
研究背景与目的:在世界范围内,肺癌是发病率和死亡率最高的恶性肿瘤之一,其中肺腺癌(Lung adenocarcinoma,LAC)是肺癌最常见的病理类型之一。由于肺癌患者早期缺乏明显的临床