【摘 要】
:
明喻识别需要判断输入句子的类别(即是否属于明喻句),并识别句中的明喻成分(如,本体和喻体),是一项具有重要研究价值的文本挖掘任务。明喻句是指使用“像”或“犹如”等比喻
论文部分内容阅读
明喻识别需要判断输入句子的类别(即是否属于明喻句),并识别句中的明喻成分(如,本体和喻体),是一项具有重要研究价值的文本挖掘任务。明喻句是指使用“像”或“犹如”等比喻词将本体和喻体显式连接起来的一种比喻手法,常见形式是“A像B”。其中,“A”为本体,“B”为喻体。值得注意的是,本体和喻体通常是两种不同的事物。在明喻识别任务中,前人的研究工作表明明喻成分通常是一个名词短语。也就是说,词性信息对于明喻成分的识别相当重要。然而,主流的明喻识别模型通常只使用一个相同的静态词向量对词语进行表征,无法准确区分多义词在不同语境下的词性信息,从而导致模型难以识别其明喻标签。在本文中,多义词是指具有多种语义的一类词语,通常在不同的语境下具有不同的词性类别(如形容词,副词,名词或动词)。除此之外,主流模型基于循环神经网络及其变种进行模型设计,假设当前时刻的状态只与上一时刻的状态以及当前时刻的输入有关,无法显式建模句中任意两个词之间的依赖关系,存在全局依赖问题。当明喻句中的本体和喻体相距较远时,模型难以准确识别句中所有的本体和喻体。为缓解上述问题,本文提出一种新颖的神经网络框架。首先,在词嵌入层中采用显式词性集成技术对词向量和词性向量进行有机组合,丰富嵌入层的词表示,帮助模型更加精确地区分多义词的确切语义,从而降低多义词的干扰。接着,引入自注意力机制帮助模型建模输入句子中任意两个词语之间的显式依赖,从而缓解全局依赖问题。最后,本文根据提出的框架分别为明喻识别任务的两个子任务进行了详细的模型设计。为验证本文提出模型的有效性,我们在Liu提供的数据集上进行了大量的实验。实验结果表明,本文提出的模型在明喻识别任务上要明显优于之前state-of-the-art的方法。通过消融实验分析表明,显式词性集成技术和自注意力机制在明喻识别任务中都是非常有效的。具体地,在明喻句分类任务中,显式词性集成技术倾向于提升模型的召回率,而自注意力机制则倾向于提升模型的查准率;在明喻成分提取任务中,显式词性集成技术能够同时提升模型的召回率和查准率,而自注意力机制则倾向于提升模型的召回率。
其他文献
截止2018年年末,我国城镇化率已达59.58%。我国城市化发展取得了举世瞩目的成就,但城市化水平提高本身不是城市化的最终目标,城市化进程给人们带来幸福感才是城市化的根本目
随着网络流量持续增加,目前的网络技术随着流量的增长,网络设备的能耗也居高不下,未来网络技术要持续发展必须要突破能量瓶颈。换句话说,未来的网络技术不须能处理比现在大几
自2016年起,肇庆公共资源交易平台已经运行了3年,对肇庆市公共资源的有效配置起到了积极的贡献,为肇庆市在市场化进一步深入和信息化时代背景下探索公开、透明和高效地进行公
人脸识别一直是身份识别的热点研究领域。特征提取和分类识别算法是人脸识别中的两大问题,但非特定情境下很容易受到表情、姿态、饰物、头发以及光照等因素的影响。本文主要针对人脸的局部纹理特征及深度信念网络模型进行研究,主要工作如下:1、提出了一种基于TPLBP特征和深度信念网络人脸识别算法模型。该模型先提取人脸的TPLBP特征;再采用深度信念网络对之进行学习和降维;最后采用Softmax分类器对人脸进行识
在银行商业智能系统的建设过程中,报表系统是数据应用的集中体现,如何解决好报表系统问题显得尤为重要。传统的报表系统存在着各种问题,尤其是报表制作难、变更难、报表执行
随着机器人、物联网等技术的发展与普及,应用自动导引车(AGV)的智能物流仓库以其高效的运作效率赢得了广大企业的青睐。在自动导引车系统(AGVS)中,主要存在碰撞与死锁两大难题,过去的仓库设计者往往采用单行线地图的方式规避该问题,但这种过于保守的地图设计策略将导致AGV需要绕行更远的距离才能抵达目的地,限制了AGVS的性能发挥。本文旨在保证AGVS较高运行效率的前提下,提出有效的交通控制策略,确保系
自治是国际体育仲裁的品质,司法是解决体育纠纷的最后阀门,两者的冲突不可避免。为了更好的实现国际体育纠纷的高效和公正的解决,实现两者的协调也成为必要。本文采用文献研
风是描述大气运动状态的基本参量之一,全球风场的精确测量对于提高数值天气预报的准确性有着重要的作用。激光雷达具有很高的时空分辨率,近几十年发展迅速,在对地观测的贡献
自主导引车AGV(Automatic Guided Vehicle)调度系统提供了一种可以在工业生产环境中提高生产效率,降低劳动强度和危险性的途径。由于仓库空间,货架布局,路径设计等因素的限制
随着贸易成本、通讯成本的降低,全球价值链分工逐渐细化。各国基于比较优势嵌入国际分工不同生产环节,以实现价值增值,全球价值链分工逐渐成为主流。农产品加工业获利能力有