基于神经网络的中文谓语动词识别方法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:xiexieni777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谓语动词是句子的焦点,是组织句子其它要素的语法单元。识别谓语动词是理解句子的关键。通过谓语动词识别可以解析句子,获取句子的语义信息,抽取的信息可以作为输入信息,提供给机器翻译、文本检索、知识图谱、自动问答等多种应用。通过构建以谓语动词为中心的知识图谱,可以建模事件的动态演化过程,实现事件识别与事件跟踪,具有重要的研究意义。然而,由于中文谓语动词形式多变、结构复杂、使用灵活,加上中文信息处理缺少句子分词信息和词的形态变化,而谓语动词的识别需同时判断其为句子的中心,在识别路径中存在高阶依赖,所以识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,结合谓语动词的语法功能和文本数据的分布特点,制定中文谓语动词标注规范,发布标注数据集。在此基础上,展开与中文谓语动词识别相关的研究。论文主要工作如下。(1)针对当前中文谓语动词语料缺乏的情况,将法院裁判文书作为数据源,确立标注规范,再使用人工标注迭代检查等手段构建了中文谓语动词标注数据集。(2)针对谓语动词作为句子焦点的特点,提出一种基于注意力机制的中文谓语动词识别方法和一种基于BERT的中文谓语动词识别方法。由于注意力机制能够获取句子中的长距离语义依赖信息,与传统方法相比,基于注意力机制的方法能有效提升谓语动词的识别性能。基于BERT的中文谓语动词识别模型则改进了前种方法,利用BERT可以充分利用输入语料的优点,使得模型性能有所提升。(3)针对谓语动词在句子中具有唯一性的特点,提出一种基于CNN的谓语动词唯一性判别方法。通过设置分类拟合条件,使数据在训练过程中能够优化输出、充分拟合谓语动词的句子全局唯一性的特点,取得了更为优良的效果。
其他文献
随着机器视觉和图像处理技术的快速发展,图像测量技术因其精度高、实时性强、适用范围广、测量过程非接触等特点,成为了当前新型综合性测量系统研究的热点。本文对图像测量技术在内部空间静态参数测量场景中的应用做了相应研究,研究点主要包括测量系统的现场标定和精确定位技术。首先,以直线度、径向尺寸和容积为例介绍了内部空间静态参数的图像测量原理,然后搭建了以计算机、测量靶标、光学成像模块、运动控制模块为主的实验平
人工智能始于1956年,它在达特茅斯会议上被首次提出,并成为了一个全新的学科,自此开始了长达70年的发展历程。随着近几年的飞速发展,人工智能技术愈加成熟,已经广泛应用于智能驾驶、智慧安防、智慧金融等新的行业形态,为人们生活带来极大便利。可以预见,在不久的将来,人工智能产品将会与人们的生活息息相关,发展和学习人工智能技术已经成为时代趋势。然而,目前国内人工智能专业人才的培养仍然面临着很多挑战,主要体
随着军民融合上升为国家战略,军民融合企业成为社会各界关注的对象,由于军民融合企业的特殊性,它的兴衰同时牵动着关系国家安全和国民经济运行的两条国家命脉的发展。协同创新是军民融合企业在新时代背景下持续经营与长久发展的最佳方式。军民融合企业正确理解协同创新能力的内涵,清楚的掌握自身协同创新能力的水平,对于军民融合企业开展协同创新活动和提升自身协同创新能力都是极为有益的。为了深入了解军民融合企业协同创新能
随着我国社会主义市场经济的发展,资本市场的作用日益被人们关注和重视,而金融保险作为证券市场的先驱,始终是投资者的偏好和选择。众所周知,股市有风险,因此,投资者在衡量投资价值时,必须要考虑保险公司所面临的信用风险可能对其造成的影响。目前,许多学者对于保险行业的投资价值能力、信用风险度量模式等都进行了深入的研究,取得了一系列有借鉴意义的研究成果,但是将投资价值能力、信用风险度量模式二者联系起来的理论和
近年来,随着城市工业和交通行业的不断发展,我国城市声环境质量受到了越来越严峻的挑战,由此产生的噪声污染问题不仅损害了居民的身心健康,还在一定程度上影响了交通管制分流和城市道路建设规划。在这样的形势下,如何有效治理噪声污染己经成为世界各国研究应对策略的重点。通过对国内外相关工作的研究发现,目前市面上已存在多种技术手段来处理噪声污染问题,如噪声监测技术、噪声模拟研究、噪声可视化技术等。然而,噪声监测需
石墨烯作为新型的二维材料,能够应用于相位调制器和光开关等电光调制器上。使用石墨烯光纤作为材料构成的电光调制器长度在纳米量级,需要的电压和电压调节范围均在十分之一伏
近年来中国经济一直保持着较高的发展速度,中国企业发展的焦点由以往的技术和市场开始转向为人力资源管理,企业的不断发展使得人力资源管理的矛盾愈发突显,特别是其中的绩效管理方面的问题。国有石油企业是我国石油行业内的风向标与引导者,对于此类企业而言,科学有效的绩效管理至关重要,对其日后稳定发展也有着巨大影响。虽然各个企业都在实行各自的绩效管理制度,但是在实施过程中都或多或少存在一些问题,A公司作为国有石油
人脸识别是模式识别领域的研究热点之一。有效的提取图像中的特征是人脸识别研究过程中所要面对的首要任务。因此设计有效的特征提取方法成为了提高人脸识别性能的关键。而在实际中,带有遮挡、光照、神态变化等各种干扰的图像随处可见,传统的特征提取方法在处理这类问题时的效果往往不尽如人意。本文基于多流形学习的思想,设计和实现了几种具有较强鉴别力的人脸识别特征提取算法,主要的工作可概括如下:1、基于最大间距准则的鲁
财税体制的全面深化改革,以及税收政策的不断调整完善,使得“营改增”作为我国财税领域的重要政策,取得长足进步。同时,随着市场经济的扩大及经济全球化步伐的加快,企业对“营改增”的认识也在逐渐提高,各行业开始借助不同的“营改增”政策来减轻企业税负,提高自身财务绩效水平,然而这些企业在营业税改征增值税后,其税收负担与财务绩效究竟如何变化,对企业存在哪些利弊,仍然值得我们仔细分析讨论。影视业对比其他行业而言
随着软件系统应用领域不断扩大,对于软件和信息系统的攻击日益增多,人们对软件安全的要求不断提升。为此,在软件开发和测试过程中,工程师使用静态代码分析系统对软件代码进行安全性扫描,并评估分析报告,只有通过安全性评估的软件才可以部署至线上运行。然而,传统代码分析是保守的,为不遗漏安全风险,系统往往会抛出大量误报,这些误报增加了安全工程师工作量,进而对软件开发进度产生影响。随着机器学习领域的发展,学术界已