【摘 要】
:
蒙古文命名实体识别是蒙古文自然语言处理的一项基础任务,其识别性能会直接影响后续处理任务或相关应用的性能。目前,基于深度学习的蒙古文命名实体识别研究工作相对较少,而采用传统机器学习方法在识别效果上仍不够理想。鉴于深度学习在其他语言命名实体识别中的优良表现和广泛应用,本文以双向长短时记忆网络-条件随机场模型(Bidirectional Long Short-term Memory-Conditiona
论文部分内容阅读
蒙古文命名实体识别是蒙古文自然语言处理的一项基础任务,其识别性能会直接影响后续处理任务或相关应用的性能。目前,基于深度学习的蒙古文命名实体识别研究工作相对较少,而采用传统机器学习方法在识别效果上仍不够理想。鉴于深度学习在其他语言命名实体识别中的优良表现和广泛应用,本文以双向长短时记忆网络-条件随机场模型(Bidirectional Long Short-term Memory-Conditional Random Fields,BLSTM-CRF)作为基线模型,同时结合蒙古文的构词特性,提出了融合语言模型和注意力机制的蒙古文命名实体识别方法。论文的主要工作如下:首先,本文提出了融合语言模型的蒙古文命名实体识别模型(Mongolian Named Entity Recognition-Language Model,MNER-LM)。针对蒙古文命名实体识别中标注语料稀缺的情况,本文通过训练语言模型捕获蒙古文文本中蕴含的语法和句法等语言学特征信息,并将这些特征信息引入BLSTM-CRF模型中来完成对模型仅从有限标注语料中学习到的信息进一步扩充。实验结果表明,MNER-LM模型的平均F值相比基线模型提高了0.86,并在训练数据匮乏的情况下,具有很好的鲁棒性。其次,针对BLSTM-CRF模型的输入层中蒙古文词素向量和字符级向量间存在信息表达能力不均衡的现象,本文使用注意力机制动态组合两种特征向量,增强模型输入层的信息表达能力,减轻不均衡现象带来的影响,提出了融合注意力机制的蒙古文命名实体识别模型(Mongolian Named Entity Recognition-Attention,MNER-ATT),其F值相比基线模型提高了0.5,验证了模型的可行性。最后,本文在MNER-LM模型的基础上,使用注意力机制改进模型编码层,减轻编码层中特征向量信息不对称现象带来的影响,提出了融合语言模型和注意力机制的蒙古文命名实体识别模型(Mongolian Named Entity Recognition-Language Model-Attention,MNER-LM-ATT)。实验结果表明,MNER-LM-ATT模型能进一步提升系统性能,其平均F值相比基线模型提高了1.13。
其他文献
目的探讨采用Protaper镍钛系统在根管预备中的临床效果。方法将258位病人的320颗怠牙随机分为2纽。Protaper组所有患牙采用Protaper镍钛器械根管预备,对照组采用普通不锈钢器
优良的室内环境不仅可以保障人的健康,还能提高人员的工作效率。目前对室内环境的评价研究多种多样,但现有的研究大多从空气环境或热环境单方面出发进行评价,评价因子不够全面,少许研究将空气和热环境结合起来进行评价,但其评价结果多为定性的描述,针对以上问题,本文采取一种定量描述室内环境的办法,将空气环境与热环境结合起来评价室内环境的优劣。首先,采用不同的量化模型,分别对室内空气环境因子及热环境因子进行量化处
利用太阳能集热技术产生温度为80-250℃左右的中温蒸汽,用于驱动制冷空调、有机朗肯循环发电、海水淡化以及工业加热等,具有巨大的节能潜力和应用前景。目前我国太阳能热利用
【摘 要】长期以来,传授英语语言知识在我国初中英语教学中取得显著的成就。然而,以应试为主的传统英语教学模式所具有的弊端,尤其是学生综合语言运用能力的培养和学生主体性的发挥等被忽视的现象日益突出。初中英语课堂教学耗费时间长,效果不理想,已成为不争的事实。因此,在初中阶段探索英语课堂教学模式的改革势在必行。针对初中英语课堂教学现状,笔者从目前的不足,对互动交流式教学法的理念进行阐述,并把这种教学法运用
【中图分类号】G633.7【文献标识码】A 【文章编号】2095-3089(2015)16-0108-01 教师对教材的讲授,学生对知识的学习,都是从引入新课开始的。俗话说:“好的开始是成功的一半”,新课的引入,是课堂教学中一个不可忽视的重要环节,并且对整个教学有着非常重要的作用。每堂课开头的任务就是要启发思维,激发起学生强烈的求知欲望和浓厚的学习兴趣,为学生学习新知识奠定必要的知识基础和心理准
本文主要观照的是跨越半个多世纪的澳门电台发展历程。研究认为澳门电台的发展历经独立发展、并存竞争、世纪飞跃三个阶段,每一阶段都各具特色。同时,研究将澳门电台的发展镶嵌
桥梁健康监测一直以来是桥梁安全的重要保障,通过实时监测能够帮助及时发现桥梁的损伤,保证国民出行的安全。然而这一切的基础是能够采集到准确有效的数据,只有采集到能够真实反应桥梁各节点的相应传感器数据,才能为桥梁健康监测做好输出工作。然而一方面有效的数据段采集比较困难,另一方面如何划定有效数据和无效数据一直是难点,此外对数据的划分需要消耗大量的人力和精力,深度学习网络在日益完善,在桥梁健康监测领域有广泛
广州新光大桥主墩为V形三角刚架结构,结构造型新颖、体积较大,施工难度很大。施工中采用比较新颖和先进的方案,运用多项施工技术,多快好省地完成了三角刚架的施工。
通过对箱梁场内滑移方案的比选,石太客运专线Z9标梁场选择了操作简便、易于维护和保养、购置费用低的轮轨式移梁台车方案。通过实际应用,不仅安全可靠,而且劳动强度低,经济效益好
为了探讨黑暗人格对中学生抑郁的影响,以及被霸凌水平在其中所起的作用,采用横向与纵向调查相结合的方式进行调查研究。本研究主要包括两部分:研究一为横向研究,采用黑暗三联征量表中文版(Dirty Dozen,DD)、Olweus儿童欺负问卷中文版及流调中心抑郁量表(Center for Epidemiological Studies Depression Scale,CES-D),从横向的角度考察中学生