面向旅游领域的蒙古文命名实体识别的研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:mistbaby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理领域的重要研究内容之一,是多项自然语言处理任务的基础工作。本文针对蒙古文旅游领域命名实体识别中标注语料库缺乏、实体识别准确率低等问题进行了研究,构建了一个蒙古文旅游领域命名实体识别标注语料库,该语料库标注了84607个实体,包括人名、景点名等5大类、18小类。在此基础上,使用深度学习技术,对面向旅游领域的蒙古文命名实体识别展开研究,具体内容如下:针对多义词中向量表示不充分的问题,本文提出了一种基于MonBERT的蒙古文旅游领域命名实体识别方法。该方法根据蒙古文构词特点,预训练了一个随上下文语境动态变化的蒙古文向量化表示(MonBERT),并将其作为神经网络实体识别模型的输入得到识别结果。实验结果表明,该方法在蒙古文旅游领域命名实体识别任务上取得了比传统Word2Vec静态词向量表示方法较优的效果,表明MonBERT向量化表示有助于提升实体识别效果。针对领域实体识别准确率低的问题,本文提出了一种融合多任务学习的蒙古文旅游领域命名实体识别方法。该方法利用多任务思想,将边界识别任务作为实体识别任务的附属子任务,通过学习边界特征辅助提升实体识别准确率。实验结果表明,边界信息可以较好的辅助提升实体识别性能。基于上述方法,本文搭建了一个蒙古文旅游领域命名实体识别原型系统与服务,实现了蒙古文旅游领域命名实体的识别。
其他文献
蒙古语语音转换是蒙古文信息处理的一个重要分支,语音转换技术是指在不改变语音内容的前提下,将一个说话人(源说话人)的语音转换成另一个说话人(目标说话人)语音的一种技术,近些年来随着深度学习算法的提出,人工智能技术得到了快速的发展,而语音转换技术也因采用了深度学习模型而使得转换后语音质量获得较大的提升。目前,关于英语和汉语等主流语言的语音转换研究已经获得了非常多的成果,但是关于蒙古语的语音转换技术仍处
本文通过对收集的语料库语料进行统计与分析,发现不同汉语水平的外国学生关于"的"字用法的习得顺序大致依次为"的"字短语修饰名词、"是……的"结构、构成的字短语代替名词、用在句末表示肯定语气、表示"等等、之类"的意思、词语或短语中插入"的"、"的"字短语用在"动词+得"之后表示结果状态。此外,不同水平之间的习得顺序存在一定的差异,不同习得项目的偏误类型也有所差别。
智能移动机器人是我国先进制造技术领域最重要的研究方向之一,同时也是数字化、信息化社会不可或缺的组成部分。随着社会的发展和科技的进步,传统的按键或摇杆等手动操作方式逐渐被时代淘汰,基于视觉跟随、语音控制和自动导航等新型控制方式的机器人越来越受到人们的关注。针对小场景内不确定的环境条件,开展移动机器人场景地图构建、机器人定位、机器人导航相关研究对提高移动机器人的服务质量和扩大应用范围具有重要意义。论文
随着科技水平的高速发展,农业现代化的快速推进,通过计算机视觉技术对绿色作物的检测是实现智慧农业,尤其是智慧农业生产的关键。然而传统的目标检测算法需要人工来设计一些特征,且设计的特征通用性、复用性较差导致检测的准确率较低。近年来随着深度学习技术的日益成熟,基于深度学习的目标检测算法逐渐成为目标检测的主流算法,在检测的精度和速度上都有了较大的提升。然而针对绿色作物的目标检测算法,目前研究尚不充分,鉴于
摘要全身扩散加权(DW)MRI在检测肿瘤方面具有较高的敏感性。然而,肿瘤疗效的评估通常需要肿瘤代谢的相关信息,这种代谢信息可以通过氟-18-氟脱氧葡萄糖(FDG)
期刊
摘要前列腺MRI广泛应用于指导前列腺癌病人的组织活检、病情监测和肿瘤分期。前列腺成像报告和数据系统(PI-RADS)有助于提供一种标准化的概率性方法来识别有
期刊
近年来,随着互联网的发展,传统旅游业迎来全新变革。越来越多旅游景区开始应用“互联网+旅游”发展模式。目前,旅游领域中亟待解决的问题是游客如何快速且准确地获取信息。以往,游客主要通过传统搜索引擎获取信息,但其无法满足快而准确的需求。而与传统搜索引擎不同,问答系统直接返回答案,能够满足游客的实际需求。目前,问答系统的数据来源主要包括问答对数据、文档数据、以及结构化数据等。与前两个相比,基于结构化数据的
摘要在钆塞酸增强MRI上非动脉期高强化(APHE)的肝胆期(HBP)低信号结节可能提示肝细胞癌(HCC)或非恶性肝硬化相关结节。目的评价钆塞酸增强MRI上无APHE
期刊
近年来,伴随着社交媒体的快速普及以及国家对于优秀传统文化艺术创新的大力支持和资金投入,博物馆作为一个承载、传播优秀传统文化的重要场所,开始越来越多的出现在我们年轻人的生活和视野之中,然而笔者在研究过程中发现当前我国博物馆传播存在创意思维狭窄,内容产品同质化,产品研发成本高,协同创作能力弱等问题,同时博物馆之间的发展还很不平衡,因此博物馆的传播与壮大成为了一个迫在眉睫的问题。故宫博物院作为国家博物馆