自然语言理解中的词义消歧及其在仪器领域中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ahzhangxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的飞速发展,深度学习的发展水平得到了显著提高。计算机在理解自然语言方面的需求越来越迫切,在机器理解自然语言的过程中不可避免的需要解决歧义的问题,词义消歧的目的是确定一个歧义词在文本中的具体含义,近年来已经引起了研究人员的普遍关注。在仪器领域中,会有很多任务需要计算机去很好地理解文本,比如需求分析、人机交互等,计算机理解文本的重要一环就是词义消歧。现有的词义消歧模型的正确率仍有较大的提升空间,而提高词义消歧模型正确率的有效途径是向模型中注入先验知识,但是现有的词义消歧模型中对于知识的融入方式比较单一,而且在中文词义消歧方面缺乏相应的知识库,基于此本文提出了融合知识的词义消歧模型,通过百科知识库获取相应知识,并将其融入词义消歧模型中,提高了词义消歧模型的正确率,然后将其应用到仪器领域的阅读理解中来证明模型的有效性。第一,设计了融合义项的词义消歧模型。针对目前词义消歧模型正确率不高的问题,本文首先通过爬虫获取百度百科中词语的义项,向预训练语言模型的嵌入层注入义项知识特征,然后将嵌入层应用到预训练语言模型中,实现了词义消歧正确率的提高。第二,提出了一种基于深度学习的融合知识的词义消歧模型,模型中融入知识内容主要包括上位关系和义项知识。首先改进了一种关于上下位关系的定义,设计了一个上位关系抽取的深度学习模型,以判断歧义词在输入文本中的上位关系,同时向模型中注入融合义项的词义消歧模型的中间层输出特征,将两个模型的最终输出特征进行融合,即可得到融合知识的词义消歧模型,最后通过对比实验证明了义项和上位关系在词义消歧模型中的重要作用。第三,在通用领域的词义消歧模型基础上,提出了面向领域的词义消歧模型,并将其应用到仪器领域的阅读理解任务中。面向领域的词义消歧模型是在融入知识的词义消歧模型的基础上增加了领域知识描述模块,通过建立仪器领域知识库,将模块输出特征和原有模型输出特征进行有机融合,向词义消歧模型中注入领域知识,然后基于此设计出面向领域的阅读理解模型,并通过仪器领域的阅读理解实验证明了模型的有效性。
其他文献
图像超分辨技术作为突破传感器硬件限制得到高分辨图像的一种有效手段,是图像处理和计算机视觉等多个领域的热点研究课题。目前主流的基于深度学习的图像超分辨算法多是利用单目图像或双目图像,搭建卷积神经网络,再加入一定的先验知识实现图像超分辨。然而现有基于深度学习的超分辨算法的超分辨效果仍然面临挑战,尤其是在大比例缩放因子下,图像超分辨质量不尽如人意。为了进一步提升图像超分辨重建质量,本文在深入研究基于深度
学位
在电磁学领域,如何灵活调控电磁波(Electromagnetic waves,EM)的特性为通信和电子行业服务一直是一项极具挑战性的研究课题。人工电磁超表面概念的引入为灵活调控电磁波提供了新思路。人工电磁超表面是一种由亚波长单元结构组成的新型二维人工电磁结构,可以实现对入射电磁波的相位、幅度和极化的灵活调控。然而,无源超表面因其一旦加工制造成型,构成超标面的单元结构的谐振特性也就随之固定,所以一般
学位
大力发展太阳电池既能降低对化石燃料的依赖,也能促进我国“碳中和”发展目标。其中,卤化物钙钛矿太阳电池具有高的光电转换效率和低的制备成本而成为研究热点。但目前卤化物钙钛矿MAPb I3太阳电池存在实际光电转换效率远低于理论预期、长期稳定性不足等问题,严重阻碍了其实用化进程。钙钛矿太阳电池的光电转换效率和稳定性严重依赖于其界面缺陷和失配应变等因素。本论文针对这一难点问题——MAPb I3钙钛矿太阳电池
学位
<正>三十年,在时间长河中,不过短短一瞬;三十年,对于期刊来说,却意味着很多很多。三十年,有成长,有成绩,有经验;三十年,有挫折,有教训,有拼搏;三十年,有感恩,有谋划,有憧憬……三十年,的确不平凡,值得纪念!三十载春华秋实,三十岁而立担当。三十年和《高中数理化》一起学习……《高中数理化》杂志是我接触的第一本教辅类杂志,影响了我的大学生活,这本杂志选题十分新颖,每一篇文章都带来了精彩的解题方法,极
期刊
随着公众对隐私需求的提高以及政府对数据安全的规范,机器学习的发展受到了极大的制约。联邦学习作为一种新兴的、隐私保护的机器学习模式,以其特有的分布式架构被广泛地部署在智慧医疗、图像处理、和自然语言处理等领域中。一个典型的联邦学习架构通常由一个中央服务器组织多个客户端利用本地数据协作地训练机器学习模型。然而,这样的中心化结构过于依赖一个可信、稳定的高算力中央服务器。一旦服务器出现被攻击者挟持、单点故障
学位
随着智能化时代的到来,机器人技术在日常生活中变得愈发重要,无论是家里常用的扫地机器人,还是物流行业中的配送机器人,亦或者马路上跑的无人驾驶汽车,其核心技术之一都是同时定位与建图(Simultaneous Localization And Mapping,SLAM)。SLAM技术是通过传感器进行场景的信息采集,随后在后端生成环境地图,对无人平台自身进行定位并指导其运动。现今的SLAM技术主要分为两类
学位
<正>北京市高考(或等级性考试)化学命题注重对学生科学探究能力的考查,试卷压轴题以实验探究题形式呈现.而氧化还原实验探究题因其具有很强的综合性、复杂性,命题视角丰富灵活,是命题的热点之一.本文研究北京市近几年高考题、模拟题与氧化还原相关的实验探究题,分析命题视角,期望给予高三复习和备考一定的帮助.
期刊
目标检测是计算机视觉的基础任务之一,能够为目标跟踪、图像描述等更复杂的任务提供更有价值的信息。其具体要求是在图像中准确定位目标的位置并判断其类别,这也是多年来最热门的研究方向之一。近年来,得益于神经网络的兴起,目标检测领域的先进算法层出不穷,得到了极大的发展。然而随着社会的快速发展,新兴事物不断出现,如何快速拟合新的数据成为了一个新的问题,且很多情况下,收集具有大量标签的数据是困难、昂贵的,因此小
学位
当前,国外对我国科技封锁政策日益升级,集成电路、量子信息、生物医疗等高科技产业及其下游领域面临较大的技术风险和断供风险,一定程度上对我国高科技产业供应链安全性及我国经济发展构成了潜在威胁,因此最大化撬动企业创新资源,助力企业迅速攻克产业高端核心技术,以拉动创新链支撑我国供应链安全防御升级迫在眉睫。然而面对日渐增多的各类高科技企业以及真假掺杂的各类信息,政府如何从海量企业数据中尽快掌握行业痛点与各类
学位
含“非特殊点”的机械波问题在高考试题中经常出现,难度较大,作者将旋转矢量法运用到此类问题的教学当中,收到了良好的教学效果。文章对旋转矢量法作了简要的介绍,总结了用旋转矢量法分析含“非特殊点”的机械波问题基本思路,把含“非特殊点”的机械波问题分为两种基本类型,并通过例题分析了旋转矢量法在两类基本问题中的具体应用。
期刊