基于深度学习的命名实体识别方法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:zzm0901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理领域一个非常重要的基础研究任务,是如问答系统、搜索引擎等诸多NLP高层应用必不可少的组成部分,识别命名实体准确与否将会直接影响这些任务的后续性能。早期进行命名实体识别的方法大多都是基于规则或基于统计的,需要人工根据具体的语言和领域来构造规则模板或设计统计特征,这导致系统的实现代价很高,并且移植性差。深度学习方法具有自动从数据中学习特征表示的能力,近十年来,其在人工智能领域的各种任务中均取得了不俗的成绩。相比传统方法,基于深度学习的实体识别模型不仅标注效果更好,而且实现代价更小。但是这些方法也存在着些许不足:(1)实体识别是一种需要强依赖上下文信息的来做决策的任务,绝大多数的模型都采用双向LSTM作为编码器来捕获输入的上下文依赖关系。但是LSTM训练时间非常长,并且传统LSTM的输入和隐层状态是相互独立的变量。(2)标注输入序列时,一般需要文本元素多方面的信息,这些信息都由各自的向量表示,标注模型通常直接拼接这些向量作为输入,这会导致信息冗余。本文针对以上问题,主要做了以下工作:1.针对LSTM训练时间长的问题,本文提出采用空洞卷积网络对输入序列进行依赖关系编码。空洞卷积方法在卷积核中注入空洞来扩大感受野,将其用于处理文本数据时能够捕获远距离的语义信息。通过对比实验发现,空洞卷积对语义依赖关系的编码能力可以比肩LSTM模型,将空洞卷积网络与注意力机制融合后可以进一步提升模型的标注效果。2.传统LSTM网络每个时刻的输入x_t和前一个时刻的隐层状态h_t是相互独立的,它们只在LSTM的门控中进行交互,而在之前毫无关系,这会导致上下文信息的丢失。本文提出采用形变LSTM网络对输入序列进行依赖建模,形变LSTM并没有改变传统LSTM的网络结构,只是让x_t和h_t在输入LSTM网络之前先进行交互。通过对比试验发现,形变LSTM网络比传统LSTM网络具有更强的上下文依赖关系建模能力,在形变LSTM的基础之上将注意力机制融入标注模型可以获取更多的上下文语义信息。3.作者提出基于注意力机制来连接单词的词向量和字符特征向量,实验表明,与直接进行向量拼接的传统方法相比,采用这种新方法可以获得更好的标注效果。
其他文献
目的探讨心理护理干预对伴有焦虑、抑郁症状的帕金森病患者的影响。方法选择2015年1月至2017年6月来本院神经内科住院治疗的具有焦虑、抑郁症状的80例帕金森患者为研究对象,对
目的:探讨推拿治疗腰椎间盘突出症的疗效。方法:将76例腰椎间盘突出症患者随机分为治疗~-(38例)和对照组(38例),对照组给予服用自拟补肾活血汤,治疗组则在对照组药物治疗基础上进行推
目的探讨产前经腹部超声(TAS)及经会阴超声(TPS)检查对植入性凶险型前置胎盘(PPP)的诊断价值。方法选择2015年1月至2017年5月本院收治的患者73例为研究对象,所有患者产前均行TAS及TP
目的评价超声引导下腰方肌阻滞联合纳布啡对老年患者全髋关节置换术患者术后镇痛的临床效果。方法择期行腰硬联合麻醉下全髋关节置换术的老年患者120例,年龄65-80岁,采用随机数
为了探讨育龄妇女妊娠期脑干听觉传导路和视觉传导路的改变,观察其脑干听觉诱发电位(BAEP)及脑干视觉诱发电位(VEP-P)的变化。方法 选择最近3年来在本院做孕前检查、产前检查并在
手法的技能教学是推拿教学过程中的重要环节.在过去三年里,针对我校2007、2008级针推专业本科班的实验教学改革过程中,我们探索出了一种新的实验教学模式,从基于教材的基本技
罗非鱼是我国主要的淡水养殖鱼类,因其不耐低温,在我国大部分地区无法自然越冬,为了能在温度适宜时快速培育到上市规格,保障次年罗非鱼养殖的经济效益,每年必须提供大量的优质越冬苗种,传统流水式越冬成本高,对环境影响大,温度不好控制,而封闭式养殖模式可以弥补这些缺点,循环水养殖系统(Recirculating Aquaculture System,RAS)与基于零换水模式的生物絮凝养殖系统(Bio-flo
目的探讨BIS监测下麻醉对老年骨折手术患者术后认知功能障碍和谵妄的影响。方法回顾性分析本院2014年7月至2017年1月收治的老年骨折患者80例临床资料,按照麻醉监测方式分为对
改革开放后,港台的通俗文学作品和西方的通俗文学作品被大量引进了内陆,尽管如此,人们对通俗文学的需求仍是巨大的,口味更是多种多样。就在这时,一些四川籍作家在80年代后期以“雪米莉”为笔名而创作的雪米莉小说应运而生,它对新时期大陆通俗文学创作的空白地带首先进行了占领,是新时期第一个有意识策划的通俗文学品牌。它曾一度风靡盛行许久,形成了“雪米莉热”,成为八十年代后期到九十年代中期这段时间内中国文学市场中
碳化硼陶瓷因其低密度、高熔点、超硬度、高中子吸收性以及好的热电性能等特点而被普遍应用于防护装甲、工程结构件、耐磨部件、核工业和电力等领域。但是,碳化硼中共价键含量高达93.94%,这使B_4C陶瓷具有烧结难度大、断裂韧性低的缺点。这两点加大了制备高致密度,高性能的碳化硼陶瓷的难度,严重限制了碳化硼陶瓷在工程领域以及军工领域的广泛应用。为了优化B_4C陶瓷的烧结工艺,改善其综合力学性能,采用向碳化硼