基于深度学习的信息抽取技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:xuwei800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取(Information Extraction)技术是指从非结构化数据当中提取用户感兴趣的信息,形成结构化的存储或提供即时检索功能的技术。最近几年来随着深度学习技术的快速发展,信息抽取技术产生了突破性的进展。本文通过对近几年面向自然语言处理的深度学习技术的深入探究,从弱监督关系抽取和机器阅读理解两个方向对基于深度学习的信息抽取技术进行研究,提出改进算法,并构建云服务场景下的原型系统。在弱监督关系抽取方面,本文通过分析从句子当中提取关系信息的难点,提出多路径卷积神经网络算法,通过改进网络的结构,增强算法的准确性。实验证明,改进后的弱监督关系抽取模型在准确率、召回率上相比现有算法均有比较明显的提升。在机器阅读理解方面,本文基于目前已有的方法对于一个问题仅提取一个单一答案的特点,通过改进答案选取机制和损失函数的形式设计多重答案机器阅读理解算法,使得算法可以自动提取多个不相关的可行答案,拓展了机器阅读理解算法的功能。实验证明,改进的多答案机器阅读理解算法可以在保持对单一答案提取的准确性的同时较好的解决多重答案选取的问题。最后,本文基于深度学习框架和网络服务框架实现了云服务场景下的深度学习算法的服务器端部署系统,通过开放API的形式响应用户请求。该系统具有快速部署、可拓展性强的特点,可以满足多种条件下部署深度学习系统的需求。
其他文献
二十一世纪是信息化的时代,近年来人们对数据存储性能和数据处理能力的需求不断提高,这促使了半导体集成工艺和技术的持续改进和创新,同时也加快了下一代存储器件的研究进度
随着社会对全民健身的重视,青少年作为实施全民健身计划的重点对象,有必要对青少年体育中的龙头品牌赛事进行研究。本文主要对阳光体育大会赛事品牌建设现状进行研究,从2011
在对有机发光二极管(organic light emitting diodes,OLEDs)的研究中,反系间窜越(reverse intersystem crossing,RISC)是一个非常重要的物理机制,也是目前的研究热点。这是因
深度学习是一类以多层神经网络为特征的机器学习方法的统称。近年来,深度学习在图像识别、自然语言处理等领域已得到广泛应用。深度学习适于高样本量、高维度问题场景下的机
随着水利水电工程建设的快速发展,宽尾墩+阶梯溢流坝+消力池一体化消能工逐步引起了大家的关注。它因具有消能率高、节约工程投资等特点而被广泛应用于许多高坝泄洪工程中。
京津冀一体化战略的实施,使三省市体育产业形成协同发展趋势,但三省市体育协同发展机制欠缺、资源发掘不充分、整合共享不够等问题仍是京津冀协同发展的重要难关。本研究运用
遥操作系统对处理远端危险环境下的任务具备极大优势,这些优势体现在对未知环境的适应性和操作的灵活性上,这对提升灾后救援、未知空间探索等能力具有重大的理论研究价值。虽
近些年来,有机光电材料被广泛应用于各种电子器件的制备,其中有机发光二极管(OLED)因其同时具有轻、薄、省电和自发光等优点,在光学显示和固态照明领域展示出巨大潜力,同时也
二十世纪初,电子二极管的出现开启了电子科学发展的黄金时代,集成电路的出现开拓了电子器件微型化的道路。随着电子技术的快速发展,对电子器件的集成度要求越来越高,传统电子
近年来,随着航空航天和医疗等行业对加工精度和效率要求进一步提高,五轴数控机床(FAMT)在复杂工件精密制造中的应用变得越发普遍,然而机床结构内部的热源(如滚珠丝杠、轴承、