一种基于深度学习的实体关系抽取方法及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:aramis_Rose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,人们越来越多的通过互联网来交流和发布信息,因此互联网上蕴含了大量的知识,但是这些知识大多以文本的形式存在,机器无法直接进行处理,如何将文本中的信息转换为结构化知识,成为自然语言处理领域的一个研究热点,其中一个很重要的方向就是关系抽取。  传统的关系抽取方法依赖于人工提取大量的特征,随着深度学习的不断发展,越来越多的学者尝试用深度学习来解决关系抽取问题,其中包括循环神经网络、卷积神经网络以及递归神经网络等,这些深度模型可以识别句子中的复杂特征,同时避免了耗时的特征工程,取得了非常好的效果。  本文在目前研究的基础上,提出了两种基于深度学习的关系抽取方法,一种是将双向循环神经网络与注意力机制相结合,同时加入浅层句法特征以及实体相关特征,优化抽取效果。另一种是使用卷积神经网络,分别在词语层面和字符层面对句子特征进行抽取,将二者结合进行最终的预测,弥补了中文分词不准确的问题。由于目前大部分研究都是在英文数据集上进行的,中文数据集比较匮乏,本文使用关联交易数据,生成了一个针对上市公司公告文本的中文关系分类数据集,并在该数据集上进行了实验比较。  最后,本文对DeepDive关系抽取工具进行二次开发,在其原有算法的基础上,加入数据增量处理以及基于深度学习的训练、预测模块,使其成为一个更加完善的关系抽取工具。
其他文献
伴随着我国呼叫中心的持续发展、全新的销售模式的产生,我国各财产保险股份有限公司推出的机动车辆商业保险产品吸引的客户群正在日渐扩大,构建多功能的电话营销系统,从而组建大
软件产品线体系结构在产品线的开发过程中扮演着核心的角色。为了支持体系结构级可变性建模,很多体系结构描述语言引入了体系结构可变性元素如可选的构件、可选的连接器、可
近年来,随着计算机技术的发展应用,很多研究开始利用计算机来辅助医生进行观察,从而得到比较客观的观察结果,给医生提供可靠的数据。通过使用图像分析技术和图像识别技术来进
无线Ad Hoc网络因其分布式拓扑和灵活快速的组网方式而成为当今最为广泛流行的网络。由于无线信道资源的限制,当前的MAC (Medium Access Control)层协议通常采用随机竞争机制
人脸表情识别(Face Expression Recognition,FER)是指利用计算机技术对人脸表情信息进行特征提取,按照人的思维方式加以归类和理解,进而从人脸信息中去分析理解人的情绪,是涉
图像复原技术具有广泛的应用领域,近年来已经成为国内外图像界研究的热点问题之一。在获取图像的过程中有许多因素会导致图像质量的下降即降质,如光学系统的像差、大气扰动、
无线MESH网络是在Ad Hoc网络基础上发展而来的相对静态的无线网络,是具有自组织、自配置和自治愈特点的能够自动地将各个节点组织起来建立一个Ad Hoc网络。路由技术是无线MES
如今计算机不断改变着人们的生活和工作方式,其中数字签名技术的发展让人们意识到把计算机网络技术与电子选举结合起来,已经成为可能。传统的选举方式不仅消耗大量的人力和时
随着计算机学科技术的高速发展,以及学科交叉融合的持续深入,制造业计算机辅助技术处于日新月异的巨大变革中。越来越多出色的计算机概念和技术被引入到传统的制造业行业中,
近年来,规划识别技术作为人工智能领域的重要分支,得到了长足发展。规划识别技术是指依据观察到的智能体的片断的、琐碎的动作来推断智能体的目标及其所执行的规划。一个规划