实体和关系联合抽取的编码解码技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:SteveZou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,信息主要通过文本形式作为载体存储和传输。人们采用信息抽取技术处理非结构化文本数据,得到结构化或半结构化的数据,获取用户真正感兴趣的信息。命名实体识别和关系抽取是信息抽取技术的基础,对于自然语言处理领域的高级应用有重要意义。传统方法使用流水线式处理实体和关系抽取任务,存在错误传播和冗余信息等缺点,性能较差。实体和关系之间存在交叉依赖,因此对实体和关系进行联合抽取很有必要。研究了实体和关系联合抽取的编码解码技术。使用神经网络结构自动提取输入文本的语义特征,不依赖外部的自然语言处理工具,避免外部工具错误。提出的模型包括四个模块:词嵌入层、编码层、关系抽取模块和命名实体识别模块。词嵌入层使用单词的word2vec词嵌入和字符级别的词嵌入;编码层采用双向长短时记忆网络,可以充分利用文本的上下文语义特征,有效缓解长距离依赖的问题。词嵌入层和编码器层属于共享底层,输出信息同时作为命名实体识别解码器和关系抽取解码器的输入,两个解码器模块共享文本特征和编码器参数,可以对两个子任务进行相互约束。关系抽取解码器采用卷积神经网络,可以抽取多种关系实例,在CNN的输入层添加注意力机制,为每个词生成上下文信息。命名实体模块分别采用Softmax解码器和条件随机场解码器,实验得出条件随机场结果更好。最终采用了Bi LSTM-ATTCNN-CRF模型,相比较之前的联合抽取方法,本课题提出的模型在F1值上取得提升。
其他文献
为解决高温环境下压力精准测量的难题,提出一种基于交流电桥的陶瓷基高温压力传感器。通过厚膜技术在陶瓷基底上集成交流电桥,敏感电容作为桥路元件随外界压力的变化而变化,而电桥将这种电容信号变化转变为电压信号变化输出,这种方法避免了高温环境可能导致的敏感单元失效以及电容式传感器因寄生电容引起的测量不准确问题。仿真结果表明了该传感器在高温环境中具有很高的输出线性度以及灵敏度,800℃时,传感器输出的最大非线
目的 对老年脑梗死长期卧床患者医院感染的细菌学进行调查,并建立Logistic风险预测模型。方法回顾性分析2016年1月-2020年8月于鹰潭市人民医院治疗的296例≥60岁老年脑梗死长期卧床患者临床资料,应用Logistic回归分析建立风险预测模型,采用Hosmer-Lemeshow检验评估模型拟合度,通过受试者工作特征(ROC)曲线分析模型的预测效果,其曲线下面积(AUC)表示预测效能。结果
目的 观察高压氧护理应用于一氧化碳中毒后迟发性脑病患者的效果,以促进患者康复,改善预后。方法 选择2018年1月—2020年9月天津市环湖医院入院治疗的20例一氧化碳中毒后迟发性脑病患者为研究对象。根据是否存在高压氧治疗禁忌,将有心肺功能不全、出血风险和感染等禁忌证的9例患者作为对照组。将11例无高压氧治疗禁忌证的患者作为观察组。对照组患者给予促进脑细胞功能恢复和肌松剂护理干预。观察组在对照组治疗
目的 探讨脑卒中健康教育中应用品管圈活动的价值分析。方法 随机选取2019年5月—2020年5月天津市北辰医院收治的96例缺血性脑卒中患者,康复护理过程中均接受健康教育,根据不同方法将其分为对照组和观察组各48例,对照组给予常规护理,观察组给予品管圈管理。比较两组患者对疾病知识掌握情况、护理质量、生活质量(SF-36)、不良事件发生率及依从性。结果 观察组对疾病知识掌握,发病机制、护理要点、康复训
从2010年起,经过中国人民银行几轮重要的汇率制度改革,人民币汇率波动弹性显著增加,波动幅度扩大,双向波动趋势明显。此后,中国货币当局在不同场合表态将继续推进人民币汇率市场化改革,保持人民币汇率弹性。同时,汇率政策和监管政策也进一步回归中性,人民币汇率有弹性的双向波动成为常态。在此阶段,中国工程机械企业“走出去”步伐加快,行业龙头三一重工国际化动作频频。在“一带一路”倡议下,沿线国家大量的基建需求
伺服参数整定是影响直线电机系统控制性能优劣的关键因素,针对其参数难以整定的问题,提出一种基于杂交PSO算法的解决方案。通过引入粒子杂交操作,有效增强算法对最优参数的全局搜索能力,并且其收敛速度和精度得到提升。仿真结果表明,应用杂交PSO算法对电机系统数学模型的伺服参数进行整定优化效果明显。对比标准粒子群算法与文献改进粒子群算法,优化后的伺服控制系统对阶跃响应的超调量减少31.34%,上升时间、调整
现如今,随着社会的跨越式发展,我国人民保有的汽车量在不断增长。无人驾驶技术蓬勃发展,许多驾驶辅助功能被研发用来减少因汽车问题引发的车祸及其他危险。在全球范围内,道路安全问题是许多学者研究的重点问题,尤其是车辆碰撞问题,需要一种高效的方法进行解决,在满足软件系统精度要求的前提基础上,不断提高控制系统的实时性,进而减少系统的响应时间,最终提高车辆的行驶安全性。目前基于图像的目标检测算法已经非常成熟,但
为贯彻落实习近平总书记关于教育的重要论述,中共中央、国务院和教育部相继出台了《国务院关于全面加强新时代大中小学劳动教育的意见》(以下简称《意见》)和《大中小学劳动教育指导纲要(试行)》(以下简称《纲要》)。《意见》和《纲要》指出了劳动教育是新时代党对教育的新要求,并肯定了其在全面发展教育体系中的重要作用,大中小学应深入掌握劳动教育的内涵,推动劳动教育落地。地理作为一门与生活联系紧密的学科,它
期刊
随着语义网的大量普及,网络上也出现了越来越多的结构化数据,以资源描述框架(RDF)格式为首的存储数据也在大量的开放领域和特定领域发挥着巨大作用,使得互联网上的普通用户对于这部分数据的需求也在增加。但是普通用户由于不了解这种结构化知识的特点,直接访问这些结构化知识相对困难,针对该方面问题,很多传统的基于知识库的问答系统被提出,这种问答系统比传统的搜索引擎更加智能,可以直接理解普通用户提出的搜索需求。
随着中国城市化进程的加快,越来越多的人选择在城市购房或租房。而拥有房产的人,也可能会因为家庭成员人数的增加,需要购置空间更大的住房。在城市居民强烈的住房需求的带动下,房产经纪这一住房领域的服务职位吸引了大量的从业人员。随着房产经纪人人数的增加,房产经纪人的培训成为了一大难点,需要管理者和房产经纪人都投入大量的精力。目前大部分房产经纪人只接受过简单的入职培训,却未得到持续的专业知识培训,导致了房产经