面向短文本的实体关系联合抽取的研究和实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:liusha5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展网络上的信息越来越多,尝试从海量的冗余信息中挖掘出对用户来说有价值的信息,可以提高用户获取有用信息的效率;同时,从大量非结构化数据中获取结构化的知识,构建知识图谱,可以方便用户准确高效的查询相关信息。实体关系联合抽取技术可以有效的解决这个问题,将实体识别与关系抽取任务结合,减少两个任务间的误差传播造成的损失。对于具体运用来说,从文本中识别出实体和关系构建三元组,在知识图谱、信息检索等领域都有重大应用。本文通过对实体关系联合抽取任务的研究,分析了之前研究中存在的问题,提出了两个模型对实体关系抽取的效果进行提升,并设计实现了一个实体关系联合抽取的系统对模型的实用性进行了研究。具体来说,本文主要工作包括:·基于融合图层次卷积的联合抽取提出一种利用融合图卷积增强特征表示的联合抽取模型,将句法信息融入模型中进行实体关系联合抽取,解决了传统流水线模型缺乏两个任务之间交互,会造成误差传播和未利用依存句法信息利用的问题。在公共数据集上进行了实验,验证了本章模型的有效性。·基于双编码器的联合抽取参考机器翻译中序列到序列的模型,提出一种基于双编码器是的实体关系联合抽取模型。利用图卷积和形变LSTM对句子进行编码,并采取融合注意力机制解码,同时关注于句子的语法特征和上下文特征,采用序列到序列的方式文本进行实体关系抽取。·文本信息抽取可视化系统基于提出的两个联合抽取的模型,实现了一个实体关系联合抽取原型系统,用户通过可视化的界面可以对文本进行抽取,并对抽取出的三元组增删改查。
其他文献
在线社交网络已成为当前主流的信息传播媒介,研究在线社交网络上的消息传播对于理解其上传播规律及实现有效地管控具有重要意义。一方面,揭示消息传播的机制和影响因素有助于人们及时、高效地获取有用信息。另一方面理解谣言、流言和虚假消息的传播机制有助于快速地进行舆情控制。以往的研究尚且存在不足:1)对消息传播的研究集中于日常消息传播,鲜少有针对突发事件消息传播机制的研究。2)大多数网络模因的研究仅关注生存环境
微塑料(3及Ti O2添加剂,对不同砷形态的吸附量均较大;而白色PE地膜碎片及LDPE对不同砷形态吸附量的差异不大。PE(微)塑料的理化性质以及砷形态结构均会影响砷类物质与PE(微)塑料之间的界面行为。此外,本研究证明外界环境条件的变化会直接影响微塑料与砷类物质的相互作用,包括水环境p H、盐度、共存化合物及不同水体等因素。吸附到微塑料上的砷类物质也可以持续不断以低剂量解吸或释放到周围水环境中。因
无铅铁电钙钛矿K0.5Na0.5Nb O3(KNN)作为介电性能和压电性能出色的氧化物代表,近年来受到了广泛的关注。作为新一代无铅压电陶瓷,KNN具有高机电耦合系数和品质因数等优良性能。并且对KNN此类环境友好型材料体系的研究有助于替代市场中铅基陶瓷锆钛酸铅,符合可持续发展的基本国策。在现有研究中,压电系数媲美铅基材料的改性KNN已可以成功制备。但难以解决的问题在于KNN的多晶相变共存区域是依赖于
科学技术的日益进步与发展,人们越来越追求于高精度的测量。频率作为现代物理中精度最高的物理量,许多不同的物理量的测量都转换到了频率的测量上,这就需要寻求更加精准的频率标准。光钟能将频率标准的精度提高到E-18或更高。由于它只在一个特定的频率输出激光,如果要用光钟开展高精度的精密测量,必须将光钟的频率稳定性、相干性和精度传递到其他光学或微波波段。于是,相位噪声优异的频率合成器便是实现这个目标的最佳手段
物联网(Internet of Things,Io T)由大量电子设备组合而成,通过互联网实现万物互联和信息共享。物联网已在许多领域得到广泛应用,如工业制造、智能家居、医疗健康等等。在这物联网发展如火如荼的年代,安全却成了阻碍其发展的重要原因之一。针对物联网的安全攻击不仅可能导致工作紊乱、财产损失,更有甚者将威胁到用户的隐私和生命安全。在万物互联的背景下,网络是恶意人员或组织发起攻击的主要途径,设
等离子体(Plasma)作为物质的“第四态”,蕴藏丰富的物理,化学内涵,现已广泛用于材料科学、集成电路制造、生物医学等不同领域。等离子体激发时产生的活性物质,对细菌、细胞等均有杀灭作用,所以,等离子体杀菌是生物医学领域的一个重要的研究方向。表面介质阻挡放电(Surface Dielectric Barrier Discharge,SDBD)是一种在大气压下产生非热平衡等离子体的放电方式,因其结构简
金文,是中国古代商周时期用于记录的主要书体。研究商周金文,对了解古代历史、考察古代社会生活等均具有重大意义。识别商周金文文字是基础性的工作,但目前其仍需由经验丰富的古文字专家费时费力地完成。随着现代计算机图像识别技术的成熟,特别是深度学习技术的发展,计算机实现文字识别的方法取得了巨大的进步,现今已可获得良好的识别结果。基于以上背景与需求,本文旨在使用深度学习相关技术,对商周金文文字识别任务进行研究
新型污染物(微塑料)产生的环境污染是当前面临的重大环境问题之一,在工业点源方面也涉及到大量的排放。本研究着眼于工业废水中微塑料污染问题,从工程控制技术的角度出发,在调研评估太湖流域工业污染控制技术与示范工程的基础上,探讨了太湖流域重点行业微塑料的分布特征及典型工业点源污染处理技术对微塑料的截留效应。为后续水环境污染深度治理及以微塑料为主的新型污染物工程控制提供理论依据与技术支撑。论文主要研究结论如
随着第五代移动通信技术(5th generation mobile networks,5G)的协议不断演进,通信网络的应用范围逐渐扩大。各行各业对室内定位的需求日益迫切。由于噪声、多路径效应、基站用户间的时间同步等影响因素,目前5G基站还无法提供可靠的定位服务。本文以5G的上行探测参考信号(Sounding Reference Signal,SRS)为基础,研究了5G系统在室内环境下实现定位的关键
随着科学技术的发展以及在“中国制造2025“的工业化革新的背景下,精密制造业技术突飞猛进,各种设备制造朝向精密化发展,这就对各种设备关键工件的制造精度要求越来越高,如何对工件进行高精度质量检测成为一个亟待解决的课题。本课题针对通用工件的表面轮廓高精度实时测量的需求展开研究。本论文设计搭建了一个通用工件轮廓测量平台,控制系统采用A3200运动控制器,数据采集方面选用STIL光谱共焦传感器,并使用双频