【摘 要】
:
随着大数据、人工智能等技术的快速发展,数据驱动下的智能化浪潮给金融业的发展带来了新的创新机遇和商业模式。目前,金融领域每天都会产生大量不同形式的互联网文本数据。如何准确、高效地挖掘这些金融文本中的重要信息,以提升金融服务效率是金融智能化面临的一个关键问题。本文主要研究金融信息挖掘中的核心任务-实体关系抽取任务。该任务的目标是从文本数据中识别出金融实体,并判断实体间存在的语义关系。通过对实体关系抽取
论文部分内容阅读
随着大数据、人工智能等技术的快速发展,数据驱动下的智能化浪潮给金融业的发展带来了新的创新机遇和商业模式。目前,金融领域每天都会产生大量不同形式的互联网文本数据。如何准确、高效地挖掘这些金融文本中的重要信息,以提升金融服务效率是金融智能化面临的一个关键问题。本文主要研究金融信息挖掘中的核心任务-实体关系抽取任务。该任务的目标是从文本数据中识别出金融实体,并判断实体间存在的语义关系。通过对实体关系抽取方法进行调研,本文从管道式和联合式实体关系抽取两个方面进行探索,分析现有工作存在的不足和缺陷,有针对性地提出相应的改进方法,以此来更好地提升实体关系抽取任务的性能。具体来说,本文主要贡献有以下几个方面:1.对现有的管道式和联合式实体关系抽取方法进行调研,整理和总结相关方法的研究现状,分析现有工作存在的不足与缺陷。2.在管道式实体关系抽取方面,针对模型语义关系信息利用不充分问题,提出一种基于实体子序列增强与实体依赖注意力的关系抽取模型,该模型通过进一步单独编码输入句子的实体间子序列来增强其对实体子序列信息的关注和利用,并保留原始长句信息;在模型特征融合层引入实体依赖注意力,引导模型更多地关注与实体相关的重要语义信息,提升关系特征的分类能力。实验结果表明,在SemEval-2010 Task 8公共数据集上本文模型取得了较当前主流模型更好的性能,在金融关系数据集上相对于基础模型F1值获得了将近2%的提升。3.在联合式实体关系抽取方面,针对模型噪声问题和关系特征表达缺陷,提出一种基于损失优化与子序列表征的多头选择联合抽取模型,该模型通过两种损失优化策略共同作用的方法,降低实体识别中存在的类别不平衡和实体漏标等噪声问题的影响;在关系分类层,除了使用实体编码信息以外,引入实体子序列表征信息来进一步加强关系特征表达能力。实验结果表明,在CoNLL04公共数据集上本文模型性能明显优于当前主流模型,在金融关系数据集上相对于基础模型overall F1值获得了将近4%的提升。
其他文献
钢纤维混凝土是在普通混凝土中掺入乱向分布的钢纤维形成的一种新型复合材料。钢纤维的存在能够有效阻碍混凝土内部微裂纹的扩展,显著提高混凝土基体的韧性和延展性,因此钢纤
在五轴加工中,平顺性较差的刀轴矢量常常会经历机床旋转轴角速度或角加速度的剧烈变化,从而影响机床运动学性能以及加工质量。实际上,刀轴矢量的优化程度,关系到加工可达性、
在金融保险中,保险风险理论中的破产理论是一个非常重要的研究课题,因为这让保险公司的股东可以提前预测破产的风险程度,所以对其研究具有及其重要的理论和实际的双重意义。为了尽可能降低保险公司破产的可能性,并且让股东的投资能得到丰富的回报。已有学者通过引入有序资本水平来推广经典的复合泊松风险模型,以模拟保险公司的偿付能力。当盈余过程低于较高资本水平,造成的理赔规模较大时,并且没有进一步破坏较所谓的中间置信
刀架系统作为数控车床的主要功能部件和可靠性薄弱环节,其故障的发生会直接影响整机的可靠性水平,并导致维修成本的增加。因此,进行刀架系统故障预测研究对于降低停机损失,提高数控车床整机可靠水平具有重要意义。首先在了解刀架系统结构组成和工作原理基础上,依据历史故障信息,结合工程经验,对其进行组件划分,应用FMECA法对刀架系统进行整体故障分析,摸清其关键故障部位及关键故障模式,并以刀架系统故障为顶事件建立
多相反应器在工业中有着十分广泛的应用,多相反应器中的颗粒尺寸分布、相含率等非均相特性(多相流体在时间和空间分布的不均匀性)是反应器优化设计和放大的重要依据,也可为多
行研分析师是活跃于资本市场中的重要市场微观主体,数量庞大且研究活跃的行研分析师是每一个成熟市场的标配。分析师通过专业化的信息搜集和信息解读,服务于各方市场参与者。一方面,行研分析师的主要面向对象是机构投资者,分析师利用其自身的规模效应和专业优势,能减少机构投资者获取信息的成本。另一方面,其研究行为本身具有正外部性,能提高信息传递的效率,减少信息不对称,维护市场稳定。然而,近年来,许多“买入”及“推
一种新型的光电材料金属卤化物钙钛矿(Metal halide perovskites,MHPs)有着卓越的物理化学性质,引起科学家们极大的关注。其中,基于良好的光电性能,钙钛矿材料已被广泛应用于太
宽扎盆地近年来油气勘探取得重大突破,盐下区域贡献突出。本文以石油地质学、沉积学、地质统计学为理论指导,在对宽扎盆地的石油地质条件进行分析和对其勘探程度认识的基础上
随着科学技术的发展,康复机器人已经被越来越多地应用于康复治疗领域。其主导的被动康复训练能有效改善肢体损伤病人的运动能力,减轻康复训练师的工作量,已经在康复训练的初期阶段得到了广泛应用。在康复训练的中后期阶段,病人具有一定的主动运动能力甚至可以主导康复训练的进行,而传统的被动康复训练往往忽视了病人的主动运动能力,所以建立一种自适应能力强、柔顺性好、能够充分激发病人主动运动能力的主动控制策略已经成为了
随着环境污染的加剧和资源稀缺的日益加深,发展循环经济已成为中国社会发展的必然之路,目前再制造是循环经济发展的最高形式之一。激光熔覆再制造技术具有在受损金属基板上制备高性能合金熔覆层而不改变基板性能的能力,对失效齿轮进行修复再制造,可以显著节约再制造成本,具有十分重要的经济和社会意义。本文通过对成形加工轨迹位置和成形形状的控制研究,对失效齿面进行激光熔覆试验,最终实现了齿面成形尺寸在磨齿余量范围内,