面向金融领域的事理图谱构建关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xing_h0576
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的知识图谱大多关注实体的属性与关系知识,而忽视了事件间的演化规律知识,为了弥补这一不足,研究者们提出了事理图谱的概念。事理图谱中的节点是高度泛化的事件,边是事件间的演化关系,例如因果关系与顺承关系。自然语言处理技术的发展使得信息抽取的准确率得到提升,也使得从文本中自动挖掘事理知识、构建事理图谱成为可能。本文从金融领域入手,对事理图谱自动构建的关键技术展开研究,具体内容包括端到端的事件因果关系抽取、常识信息增强的事件表示学习以及数据驱动的因果关系强度计算。事理知识的获取是构建事理图谱的基础,本文针对事件间因果关系的获取进行了探索。本文将事件因果关系抽取建模为序列标注任务,提出了基于预训练模型的因果抽取方法,以端到端的方式同时进行因果关系的识别与相关事件的抽取。为缓解有标注数据不足的问题,本文进一步提出基于噪声模型的半监督学习方法,利用大量无标注数据提升因果抽取的效果。中英文两个因果抽取数据集上的实验结果证明了该方法的有效性。事件是事理图谱的核心元素,为了更好地建模事件语义,本文提出了常识信息增强的事件表示学习方法,使学习到的事件表示中融入意图、情感、实体关系等常识信息,以更好地帮助事理图谱的构建以及在其他任务上的应用。事件相似度、脚本事件预测、股市预测等多个任务上的实验结果表明我们的方法可以更准确地建模事件语义,并提升下游任务上的效果。为了更好地建模事件间因果关系的强度,本文探索了基于统计与基于预训练模型的因果强度计算方法,从大量因果事件对中自动学习因果强度信息。COPA因果推理数据集上的实验结果表明,预训练模型可以有效地从大量因果事件对中学习因果知识,并准确地建模因果关系强度。最后,本文基于上述研究成果设计并实现了金融领域事理图谱构建系统,并在大规模金融语料上构建了包含数百万事件与因果关系的事理图谱,验证了本文提出的事理图谱构建方法的可行性。
其他文献
目前社会化电子商务对用户分享行为的激励措施单一,缺乏吸引力,急需个性化的、有针对性的激励方式。社会化电子商务网站上,除了普通用户分享产品和购物信息外,一些电子商务卖
微课是翻转课堂的基础,翻转课堂是微课发展的载体。微课作为一种新的英语教学模式,因其具有新颖的形式、较强的针对性、明确的教学目标等特点,正逐渐得到广大初中一线英语教
电子竞技已受到广大民众尤其是青少年群体的广泛关注和喜爱,广东电子竞技产业的发展具有广阔的前景。本文通过文献资料检索法、逻辑分析法研究了国内外电子竞技现状和发展趋
热敏电阻是一种在航天领域广泛应用的测温元件 ,由于其一致性差 ,使用时必须给出每个元件的电阻—温度对应关系。在标定时 ,通过控制测量电流来防止热敏电阻发热。而在实际使
技能竞赛对推动高职院校学风建设具有积极作用.本文通过对高职院校学风建设存在的问题进行解读,从技能竞赛角度对学风建设的促进作用进行探究.提出推动高职院校学风建设的路
常宽凸集是广泛应用在设计、医学等方面的一类特殊的几何图形,然而常宽凸集的例子却很少,我们熟知的是圆盘与由(2n+1)(n≥1)-边形构造的Reuleaux多边形.本文中,我们构造了新
随着我国经济从高速增长向高质量发展阶段转化,现代企业生产自动化和智能化程度越来越高,传统成本核算方法的弊端也越来越明显,已经不能满足现代企业成本管理的需求。作业成
近年来,随着我国基础设施建设的迅猛发展,其中高地应力软岩隧道所占的比例也在不断增加,同时在高地应力软岩隧道施工中暴露出诸多问题,例如,围岩变形量大且变形持续时间长,初期支护变形严重,易发生侵限,拱顶喷射混凝土脱落、破裂等。因此,在高地应力软岩条件下如何安全稳定施工,保证工程质量成为一个施工重点与难点。本文以渭武高速木寨岭隧道为工程依托,采用围岩变形量测、理论分析以及有限元模拟等综合分析法,对渭武高
随着城市化的发展进程加剧,全世界环境日益恶化,绿色、生态和可持续发展成为当前社会的热点和重点问题。“生态校园”和“生态舒适”理论成为认识和研究城市中学校园环境的生
马克思哲学中的实践观是说明人的存在方式和发展基础的核心概念,在马克思哲学传播过程中,只有以整个西方实践哲学为背景,才能充分揭示马克思哲学实践观的本真内涵,凸显马克思