基于事理图谱和知识图谱的金融领域问答系统设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:dacong966963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,各行各业都在数据科学的驱动下获得了新的生机。金融行业作为数据高度相关的领域,也面临着数字化和智能化的转变。知识图谱技术是人工智能与传统数据库结合的产物,旨在利用信息抽取技术,从非结构化的文本中提取人类所关注的知识,并通过知识图谱的形式存储。在金融领域,数据资源不仅仅包含诸如企业信息、人员信息这些知识图谱可覆盖的“静态”知识,还包含着以事件为核心的“动态”知识。事理图谱技术关注的是事件和事件之间的逻辑关系,是知识图谱技术在“动态”知识上的延伸,因此可以利用事理图谱管理金融领域的“动态”知识。基于知识库的问答系统有着传统信息检索系统所没有的优势,它能够处理符合人类口语化表达习惯的自然语言问句,利用图谱技术作为支撑,自动化的构建知识库并保证知识库快速的更新。因此,我们面向金融行业构建了事理图谱和知识图谱,同时考虑到知识的可用性,实现了基于知识图谱和事理图谱的知识库问答系统。本文的主要工作包括:(1)针对金融领域事件知识的管理问题,本文提出了一种事理图谱的构建方法。该方法采用深度神经网络模型自动抽取文本特征,避免了手动选取和构建特征。使用序列标注算法提取因果事件对,有效发掘隐含的事件因果关系。利用深度聚类算法进行事件融合,提高了事件融合的准确率。最后利用事件融合结果构建事理图谱。我们在真实的金融新闻语料上进行了实验,实验表明我们的方法在准确率、召回率和F值上均取得了较好的效果。(2)本文设计并实现了基于事理图谱和知识图谱的知识库问答系统。本文从软件工程的角度,明确了系统的需求,进行了系统的总体和详细设计。将系统划分为事理图谱构建、知识图谱构建和基于知识库的问答三个部分。针对金融领域知识特点,基于信息抽取、深度学习相关技术构建了事理图谱和知识图谱,实现了基于事理图谱和知识图谱的问答系统。最后,我们对系统各模块进行了测试,测试结果表明系统达到了设计要求和实现目标。综上,本文面向金融文本,提出了一种基于序列标注和深度聚类的事理图谱构建方法,并在此基础上,设计并实现了一个基于事理图谱和知识图谱的问答系统。
其他文献
铁电材料因其独特的铁电性、热释电性、压电性、电光效应等重要特性而成为一类重要的功能材料,被广泛应用于铁电存储器、红外探测器、压控滤波器等电子元器件中。伴随着微电子集成技术的发展,铁电材料在纳米厚度上铁电性的研究越来越受人们的关注。近年来,相关的薄膜研究主要基于无机铁电薄膜开展,而对分子铁电薄膜的研究则较少。就分子铁电体而言,其中某些具有层状结构的化合物可以通过剥离制备出超薄薄层,并具有一定的半导体
背景心源性脑栓塞(Cardiogenic Cerebral Embolism,CCE)是缺血性脑卒中的亚型之一,与其他类型缺血性脑卒中相比,其临床危害更大,致死率、致残率及复发率均较高,其中心房纤颤是CCE的主要潜在病因和独立危险因素。CCE与动脉源性栓塞的二级预防方案有所不同,故而及时识别CCE尤其对于不明原因型卒中患者进行早期、有效的二级预防十分重要。但当下我国缺血性脑卒中并发心房纤颤比率较欧
近年来,随着互联网技术的进步,面向开源社区的开源软件开发方法凭借低成本、高质量的开发特性得到了快速发展。然而,随着软件需求和项目的大量涌入,巨大的竞争压力使得开源项目难以快速吸引足够多的开发者共同促进软件项目发展。因此,需要构造合适的方法建立开发者与项目之间的关联从而促进软件项目的开发与完善。目前,许多研究者从开发者推荐的角度解决项目和开发者之间的关联问题。然而现有的开发者推荐方法依然存在一些问题
目的:膀胱癌发病率占全球癌症的3%,在我国泌尿系肿瘤位居首位,而且目前膀胱癌发病率和死亡率也是在世界范围内稳步上升。膀胱癌根据肿瘤浸润深度可分为非肌层浸润性膀胱癌和肌层浸润想膀胱癌,而根治性膀胱切除术是肌层浸润性膀胱癌常用的手术治疗方式。但是膀胱癌患者术后复发率时常较高,而且患者的的总体预后效果较差。因此,需要研究一些有效的临床生物标记物,来对根治性膀胱切除术后的患者进行预后分析。最近,越来越多的
随着智能交通技术的蓬勃发展,智能车路系统逐步成为新形势下解决交通问题的有效手段。在智能车路系统中,交通环境信息的准确分析是实现“人-车-路-云”高度协同功能的关键因素。车辆作为交通主要参与者,精准感知其空间位置、数量等信息尤为重要。目前路侧车辆检测主要采用感应线圈、视觉传感器等感知技术,难以同时满足高精度、环境适应性、移动性、实时性和空间信息准确性等多方面要求。随着人工智能的发展,以视觉传感器、激
背景:随着工农业生产的快速发展,我国铜污染问题日益加重,部分地区土壤、水体铜含量已超过环境限量。目前,国内外铜的环境、食品限量标准尚不完善,人群铜暴露风险逐渐增加,铜代谢紊乱与多种神经退行性疾病密切相关,影响认知功能,但具体机制仍不清楚,探讨铜暴露的健康危害及机制具有重要意义。目的:1.探究铜暴露对神经系统认知功能的影响,初步探讨海马神经细胞凋亡、氧化应激、突触功能在铜致认知障碍中的作用;2.评估
光学疗法是一种用于局部肿瘤治疗的非侵入性疗法,它的核心是光敏剂在特定的时间内富集于肿瘤组织,通过使用与光敏剂特征吸收相匹配的光进行定向辐照,激活光敏剂,从而产生具有细胞毒活性的ROS,杀死肿瘤细胞。金属光敏剂具有丰富的光物理化学性质和结构多样性,因而在肿瘤的光学治疗研究中引起了科研人员的广泛关注。基于此,本论文以开发新型金属光敏剂为研究方向,合成了两类具有不同抗肿瘤作用机制的金属光敏剂,以解决目前
背景肺癌转移侵犯胸膜可引起恶性胸腔积液。恶性胸腔积液患者预后欠佳,通常为3-12个月。有研究表明非小细胞肺癌伴恶性胸腔积液患者的总生存期约为8.5个月。LENT评分和PROMISE评分纳入了临床病理特征,用来预测恶性胸腔积液患者的预后。但这两个评分系统是针对所有恶性肿瘤导致的恶性胸腔积液患者,由于肿瘤起源、治疗反应等因素影响,以上两个评分系统对于肺癌伴恶性胸腔积液的预后效能较差。因此,本研究拟开发
钢-混混合梁是混凝土梁和钢梁在纵向合理的位置利用结合段连接成一个整体的结构体系。钢混混合结构在负弯矩处布置具有良好压缩性能的预应力混凝土结构,在正弯矩处布置具有良好抗拉性能的钢结构,极大地增强了桥梁的整体刚度,有着广阔的发展前景。随着混合结构的逐步推广,钢-混凝土结合段的设计问题已成为工程领域研究的新热点。钢混结合段因其构造受力的复杂性,是混合梁的关键部分,在某种程度上决定了整个桥梁设计的成败。因
打印机图像处理引擎负责处理打印文件的图像解码,常见的打印机图像解码包括黑白或红黑图像的JBIG解码和彩色图像的JPEG解码。在打印机中,图像解码占据了处理器执行时间的一半以上。图像解码的速度直接影响到打印机的打印速度,是打印机的主要瓶颈之一,提升图像解码速度至关重要。论文首先基于龙芯2K1000B处理器,面向国产打印机,选用JBIG/JPEG解码函数库和龙芯2K1000B集成的视频处理单元(Vid