金融知识图谱构建关键技术研究与原型实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:tansb87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今社会,随着互联网的快速发展以及人工智能热潮的兴起,金融行业本身的行业特殊性也在每分每秒地生产出海量的数据。而这些数据之间往往非结构化,难以处理;数据之间看似无关紧要,但往往又相互制约,数据间又包含着隐藏的信息。知识图谱(Knowledge Graph)作为一种将不同数据(知识)关联在一起的技术,因为它“还原真实世界”,拓宽了传统数据存储维度和业务展现方式,进而由最开始被搜索领域被关注的概念,逐渐成为各行各业争相研究的技术方向。构建一个金融领域的知识图谱,能有效地帮助行业工作人员进行风控、推荐等方向的应用。本文围绕着知识图谱的构建技术,针对金融领域。对构建金融知识图谱的方案进行了研究,且着重围绕了基于深度学习的命名实体识别模型与关系抽取模型。本课题的主要工作包括如下几个方面:1.数据的采集与预处理,对于命名实体识别与关系抽取研究,训练集的缺乏一直是当前的研究热点。本课题结合了常识知识库,利用了一种远程监督的方案,并配合层次聚类的算法对实体进行打标签,减少了人工操作的工作量与误差。2.在命名实体识别任务中,结合BERT预处理模型,针对BERT模型没有考虑词性、上下文信息也只用了embedding,各个词权重一样的问题,没法突出关键词的问题。本文结合了BiLSTM,通过加入一个attention层来获取上下文相关的语义信息,并且根据数据挖掘工作中得到的标签数据,根据标签来进行权重分配,提升对命名实体识别的提取效果。3.在关系抽取任务中,本文采取了远程监督的方案来获取金融领域的训练集。然后针对训练集中的噪声过大的问题,基于BiLSTM模型,结合多种注意力机制,利用了实体与关系的相关性,句法依存特征来处理训练样本噪声过大的问题,同时提升关系提取效果。4.最后,提出了一种半自动的收集金融知识图谱数据的方法,并根据收集到的数据,完成了金融知识图谱系统的设计与实现。
其他文献
党的“十七大”报告提出,通过建立以工促农、以城带乡长效机制,逐步形成城乡经济社会发展一体化新格局。城乡经济的发展取决于许多的因素,其中由于城乡经济的巨大差距,造成城乡居
<正> 省编六年制语文课本第十册第三课集《咏柳》《游园不值》和《春日》三首颂春诗于一篇,这样的辑合,有利于启发学生去学习、鉴赏。把三首诗作一比较,便可发现,诗的内容,虽
中国汽车市场发展,是在中国市场经济发展这个大背景下得以实现的。中国改革开放已经走过了30载,给人们的生活带来了翻天覆地的变化。而也正是因为人们的生活水平的提高,才有了要
我国现行期货新品种上市机制已经成为期货市场发展的"瓶颈",导致期货市场效率低下、功能难以充分发挥、国际竞争力明显不足。从国外期货品种上市机制立法看,完善期货品种上市
近几年来,政府和社会资本合作模式(PPP)逐渐演变成基础设施及公共服务领域项目建设的重要方式,成为解决公共产品和服务供给问题的重要助推器。在以往完全由政府部门提供公共
现阶段,我国小微企业数量庞大,从业人员逐年上涨,是市场主体的重要组成部分,在扩大就业、促进经济平稳发展、维持社会稳定等方面均起到了不可忽视的作用。近年来,我国为支持小微企业的发展,陆续出台了多项财税政策,税收优惠政策是其中重要的一项,发挥着不容小觑的作用。由于小微企业自身体量小、容易受到环境的影响,相对于大企业来说,政府采取的税收优惠政策能够对小微企业产生更大的效应。然而,尽管我国政府已经通过财税
网络信贷资金安全是互联网金融的重要研究内容之一。本文研究了机器学习与大数据技术相融合的信贷风险预警方法,构建智能的信贷风险评估体系,实现对信贷风险的预先感知,为信贷金融企业和金融机构提供及时的风险预警,降低企业金融风险和保障资金安全具有重要意义。其主要的工作如下:(1)在研究了贷前风险的事先防控方法的基础上,采用多种方式对信贷数据进行处理,其中包括分箱、编码和变量等处理方法。融入了随机森林方法以及
本文通过对土地利用总体规划区域经济评价中的方法进行分析,总结出现有规划区域经济实施评价方法存在的很多不确定因素,这影响了规划区域经济评价的准确性,然后提出把集对分
无人机技术和传感器技术的快速发展,使无人机摄影测量广泛应用于测绘、救灾应急、地质勘测、电力巡检、3D建模、气象探测等领域,成为国内外研究的热点之一。无人机摄影测量有