基于HowNet的金融领域新闻知识库的构建研究

被引量 : 0次 | 上传用户:xiao_ai1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的飞速发展和科技的不断进步,各行各业对于信息和知识的需求日益增加。在各个行业中,金融领域对于信息和知识的需求更为突出。然而金融信息量迅速增长以及大量非结构化的金融公告文本的存在,给金融研究团队在信息处理和公告研读的工作中带来了困难。为了解决这一问题,金融知识库应运而生,该知识库旨在从海量文本中抽取出相关的实体、关系以及属性等信息,以帮助人们更好地了解和把握市场的发展动态和趋势。本文旨在构建一个金融领域的新闻知识库系统,以金融领域新闻为数据来源,设计并实现了知识库系统,主要研究工作如下:(1)了解构建金融领域新闻知识库所需要用到的相关技术,并针对本文需求进行系统的设计,主要可以分为四个模块:数据获取、知识抽取、事件抽取、知识存储。(2)本文提出了SAH(Skip-gram-Attention-HowNet)的词向量表示模型,在Skip-gram框架中融合了注意力机制和HowNet义原,以更好地理解词义,提高词汇学习效率。通过利用HowNet中的义原作为语义特征,将其加入Bi LSTM-CRF模型中,提出了SAHBi LSTM-CRF-HowNet模型,该模型通过使用HowNet对词进行深层次的挖掘,寻找命名实体之间的关联,经过对比实验,本方法较其他方法准确度提高了3.2%,召回率提高了2.43%,F1值提高了1.7%。(3)基于本文提出的SAH-Bi LSTM-CRF-HowNet模型构建了一个金融领域的实体关系库,这个库首先利用知识抽取技术获取实体信息,然后利用HowNet中的上下位关系和层次结构计算出每个实体的义原之间的距离,从而得出实体之间的相似度,实现了实体消歧的目标。(4)本文首先对新闻文本进行分类,定义不同类型的事件模板;然后通过事件抽取技术提取新闻事件的关键信息,构建事件的结构化描述;随后,基于(3)中构建的实体关系库,将事件的主体和关系进行关联,构建事件之间的联系;最终实现了一个完整的金融领域新闻知识库。总体而言,本文提出了基于HowNet的金融领域新闻知识库的构建方案,并通过Python开发应用平台,实现了知识库的整合、展示和搜索功能,为用户提供快速获取所需信息的服务。经过系统功能实现和测试,完成了金融领域新闻知识库的构建。
其他文献
相机在拍摄人脸图时,常常因为抖动、失焦等原因得到模糊图像。而当人脸图像被模糊化时,对人脸识别等高级视觉任务有很大的影响。人脸图像去模糊的目的是从模糊的输入图像中恢复出清晰的图像,从而提高识别精度等。因此,图像去模糊问题是图像复原领域里面的研究重点,而一般的去模糊方法在人脸图像上效果不佳。本文采用生成式学习方法,结合特征矫正模块,实现对模糊人脸图像进行高精度复原,主要工作如下:(1)基于高效自注意力
学位
随着深度学习中卷积神经网络技术发展,现今的卷积神经网络的模型结构应用越加广泛。为了提升模型性能,网络模型通常变得更加复杂,规模日益庞大,且神经网络本身存在计算冗余,使得边缘设备无法满足复杂模型的运算需求。因此深度卷积神经网络的模型压缩工作被广泛研究,使用有效的模型压缩算法可以减少冗余度,让复杂模型转变为轻量模型以适应更丰富的应用场景。本文主要工作研究了轻量化卷积神经网络和结构化模型剪枝技术。首先是
学位
随着计算机图形学、数字图像三维处理在口腔数字化方面的快速发展,计算机在口腔诊疗领域有着广泛的应用。本课题着眼于数字化口腔医疗的发展和推广,在牙齿尖点的提取和牙齿的三维测量基础上,进行了全牙列数字化评估研究。本文包括以下几个方面的主要研究内容:1)本文以全牙列数字化评估系统在口腔数字化诊疗中的应用为背景,对三维测量技术、牙尖提取方法和现有的评估系统进行了简单的介绍。在此基础上,基于编码结构光技术的相
学位
随着计算预算和数据可用性的空前增加,深度模型在目标识别任务中取得了优异的性能。然而,机器学习机制仍然无法与认知学习相比,认知学习不仅可以持续地获取新知识并保存大部分经常用到的旧知识,还能在少量注释样本上构建高精度的识别能力。小样本类增量学习(FSCIL)是一种受认知学习启发的新兴机器学习范式,给定具有足够训练数据的基类和来自新类的少量可训练样本,FSCIL使用旧类训练一个表示模型,然后不断地使模型
学位
近年来,随着卫星遥感技术和深度学习技术的快速发展,基于深度学习方法对遥感图像中的特定目标进行检测逐步成为当前的研究热点。我国拥有广袤的海域和许多重要的港口,开展海面目标检测无论在军事上还是在民用上都有着非常重要的价值和意义,例如渔业管理、港口交通服务、海上巡逻等。本文主要目标是在复杂海洋环境以及各种云雾天气的干扰情况下,依托现有的深度神经网络方法,研究海面遥感舰船图像处理的分类与定位不准确问题。主
学位
人工智能的迅速崛起开启了一次重大的时代转型,生理状态评估领域迎来了新的曙光,以数据和智能状态评估算法驱动的生理状态评估领域方兴未艾。在生理状态评估领域之中,传统的心率异常状态存在误报警、准确率不高等问题,同时疲劳状态也难以通过单一参数进行感知与评估。因此本文针对两类不同的生理数据(波形生理信号以及稀疏多元生理数据),分别建立了深度神经网络模型,实现了人体心电异常状态以及疲劳状态的识别。本文主要的研
学位
随着武器装备的飞速发展,空战环境日益复杂多变,现代战场呈现出高度智能化的特点。威胁评估作为一种辅助决策工具,可以提高指挥员对战场的实时感知能力,帮助指挥员快速、准确地判断战场形势,从而做出科学、有效的战术决策。本文以地面防空为背景,展开研究空中目标威胁评估的相关问题。论文的主要研究内容如下:(1)针对空中袭击目标,建立威胁评估模型。在建模过程中综合考虑诸多因素,通过相关系数和Alpha系数确定威胁
学位
区块链是数字经济发展中的一项重要技术,已被纳入国民经济十四五规划纲要中。区块链技术的应用范围正在迅速扩张,已经从虚拟货币扩展到了与金融、物流、政府以及医疗等各种行业的结合。然而,在区块链技术飞速发展的今天,区块链网络间的数据协同需求也在日益上升,由于不同区块链在底层架构、共识机制以及消息协议等方面的不同,导致区块链生态形成了“数据孤岛”的局面,无法进行数据交互。在现如今大量的联盟链应用场景中,跨链
学位
软件等信息技术产业的不断发展,使软件的功能和组成结构日趋复杂,而复杂的软件结构导致软件安全事件频发,使工业生产和社会安全受到了严重威胁。大部分软件安全问题来自于软件源代码本身存在的安全风险,因此,近年来软件源代码安全问题得到社会各界的广泛关注。面对软件漏洞利用问题的快速增长,如何快速有效地对软件源代码进行漏洞检测,是当下信息安全研究领域的热门研究问题。传统的静态漏洞检测方法大多依赖于人工定制的漏洞
学位
随着互联网技术的飞速发展,在为人们带来便利的同时,也产生了海量的数据,使人们面临选择困难的窘境。推荐系统能够根据用户画像,从海量信息中筛选出用户感兴趣的内容,产生个性化推荐列表给用户,从而有效解决信息过载问题。近年来,基于深度学习的推荐算法占据主导地位,在电影推荐中,引入深度学习模型来提取用户行为序列特征,精准刻画用户画像,有助于改善推荐效果。推荐系统的设计要兼顾准确性以及高效性,所以通常采用分级
学位