基于深度学习的互联网金融实体识别系统的研究与实现

来源 :河北工程大学 | 被引量 : 0次 | 上传用户:caiwenta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来由于互联网行业的飞快发展,促进了互联网行业与金融行业的相互融合,由此成千上万的互联网金融企业应运而生,随之带来的是海量的与互联网金融相关的自然语言数据。对海量的互联网金融数据进行中文命名实体识别已经成为自然语言处理领域不可或缺的一环。命名实体识别是指在文本中识别出文本中的各种特定实体,它是自然语言处理领域最为基础的问题之一,而现在已知的命名实体识别模型对互联网金融实体还不能高效率地识别,如果不能精准地识别互联网金融实体,会影响国家对互联网金融企业的监管工作。近年来,以深度学习为主的实体识别方案逐渐在传统的命名实体识别领域大放异彩,但对特定领域的中文命名实体识别任务仍存在一些问题:传统的模型无法有效地解决中文句子中一个词语含有多种含义的问题;针对特定领域如互联网金融领域的识别需要特定的知识。基于以上问题,本文对传统的基于深度学习的命名实体模型做了改进,并用专业的互联网金融数据集进行训练、识别,最终构建了一套基于深度学习的互联网金融实体识别系统。具体工作如下:第一,针对基准模型Bert-Bi LSTM-CRF缺少对中文的词语语义信息的获取方法,引入基于全词覆盖策略的Bert-WWM模型,能够有效地获取中文词语级别的语义信息。第二,本文针对传统的Bi LSTM模型由于参数过多,模型过于复杂导致计算时间过长的问题,引入了Bi GRU模型,减少了模型参数,可以大大减少模型的计算量。第三,本文提出了一种基于Bert-WWM-Bi GRU-Att-CRF的互联网金融实体识别模型。为解决Bi GRU网络对于当前输入序列在编码层存在着注意力分散问题,在现有模型上加入一层注意力机制层,能够有效地筛选出同一输入序列中的重要信息和次重要信息。第四,本文通过上述提出的实体识别模型,搭建了互联网金融实体识别系统,可首先通过网络爬虫爬取网络上庞大的金融信息,然后通过上述实体识别模型进行互联网金融实体识别。经实验验证,本文模型相比于现有模型更具有优势,F1值相比于基线提高了1.99%。
其他文献
高校园区用水作为城市用水的重要组成部分,在人均用水量方面明显高于城镇居民用水量,因此对高校园区用水量进行科学合理的监管,具有重要的节水意义。现如今高校园区供水主要依靠人工经验决策,但人工经验决策供水误差较大,常常导致水管爆裂、用水高峰供水不足等情况发生。本文以河北工程大学为研究对象,首先分析了历史供水数据的特征、分布、影响因子,提出了一种基于深度学习的混合需水预测模型。为进一步提升校园的短期供水精
学位
稳定的供电有利于推进乡村建设的进程,为乡村振兴提供了强有力的保障。电力负荷是供电计划中的重要参考内容,同时,电力负荷水平反映着乡村振兴的建设效果。为了量化分析乡村发展水平,为合理制定用电计划提供数据支持,本文以石家庄市平山县各行业负荷数据为基础,以电力负荷预测为出发点,通过搭建混合神经网络预测模型,对平山县各行业电力负荷数据进行精准预测,深入挖掘电力负荷数据背后的隐藏信息。具体研究内容如下:(1)
学位
在当前作战信息化条件下,使用作战辅助决策仿真系统是主要配合指挥人员作战方式之一。传统辅助决策模型存在功能分散、可信度不够、欠缺监管等问题,对辅助决策作战仿真系统进行研究可以更好地解决作战环境难以构建和作战效果难以及时反馈的难题。因此,设计合理的作战智能辅助决策系统对作战人员的指挥决策发挥了重要的作用。对辅助决策系统中,作战路径规划与火力分配两个重要方面展开深入研究。首先,对两个重要领域的研究现状进
学位
学位
智能制造业精密部件的加工依赖于先进的数控机床,而数控机床的核心之一是伺服系统。目前,高性能伺服系统的研究热点是永磁同步电机伺服系统,因此,本文以数控机床为工程研究背景,以永磁同步电机为具体研究对象。通过永磁同步电机的数学模型,构建其矢量控制系统,通过对转速环控制方法、电流环控制方法,无速度传感器技术的研究,提高伺服系统的鲁棒性及系统控制的精度。首先,介绍伺服系统控制策略及控制方法的发展现状,随后选
学位
在互联网信息呈爆炸式增长的时代,推荐系统已经成功进化为信息服务的基础性工具之一,它能够帮助用户做出合理的选择和决策。传统的推荐算法需要借助用户个人简介以及历史评分等额外语义信息来构建推荐任务以预测用户真正感兴趣的物品,然而在实际应用中,由于隐私策略或用户匿名访问的限制,这些配置文件大多都无法直接获得,唯一可用的有效信息是当前会话中的点击行为记录。因此,基于会话的序列推荐方法诞生并受到了学术界和工业
学位
学位
随着计算机视觉领域相关技术的不断更新迭代,尽管目前基于视频的烟雾检测技术取得了一定的进展,但是依然存在着检测精度不足、检测速率不高等问题。首先,目前公开的火灾烟雾数据集场景十分单一。针对由单一数据集所训练的火灾烟雾检测模型在场景适应方面表现较差,而且往往不能匹配某些场景,普适性较差等问题,本次研究对不同来源的火灾烟雾数据集进行收集与整理,数据集内包含森林、工厂、建筑、以及车辆起火等多种场景。针对现
学位
社会主义核心价值观是政治性与学理性、同一性和多样性、知识性和价值性相结合的价值系统,是当代中国马克主义最集中的价值诉求。社会主义核心价值对新时代的榜样教育有着重要的理论指导作用,其铸魂育人和价值引领的价值内涵契合着新时代榜样教育的价值追求。基于社会主义核心价值观作用机理深入剖析新时代榜样教育实效性式微的现实表征和原因,创新教育理念、加强成“人”教育,转变教育方式、追寻原型叙事,更新教育内容、深化情
期刊
随着信息时代的快速发展,海量的信息数据呈指数倍增长导致出现信息过载的问题。推荐系统作为缓解信息过载问题的重要方法之一,可以根据用户的偏好为用户提供所感兴趣的服务。然而,目前大部分推荐系统的研究主要针对单用户进行个性化推荐,随着社交网络的不断发展,以群组为单位的活动屡见不鲜,如公司团建,组队旅游等,但是个性化推荐很难满足以群组为单位活动的需求,因此群组推荐系统应运而生,可以为群组提供所感兴趣的服务,
学位