基于BERT模型的互联网金融实体识别研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:lubiaofs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据处理技术的不断发展,互联网金融信息也进入了大数据时代。面对海量的互联网金融文本,使用自然语言处理技术对互联网金融文本进行实体识别已成为技术发展的必然趋势。命名实体识别是指识别文本中命名实体并执行分类,是自然语言处理技术中的重要基础。目前已有的命名实体识别模型不能有效的识别金融实体,互联网金融实体无法识别,则金融监管无从谈起。面向互联网金融实体的识别,本文提出了一种基于BERT的改进模型BERT-Bi GRU-STM。该模型结合了序列化标注模型(Sequence Tagging Model,STM)和BERT-Bi GRU-CRF模型的优点,提高了互联网金融实体识别的精确度。利用Le NER-Br数据集对该模型效果和其他模型进行验证,各项指标较其他模型均取得了最优。其中,该模型的F1值相比于STM模型提高了0.5%,相比于BERTBi GRU-CRF提高了2%。为了展示模型的识别效果,本文构建了一个互联网金融实体识别的可视化系统,系统功能包括互联网金融文本录入、分词标注、实体抽取、词频统计、名词关系展示等。本文提出的改进模型和实现的可视化系统可为金融监管、金融数据标注等提供技术支持。
其他文献
石油企业是资金聚集、技术密集和劳动密集于一体的大型企业,油田企业要完成由传统企业到现代企业的转变,除了体制、机制等根本性因素外,其关键性制约因素是人。以人为本是企业成
9月6日,由商务部举办的中国进口论坛在北京举行。一位不愿透露姓名的商务部官员在论坛上向媒体透露,面对连月来的高额贸易顺差,外贸系统内正在讨论"削减顺差"的方案;而与以往"压
中国投资者不但拓宽了海外并购的行业领域,同时中国的海外并购活动也开始走向成熟市场,如美国、日本以及欧盟等地。
中医药要实现产业化、现代化和国际化的快速发展,必须借助产业投资基金这一投资制度,实现产业资本和金融资本的结合,利用中医药产业投资基金,为中医药行业提供投资和融资服务
文章介绍了云岗矿南翼主扇励磁盘的技术改造.通过实践运行,性能稳定,事故率降低,保证了主风机的安全运行,为煤矿井下的安全生产提供了极大的保障.
文章根据测量工作的地位和作用,结合自己多年的工作实践,对独立厂矿在建设和生产中如何搞好测量工作,提出了几点具体的建议。
文章通过施肥技术的产业化经营,阐明了科技产业化经营是农业科研单位推广先进技术的重要途径。
作为一项高质量的信息资源服务,科技查新工作避免了许多科研重复立和低水平成果鉴定,启迪了科研思路,有力地促进了技术创新和科技进步。
10月15日,第108届广交会第一天。在进口展区,台湾纬和公司的展台前挤满了观众,这个公司发明的小小掌上封口机吸引了众多目光。它究竟有什么神奇的功能呢?
从CL结构的设计规程和验收标准来看,CL墙板的施工方法为单面预制,单面现浇.但在试验中我们发现CL网架板混凝土单面预制存在很多不足,CL网架板混凝土双面现浇更有利于结构的整