基于BERT的中文实体识别研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:tonykaier
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理的一个关键技术,该技术可以识别非结构化文本数据中的实体。实际上,可以将此项技术应用到自然语言处理的下游任务中,提高下游任务的完成效果。而命名实体识别的效果将会直接影响自然语言的众多下游任务的效果。本文使用深度学习的方法,以BLSTM-CRF模型为基准模型,在模型中引入BERT语言模型,并在损失函数中加入对抗不平衡分类结果的损失。由此构建一个改进的BERT-BLSTM-CRF模型。首先,在实体识别模型中引入近年在自然语言处理领域起到突破作用的BERT模型作为词向量模型。解决了以往词向量模型不能动态表示多义词在不同语境中应具有不同语义的问题,并丰富上下文语义在词向量中的表示。其次,在命名实体识别模型中引入CNN网络层,处理并得到网络输入信息的空间特征。最后,在命名实体识别的损失函数中引入图像分类的Focal Loss来缓解序列标注中,实体标签分类不均衡的问题。本文使用公开数据集《人民日报》对命名实体识别算法模型进行试验和对比,又构建了一个包含人名、组织名、职位实体名的维基百科中文数据集,对命名实体识别算法模型进行验证和对比,也为后续做信息监控知识图谱做数据准备。改进后的算法在人民日报数据集和维基百科中文数据集上进行实验,结果显示在各实体类别上F1值都有所上升。
其他文献
随着信用经济的高速发展,信贷业务在各类金融机构业务中所占的比例越来越大,“信用消费”在国家经济运作和日常生活中的应用也有了很大的改变。“如何在信用贷款业务和信贷违约率之间达到平衡,降低违约率”是目前学术界研究的主要技术性问题之一,也是各金融机构在信贷业务发展中急需解决的问题。而这些问题究其根源是要解决金融机构个人信贷的配给风险问题,即如何科学、准确、合理的选择申贷者,减少机构的潜在损失,尽可能获得
上市公司的年度报告一般包含对公司上一会计年度的主要经营活动和财务业绩的全面描述,其中的文本内容与数据是衡量一家公司组织和经营状况是否良好的有效指标。通过阅读年度报告,人们可以了解公司的综合运营情况,以便做出合理的业务评估或投资决策。因此,年度报告翻译的研究具有一定价值。彼得·纽马克(Peter Newmark)的交际翻译理论为此次年度报告翻译实践提供重要指导。本次翻译实践的对象为万事达卡公司201
进入本世纪,经济增长长期对高投资过分依赖因而导致国内过剩产能积累,相应消费支出贡献率在2000年-2010年持续下降,而资本形成总额贡献率在21世纪前十年节节攀升。随着我国经济进入新常态,国际环境带来的不确定性以及2020年以来疫情对全球经济的冲击,在此背景下只能更多的依靠国内居民消费,国家提出构建以内循环为主、内外双循环结构的新发展战略,扩大居民消费势在必行。2012年后政府陆续推出一系列减税降
企业社会责任这一概念最早出现于上世纪初,近年来越发受到社会广泛关注,相关研究文献也越来越充实。与此同时,企业避税一直是比较敏感且容易触及法律漏洞的问题,企业的非法避税危害国家财政安全和整体利益。而企业社会责任涉及企业的经营成本和企业声誉,与企业的税收息息相关,本文旨在研究企业社会责任和企业避税之间的关系,同时考虑到产权性质、融资约束、名义税率的不同对企业社会责任和企业避税的影响,本文也会分别讨论不
税收协同效应作为并购后整合协同体系的重要因素,决定了并购的成本,影响到公司以后发展的绩效。由于税收的特殊性,关联并购与非关联并购以及不同产权性质下企业并购节税的动机以及实现并购节税的效率会有不同,从而导致并购的税收协同效应会产生差异。本文以沪深两市2014-2018年我国A股上市公司为总样本,分别实证检验关联并购和非关联并购的税收协同效应,比较分析关联并购的税收协同效应,随后根据产权性质进行分组后
当前我国经济走向新常态,科技创新在国家的发展中发挥越来越重要的作用。2020年,《政府工作报告》指出要培养企业研发创新能力,提高企业创新积极性,促进企业增加研究开发投入,提高社会创造力。作为创新的主体,企业的研发创新将成为促进国家经济增长和社会进步的动力。但是,由于创新活动风险大、投入资金多,且具有正外部性,企业创新带来的收益小于社会收益,这极大地抑制了企业的研发动力。因此,政府出台相应的税收激励
改革开放以来,我国在资本市场开放方面先后试行和出台了多项政策,并取得了一定的成果。从1992年建立B股市场,到2002年出台QFII政策,2011年试点RQFII制度,再到于2014年11月17日正式运行的“沪港通”和于2016年12月5日正式启动的“深港通”,我国资本市场的开放程度不断扩大。“沪港通”的开通是我国资本市场开放的里程碑事件,在一定程度上降低了境外投资者参与境内资本市场交易的门槛,打
由于我国资本市场目前正处于快速发展的阶段,企业之间的并购、重组等资产交易行为都离不开对企业的价值进行评估,因此企业管理者及投资者都越来越关注企业的内在价值。房地产为促进我国GDP的增长做出了杰出贡献,同时促进了就业,但随着近年来房价的突飞猛进,随之而来的是政府对房地产行业限售限购限贷等一系列政策调控,使得房地产行业发展受限。近年来房地产企业债务融资日渐困难,融资成本逐渐增高,源于银行对房地产行业信
小微企业的发展是我国政府关注的重要问题,也是各金融机构支持的重要对象。小微企业为我国经济的发展提供了支撑,创造了大量的就业岗位,推动了经济结构的转型与优化。但是,小微企业的发展也面临诸多难题,并且需要一定的资金支持。为此,政府出台了若干支持金融机构向小微企业贷款的政策。城市商业银行作为组成地方金融机构的重要部分,在小微企业的贷款上也投入了较多的资源,贷款规模不断增加。但是,与中大型企业相比,小微企
随着我国市场经济的发展,越来越多的公司在业务运营管理流程的各个方面从事避税活动,所采用的避税方法较为复杂化、多样化和隐蔽化。因此,对企业避税的影响因素进行全面的研究已成为许多学者研究的重点,其目的是为企业内控和相关公共管理部门发现并有效防止企业避税提供一定的政策建议。学者们通过对高层梯队理论的研究证明,高管的性别、学历、年龄和专业背景等个人特征将会影响企业战略的选择。那么,CEO的财务职业背景是否