增强语义表示的中文金融评价要素抽取

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:qq1036191963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文金融评价文本是了解金融行情和判断金融行业繁荣程度的主要载体,对其中的评价要素进行抽取和分析可以在一定程度上的帮助决策者做出判断.传统的抽取方法更侧重于寻找规则,工作量大,且在句子复杂或者不规范的情况下,难以充分考虑句子的句法特征.为了解决该问题,本文构建BBG-BMC模型,利用基于图自注意力机制的混合词编码模型BBG(BERT-BiLSTM-GAT)进行词语编码,在经典的BiLSTM-CRF模型中增加自注意力机制(BiLSTM-多头自注意力机制-CRF,BMC)进行序列标注.该模型的特点是:1)通过图自注意力网络(GAT)建模并利用词语之间的句法依存关系,增强词语语义学习;2)融合词语的上下文信息、词语的局部语义信息、词语之间的句法关系信息,弥补金融词汇在BERT预训练模型上语义表示不够充分的问题;3)对评价单元的三要素联合抽取,扩大评价单元抽取的应用场景;4)使用序列标注的评价单元抽取思想,以混合词编码(BBG)、双向长短期记忆网络(BiLSTM)、条件随机场(CRF)与多头自注意力机制(MHSA)为组件,提升评价单元抽取效果.在中文金融文本数据集上对BBG-BMC模型进行评测,结果表明,本文的模型比最先进的模型BiLSTM-CRF取得了6.75%的F1值提升.
其他文献
针对传统的云存储完整性审计技术依赖PKI公钥体系、密钥管理成本高等问题,文章构建了一种基于身份的云存储审计模型,利用Merkle哈希树技术实现用户数据的动态更新.经方案分析证明,该方案是安全可行的.通过构建云医疗数据管理模型,证明该方案具有良好的应用前景.
国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局近期联合发布《互联网信息服务算法推荐管理规定》(以下简称《规定》),《规定》自2022年3月1日起施行.国家互联网信息办公室有关负责人表示,出台《规定》旨在规范互联网信息服务算法推荐活动,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,促进互联网信息服务健康发展.
期刊
中国科学技术大学郭光灿院士领导的中国科学院量子信息重点实验室在量子密钥分发研究方面取得重要进展.该实验室的韩正甫教授及其合作者王双、银振强、何德勇、陈巍等实现了830公里光纤信道量子密钥分发,将安全传输距离的世界纪录提升了二百余公里,向实现千公里陆基量子保密通信迈出了重要的一步.相关研究成果于1月17日在线发表在国际知名学术期刊《Nature Photonics》上.
期刊
近日,国家超级计算天津中心和国防科技大学联合数十家合作团队,共同发布面向新一代国产E级超级计算系统的十大应用挑战,支撑解决世界科技前沿、经济主战场、国家重大需求、人民生命健康领域的重大挑战性问题.rn新一代百亿亿次(E级)高性能计算机的研发,是国家在新一代信息技术领域的重要部署,将有力驱动国家信息技术产业创新发展,其自主化程度远高于其他超算平台,同时规模与性能大幅提升.此次十大应用挑战的发布,就是为了充分发挥新一代E级高性能计算机强大计算能力,研发适配国产超级计算系统的关键技术和应用软件,构建新的国产E级
期刊
2021网络空间安全人才峰会(CSTC)暨中国网络空间安全人才教育论坛年会于近日在湖南长沙顺利举行.本次会议由中国网络空间安全人才教育论坛、长沙国家高新技术产业开发区管理委员会和广州大学联合主办,中国产学研合作促进会、教育部高等学校网络空间安全专业教学指导委员会等多家单位共同承办.会议聚焦网安人才培养面临的挑战和人才需求短板,探索网安人才培养的模式与路径,分享网安人才培养成果与案例.会议联合了产、学、研、用多方力量,有来自政府主管部门、网安行业的代表及专家学者、新闻媒体代表近300人参会.会议设有1个主论
期刊
近日,科学技术部公示了国家重点研发计划“网络协同制造和智能工厂”重点专项2021年度项目立项名单,由重庆大学牵头申报的青年科学家项目“场景驱动的产品生态数据空间设计理论与方法”成功获批.rn该项目依托重庆大学信息物理社会可信服务计算教育部重点实验室,在重庆市科技局、重庆大学科发院及大数据与软件学院的指导下,由大数据与软件学院鄢萌研究员担任项目负责人,青年教师徐洲博士担任项目骨干,联合浙江大学和海尔智能技术共同申报,项目获国家专项资助经费500万元,实施周期为3年.
期刊
当前,卷积神经网络越来越多的应用于工业生产中,传统的基于CPU及GPU的神经网络平台存在体积大、能耗高等缺点,在工业生产现场部署存在困难.基于ARM的嵌入式平台虽然易于部署,但存在算力低的缺点,难以高效的实现卷积神经网络.针对此问题,本文设计并实现了一种基于Zynq平台的卷积神经网络单元,通过充分利用Zynq平台上FPGA端并行计算的特点,对卷积神经网络中卷积层进行加速,使用高层次综合(High-Level Synthesis,HLS)进行卷积层和池化层IP核的设计,并针对性的给出优化方案.最终实现在嵌入
面临大量数据时,如何从中摘取一部分感兴趣的数据帮助用户进行决策是数据库系统的一项重要功能.在过去几十年里,top-k和skyline查询是两种最常用的技术手段,但他们分别存在不能控制输出结果大小与需要用户提供效用函数的缺陷.为克服两者的缺陷,k代表点查询技术应运而生;其中性质较好、受到较多关注的是k-遗憾查询.本文首先回顾了skyline、top-k查询和几种典型的代表点查询.随后,详细地介绍了k-遗憾查询的概念与方法,从多个角度分析了提升查询质量的途径,并对k-遗憾查询的变体进行了研究.最后对未来遗憾最
针对蝗虫优化算法(Grasshopper Optimization Algorithm,GOA)存在求解精度低,收敛速度慢等问题,提出具有扰动机制和强化莱维飞行的蝗虫优化算法(DLGOA),位置参数部分使用非线性曲线函数去平衡算法局部开发和全局探索;扰动因子引入位置更新公式,提高算法寻优精度、收敛速度;将莱维飞行的步长改进以避免陷入局部最优,并利用高斯分布的随机性增加种群多样性.通过对7个基准函数进行仿真实验以及使用Wilcoxon秩和检验来评价算法性能,实验结果表明DLGOA算法具有较好的鲁棒性以及寻优
复杂网络重要节点在遭受敌方蓄意攻击时往往会造成网络的大范围瘫痪,评估出重要节点对网络的可靠性和网络安全具有重要意义.现有的评估重要节点的中心性准则仅针对某一测度,具有局限性,因此,文章提出了一种结合现有中心性准则对复杂网络节点进行重要度排序的方法.该方法结合度中心性、中介中心性、接近中心性和特征向量中心性准则,从多角度多方位评估节点重要性.该方法借助熵权法求得每项准则的权重,避免了人为因素带来的偏差.采用多准则妥协解排序法(VIKOR)对节点的重要度进行排序,在3个典型的复杂网络上利用病毒传播模型(SI)