基于文档结构与深度学习的金融公告信息抽取

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:mayf014
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对金融类公告中的结构化数据难以被高效快速提取的问题,提出一种基于文档结构与Bi-LSTM-CRF网络模型的信息抽取方法。自定义一种文档结构树生成算法,利用规则从文档结构树中抽取所需节点信息;构建基于信息句触发词的局部句子规则,抽取包含结构化字段信息的信息句;将字段的结构化信息抽取看作序列标注问题,分词时加入领域知识词典,构建基于Bi-LSTM-CRF的神经网络模型进行字段信息识别。实验结果表明,该信息抽取方法可以满足多类型公告的结构化信息提取,最终的信息句与字段信息抽取的平均F1值均可达到91%以上,验
其他文献
随着我国经济增长结构的转型,消费占经济的比重越来越大,以促消费为重点的政策也持续加码。"首发经济"对于增强城市空间活力、增加城市消费空间和消费供给的作用日益增强。今
上天赐予自然界万物求生的本能,而万物灵长却在自己的贪婪任意杀戮。为保护野生动物、拯救人类赖以生存的家园,继“可可西里一号”行动、“南方二号”行动之后,又一次全国性大规
针对粉煤加氢气化反应后生成大量粉状半焦的特点,论述了对半焦的规模化应用技术:包括与干粉气化技术耦合制氢、制半焦浆后气化制氢、锅炉掺烧、高炉喷吹、制半焦吸附剂、制备
创造性判断涉及诸多因素,是发明实质审查实践中的重点和难点,而发明构思是判断创造性的内在依据和标尺,应当贯穿审查过程的始终,以便从整体上客观地对发明进行考量和判断,保
针对目前飞机维修场景众多的特点,提出一种适用于飞机协同维修的交互状态机模型。运用UML状态机建立维修人员、操作对象的状态转移模型,基于操作对象间的约束关系、操作对象-
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
【正】今年元月29日和2月23日,清华大学电机系大四学生刘海洋为了验证“笨狗熊”的说法,竟然先后两次把掺有火碱、硫酸的饮料倒在北京动物园饲养的5只狗熊身上和嘴里,在社会
为综合利用基于情感词典和基于机器学习的两类情感分类方法的优点,提出一种基于情感词汇与机器学习的方面级情感分类方法。通过选取少量情感倾向与评价对象无关的情感词汇对
勤劳都是相似的,懒惰却各有不同。吕梁山深处的黎掌村曾有几位懒汉,要么沉迷空想,要么无所事事,要么坐等靠要……眼下正是脱贫攻坚“啃硬骨头”的冲刺阶段,这些懒汉无疑是重
读19世纪末叶到20世纪初叶的欧洲小说,感觉留在西方文学史记忆中的,总有一种病恹恹的审美气息。直到看了美国作家苏珊·桑塔格的《疾病的隐喻》,才恍然那是一种结核病的气息