论文部分内容阅读
结合语言模型与图像特征的财经文档信息抽取
【摘 要】
:
在我们的日常生活中有着大量的文档数据,若能自动、高效、准确地从非结构化的文档中抽取出所需的结构化信息将极大地方便我们处理和理解这些数据,财经文档就是常见的文档数据类型之一。但与一般自然语言处理中的纯文本不同的是,生活中的财经文档往往是图片、PDF、扫描件等形式,并且含有大量的“视觉信息”和“版式特征”,针对这种类型的文档信息抽取,本文主要进行了如下三个方面的工作:(1)基于文本检测和文本识别模型将
【出 处】
:
上海交通大学
【发表日期】
:
2020年01期
其他文献
预制装配式钢波纹管城市地下综合管廊是一种可同时容纳多种市政管线的大断面浅埋薄壁钢结构。管廊作为地下生命线工程结构,对其抗震性能的研究非常重要。本文针对预制装配式钢波纹管综合管廊这一新型地下结构,综合考虑结构设计施工特点、土与结构相互作用方式及多种管线支架布置等,开展了此类新型钢结构管廊在一般场地和可液化场地的大型振动台缩尺模型试验研究。从管廊在一般场地的振动台试验结果中发现,管廊对场地地表位移响应
学位
风能是一种重要的能源,风力发电机是风能利用的主要途径。H型垂直轴风力机因其整体结构更简单,生命周期更长,发电效率更高,拥有广阔的发展前景,但垂直轴风力机叶片在风荷载的作用下易产生振动问题,抗风能力较弱。本文针对三叶片H型垂直轴风力机风振与减振问题,以某大型10MW垂直轴风力机为研究对象,基于计算流体动力学CFD方法,用STAR-CCM+软件数值模拟获得风力机在转动周期内的叶片气动荷载。将风压力时程
学位
这项研究探索了能够区分网页对用户审美吸引力差异的眼注视视觉指标,以及这些指标在不同文化之间的差异。由中国和北欧学生组成的44位被试者观看了40张网站截图,然后对每张图片的好坏进行评分。通过审美倾向的百分比对图像进行评分并排序,并使用聚类图,热图和凝视图进行分析。结果表明,在具有更高美学吸引力的图像上,人们的集体凝视的方向落在相同的布局元素和组上,这表明,对于哪些元素和组构成布局,用户间达成了共识。
学位
作为一种复杂的现象,流固耦合在许多工程中具有重要的实际意义。在过去的几十年里,对这一现象已经从理论、实验和数值研究等多方面开展了大量的研究。已有的研究结果表明,绕流钝体截面形式的不同可能会改变涡激振动的一些最基本特性。方形截面由于其几何结构简单,一直是工程设计中最常用的结构截面形式之一。然而,迄今为止,关于多方柱多自由度下的VIV响应还未曾开展研究。因此,研究两自由度串联方柱的涡激振动特性具有重要
学位
缺口在日常生产生活中非常常见。由于缺口具有的应力集中效应,缺口试件在科学研究中应用得也非常广泛。工程构件难免存在难以检测的微小缺陷,缺陷的存在会对缺口的疲劳性能造成影响。缺口前端疲劳应变场是裂纹萌生寿命预估的重要依据,因此对缺陷对缺口前端疲劳应变场的影响进行研究具有重要意义。本文为了测量含缺陷缺口试件缺口前端疲劳应变场,提出了一种更加经济、便捷的微型散斑制备方法,制备了平均直径约7μm的散斑,并通
学位
近年来,在规模效益的驱使下,集装箱船被越造越大,单船箱位数的纪录不断被突破,20000 TEU级巨型集装箱船设计建造技术还处于开拓摸索阶段,上层建筑前岛位置的确定便是诸多亟待研究的关键技术之一。结合MARIC设计的系列大型集装箱船,首先简单分析了前岛位置对设计的影响因素,从总布置角度主要影响装箱数量,从结构角度主要影响船体梁的弯扭合成强度。决定运用全船有限元分析方法对巨型箱船实例进行计算分析。以M
学位
工程上广泛存在充液多体系统,随着液体晃动幅值的增大,液体晃动对刚体运动的影响不容忽视。处理充液问题的研究方法包括理论解析法、实验研究法、基于网格的数值计算方法和基于无网格的光滑粒子法(SPH)。理论解析法可用于求解几何形状规则的容器内微幅晃动问题,计算效率高但适用范围有限;实验研究法对处理非线性大幅晃动问题十分有效,但实验成本高且影响实验结果的不确定因素很多;基于网格的数值计算方法发展较为成熟,但
学位