基于自回归深度神经网络的公式图片识别研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:bbanb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能对社会经济和文化领域的发展产生了积极的效果,表现出了突出的变革性和引领性。在科研和学习中,将公式图片转换为La Te X代码是一项常见但耗时的任务。以深度学习算法模型为代表的人工智能技术可以有效地提升这一过程的效率。本文主要研究和搭建基于自回归深度神经网络的数学公式图片识别与La Te X代码转化模型。具体而言,我们分别基于seq2seq结构和Transformer结构搭建了两个具体的公式图片识别转化模型进行实验,并使模型对im2La Te X-100k数据集进行学习测试。通过对比两种模型的训练过程和结果,发现基于Transformer的模型具有更高的准确率和更快的收敛速度。进一步,在所搭建的模型基础上,本文还尝试对模型进行改进,包括集束搜索优化和网络深度及训练轮数的优化,分析探索了公式图片到代码转换的模型中可能的改进方向。本文展示了一种针对数学公式图片识别和转化问题的有效方法,并提供了一个具体的、识别准确的实践模型。本文的研究有望能为相关模型的提升和完善提供了新的视角。
其他文献
小屏手机因其小巧便携和续航能力强等特点一直备受欢迎。然而,受限于零件配置和生产技术,目前市场上可选的小屏手机种类并不多。因此,各大手机厂商对小屏手机市场份额的竞争异常激烈。与此同时,在线评论数据爆炸式增长,如何有效利用这些数据已成为一个挑战。本文旨在利用大数据分析和文本挖掘技术分析消费者的反馈和评论,帮助商家提高产品和市场竞争力,同时也有助于消费者更好地了解商品情况,优化购买决策。基于此背景,本文
学位
近年来,房地产行业实现了跨越式发展,它对国民经济起到重要支撑作用的同时也带来了一些现实问题。随着房地产行业的快速扩张,日益高涨的房价成为了社会各界的关注热点,我国政府也相继出台了多项政策来对房价进行控制。为了确保宏观政策调控的合理性,需要对房地产行业进行更为科学有效地分析。本文采用中国35个大中城市2007年-2020年的房价及相关数据进行实证分析。首先,建立参数空间面板自回归模型探索房价影响因素
学位
糖尿病是全球最为流行的慢性病之一.根据2021年一份全球糖尿病报告,全球糖尿病患者已达到5.37亿人.我国是糖尿病患者最多的国家,近年来我国成人糖尿病患病率持续上升,过去的10年间患者人数增幅达56%,其中尚未被确诊的患者比例高达51.7%.但由于医疗资源有限等原因,我国对糖尿病高危人群的筛查是远远不够的.而通过机器学习的方法,可以帮助医生快速的对高危人群进行筛查,做到早发现、早干预,可以有效减少
学位
本文介绍了对数正态几何复合分布的定义与性质,给出了复合分布函数的概率分布函数、密度函数、失效率函数、平均剩余寿命和平均失效率函数。由于文中给出的失效率函数、平均失效函数、以及密度函数和平均剩余寿命较为复杂,不能通过对函数求导的方式给出函数的形状特征,故本文主要以图像加证明的方式讲述了复合分布概率密度函数、失效率函数、平均剩余寿命和平均失效率函数的性质。此外,文中给出了高阶矩的存在性的证明。论文在参
学位
顺应经济全球化的发展,未来国家需要的是应用型和全面型的人才,以满足科学技术的发展和应对国际竞争的需要。随着全球化的进程不断推进,多元文化的融合已然成为我国社会文化发展的必然趋势和不争的事实。发展STEAM教育既有利于培养创新性、实践性和全面性的人才,又能促进多元文化的融合。近年来国内相继出台了很多国家性和地方性的政策来促进STEAM教育的本土化发展,希望通过STEAM教育培养学生成为具有科学文化素
学位
股票市场是资本市场的重要组成部分,也是量化投资的重要研究方向。随着我国经济的不断腾飞,人们的投资理念在不断提高,对于股票趋势预测的研究课题越来越受到广大学者的重视。从初期通过简单的线性模型,例如:ARIMA模型、GARCH模型等时间序列模型对股票数据进行预测,到通过非线性模型,例如:SVM模型、RF模型、NBM模型等机器学习模型对股票数据进行研究,模型的复杂度和预测效果都在不断上升。最近几年,随着
学位
在房地产市场的搜寻过程中,初始价格、交易持时和交易价格是反映交易过程的重要指标。所谓交易持时是指房屋从挂牌开始到销售达成的时间间隔。通过探究交易持时和成交价格的影响因素,建立模型,既可以帮助买方选择成交价格合适、更符合自身情况的房源;又可以帮助卖方在较高的成交价与较短的交易持时之间找到平衡点,获取更高的收益;同时为房产中介及政策制定者提供参考。上海作为我国的超大城市之一,其二手房地产业更是备受关注
学位
随着人工智能、大数据等新技术的迭代与飞速发展,数据规模与网络复杂度日益呈现爆炸式增长。由于各类网站和应用的增多,为了维持更新服务器的性能与质量,企业不断增加服务器数量和规模,这也就导致了IT系统越来越复杂化。针对当前运维的缺陷,需要有一种更高效、智能的运维技术。它可以大幅度提升运维效率和质量,包括监控的便捷部署、系统故障的及时发现与报警、根因定位、以及故障处理的智能决策。本文旨在通过搭建一套微服务
学位
本文主要研究基于深度学习方法的中文手写字体的识别问题。由于汉字特有的“方块形”特点,手写体汉字无法直接利用英语手写字体识别的模型(如卷积循环神经网络模型,CRNN)进行识别。借鉴深度学习中目标检测算法的最新进展,尤其是YOLO系列算法在准确度、易用性、速度等多方面的提升,本文提出了一个基于目标检测与图像分类的两阶段非端到端模型VRCH。该模型通过在中文识别模型中引入目标检测算法,弥补了CRNN单方
学位
空气质量与居民生活质量息息相关。近年来空气污染问题对居民的日常生活产生巨大影响。探究空气污染物的时空扩散规律并对污染物浓度进行预测具有重要现实意义。长江三角洲地区是我国人口最密集、经济发展最活跃、开放程度最高、创新能力最强的区域之一,是我国的重要经济中心。对于该地区的空气污染物浓度的时空扩散规律的研究及预测能够为长江三角洲区域大气污染联防联控提供理论支撑和政策参考。本文基于时间基函数对空气污染物浓
学位