基于深度学习的表情图片文本识别与检测方法及表情智能选择系统研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:wuyu9603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微信、QQ等聊天软件的普及,网络社交已成为人们日常生活的一部分,表情图片也因其丰富的表达能力而在交流中被大量使用。如果不能在海量的表情图片中快速找到自己需要的图片,势必会影响聊天过程,甚至可能产生误解与分歧,据此,本文探索构建了一个文图自动匹配的系统。该系统通过分析文字内容可以帮助人们快速定位表情图片,从而改善聊天过程,让网络社交更加快捷、智能、生动。构建系统需要使用OCR技术对表情图片中的文字进行准确识别。相较于统计机器学习模型,由深度神经网络实现的基于文本区域识别-文本字符识别的双阶段范式由于具有更强的函数表达能力而成为当前OCR技术实现的主流方法之一。在文本区域识别阶段,由于表情图片文本长度的变化范围非常大,传统的文本区域识别模型无法对文本区域进行精准提取,冗余或缺乏的区域将严重影响后续的识别效果。对此,本文设计了基于目标检测的文本区域检测模型TDRR。TDRR由尺寸变换模块、特征提取模块、双向GRU、候选区域类别层以及候选区域垂直回归层等部分构成。通过将表情图片分解为多个固定宽度的检测区域,TDRR可对文本线进行精确求解,从而实现对文字区域的准确位置标定。在ICDAR2017-MLT数据集上的对比试验结果表明,相比其他区域检测模型,TDRR在精确度、召回率和f测度三个指标均表现最优。在文本字符识别阶段,表情图片中的字符之间具有语义序列依赖关系,而传统的识别模型仅对空间特征进行处理,忽略了对时间特征的抓取,从而导致识别准确率不足。为了解决上述问题,本文设计了基于时空域联合神经网络的文字识别模型SJNN。SJNN由空间域处理模块、时间域处理模块和转录处理模块等构成。通过对图像进行空间域信息和时间域信息的双重抓取,SJNN实现了对文本时空特征的建模,实现了对表情图片中文本区域的高准确率识别。在自制数据集和ICDAR2017-MLT上的对比实验结果表明,基于双向LSTM的SJNN具有最好的识别效果。基于上述两种模型,本文设计并实现了一个社交软件表情智能选择系统。系统包含表情图片收集、图片字符处理、输入和输出等模块。首先,系统在图片收集部分实现了本地导入、本地预储存以及爬虫抓取三种方式。其次,在表情图片的字符处理部分,系统使用了TDRR和SJNN模型进行字符自动识别,并将识别结果与图片进行关联。最后,系统可根据用户的输入信息,并结合其历史习惯,向其智能推荐匹配的表情图片。
其他文献
茉莉花为木犀科素馨属常绿灌木,用途广泛,不仅可用于花茶窨制、精油提取、香料制作、盆栽观赏,还具有药用价值。横州市的茉莉花具有花期早、花期长、香气浓郁的特点,享有“中国茉莉之乡”“世界茉莉花都”的美誉。2022年横州市茉莉花(茶)品牌综合价值218.14亿元,是横州市人民的一朵致富花,但茉莉花花期集中在4—10月,将近半年的时间没有茉莉鲜花,严重影响产业的发展。该文从温度、光照、植物激素、水肥等方面
期刊
选修课程具有独特的课程性质:基于学生的关注和兴趣自主选择的学习科目。选修课程作为培养学生综合素质与能力的途径之一,在我国高等教育课程体系中有着十分重要的地位。近十几年来,选修课程逐渐走进基础教育课程结构中,成为中小学教育变革和探索的热点问题。本文的研究问题是:(1)初中数学教师和学生是如何看待数学选修课的,对开设选修课持何种态度?(2)初中阶段数学选修课程应当如何设计?(3)初中阶段数学选修课程应
学位
随着信息化程度的提高,数据产生的速度超过以往任何时候,据统计中国网民数量已经达到10.32亿,网民在网络活动中产生了海量的用户行为日志。利用流式技术从这些行为日志中及时挖掘潜在的价值具有重要的实际意义,也是大数据处理的重要研究方向,本文基于Flink流式处理引擎实现了用户行为日志的统计系统。首先文中对基于用户行为日志中资源信息的统计需求进行了详细分析,主要包括提供用户行为日志收集服务,并将收集到的
学位
数学概念是数学学习的起点和基础。而函数概念是初、高中重要的数学概念之一,是中学数学的核心内容。在初中阶段,教材正式引入了函数概念,并把函数作为数与代数的重要组成部分。进入高中后,函数成为高中数学学习的重难点内容,是新教材编写和修订的重点,是贯穿高中数学课程的主线,在整个高中数学学习中占有非常重要的地位。由于中学函数成为最难教和最难学的概念之一,所以高一学生函数概念理解的研究在数学教育研究中具有重要
学位
新义乌人子女作为义乌城市经济发展过程中出现的特殊群体,他们的教育问题引起了越来越多人的关注。在当前由教读、自读和课外阅读构成的三位一体的阅读教学体系下,语文课要更加重视学生的阅读实践,培养学生自主阅读能力。新义乌人子女的课外阅读现状,以及他们的阅读兴趣、阅读面和阅读方法所呈现出的特点是教育工作者在教育教学的过程中需要去关注和探讨的。本文在这样的背景下探讨新义乌人子女课外阅读的现状和存在的问题,旨在
学位
科学思想是科学家们为理解自然世界,在科学实践活动中形成的对科学知识、科学方法、科学价值的理性共识。本研究主要围绕科学思想拟解决以下问题:目前学生的科学思想现状如何?提高学生科学思想需要怎样的作业任务模型?融合科学思想的作业任务模型对提高学生科学思想是否有效?得到以下结论:(1)利用化学科学思想问卷进行学生科学思想现状调查,发现学生目前整体上学生科学思想仍有较大发展空间。具体维度上,对科学知识的认识
学位
食品是一个复杂的多相体系,由于蛋白质与多糖丰富的功能特性,对于研究蛋白质与多糖互相间的作用日益受到重视,将两者混合配比后可改善各自的性质。枸杞多糖、黄芪多糖常用于保健食品的配方组成,本研究采取蛋清液直接添加枸杞多糖、黄芪多糖复配,研究蛋清植物多糖复合体系的相关溶液行为和凝胶属性;探究利用物理方法改性、调控蛋白质和植物多糖的特性,开发生产新颖风味、营养丰富的蛋类食品。主要研究内容和结果如下:(1)将
学位
随着教育事业的不断发展,社会教育界已经普遍关注有关学习兴趣、学习自信心、学业情绪、学业动机和学习情绪等非智力因素方面的内容。值得注意的是,拥有良好的物理学习动机能够有效提升物理学业成绩。学习驱动力能进一步影响学生的心理过程,通过相互影响作用,使其认知活动受到正向影响,从而有效提升学生的人格魅力和精神风貌。学习活动的主要影响因素包含了有关学习驱动力的部分,对于那些面临极大升学压力的中学生,学习驱动力
学位
科学本质一直是科学教育和科学素养的重要组成,在2017年底颁布的《普通高中物理课程标准》(以下简称新课标)中首次明确提出了要发展学生对科学本质的理解,因此在科学课程中融入对科学本质的认识至关重要。教科书是科学课程的核心资源,相关研究表明,教科书中科学本质的表征情况会影响师生对科学本质的认知。为了使教科书起到提高师生对科学本质认知的目的,需要解决两个问题:第一,教科书中应该包含哪些科学本质方面;第二
学位
不同于电力电子学中常见的开关电源电路作为输出单元,高带宽线性功率单元凭借着输出纹波小、精度高、动态特性好等特点被广泛用于航天航空系统的二次侧末端以提高输出的电流电压品质。线性功率电流单元较为重要的应用便是为产生磁场的亥姆霍兹线圈提供励磁电流。由于亥姆霍兹线圈产生的磁场与通过线圈内部的电流呈线性关系,航天领域想要利用其产生精确、稳定的磁场必须控制流过线圈内部电流的精度和稳定度。针对传统线性恒流源支路
学位