【摘 要】
:
自然场景中的图形符号不仅存在于设计图纸、考卷中,还存在于道路指示牌、广告牌等场景中。目前,图形符号的检测与识别已成为计算机视觉领域越来越重要的分支,随着计算机的快速发展,从传统的图像算法到利用深度学习进行检测,图形符号的检测与识别的处理方式日新月异。在人们的日常生活和工作中,越来越多应用了图形符号检测和分类识别技术的相关产品也应运而生。简单地说,图形符号的检测与识别其目的是智能获取场景中相关信息,
论文部分内容阅读
自然场景中的图形符号不仅存在于设计图纸、考卷中,还存在于道路指示牌、广告牌等场景中。目前,图形符号的检测与识别已成为计算机视觉领域越来越重要的分支,随着计算机的快速发展,从传统的图像算法到利用深度学习进行检测,图形符号的检测与识别的处理方式日新月异。在人们的日常生活和工作中,越来越多应用了图形符号检测和分类识别技术的相关产品也应运而生。简单地说,图形符号的检测与识别其目的是智能获取场景中相关信息,即通过对图像信息进行分类处理,获得感兴趣目标的位置及类别。本文主要针对自然场景中的图形符号进行研究,目的是能够对其进行准确的定位、分类和识别。本文主要研究及工作内容如下:1.研究了图形符号的特征提取,主要特征包括图形符号的自然特征(如颜色特征、形状特征、纹理特征等)、频域特征、笔画特征等,并且对每种特征都阐述了相应的原理、算法及结果分析,然后介绍了特征选择方法,为后续的图形符号检测、Layout模式建立、分类识别做准备。2.研究了传统的图形符号检测方法和基于深度学习的图形符号检测方法。首先对传统的检测理论进行介绍,并对于几种经典理论选取了代表性的方法进行仿真和分析。然后介绍了具有代表性的两种基于深度学习的图形符号检测方法(EAST、DB),并进行仿真和分析。在联合方法中,增加图像去噪、增强模块,并对其骨干网络进行了更改和改进,使其能够实现图形符号的检测。3.研究了图形符号的聚类和符号切割方法,在机械图中图形符号检测和提取的实际应用中,提出了Layout模型建立的方法,该方法利用DBSACN实现粗聚类和细聚类,并利用字符的定向生长实现Layout模型的建立。并在分类识别前进行符号切割方法上,提出了一种基于包围圆的切割算法,实验结果表明该方法具有较好的切分效果。4.研究了传统和基于深度学习的分类识别方法,如MLP、SVM、VGG、ResNet等,对它们的原理和所用参数进行了介绍。针对不同的数据集进行实验和分析,并对VGG、ResNet算法进行改进,通过实验结果可知,改进后模型的识别速度有所提升,针对手写数字的识别,联合方法的识别准确率提高了5%。
其他文献
近年来,移动互联网技术的快速进步和智能设备的广泛普及使得基于位置的社交网络平台得到了空前的发展。位置社交网络可以将虚拟的网络社区和真实的物理世界联系在一起,从而使用户能够通过移动设备将自己喜欢的地点分享到网络上,帮助其他用户发现有趣的地点。因此,向用户推荐感兴趣的地点成为了一个热门的研究方向。兴趣点推荐系统主要是通过用户的历史签到数据来获取用户的出行偏好,以此向用户推荐地点。但现有的关于兴趣点推荐
在实际应用中,情感分析通常是与领域相关的,由于领域之间的语义差异,相同的词在不同领域所表达的情感极性可能是矛盾的。因此,在特定领域训练好的模型,可能无法在另外一个领域很好的运行。另外,领域之间可能存在公共信息,为每个领域都训练单独的情感分类器会显得比较冗余。因此本文的工作以此作为出发点,旨在研究如何充分利用多个领域有限的训练数据来提高所有领域的分类性能。与此同时,本文会聚焦于跨领域文本情感分析场景
随着互联网的飞速发展,网络数据种类和规模极速增长,用户难以发掘出感兴趣的物品。为解决“信息超载”的问题,个性化推荐算法被广泛地研究和使用。数据稀疏程度较高且数据规模较大对推荐算法的准确率和推荐效率提出了挑战。研究高效准确的推荐算法对提升用户使用体验和企业盈利具有重要意义。本文从用户行为角度出发,在协同过滤算法的基础上针对数据稀疏性、推荐系统的可扩展性和近邻搜索的高效性等问题提出了对应的解决方案:1
登机桥在对接舱门后,飞机会随着自身的载重变化发生高度变化,因此登机桥必须工作在自动调平模式以避免和飞机舱门发生碰撞。登机桥通过调平轮上的编码器实现此功能,但该机构会发生假接触,打滑等问题,每次对接完成后都需要桥手进行检查。目前无人驾驶登机桥的研究在替代桥手的同时也引入了新的研究课题,即如何更准确且智能的检测机舱位移。本论文分析基于视觉的无靶标位移测量方法,主要研究了基于稀疏光流和特征点匹配的机舱位
在医疗领域中大量的专业医学知识以文本的形式存储,利用自然语言处理算法对其进行分析处理能够帮助医生减轻工作负担。肺癌领域的前沿趋势预测可以为医生未来研究方向的规划提供参考,抽取医疗文本中的关键信息能够协助医生阅读文献,自动问答系统可以在不增加医生负担的情况下帮助大众查询简单的医疗问题。本文从以上几个需求出发,将自然语言处理技术应用于肺部疾病文本分析中以缓解医疗系统的压力。本文的主要研究工作如下:针对
随着数字成像系统和深度神经网络相关技术的成熟,基于视觉信息和神经网络的多目标跟踪方法获得了越来越多研究者的关注。密集人群场景下的多目标跟踪是一个具有挑战性的课题,基于检测的多目标跟踪(Tracking by Detection,TBD)相较于不使用检测的多目标跟踪(Detection Free Tracking,DFT)在这一场景下有更好的性能表现。TBD框架使用数据关联算法将检测器提供的目标检测
随着智能化、信息化进程在电网公司的不断推进,信息系统的建设成为了业务系统中非常重要的一环。在信息系统的运行过程中,产生了大量的主机指标数据。公司现有的运维方式难以从海量的主机指标数据中快速、高效地分析出有用信息,无法保障信息系统的稳定运行。基于此,本文从主机指标数据的预测角度出发,设计并实现了基于时序数据挖掘的电网主机指标预测系统。该预测系统能对信息系统中的主机指标数据进行短期预测并将结果可视化,
时空轨迹是移动对象的在一定时间序列下的运动记录,时空轨迹具有丰富的时间、空间和语义特征,时空轨迹的时空特性和潜藏的语义价值使得时空轨迹挖掘成为数据挖掘领域具有挑战的前沿研究分支。时空轨迹聚类是时空轨迹数据挖掘的重要研究内容之一,旨在挖掘出具有相似特性的轨迹簇,可应用于轨迹预测、异常检测等方面。然而时空轨迹数据数量大,数据内容和结构复杂,时空轨迹的本质特征隐藏于海量冗余信息中,处理流程极复杂。此外,
随着深度学习和计算机视觉技术的快速发展,目标检测任务受到了广泛的关注与研究,其在智能安防,自动驾驶,航空航天等领域有者关键的应用。然而,当前目标检测主要存在特定场景下的训练数据缺乏,对小目标检测性能不佳等问题。本文针对数据缺乏问题,研究了通过生成数据对训练数据进行增强,再进行目标检测的方法,主要的研究内容如下。第一、本文研究了一种合成目标检测数据的方法。首先通过DCGAN生成被检测目标的图像,接着
精神疾病是人类大脑受到各种因素的影响,导致精神活动出现异常的一类疾病,精神分裂症则是精神疾病中患病率极高的一种,至目前为止病因尚未明确。网络神经科学的出现为精神分裂症的研究提供了一套可行的方案,利用非侵入式成像技术得到患者的大脑影像来建立个体的脑网络模型,可以帮助人们了解精神分裂症患者的大脑异常,对于认识精神分裂症的病理机制具有极其重要的意义。本文获取了精神分裂症患者以及正常对照个体的功能核磁共振