面向精准价格牌识别的多任务循环神经网络

来源 :自动化学报 | 被引量 : 0次 | 上传用户:abcd55443388
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了促进智能新零售在线下业务场景的发展,提高作为销售关键信息价格牌的识别精度。本文对价格牌识别问题进行研究,有效地提高了价格牌的识别精度,并解决小数点定位不准确的难题。通过深度卷积神经网络提取价格牌的深度语义表达特征,将提取到的特征图送入多任务循环网络层进行编码,然后根据解码网络设计的注意力机制解码出价格数字,最后将多个分支的结果整合并输出完整价格。本文所提出的方法能够非常有效的提高线下零售场景价格牌的识别精度,并解决了一些领域难题如小数点的定位问题,此外,为了验证本文方法的普适性,在其他场景数据集
其他文献
唇读,也称视觉语言识别,旨在通过说话者嘴唇运动的视觉信息,解码出其所说文本内容.唇读是计算机视觉和模式识别领域的一个重要问题,在公共安防、医疗、国防军事和影视娱乐等领域有着广泛的应用价值.近年来,深度学习技术极大地推动了唇读研究进展.本文首先阐述了唇读研究的内容和意义,并深入剖析了唇读研究面临的难点与挑战;然后介绍了目前唇读研究的现状与发展水平,对近期主流唇读方法进行了梳理、归类和评述,包括传统方
期刊
生成式对抗网络(Generative Adversarial Networks, GANs)是一种有效模拟训练数据分布的生成模型,其训练的常见问题之一是优化JS散度(Jensen-Shannon divergence)时可能产生梯度消失问题(Vanishing gradient problem).针对该问题,本文提出了一种解码约束条件下的GANs,以尽量避免JS散度近似为常数而引发梯度消失现象,从
期刊
电熔镁熔炼过程中的异常工况(如半熔化工况)直接影响产品质量、威胁人员和生产安全,有必要及时诊断.但与异常直接相关的超高温熔池温度(>2850℃)难以利用温度传感器检测,目前现场主要依靠工人在定期巡检时人眼观察炉壁来诊断,工作强度大、安全度低、诊断不及时.针对上述问题,本文提出一种炉体图像驱动的电熔镁炉异常工况实时诊断方法.结合电熔镁炉熔炼各区域温度分布的空间特征、正常工况下熔炼温度变化和水雾扰动引
期刊
二元语义偏好关系作为一种新的偏好信息结构和有效的词计算模型,已被应用于各种决策领域。为了处理评价信息为二元语义偏好关系的复杂问题,首先给出了能够协助专家在某些情况下进行快速决策的二元语义偏好关系有序一致性策略方法;其次,提出了一种新型乘性一致二元语义偏好关系概念,并探究了完全乘性一致二元语义偏好关系的设计方法;最后,构建了具有收敛性的二元语义决策模型,该模型能够将非一致性的二元语义偏好关系调整成为
期刊
多视角图像生成即基于某个视角图像生成其他多个视角图像,是多视角展示和虚拟现实目标建模等领域的基本问题,已引起研究人员的广泛关注。近年来,生成对抗网络在多视角图像生成任务上取得了不错的成绩,但目前的主流方法局限于固定领域,很难迁移至其他场景,且生成的图像存在模糊、失真等弊病。为此本文提出了一种基于混合对抗生成网络的多视角图像生成模型ViewGAN,它包括多个生成器和一个多类别判别器,可灵活迁移至多视
期刊
逆境胁迫是指对植物施加有害影响的环境因子,是目前造成植物减产、品质下降的主要影响因素。植物在遭受逆境胁迫后通过外源物质的施加可显著提升作物对逆境胁迫的抵抗能力,目前在作物遭受逆境胁迫后常用的外源干预物质主要有植物生长调节剂、外源有机物、外源无机物和金属离子等,国内外针对不同的外源物质缓解及调控作物面临逆境胁迫下的研究主要集中在生理生化、活性氧、代谢酶、基因变化等细胞和分子水平,然而,针对外源物质对
期刊
目的 探讨一种基于数字化人体(CVH)的冠脉CT血管造影(CTA)多维可视化方法对于CTA中观察冠脉结构和辅助诊断的可行性。方法 获取CVH断层数据集和临床冠脉CTA影像,分别对冠脉进行分割、提取中心线和标定,获得右冠状动脉(RCA)、左主干(LM)、前降支(LAD)和回旋支(LCx)等节段,然后使用曲平面重建技术对冠脉横断面、冠状面、矢状面、拉伸曲平面和拉直曲平面等多平面进行重建,并在此基础上使
期刊
本文根据元胞自动机模型划分方法,将二维图像分解为2×2矩阵单元结构.提出了几种逻辑运算式,用以分类由黑白二值点构成的2×2矩阵图形.本文通过CNN神经网络的多层结构形式,分析了金字塔结构逻辑在相似的组合形式下,对二值图形边缘检测和池化的功能.通过同步脉冲形式能将灰度图像,分解为多个时间维度的二值图形,方便多层金字塔逻辑运算处理.分析了如何采用延时继电器使金字塔结构逻辑具有记忆的特性.讨论了3×3输
期刊
通过对目前现有的肺癌检测技术研究,发现大部分研究人员主要针对肺癌CT影像进行研究,忽略了电子病历所隐藏的肺癌信息,本文提出一种基于图像与文本相结合的肺癌分类方法,从现有的基于深度学习的肺癌图像分类出发,引入了电子病历信息,使用Multi-Head Attention以及Bi-LSTM对文本建模.实验结果证明,将电子病历信息引入到图像分类模型之后,对模型的性能有进一步的提升.相对仅使用电子病历进行预
期刊
油气管道站场向无人站、智能化方向发展,对站场巡检的有效性与及时性提出了新的要求。为了解决传统站场视频巡检方式中视频图像孤立、目标跟踪困难、人力监控遗漏等不足,结合中俄东线站场视频巡检需求,研究实现了基于三维全实景融合的压气站视频自动巡检技术,实现了巡检路线自定义、高低监控点关联、目标锁定追视、2D/3D地图联动以及视频分析与报警联动等多项视频巡检功能。其在中俄东线天然气管道黑河压气站的工程应用实践
期刊