【摘 要】
:
发票是财务系统的重要组成部分。随着计算机视觉和人工智能技术的发展,出现了各种发票自动识别系统,但是发票上的印章严重影响了识别准确率。本文提出了一种用于自动消除发票印章的SealGAN网络。SealGAN网络是基于生成式对抗网络CycleGAN的改进,采用两个独立的分类器来取代原本的判别网络,从而降低单个分类器的分类要求,提高分类器的学习性能,并且结合ResNet和Unet两种结构构建下采样-精炼-
论文部分内容阅读
发票是财务系统的重要组成部分。随着计算机视觉和人工智能技术的发展,出现了各种发票自动识别系统,但是发票上的印章严重影响了识别准确率。本文提出了一种用于自动消除发票印章的SealGAN网络。SealGAN网络是基于生成式对抗网络CycleGAN的改进,采用两个独立的分类器来取代原本的判别网络,从而降低单个分类器的分类要求,提高分类器的学习性能,并且结合ResNet和Unet两种结构构建下采样-精炼-上采样的生成网络,生成更加清晰的发票图像。同时提出了基于风格评价和内容评价的综合评价指标对SealGAN
其他文献
二元语义偏好关系作为一种新的偏好信息结构和有效的词计算模型,已被应用于各种决策领域。为了处理评价信息为二元语义偏好关系的复杂问题,首先给出了能够协助专家在某些情况下进行快速决策的二元语义偏好关系有序一致性策略方法;其次,提出了一种新型乘性一致二元语义偏好关系概念,并探究了完全乘性一致二元语义偏好关系的设计方法;最后,构建了具有收敛性的二元语义决策模型,该模型能够将非一致性的二元语义偏好关系调整成为
多视角图像生成即基于某个视角图像生成其他多个视角图像,是多视角展示和虚拟现实目标建模等领域的基本问题,已引起研究人员的广泛关注。近年来,生成对抗网络在多视角图像生成任务上取得了不错的成绩,但目前的主流方法局限于固定领域,很难迁移至其他场景,且生成的图像存在模糊、失真等弊病。为此本文提出了一种基于混合对抗生成网络的多视角图像生成模型ViewGAN,它包括多个生成器和一个多类别判别器,可灵活迁移至多视
逆境胁迫是指对植物施加有害影响的环境因子,是目前造成植物减产、品质下降的主要影响因素。植物在遭受逆境胁迫后通过外源物质的施加可显著提升作物对逆境胁迫的抵抗能力,目前在作物遭受逆境胁迫后常用的外源干预物质主要有植物生长调节剂、外源有机物、外源无机物和金属离子等,国内外针对不同的外源物质缓解及调控作物面临逆境胁迫下的研究主要集中在生理生化、活性氧、代谢酶、基因变化等细胞和分子水平,然而,针对外源物质对
目的 探讨一种基于数字化人体(CVH)的冠脉CT血管造影(CTA)多维可视化方法对于CTA中观察冠脉结构和辅助诊断的可行性。方法 获取CVH断层数据集和临床冠脉CTA影像,分别对冠脉进行分割、提取中心线和标定,获得右冠状动脉(RCA)、左主干(LM)、前降支(LAD)和回旋支(LCx)等节段,然后使用曲平面重建技术对冠脉横断面、冠状面、矢状面、拉伸曲平面和拉直曲平面等多平面进行重建,并在此基础上使
本文根据元胞自动机模型划分方法,将二维图像分解为2×2矩阵单元结构.提出了几种逻辑运算式,用以分类由黑白二值点构成的2×2矩阵图形.本文通过CNN神经网络的多层结构形式,分析了金字塔结构逻辑在相似的组合形式下,对二值图形边缘检测和池化的功能.通过同步脉冲形式能将灰度图像,分解为多个时间维度的二值图形,方便多层金字塔逻辑运算处理.分析了如何采用延时继电器使金字塔结构逻辑具有记忆的特性.讨论了3×3输
通过对目前现有的肺癌检测技术研究,发现大部分研究人员主要针对肺癌CT影像进行研究,忽略了电子病历所隐藏的肺癌信息,本文提出一种基于图像与文本相结合的肺癌分类方法,从现有的基于深度学习的肺癌图像分类出发,引入了电子病历信息,使用Multi-Head Attention以及Bi-LSTM对文本建模.实验结果证明,将电子病历信息引入到图像分类模型之后,对模型的性能有进一步的提升.相对仅使用电子病历进行预
油气管道站场向无人站、智能化方向发展,对站场巡检的有效性与及时性提出了新的要求。为了解决传统站场视频巡检方式中视频图像孤立、目标跟踪困难、人力监控遗漏等不足,结合中俄东线站场视频巡检需求,研究实现了基于三维全实景融合的压气站视频自动巡检技术,实现了巡检路线自定义、高低监控点关联、目标锁定追视、2D/3D地图联动以及视频分析与报警联动等多项视频巡检功能。其在中俄东线天然气管道黑河压气站的工程应用实践
为了促进智能新零售在线下业务场景的发展,提高作为销售关键信息价格牌的识别精度。本文对价格牌识别问题进行研究,有效地提高了价格牌的识别精度,并解决小数点定位不准确的难题。通过深度卷积神经网络提取价格牌的深度语义表达特征,将提取到的特征图送入多任务循环网络层进行编码,然后根据解码网络设计的注意力机制解码出价格数字,最后将多个分支的结果整合并输出完整价格。本文所提出的方法能够非常有效的提高线下零售场景价
针对目标检测任务中获取人工标注训练样本的困难,本文提出一种在像素级与特征级渐进完成域自适应的无监督跨域目标检测方法.现有的像素级域自适应(Pixel-level domain adaptation)方法中,存在翻译图像风格单一、内容结构不一致的问题,因此,本文将输入图像分解为域不变的内容空间(Domain-invariant content space, DICS)及域特有的属性空间(Domain
为有效修复低秩图像,提出了基于矩阵核范数的张量鲁棒性主成分分析(RPCA)的低秩图像修复算法.首先将破损的灰度图像扩展到三维空间,即张量层面;然后进行张量奇异值分解(t-SVD),得到一个f(正向切片)对角张量,接着对f对角张量提取其低秩矩阵,分析矩阵的低秩特性,进而求解矩阵核范数并提取张量的低秩成分;最后取低秩张量的正面切片将三维张量收缩至二维矩阵层面,得到恢复后的图像.对提出算法和同类算法进行