基于改进Mask R-CNN的在架图书书脊图像实例分割方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:loganhuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运用人工智能技术将是构建下一代智慧图书馆的关键,为了实现图书的定位和识别,提出一种基于改进Mask R-CNN的在架图书书脊图像实例分割方法。考虑到图书密集排列、具有一定的旋转性、副本纹理极相似等难点,改进锚框为旋转矩形框,提出旋转区域建议网络取代区域建议网络;提出旋转特征提取方法可减少池化误差且有效提取目标特征,结合掩膜的旋转对齐以提升预测掩膜的准确性。建立了一个包含1 849张在架图书书脊图像的标注数据集,提出方法的测试结果大幅度优于其他重要的实例分割算法,证实了在网络中使用旋转特征对于具有一定
其他文献
在研究生成对抗网络(GAN)生成动态图像时,经常出现前后帧图像内容中的部分物体颜色不一致和生成的细节不自然等问题。针对当前生成视频的不理想问题,采用的主要方案是分别对GAN网络中的生成器和判别器进行改进,具体表现在两个方面:一方面是在生成器中对视频的前景和背景分别建模,并且使用多重空间自适应归一化(Multi Spatially-Adaptive Normalization, M-SPADE)算法
期刊
磁瓦作为永磁电机中的关键部件,其产品质量易受到内部缺陷的影响而下降。然而传统的声振检测手段在面对快速、精准的检测需求下已暴露出一些低效率的问题,因此开发一种针对磁瓦内部缺陷的高效智能化检测方法具有重要的现实意义。文中结合深度学习的优势,提出了一种基于卷积神经网络的磁瓦内部缺陷声振检测方法。在该方法中,磁瓦的一维声振信号首先被转换为二维声振图像,再输入针对信号特点所设计的卷积神经网络进行学习训练,以
期刊
厚层松散堆积区(盆地或平原等)发震断层多以隐伏活动为主要特征,基于上断点的传统活动断层探测技术通常难以约束断层最新活动性质和时代。利用冲积河流对地表形变的敏感性评估断层活动性,是极具潜力的隐伏活动断层研究方向。本文基于TM/ETM遥感影像,对小浪底水库建设前后(1990~2013年)郑州—济南段黄河水域多期次几何特征进行提取和分段,共获取6个时期河道中心线弯曲度和5个时段河道面积重叠率的沿程变化信
期刊
在线知识蒸馏通过同时训练两个或多个模型的集合,并使之相互学习彼此的提取特征,从而实现模型性能的共同提高。已有方法侧重于模型间特征的直接对齐,从而忽略了决策边界特征的独特性和鲁棒性。利用一致性正则化来指导模型学习决策边界的判别性特征。具体地说,网络中每个模型由特征提取器和一对任务特定的分类器组成,通过正则化同一模型不同分类器间以及不同模型对应分类器间的分布距离来度量模型内和模型间的一致性,这两类一致
期刊
针对目前表面肌电信号(surface electromyography,sEMG)端到端手势识别特征提取不充分、多手势识别准确率不高的问题,提出一种融合注意力机制的多流卷积肌电手势识别网络模型。该模型通过滑动窗口将多通道时域sEMG生成肌电子图,并使用多流卷积神经网络充分提取每个采集通道sEMG的语义特征,然后将其聚合得到丰富的多通道手势语义特征;同时从时间和特征通道维度上计算语义特征的注意力分布
期刊
针对高速公路场景下难以实现车辆轨迹精准还原的问题,提出以新近大规模建设的ETC门架系统作为检测载体,将车牌识别与车辆重识别(ReID)技术结合实现更好的轨迹还原效果。高速公路车辆目标多、速度快,常用目标检测算法难以满足属性检测与重识别要求的情况下,对多目标检测与重识别的FairMOT算法结构作出改进,添加多个并行头输出,对车牌、车辆颜色、类型、品牌及重识别等特征同时训练,输出车辆多标签属性;制作数
期刊
针对物联网设备很容易被攻击者利用来入侵网络的问题,设计实现了一种将基于网络拓扑改组的移动目标防御(network topology shuffling-based moving target defense,NTS-MTD)和网络欺骗相结合的物联网集成防御机制,并基于该防御机制设计了一种诱饵路径优化算法(decoy path-based optimization algorithm,DPOA)来进
期刊
为了进行复杂交互动作识别,提出基于深度信息的特征学习方法,并使用两层分类策略解决相似动作识别问题。该方法从频域的角度分析深度图像动作序列,提取频域特征,利用VAE对特征进行空间特征压缩表示,建立HMM模拟时序变化并进行第一层动作识别。为了解决相似动作识别问题,引入三维关节点特征进行第二层动作识别。实验结果表明,两种特征在动作数据集SBU-Kinect上能够有效地表示姿态含义,策略简单有效,识别准确
期刊
对于复杂点云的骨架提取,由于原始点云的遮挡、缺失、分布不均、分支复杂等原因,所提取骨架会产生断裂、拓扑结构错误等问题。针对复杂结构点云的骨架提取,提出了一种基于等级划分的复杂点云骨架提取算法(multilevel divided skeleton extraction,MDSE)。使用L_1-medial提取初始骨架点,将初始骨架点连接成单分支骨架线,通过对单分支结构的初始骨架线进行等级划分,利用
期刊
针对细粒度图像分类问题提出了一种有效的算法以实现端到端的细粒度图像分类。ECA-Net中ECA(efficient channel attention)模块是一种性能优势显著的通道注意力机制,将其与经典网络ResNet-50进行融合构成新的基础卷积神经网络ResEca;通过物体级图像定位模块与部件级图像生成模块生成物体级图像和部件级图像,并结合原始图像作为网络的输入,构建以ResEca为基础的三支
期刊