一种嵌入并行通道蓝图分离卷积的图像分类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:shizhijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络计算复杂度高,占用资源多,使得其很难部署到移动嵌入式设备上.为了解决这类限制,本文提出了一种基于嵌入并行通道蓝图分离卷积(B2SENet)模型的图像分类算法,首先通过引入并行SENet通道,使得不同内核大小的并行分支融合在一起,增强全局感受野,其次在并行SE通道中改变传统卷积操作方式,适配蓝图分离卷积(BS),有效减少卷积层参数以及模型体积.最后在并行通道融合过程中引入soft attention机制,获取通道权重系数,使得模型强化对特征的选择性,在CI-FAR10和100以及ImageNet2012基准数据集上对比,实验表明B2SENet(BS+并行通道SENet)在模型复杂度以及准确率上均优于MobileNet和ShuffleNet,使得其在嵌入式设备网络模型中表现相当出色.
其他文献
随着大数据和人工智能的发展,多轮对话算法受到了越来越多的关注.多轮对话回答选择是多轮对话算法中的关键问题之一,其目标是选择与输入消息和对话内容最相关的回答作为应答.近年来,深度神经网络模型在多轮对话回答选择问题上取得了较大进展.然而,如何提取对话上下文和回答中的相关语义信息并从中提取丰富的多粒度语义匹配特征仍然是多轮对话回答选择问题面临的巨大挑战.针对上述问题,本文提出了一种结合词注意力机制的多粒度循环神经网络模型MRNA(Multi-Granularity Recurrent Neural Networ
电影推荐算法依靠计算用户的偏好差异进行推荐,以解决互联网时代的信息过载问题.传统协同过滤等推荐算法主要基于用户间对相同电影的评分差异计算用户偏好的相似性.这类方法忽视了用户的评分行为是一种实际上的选择行为,即便评分不高也体现出用户对该类型电影的兴趣.针对这一问题,本文设计了基于电影类型标签选择概率的用户间相似性计算方法,并建立了以用户为节点,以用户之间的相似性为边的推荐系统的复杂网络模型,并根据上述网络拓扑结构中的节点中心性数据,进一步设计了平衡用户品味影响力函数,调整了用户协同偏好的结果,提出了基于用户
实时视频会话类业务中,如何保证用户的隐私不被泄露是一个关键问题.当用户不想将涉及自身隐私的环境细节信息暴露给他人时,支持实时视频会话的背景替换方法至关重要.传统的抠图方法虽然精度较高,但是处理速度较慢,而且需要额外的人工交互,难以满足实时视频会话类业务的要求.因此本文提出一种基于深度学习的视频图像实时背景替换方法,该方法利用区域划分模块实时的将视频图像中包含用户的前景提取出来,再利用分割模块对前景进一步进行处理,以得到更高的精度与速度,最后利用背景替换模块将前景和新的背景融合.实验结果表明,本文提出的背景
现有大部分基于卷积神经网络的图像去模糊算法,在人脸识别相关场景应用中,存在识别率提升不明显、参数量过多等问题.针对上述现象,本文提出一种基于条件生成对抗网络(Conditional Generative Adversarial Networks,DGAN)的图像去模糊算法.该算法将结合了轻量级分组卷积与改进SE(Squeeze-and-Excitation,SE)注意力机制的Group-SE模块作为生成器的主体部件,将引入了全局性稠密连接的改进DenseNet作为判别器核心,以解决去模糊技术应用在人脸识别
普通摄像设备拍摄的视频帧速率有限,从而影响观众的特殊观感体验,提高视频帧速率的后处理过程是必不可少的,视频插帧就是其中关键技术之一.视频插帧是指根据两个连续视频帧合成中间帧数据,在影视作品、体育比赛精彩视频片段慢动作回放等方面有广泛的应用.基于光流的视频插帧方法能有效解决视频中场景、目标的移动估计问题,但是其受制于光流估计的速度,无法很好地应用于实时视频任务.本文提出一种新的光流预测模型,并将其用于视频插帧任务中.首先对于输入的两张连续视频帧数据进行多次信息无损的下采样,获得不同尺度的输入数据;之后通过卷
超分辨率是指将一张低分辨率图片转换成高分辨率,在军事领域、工业领域等都有着重要作用.基于生成对抗网络(GAN)的超分变率方法,主要是根据生成对抗网络原理,由生成器生成一张伪高分辨率图片,再由鉴别器计算这张图片与真实高分辨率图片的差值,来衡量这张图片的真实程度.本文基于SRGAN(Super-resolution Generative Adversarial Network)网络主要进行了3点改进:1)引入了注意力通道机制,即在SRGAN网络中加入CA(Channel Attention)模块,同时增加网络
医学图像配准是医学图像分析的基本课题之一,具有重要的理论研究和临床诊断应用价值,可以视为参数最优化问题进行求解.作为经典的最优化算法——遗传算法已经在该领域得到了成功应用,然而,遗传算法存在着搜索空间受限、局部搜索能力较差、容易早熟收敛等不足.因此,本文提出了多种策略对遗传算法进行改进,首先结合混沌系统和频度记忆对随机数和随机个体的产生机制进行改进,进而设计一种动态的基因多样性控制器,最后模拟三系杂交水稻的育种机制来发挥杂种优势.同时,结合多分辨率策略实现了多模医学图像的精确配准.公开数据集实验结果表明,
针对密集人群中行人躯干部位易被遮挡、小尺寸行人难以检测、检测速度慢等问题,提出一种结合多尺度反馈的行人头部检测方法用于行人检测.该方法首先以YOLOv3为网络原型,在特征提取网络中新增由两倍下采样得到的特征图以提升对小尺度行人的识别.其次采用多尺度反馈将感受野较大的分支融合到感受野较小的尺度分支上以引入全局上下文信息来提升对高密度人群的识别能力.本文在INRIAPerson,PASCALVOC2012,WiderFace等数据集上进行了实验,实验结果表明,提出的方法在行人检测的精度和速度上都有了较大提升,
近年来,物联网智能硬件技术高速发展,增强了以智能家居行业为主的对物联网场景下设备智能控制的需求.本文分析了现有的情景建模方法与设备智能控制框架,基于家居情景活动特征,提出了基于对象与属性图模型的情景建模方法,以适用物联网计算资源有限的场景;设计了智能家居交互的规则控制、模式控制和语音控制方式,使用推理引擎将情景感知数据映射到设备控制服务以实现系统的自动控制;提出了物联网下基于情景感知的智能控制系统框架;考虑用户行为习惯,引入了用户偏好这一情景概念以提供个性化的服务.性能测试表明基于对象与属性图模型的情景建
生成式对抗网络(GAN)具有比传统机器学习算法更强大的特征学习和特征表达能力,基于GAN的三维生成是当前研究的热点方向之一.本文以基于生成式对抗网络的三维生成模型及其应用为研究对象,阐述了GAN的研究现状与研究方向,归纳出生成式对抗网络在三维室内场景生成、三维人体等多个三维生成研究方向的研究现状和发展趋势,并对各研究方向进行深入探讨与总结,通过对比分析每种方法的基本思想、特点及使用场景等,对未来可能的发展方向进行了展望.当前已有多种GAN模型应用在三维生成的任务中,在生成效果与性能上各有优劣.这些基于GA