结合改进卷积神经网络与自编码器的表情识别

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:oldbuck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了克服单一神经网络模型提取表情特征困难,以及堆叠深层网络结构会造成训练过程复杂、参数冗余等问题,本文提出了一种引入注意力机制的轻量级CNN通道和卷积自编码器预训练通道的双通道模型。在轻量级CNN通道中以具有残差思想的深度可分离卷积结构进行深层次特征提取并且减少了模型参数量,还引入了通道域注意力机制使得该通道能够学习到更有用的特征;同时使用卷积自编码器对输入人脸表情图像进行无监督预处理,使得模型提取的特征更加多样化。实验结果表明,在FER2013和CK+表情数据集上分别取得了72.70%和97.50
其他文献
为了缓解大规模糖尿病视网膜病变筛查需求下医疗资源不足所带来的问题,本文提出了糖尿病视网膜病变分期双分支混合注意力决策网络(BiRAD-Net)。所提网络分为特征提取与分类两个阶段。在第一阶段中,本文引入混合注意力机制抑制噪声,并设计了特征分级决策网络进一步优化特征质量;在第二阶段中,本文设计了双分支分类器以及对应的损失,以减缓标签数据不足所带来的影响,增强分类准确性。此外,在模型训练过程中应用迁移
期刊
前列腺癌是全球范围内男性最常见的癌症之一,仅次于肺癌。在前列腺癌的诊断过程中最常用的方法是病理学专家通过显微镜对染色活检组织进行观察,得出组织微阵列图像的Gleason评分。在大量的组织微阵列图像下,病理学专家使用Gleason模式对前列腺癌组织微阵列进行评分非常耗时,易受到不同观察者之间主观因素的影响,且可重复性低。深度学习和计算机视觉的发展使得病理学计算机辅助诊断系统更具有客观性和可重复性。U
期刊
由于高血压性视网膜病变(Hypertensive Retinopathy,HR)病灶特征不明显,传统分类算法难以对其进行有效分类。针对这一问题,提出一种具有整体特征和局部特征的区域特征融合HR分类方法,即在整体HR分类模型的基础上,融合局部特征动静脉交叉压迫(Arterio-VenousNicking,AVN)分类模型来增强HR分类效果。在AVN分类中,提出一种新型的交叉点检测算法,该算法对分类后
期刊
全卷积孪生网络SiamFC++在复杂场景下,尤其是当目标外观发生剧烈变化时,跟踪准确性会受到严重影响,为此提出了一种基于动态更新模板的孪生网络目标跟踪算法。该算法使用ResNet-50作为骨干网络提取图像的深度特征,增强网络的特征提取能力。对于深度特征互相关操作得到的响应图,直接通过无锚的方式预测目标对象的位置和比例。针对模板更新,首先使用模板动态更新策略判断模板是否更新,若需要更新则采用模板更新
期刊
前视声呐(Forward-Looking Sonar, FLS)使用换能器基阵收发声波,通过回波探测水下物体。在浅海环境,由于水下介质的反射、散射与不均匀波动,前视声呐图像极易引入散斑噪声。本文针对前视声呐图像散斑噪声,结合SRResNet与非对称金字塔非局部块,提出了ANLResNet网络用于前视声呐图像去噪,并针对前视声呐图像特性,使用FieldII构建模拟前视声呐图像数据集,对网络进行训练。
期刊
为解决图像配准中因旋转变换,尺度缩放,光照变化,相机抖动,气流变化以及压缩等影响成像质量,而导致特征点检测数目不足的问题,本文提出了基于组合模型的图像配准方法。该方法采用KAZE与SURF算子联合检测局部区域中线性与非线性特征点;同时为了提高计算效率,采用二进制向量描述符表征特征点,并使用汉明距离计算特征点之间的匹配距离,有效地提高匹配效率;最后,利用随机一致性算法(RANSAC)进一步消除异常点
期刊
深度学习网络在模式识别领域性能优异,但需要大量有标注样本对网络进行训练,而对于人脸认证情况下训练样本有限,且已有网络模型在不同人种间的性能差异大,往往会导致人脸认证失效。针对以上问题,本文首先在几种预训练深度网模型上构造孪生网络,并设计相似度度量网络;其次,选用多人种的人脸数据库(Racial Faces in-the-Wild,RFW)中不同人种构造正负样本对作为训练集,扩展数据分布,提高模型泛
期刊
针对传统特征金字塔网络应用于全景分割领域存在的不足,本文提出一种双向特征金字塔全景分割网络。网络解决了特征金字塔单向传递统一特征输出与全景分割双线任务特征需求的矛盾,根据图像前背景的差异分析,按照前背景分割任务的不同需求构建双向传递路径,使用上采样自上而下传递加强前景特征,利用空洞卷积自下而上传播增强背景特征,以双向网络同时提取前景特征和背景特征,营造前背景分割精度的动态平衡,从而提高全景分割质量
期刊
屏幕内容图像是一种组合图像,由计算机将图形、文字和图像组合起来而形成。由于人类视觉系统是从粗略到精细进行图像信息的提取,本文提出一种基于多尺度特征的无参考屏幕内容图像质量评估算法。屏幕内容图像中包含大量的图形和文本内容,以及色彩和布局结构信息,因此我们提取失真图像的边缘特征、结构特征和亮度特征。然后将多个图像尺度上提取的特征进行拼接,作为最终的失真图像质量感知特征。最后使用随机森林回归方法训练得到
期刊
基于太赫兹技术的安检设备具有独特的无损伤检测特性,在安防领域具有良好的发展前景。太赫兹图像分辨率低,特征信息有限,且高亮区域多,目标与背景亮度相近,为太赫兹图像中的目标检测带来了一定的困难。针对此,本文提出一种融合多尺度注意力的目标检测框架MSAD-SSD,在SSD算法的基础上,采用ResNet101作为特征提取网络,并设计一种多尺度注意力模块。该模块采用多支路膨胀卷积进行多尺度特征提取,扩展网络
期刊