卷积神经网络表征可视化研究综述

来源 :自动化学报 | 被引量 : 0次 | 上传用户:guojicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习在图像分类、目标检测及场景识别等任务上取得了突破性进展,这些任务多以卷积神经网络(ConvolutionalNeuralNetwork,CNN)为基础搭建识别模型,训练后的模型拥有优异的自动特征提取和预测性能,能够为用户提供―输入-输出‖形式的解决方案.然而,由于分布式的特征编码和越来越复杂的模型结构,人们始终无法准确理解CNN模型内部知识表示,以及促使其做出特定决策的潜在原因.另一方面, CNN模型在一些高风险领域的应用,也要求对其决策原因进行充分了解,方能获取用户信任.因此, C
其他文献
针对弹载图像探测器协同探测的分配方式影响目标信息增益的问题,开展此类探测器广域协同探测算法研究。以获取最多有效毁伤信息为目标,研究了弹载图像探测器散布修正与目标分配问题;建立完整的图像探测器的动力学模型和目标等效模型,模拟多探测器的协同探测环境;通过有效信息熵描述图像探测器系统获取毁伤信息的能力,并推导毁伤信息熵与系统和目标的相关方程,建立协同探测能力的评价准则;基于Kuhn-Munkres算法和
期刊
Dear editor,Video inpainting is a new technology of recovering the lost motion vectors or image blocks during the video sequence transmission. It aims to speculate the correct value of missing voxels
期刊
为解决Deeplab v3+网络在解码过程中仅融合一个尺度编码特征,导致部分细节信息丢失,从而造成最终分割结果较为粗糙等问题,提出多尺度特征自适应融合的图像语义分割算法。该算法在Deeplab v3+的解码过程中使用自适应空间特征融合结构,给不同尺度的编码特征分配自适应的融合权重,通过融合编码过程中的多尺度特征进行特征图的上采样,从而实现图像更加精细的语义分割效果。实验结果表明,该算法在Citys
期刊
现有算法所提取的语义信息还不够丰富,影响了显著性目标检测的性能。因此,提出了一种多尺度特征金字塔网格模型来增强高层特征包含的语义信息。首先,采用特征金字塔网格结构对高层特征进行增强;其次,采用金字塔池模块对最高层特征进行多尺度操作;最后,引入非对称卷积模块,进一步提高算法性能。所提模型与其他14种显著性目标检测算法在四个数据集上进行了比较,实验结果表明所提算法能够有效提升著性目标检测的性能,特别是
期刊
随着眼动追踪技术的进步和设备成本的降低,眼动追踪技术已广泛应用于智能教育领域,分析眼动数据以评估学习状态成为智能教育中一个十分重要的环节。眼动扫描路径可以直接或间接地反映思维模式及心理状态的变化;本文通过分析扫描路径探索学习者眼动行为的共性和差异性,为改善视觉内容和给出指导性意见提供重要参考。首先研究在同一任务情况下学习者扫描路径的时间序列表示和聚类,通过聚类结果评估专注、走神及信息迷航等三种学习
期刊
针对叶片机器人磨抛系统中手眼标定存在人工误差、二次误差等因素导致标定精度差等问题,提出一种基于“重定位”的手眼标定算法。以拍照式三维扫描仪为标定对象,分析机器人手眼标定数学模型,提出利用标准球在机器人末端坐标系中绕工具中心点做定点变位姿运动的标定方案。通过最小二乘法计算扫描仪坐标系下的“重定位”中心坐标,并根据多空间点四元数耦合方法,同时完成平移和旋转矩阵的标定,进而得到扫描仪坐标系到机器人基坐标
期刊
现有识别算法所使用的数据集过于简单,对真实场景中的安检图像危险品识别准确率低,易导致误检和漏检,给辅助安检的人员造成了很大的困扰。针对这一问题,本文基于渗透假设的类平衡分层求精,提出了加入多层通道注意力机制和空间注意力机制的算法。该算法在安检图像分层建模的思想的基础上,首先在特征图上加入通道注意力机制,在通道上对其通道特征赋予不同的权重。其次加入空间注意力机制,在空间上对安检图像特有的颜色特征赋予
期刊
利用低成本的Kinect相机可以实现人体姿态捕捉,代替价格昂贵的光学动作捕捉系统进行异常步态分析。本文从病理性异常步态特征、步态数据集、Kinect相机可靠性和异常步态识别方法四个方面分别对异常步态分析的发展现状展开综述。首先,总结了常见的异常步态的病理性特点,介绍了步态分析中常用的步态特征和步态事件;然后,介绍了基于Kinect相机采集的异常步态骨架数据集和可穿戴设备、压力传感器采集的异常步态数
期刊
高动态范围(High Dynamic Range,HDR)图像相比低动态范围(Low Dynamic Range,LDR)图像有更宽的色域和更高的亮度范围,更符合人眼视觉效果。但由于目前的图像采集设备大都是LDR设备,导致HDR图像资源匮乏,解决该问题的一种有效途径是是通过逆色调映射将LDR图像映射为HDR图像。本文提出一种基于条件生成对抗网络(Conditional Generative Adv
期刊
当前深度残差网络模型训练缓慢,为解决这一问题该文设计了一种新型的残差结构。与典型的残差结构相比,该结构仅含有一个BatchNormalization和 ReLU模块,通过减少网络训练过程的计算量降低了耗时,提升了模型训练速度。在常用的CIFAR10/100图像分类数据库上进行了对比实验分析,以该方法构建的深度为110层的网络CIFAR10分类错误率为5.29%,CIFAR100分类错误率为24.8
期刊