【摘 要】
:
多标签图像分类问题是计算机视觉领域的重要问题之一,它需要对图像中的所有标签进行预测。而一幅图像中待分类的标签个数往往不止一个,同时图像中对象的大小、位置和姿态的变化都会对模型的分类性能产生影响。因此,如何有效地提高图像特征的准确表达能力是一个亟需解决的难题。针对上述难题,文中提出了一个新颖的双流重构网络来对图像进行特征抽取。具体而言,该模型首先应用一个双流注意力网络来对图像进行基于通道信息和空间信
论文部分内容阅读
多标签图像分类问题是计算机视觉领域的重要问题之一,它需要对图像中的所有标签进行预测。而一幅图像中待分类的标签个数往往不止一个,同时图像中对象的大小、位置和姿态的变化都会对模型的分类性能产生影响。因此,如何有效地提高图像特征的准确表达能力是一个亟需解决的难题。针对上述难题,文中提出了一个新颖的双流重构网络来对图像进行特征抽取。具体而言,该模型首先应用一个双流注意力网络来对图像进行基于通道信息和空间信息的特征提取,并经过特征拼接使得图像特征同时兼顾通道特征细节信息和空间特征细节信息。其次,该模型引入了重
其他文献
卷积神经网络进行实时图像语义分割时,处理大片色彩变化较小的像素区域会存在计算的空间冗余,同时利用轻量级网络进行特征提取的精度较低。针对上述两个问题,本文利用改进后MobileNet v3和OTCH-L模块设计了一种实时语义分割网络。首先利用hardswish激活函数对轻量级网络MobileNet v3进行精度补偿,提出改进后的MobileNet v3特征提取网络;其次基于八度卷积设计轻型高频采样模
人类动作识别是一个极具挑战性的研究课题,广泛应用于安全监控、人机交互和自动驾驶等领域。近年来,图卷积网络在建模非欧几里德结构数据上取得了巨大成功,为骨架模态动作识别提供了新思路。由于骨架预定义图包含大量噪声,现有方法多使用高阶空域特征对空间依赖性进行建模。然而,仅关注高阶子集并不能在全局上反映顶点之间的动态相关性。此外,主流方法中模拟时间依赖性使用的卷积神经网络或循环神经网络也无法捕获多范围的时序
针对红外与可见光图像在融合过程中目标物体的边缘模糊导致细节丢失的问题,提出基于滚动引导滤波器(RGF,Rolling Guidence Filter)和卷积稀疏表示(CSR,Convolution Sparse Representation)的红外与可见光图像融合方法。首先,利用RGF和高斯滤波器将配准后的源图像进行多尺度分解;其次,针对基础层,通过构建对比显著图和权重矩阵进行融合;然后,细节层利
针对传统的核相关滤波跟踪算法缺乏处理目标存在遮挡情况的能力,提出了遮挡判断指标以及模型自适应更新的改进算法。首先通过最大响应和低响应点个数两个指标综合判断是否存在遮挡,然后自适应调整模型学习率,解决了存在遮挡时不能准确跟踪的问题。在OTB2015数据集中选取存在遮挡的图像序列验证了算法的性能,相比传统的核相关滤波算法对遮挡情况下的跟踪,精确度提高了15.12%,成功率提高了14.7%。实验结果表明
准确、稳定的图像特征点提取是图像拼接、三维重建、以及基于特征点的视觉SLAM(simultaneous localization and mapping)等计算机视觉应用的前提。核辐射环境下采集的图像存在噪点量多、噪声块较大、传统的特征点提取方法存在容易将噪声判定为特征点的问题。基于某辐照厂卡源故障采集的受γ射线影响的图像噪声特点,提出一种抗核噪特征点(Against Nuclear Featur
分子可视化工作中高质量的分子渲染效果对研究人员观察生物分子结构尤为重要。主流分子可视化工具中常用的光栅化方法渲染效果不佳,不利于研究人员观察分子结构。先进的光线追踪渲染技术可以实现高质量的渲染效果,但目前工具中支持光线追踪的分子渲染方法存在使用平台限制、实时性能不足以及渲染质量不佳的问题。文中提出一种动态低采样环境光遮蔽的实时光线追踪分子渲染方法,提出了光线追踪中简易的重投影方法,用于实现动态低采
滨海沙地条件恶劣,季节气候环境差异较大,植物生存困难。厚藤是南方滨海沙地广泛分布的重要固沙植物。为探究厚藤对不同季节环境变化的适应机制,研究了其叶片生理性状的季节变化。该文以广西滨海沙地自然生长的厚藤为试材,分别测定了不同季节厚藤叶片的叶绿素含量、渗透物质含量、抗氧化酶活性、叶绿素荧光参数等生理指标,并进行相关性分析和主成分分析。结果表明:(1)叶绿素含量随季节变化的趋势一致,春季均显著大于夏秋冬
社交网络已经成为人们日常生活中不可分割的一部分,对社交媒体信息进行情感分析有助于了解人们在社交网站上的观点、态度和情绪。传统情感分析主要依赖文本内容,随着智能手机的兴起,网络上的信息逐渐多样化,除了文本内容,还包括图像。通过研究发现,在多数情况下,图像对文本有着支持增强作用,而不独立于文本来表达情感。文中提出了一种新颖的图像文本情感分析模型(LSTM-VistaNet),具体来说,LSTM-Vis
针对可见光与热红外图像融合跟踪中采用孪生网络架构进行跟踪存在鲁棒性较差的问题,提出一种基于双孪生网络特征融合的可见光热红外(RGB-T)目标实时跟踪方法。该方法首先采用两个孪生网络分别对可见光和红外图像的模板分支与搜索分支进行特征提取,得到两种模态特征层;然后,利用自注意力特征增强模块(SFEM)对两种模态的特征进行增强,并对增强后的特征使用双模特征融合(DMFF)模块将模板分支与搜索分支的特征分
针对传统机器人抓取算法成本高、位姿估计准确率低、在极端场景中鲁棒性差等问题,提出了一种基于单视图关键点投票的机器人抓取方法。该方法基于单个RGB图像,采用投票推理2D关键点的方式,再结合3D关键点的位置,利用EPnP算法计算物体的6D位姿,并将其转换为最优的机器人抓取姿势,实现机器人抓取。实验表明,即使在遮挡、截断、杂乱场景中,也能体现较好的估计结果。该方法抓取成功率达到了94%,能引导机器人实现