论文部分内容阅读
视觉感知机制是人类视觉系统的重要特性之一,是指人在观察和感知周围世界的时候能够本能地快速定位并获取重要的信息。通过模拟视觉系统的自适应感知机制,并从视觉数据中高效地提取显著区域或特征,可以有效提升各阶段计算机视觉任务的性能。在本次课程讲座中,我将主要介绍基于深度学习的视觉显著物体检测算法的研究进展以及视觉注意力机制在图像视频各阶段语义理解中的应用,包括图像多标签分类、物体检测以及视频语句生成等。