Video description with subject, verb and object supervision

来源 :The Journal of China Universities of Posts and Telecommunica | 被引量 : 2次 | 上传用户:lsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Video description aims to generate descriptive natural language for videos. Inspired from the deep neural network(DNN) used in the machine translation, the video description(VD) task applies the convolutional neural network(CNN) to extracting video fea
其他文献
为了在显著性目标检测中保持高的召回率的同时提高准确率,本文提出了3点改进思路.第一,从超像素中提取简单的视觉特征,如颜色、方向和空间信息;第二,为了克服经典的基于图的流形排序(MR)的显著性目标检测算法中背景先验假设的缺点,使用仿射传导聚类算法(APC)自动聚合超像素为不同的特征类别.根据目标与背景(改进的)边缘连通度的不同,图像边缘的超像素会得到较大的权重即较大的背景概率值,这样边缘上真正的背景
期刊
在计算机视觉领域,行人检测是一项艰巨的任务。利用TOF(time-of-flight)相机提供的深度信息进行俯视行人的高精度检测。当TOF相机处于俯视角度时,作为人体的一部分,人的头部具有非常丰富的特征信息,并且能在很长的时间里不被遮挡。鉴于此,提出了一种头部检测与注水算法相结合的俯视行人检测方法。该方法首先利用混合高斯背景模型来寻找图像中的感兴趣区域;然后采用注水算法对候选头部区域进行过滤;最后
期刊
为了解决射频识别系统中电子标签的低功耗问题,提出并设计了基于STM32的半主动式电子标签低功耗性能评估系统,采用时分复用的方法,通过一个节点管控多个电子标签,同时将各个电子标签接收到的信号通过CAN总线传输给系统软件架构,实现系统总体设计,充分考虑系统主要功耗来源,对系统硬件部分进行设计时选取具有超低功耗优点的STM32单片机和nRF24LE1芯片,系统硬件部分主要包括微控制器单元、电源转换电路单
期刊
针对尺度不变特征变换(SIFT)算法在特征提取过程中运算量过大、非主要特征数据冗余、匹配率低等问题,提出一种基于SIFT稀疏深度信念网络算法模型。首先使用SIFT算法提取人脸特征,然后利用局部方差相似性优化稀疏编码,对提取的特征向量进行稀疏表示,最后采用无监督逐层训练,并用有监督的BP网络进行微调,深度信念网络进行分类,识别人脸图像,实现网络的自学习和自优化。将该算法应用到FERET人脸库上,实验
期刊
针对当前卷积神经网络算法在近红外光人脸检测时,普遍存在着检测时间过长、检测性能较低等问题。提出一种基于粒子优化群算法和卷积神经网络的人脸检测方法。通过对近红外光人脸进行分析,在人脸图像预处理中对人脸进行近红外光光照强度补偿,利用小波变换方法提取人脸图像低频子带,引入主特征分析法提取出近红外光人脸图像特征分量,将神经网络参数进行初始化,确定其拓扑结构。将提取的特征向量输入神经网络中,引入粒子群优化算
期刊
像素非均匀性是CCD成像性能评价中的一个重要指标,反映的是像素结构本身的差异。传统的以灰度值为基础计算DSNU和PRNU的方法未能考虑读出电路引入的时域噪声,且计算时未剔除不同像素曝光时间不同带来的误差,计算结果也只适用于某个具体曝光量。在分析CCD信号流的基础上,厘清灰度值不均匀的影响因素。参考DSNU和PRNU的计算方法,再结合帧转移型CCD的工作方式,提出了设置多档曝光时间,每档曝光时间下采
期刊
傅里叶叠层成像是一种能够同时实现大视场和高分辨的成像方法,公开发表的文献表明其空间分辨率极限由照明数值孔径和物镜数值孔径决定。为了进一步提高其分辨率,提出了频域和空间约束傅里叶叠层重建方法:利用传统重建算法获得的空间频谱进行频域约束,以传统重建算法获得的图像进行空间约束;该方法基于一个假设:图像具有稀疏特性;从传统重建算法获得的图像中提取所需的频域和空间约束条件,不需要额外采集数据和硬件改进。仿真
期刊
We propose a resolution enhancement method for a lensless in-line holographic microscope(LIHM) by combining the hologram segmentation and pixel super-resolution(PSR) techniques. Our method is suitable
期刊
In our Letter, two kinds of handwriting traces, colored and colorless, are studied by means of reflectance transformation imaging. The illumination direction and rendering mode can be changed alternat
期刊
Dear editor,In our daily life, information such as tactile and visual information is widely used to recognize objects when we manipulate them. Research has shown that the human brain makes use of mult
期刊