【摘 要】
:
近年来,图像与视频自动标注技术成为多媒体信息处理领域的一个研究热点并且发展迅速。重点介绍此领域研究的最新进展。将这些新方法分为两类:基于学习的标注方法和基于搜索的标注方法,分别介绍了各个算法的基本思想和优缺点。然后,介绍了一些目前流行的商业的和研究性的图像检索及标注系统。最后,提出了自动标注技术的进一步研究方向。
【基金项目】
:
本文受西北工业大学基础研究基金(JC20L041),西北工业大学引进高层次人才科研启动费资助项目资助.
论文部分内容阅读
近年来,图像与视频自动标注技术成为多媒体信息处理领域的一个研究热点并且发展迅速。重点介绍此领域研究的最新进展。将这些新方法分为两类:基于学习的标注方法和基于搜索的标注方法,分别介绍了各个算法的基本思想和优缺点。然后,介绍了一些目前流行的商业的和研究性的图像检索及标注系统。最后,提出了自动标注技术的进一步研究方向。
其他文献
形变物体边界的准确定位是光流估计的难点之一,仅依靠改进光流算法收效甚微。提出了全自动生长分割法,以准确提取形变运动物体,从而将视频分割结果与梯度彩色光流算法相结合来提高光流法对形变物体的检测准确度。
草体作为自然场景的一种重要元素,数量众多、覆盖范围广,很难实现实时模拟。针对已有方法存在的问题,提出了一种草体碾压效果模拟方法。利用混合式表达方式构建出大规模静态草地场景,采用基于GPU的实时碰撞检测算法和受力向量传播机制计算视点近处草叶的受力和形变,通过调整布告板斜率模拟中远距离草丛变形。为消除混合式表达方法带来的跳动现象,实现了一种层间动态过渡策略。实验结果表明,该方法能模拟出逼真的草体碾压效
利用压缩算法及C语言编译器辅助分析,提出了一种用于代码保护的低开销策略。设计了一种基于C语言安全漏洞的安全级别模型,它对不同安全级别的代码采用不同的保护策略,以减少
提出了一种稳定、快速地获取摄像机视频运动图像的三维重建方法,并对该运动图像做适当的虚拟化处理以展示重建效果。采用基于尺度不变特征点匹配的摄像机标定进行三维重建。尺度不变特征对于视频图像中的特征具有优秀敏锐的匹配能力,极大地放宽了摄像机标定对于设备上的限制,拓宽了实时三维重建的适用范围。通过对系统的一系列优化,不但提升了三维重建的精度,减少了错误匹配对摄像机标定的影响,而且进一步提升了处理速度。通过
kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注
针对如何优化模糊神经网络的规则及如何合理地调整非线性参数及线性参数等问题,提出了将奇异值分解_总体最小二乘法(SVD_TLS)及扩展卡尔曼滤波(EKF)相结合的动态自组织模糊神经网
随着信息技术的快速发展,分布式计算技术逐渐向普适计算技术演化,从而达到信息空间和物理空间融合的最终目标,为用户提供普适的智能化服务。为了达到这个目标,一个主要的困难
提出了一种用于三维重建的未标定彩色图像立体匹配算法。针对Harris角点的聚簇现象,引入了限制因子来消除,通过采用精度较高的邻域彩色相关法进行匹配。针对相机平移旋转较小的情况,提出了利用斜率一致性剔除明显的误匹配,然后运用随机抽样算法估计基础矩阵,同时进一步剔除误匹配点对,最后用基础矩阵引导未匹配特征点进行匹配。实验表明,该算法用于三维重建,能够较好地恢复物体的结构,是一种有效的匹配算法。
操作系统结构化是目前安全领域的一大难题。以无干扰模型为基础,提出了一种基于分层隔离的进程环境安全模型,给出了进程环境安全的定义和条件。然后对系统结构化要求进行了形
快速全局运动估计的关键在于全局运动区域与局部运动区域的分割,其难点在于阈值的设定。提出一种面向快速全局运动的渐进精细阈值方法,该方法分为两步:第一步,用一个将统计特性与均值阈值相结合的亮度残差阈值模型来大致划分局部运动区域与全局运动区域,从而得到全局运动估计区域的近似集合;第二步,使用一种运动矢量残差分级阈值技术在能量残差函数最小化迭代过程中逐步细化全局运动像素点集合,最后分离出完整的全局运动区域