基于三维卷积和哈希方法的视频检索算法

来源 :电子科技 | 被引量 : 0次 | 上传用户:thriving_hehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频信息检索与其他多媒体检索的最大不同在于视频信息量较大,因此进行视频间相似度计算时的计算量较大.此外,对视频特征的提取中常常忽略视频帧之间的时间相关性,从而导致特征提取不充分,影响视频检索的精度.为此,文中提出基于三维卷积和哈希方法的视频检索方法.该方法构建了一个端到端的框架,使用三维卷积神经网络来提取视频中代表帧的特征,并将视频特征映射到低维的汉明空间中去,在汉明空间计算相似度.在两个视频数据集下的实验结果表明,相较于当前最新的视频检索算法,文中所提方法在精度上有较大的提升.
其他文献
根据《全球教育机器人发展白皮书》所述,教育机器人在智能教育方面逐渐占据重要地位,机器人在教育中的应用已经普遍成为一种期待,成为教育人工智能技术领域的热点之一.在此背景下,本研究以2001—2021年CNKI中国知网的教育机器人相关文献为研究对象,梳理了我国教育机器人的发展动态与研究热点,进而通过SATI软件和UCINET软件对样本数据进行高频关键词的共词关系分析,研究发现:我国教育机器人的研究方向主要集中在教育机器人本身的设计开发以及机器人教育的扩展应用这两个方面.并对教育机器人未来的未来的发展趋势进行简
轨道车辆运行在恶劣天气状况下时,车辆轮轨间的黏着力会因轨面状态的改变而降低,造成列车的空转或滑行等现象,影响列车正常行驶甚至造成安全事故等严重后果.国内外提高轮轨间黏着力普遍采用的方式是通过撒砂装置向铁轨上喷洒细砂.实验表面撒砂能显著提高黏着力.但是现阶段列车撒砂系统撒砂判断逻辑简单,多依靠司机经验判断决定是否撒砂.无法对撒砂量进行控制,这种经验判断法无法应对机车运行时的复杂需求,有些运行情况下会撒砂过多造成铁轨损坏或者撒砂过少增黏效果不足以达到运行要求等情况.为避免此类情况的出现,优化机车的撒砂逻辑,减
在RRAM交叉阵列结构中实现逻辑运算可以较好地解决传统冯诺依曼架构中的存储墙问题.三值逻辑相比于传统的二值逻辑,具有更少的逻辑操作数目和更快的运算速度.文中提出了一种基于RRAM双交叉阵列结构的三值存内逻辑电路设计,其中三值逻辑电路的输入与输出均通过多值RRAM的阻值表示.该结构支持两种三值逻辑门和一种二值逻辑门以提升计算速度.实验结果显示,相比于传统的二值存内逻辑电路设计,三值存内逻辑电路加法器可以减少68.84%的操作步数.相比于传统的IMPLY逻辑电路设计,三值存内逻辑电路加法器可以降低33.05%
为科学管控市政工程安全生产问题,首先基于2015-2020年的92份市政工程生产安全较大及以上事故调查报告和社会网络评价方法提取关键致因因素,构建市政工程项目安全风险评价指标体系;然后利用点度中心度对评价指标权重进行排序,并结合偏好者信息实现对20个市政工程项目施工现场安全风险的偏序集评价;最后绘制了市政工程项目施工现场安全风险HASSE图.结果表明:根据事故调查报告所得的45项致因因素中,19项致因因素位于致险网络的核心区域;采用偏序集评价得到的市政工程项目施工现场安全风险HASSE图能够直观地显现样本
随着科学技术的发展,车载通信系统面临的电磁干扰问题愈加突出.针对车载通信系统的干扰余量评估问题,基于四级筛选法,文中提出了一种新颖的车载通信系统电磁干扰余量评估方法.依次对车载接收机的工作条件、工作频率、信号功率和通信性能进行评估,以定量表述车载接收机的干扰余量及受扰情况.针对干扰源对接收机灵敏度的影响,该方法选取了通信距离、信噪比、误码率等3个指标对车载通信系统的性能进行评估.结果表明,与传统四级筛选法相比,文中所提方法能够较为全面地体现通信系统受扰后通信性能的变化情况.
本文结合实际工作经验,在探讨猪免疫抑制性疾病危害的基础上,就常见的致病因素进行了分析,然后论述了相应的防控措施,希望对广大同行有所帮助.
为解决复杂道路条件下的汽车夜间行车安全问题,避免会车时使对向车辆驾驶人员产生炫目效果,文中以非成像理论为基础并结合折反射定律,建立LED出射光线与接收面上远光分布点的对应投射关系.通过数值迭代的方法求解自由曲面离散点,并导入到3D软件中进行拟合建模,设计出一种通过控制对应LED亮灭,用以组合形成不同远光光型的反射式ADB光学系统.最终样件的实际测试结果表明,当该光学系统处于最大工作条件时,其出光效率达到34.3%,最大光照度值为134 lx,配光结果满足远光法规各测试点要求.
在小鼠行为学实验中,仅使用数字图像处理技术无法对小鼠行为进行全面检测和分析.针对这一问题,文中提出基于图像和IMU传感器结合的生物行为检测方法.该方法在Python编程环境下,利用数字图像处理技术对小鼠运动视频进行检测跟踪,获得小鼠的运动行为学参数.同时,使用本实验室设计的无线蓝牙微型IMU传感器测量小鼠的三轴加速度、三轴角速度、三轴磁力,对测量数据使用扩展卡尔曼滤波算法进行解算以获得小鼠的姿态等体态变化信息.实验结果表明,该系统能较好地自动分析出小鼠的运动行为信息和姿态信息,并能在生物行为分析系统界面上
传统VSLAM算法基于静态场景实现,其在室内动态场景下定位精度退化,三维稀疏点云地图也会出现动态特征点误匹配等问题.文中在ORB-SLAM2框架上进行改进,结合Mask R-CNN进行图像的语义分割,剔除位于动态物体上的动态特征点,优化了相机位姿,得到了静态的三维稀疏点云地图.在公开的TUM数据集上的实验结果表明,结合Mask R-CNN的ORB-SLAM2有效提高了智能移动机器人的位姿估计精度,绝对轨迹的均方根误差可提高96.3%,相对平移轨迹的均方根误差可提高41.2%,相对旋转轨迹的误差也有明显改善
场景识别是计算机视觉研究中的一项基本任务.与图像分类不同,场景识别需要综合考虑场景的背景信息、局部场景特征以及物体特征等因素,导致经典卷积神经网络在场景识别上性能欠佳.为解决此问题,文中提出了一种基于深度卷积特征的场景全局与局部表示方法.此方法对场景图片的卷积特征进行变换从而为每张图片生成一个综合的特征表示.使用CAM获取局部关键区域,利用LSTM对局部区域的卷积特征进行编码形成场景图片的局部表示;通过注意力机制融合场景特征与物体特征形成场景图片的全局表示.最后,在MIT indoor 67场景识别数据集