利用类别信息和列表排序的跨模态检索

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:xjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着越来越多多模态数据的出现,跨模态检索引起了广泛的关注。跨模态检索面临一大挑战为模态鸿沟,为了解决数据的异构性问题,公共子空间学习的方法被提出。然而,大部分方法仅仅是单独考虑了样本之间的相关联信息或不相关信息,而没有同时考虑样本间的相关信息和不相关信息。除此之外,大部分方法对于样本之间相似度的比较,使用的是基于文档对的排序比较,其没有充分考虑样本之间的类内依赖性和类间样本的结构差异性。基于此,提出了一种同时而不是单独考虑样本间的类内关系和类间关系的基于列表排序的跨模态检索方法,其通过列表排序最大化锚点与
其他文献
养牛过程中牛消化系统疾病较为常见,瘤胃臌气、胃肠炎均属于其中代表。本文简单分析牛消化系统疾病的病因,并深入探讨牛消化系统疾病的治疗方法,希望研究内容能够给牛消化系
本文简单分析了绵羊肺腺瘤病病症分析及诊断要点,并深入探讨绵羊肺腺瘤病的治疗措施,希望研究内容能够给相关养殖人员以启发。
人体动作识别是视频理解领域的重要课题之一,在视频监控、人机交互、运动分析、视频信息检索等方面有着广泛的应用。根据骨干网络的特点,从2D卷积神经网络、3D卷积神经网络、时空分解网络三个角度介绍了动作识别领域的最新研究成果,并对三类方法的优缺点进行了定性的分析和比较。然后,从场景相关和时间相关两方面,全面归纳了常用的动作视频数据集,并着重探讨了不同数据集的特点及用法。随后,介绍了动作识别任务中常见的预
针对基于深度特征的目标跟踪算法在目标快速运动、长时间遮挡容易导致跟踪漂移的问题,提出了一种结合重检测机制的多卷积层特征响应跟踪算法。首先基于图像分块的混合高斯模型检测出目标区域,其次多卷积层根据加权梯度的类激活映射提取目标深度特征图,并训练出相互独立的相关滤波器,然后融合底层空间特征和高层语义特征的卷积层滤波器得到目标响应位置,再由重检测机制约束项平滑输出响应值,从而构建出强跟踪器,最后自适应地更
现有的网络表示学习算法主要是针对同质网络或异质网络设计的,而忽略了在推荐系统、搜索引擎和问答系统等领域出现的二分网络的特殊特征以及这类网络所携带着的非常丰富的属
时间序列事件聚类是研究事件分类及挖掘分析的基础。现有聚类方法多直接针对具有时间属性且结构复杂的持续事件聚类,未考虑聚类对象的转化,聚类准确性低且效率差。针对这些问
许多现实场景要求准确的脸部性别识别。深度卷积神经网络在正常状况下取得好的准确率,适用于大规模分类任务,但存在模型可解释性差、易丢失细节信息等问题,并且光照、姿势、表情等因素带来的不确定性会导致分类准确率较低。提出一种基于阴影集的二级分类模型。采用深度卷积神经网络对大规模图像集进行一阶段分类;结合阴影集理论,将图像分类结果划分为接收域、拒绝域和不确定域,得到不确定的脸部图像集,用传统方法进行二阶段分
目前大多的域自适应算法在源域与目标域具有相同类别的场景下,利用标签丰富的源域信息对标签稀少且分布相似的目标域数据进行迁移学习,取得了很多成果。然而,由于现实场景的复杂性和开放性,源域和目标域在类别空间上不尽相同,往往会各自包含一些类别未知且超出现有类别设定的样本。对于这样具有挑战性的开放集场景,传统的域自适应算法将无能为力。为了有效解决上述问题,提出一种面向开放集的模糊域自适应算法。该算法引用了不
视频质量评价(VQA)是以人眼的主观质量评估结果为依据,使用算法模型对失真视频进行评估。传统的评估方法难以做到主观评价结果与客观评价结果相一致。基于深度学习的视频质量评价方法无需加入手工特征,通过模型自主学习即可进行评估,对视频质量的监控和评价有重要意义,已成为计算机视觉领域的研究热点之一。首先对视频质量评价的研究背景和主要研究方法进行介绍;其次从全参考型和无参考型两方面介绍基于深度学习的客观质量
传统深度金字塔模型作为一种有效的行人检测算法备受关注,融合可变形部件模型和卷积神经网络模型,但特征提取部分使用的算法像素区域的大小不同,导致模型之间不能完全融合,在行人数量多、姿势复杂和有遮挡情况时的检测效果不理想。因此,提出一种基于规范化函数的深度金字塔模型(Norm-DP)算法,使用规范化函数融合可变形部件模型和卷积神经网络模型,直接从金字塔特征中提取正负样本,使用隐变量支持向量机进行模型训练