基于哈希学习的大规模媒体检索研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:sky_ywt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网技术和移动设备的大发展,媒体数据的规模越来越大,大规模媒体检索任务已经成为一个紧要的问题。因为其快速的检索速度以及十分低的存储消耗,所以哈希学习技术非常适合用来进行大规模媒体检索,已经获得越来越多的关注。并且研究表明,监督哈希方法在实际应用中比无监督哈希方法的效果更好。尽管基于监督哈希方法的媒体检索研究已经有一定的进展,但仍有一些问题需要去解决。比如,大部分的监督哈希方法因为使用了大小为数据量平方的成对相似性矩阵,使得其复杂度高,存储消耗大,不利于应用在大规模数据上。又比如,有一些哈希方法,在模型学习的时候先松弛掉哈希码二进制约束,优化一个松弛后的损失函数进而得到一个实值的解,最后把该解量化成最终的哈希码,这样的学习策略会引入大量的量化误差。本文在基于哈希学习的大规模媒体检索研究方面进行了深入研究。更具体的,我们设计了四种监督哈希模型来进行大规模媒体检索。本文的主要工作和贡献如下:(1)通过分析与观察之后,我们发现属于相同类别的数据的哈希码应相同。在此基础上,我们只需要为每一个类别学习出一个类别哈希码,并使之保持住类别之间的相似性即可。这样,训练的时候便无需考虑具体的样本,从而使得我们的训练时间及空间消耗不再受数据量的限制,因此我们可以在极短的时间内以及极低的内存使用下完成模型的训练,并且可以扩展到大规模媒体数据上。(2)监督哈希学习通用的目标函数涉及到一个数据量平方大小的样本间成对相似性矩阵,这个矩阵的存在使得哈希学习的时间复杂度很高,从而无法进行大规模媒体检索任务。为了解决这个问题,且不采用会导致信息损失的采样技术,我们通过替换目标函数中的一个哈希码项,进而引入了一个大小只与数据量线性相关的中间项。这个中间项是成对的相似性矩阵与标签矩阵的乘积,且是一个可以在优化前预先计算的常数项。通过在优化中直接使用该中间项,我们避免了使用成对相似性矩阵造成的很高的时间复杂度及很大的空间消耗。并且我们使用了离散优化算法去求解哈希码,这样得到的哈希码可以避免引入较大的量化误差。(3)尽管我们已经可以用一个中间项来规避直接使用数据量平方大小的样本间成对相似性矩阵,但是这个中间项是与数据量成线性相关的,当数据量足够大的时候,仍会有很高的消耗。在第四章中,我们提出了另外一种监督哈希方法。类似的,该方法也引入了一个中间项,可以在不采用会导致信息损失的采样技术的情况下,避免在优化过程中直接使用样本间成对的相似性矩阵。这个中间项的大小与数据量无关,只与类别数及特征的维数有关,因此其远小于样本间成对的相似性矩阵。除此之外,哈希码的生成不仅受益于监督信息,还会考虑到数据的特征信息,并且我们采用了一步优化所有位哈希码的离散优化算法。因此,本章提出的方法可以准确并高效地完成哈希码的更新。实验及理论分析均显示了该方法优于现有的监督哈希方法及上一章所提出的方法。(4)除了单个模态内的媒体数据检索,跨模态媒体检索也是值得研究的方向,并且在现实生活中有着广泛的应用。因此我们设计了一种跨模态监督哈希方法。该方法充分考虑了数据的流形结构及语义信息,并且使用离散优化策略以保证哈希码能被准确地学出。我们在公用的数据集上进行了大量的实验,实验的结果表明我们设计的跨模态哈希检索技术是十分有效的。
其他文献
采用样地调查方法研究了广东惠州莲花山海拔100~900 m区域木本植物的种类组成,并据此分析了该区域木本植物的种类多样性和生物量沿海拔的变化规律及其相互关系。结果显示:莲花
本文推荐了一套进口旧瓦楞箱(OCC)制浆生产线的设计 ,从废纸处理的要点、工艺流程的编排以及设备的选用等方面作了综合性论述 ,并对废纸制浆生产线各处理系统的作用进行了详
以微课、慕课为代表的新型多媒体教学手段可以在电类专业课程的课前、课中、课后不同的时段使用。教师可以将微课、慕课作为学生课前预习的资源,也可以让学生在课后根据微课讲
对纺丝温度、冷却条件进行了详细的讨论。结果表明:适合的PET纺丝温度,PET的黏度降在0.06以内,有效的吹风和上油条件可纺出优良产品。
阐述了大坳水库水源涵养林第一期工程建设情况。根据该地区的气候、地质状况,综合考虑生态、经济效益、景观效应,全面规划、整体推进、合理配置,选用优质苗木营造了一批高标
信息技术时代,多媒体已经广泛地应用于学校教学管理工作中。伴随国家加大对小学教学的支持和投入,多媒体已经成为小学教学良好的教学手段。越来越多的小学教师通过在小学数学
中国和日本是亚洲两个重要的国家,两国关系如果处理不当,对两国的国家利益和世界的和平与发展都会造成一定的威胁。中日两国关系能够持续健康发展,是两国人民的共同期待。但
增强现实(Augmented Reality,简称AR)是一种新型的人机交互技术,它通过计算机模拟仿真,能够将虚拟世界信息叠加到现实世界,从而被人类感官所感知,达到对现实世界的补充和增强
运用文献资料法、问卷调查法、逻辑分析法、数理统计法、专家访谈法等科研方法,对广东省体育特色学校的开展情况进行调查,旨在为相关政府部门制定相关体育特色学校的政策措施