面向多媒体数据的哈希检索方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jonnykang001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频、音频、文本、图像等多媒体数据广泛存在于互联网络和社交媒体。海量的多媒体数据蕴含丰富的社会和经济价值,为社会发展带来机遇的同时也带来了许多挑战。如何对迅猛增长的多媒体数据进行有效的存储、分析和管理,已经成为国内外研究者高度关注的问题。哈希算法是检索领域常用的一种技术,由于其检索速度快、占用存储空间小等优势,得到了广泛的应用。虽然现有基于单一数据类型的检索方法研究比较多且应用广泛,但是在跨模态检索领域仍存在许多问题需要深入研究。现有的一些跨模态哈希方法中损失函数和优化算法紧密耦合导致方法缺乏灵活性,缺乏足够能力去减少不同模态之间的差距。还有一些跨模态哈希方法在学习哈希编码的过程中没有能够很好地保持语义信息,从而导致了较差的检索精度。本文在深入研究集成学习、块搜索算法、近邻图构造和基于分类器的两步哈希方法的基础上,针对现有跨模态哈希方法的不足之处,提出两种新的面向多媒体数据的哈希检索方法:1.针对现有一些跨模态哈希方法中损失函数和优化算法紧密耦合以及缺乏足够能力减少不同模态之间差距的问题,提出一种基于集成学习的跨模态哈希检索方法。该方法主要基于分类器的思想将哈希学习问题转化为二进制分类问题,方法的框架主要分为两个步骤,首先为不同模态的数据生成统一的二进制编码,然后用学到的二进制编码和不同模态的数据分别训练分类器学习哈希函数。另外,该方法采用基于块搜索的算法实现多标签数据的划分,利用集成学习的Adaboost算法训练分类器得到不易过拟合的分类模型和较小的泛化误差。该方法不仅解决了现有方法中损失函数和优化过程耦合的问题,而且缩小了不同模态之间的差距,进一步提升了跨模态检索的精度。2.针对现有一些跨模态哈希方法在学习哈希函数的过程中因为忽略了同一模态内部数据的相似性保持而导致哈希检索的效果较差的问题。本文提出了一种基于近邻图语义保持的跨模态哈希检索方法,在计算模态内部相似性矩阵的过程中,利用近邻选择算法构造近邻图,对模态内相似性关系进行建模。近邻选择算法能够同时保持近邻图的稀疏性和连通性,在保持近邻图关键连接的同时去除一些冗余或者错误的连接。在学习哈希码的过程中,相似性矩阵的稀疏性可以去除样本点之间冗余或者错误的相似性关系,从而保证不同类别样本点之间的距离尽可能远,而连通性保证了同一类别样本点之间的相似性。该方法将哈希编码和数据标签结合以保持不同模态同一类别的数据之间的语义关联,进而得到更好的检索性能。实验结果表明,本文提出的基于集成学习的跨模态哈希检索方法不仅能够解决现有方法中损失函数和优化算法的耦合问题,而且能够在学习哈希码的过程中减少不同模态之间的差距。基于近邻图语义保持的跨模态哈希检索方法在学习哈希码的过程中保持了语义信息,得到了好的检索性能。
其他文献
目前,氧化还原反应通常使用金[1]、钴[2]、铁[3]、铂[4,5]、钯[6]等金属作为催化剂[7],金属催化剂虽然催化效率好,但价格昂贵,资源匮乏,还会对环境产生污染。非金属催化剂作为新型的绿色催化材料,近年来引起了很多关注。相比于传统的金属催化剂,非金属催化剂有高效、环保、低能耗和耐腐蚀的有利条件。在烃类转化、化学合成和能源催化等领域,非金属催化剂表现出优异的催化性能和发展潜力。石墨烯是很有前
“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的合称,位于世界油气资源核心分布区域“俄罗斯-中亚-中东-北非-西非”的北段。中国对“一带一路”沿线国家进行油气投资,不仅可以实现油气供给来源多元化和进口途径多样化,以此缓解国内油气资源所面临的现实风险;同时可以通过多边化的油气合作,优化产业结构,进而保障未来的巨大需求。因此,研究“一带一路”沿线国家油气投资环境影响因素,对中国海外油气投资
随着人类社会的不断发展,陆地资源开始日趋匮乏,而海洋覆盖了地球表面的大部分面积,是人类的一个天然宝库,对海洋资源的开发利用将成为今后世界各国新的发展机遇。现阶段对海底进行远距离成像探测主要是通过声呐设备,对于侧扫声呐设备获取的声呐数据,瀑布图像并没有考虑实际的地理位置关系,而按照GPS位置信息拼接后,可以得到反映海底地貌信息的二维侧扫声呐图像;对于多波束测深设备获取的测深数据,则可以反映海底详细的
现实世界中,经济的发展离不开金融,金融本身是一个复杂的体系,金融结构更是一个金融体系的骨架,尤其是针对金融系统的支撑,金融结构的重要性不言而喻,因而对它研究的脚步从未停止过。林毅夫曾在他提出的经典理论--新结构经济学理论中提到,经济结构是一个不断动态优化的过程,是根据不同时间节点下呈现出的不同的要素禀赋,在比较优势下得出不同的产业结构特征和技术风险特性,所对应的金融服务需求不同,进而又决定了金融结
中国和印度作为目前世界上最大的两个发展中国家,自上世纪九十年代以来,经济得到了迅猛发展的同时,化石能源消费量也不断增长,并带来了大量的二氧化碳排放,已分别成为全球第一和第三大碳排放国。随着《巴黎协定》等气候条约的制定,减缓温室气体排放已成为各国共同承担的全球主要环境责任之一。在这种背景下,科学准确地核算中印两国的碳排放量,并定量分析两国碳排放变化的驱动因素,不仅可以为中印两国节能减排政策的制定和低
不同形貌的碳酸钙微粒具有不同的性质和应用领域,因此对碳酸钙形貌的调控就显得尤为重要。本文在传统的高分子有机控制剂调控碳酸钙形貌的基础之上,选取非常规的无机盐控制剂
目前,推荐系统的应用范围越来越广泛,已经成为电商平台、视频播放平台、娱乐社交等平台的基础设施。序列推荐是推荐系统的一个分支,能够从用户与项的信息中挖掘隐含信息并建立用户交互的依赖关系模型。隐含信息包括各个项之间的联系、用户的偏好以及偏好的变化、商品的流行度变化等。依赖关系是指用户在不同时刻交互的产品之间存在联系,例如交易序列中的商品之间存在顺序依赖关系。序列推荐中存在许多问题,如序列数据的稀疏问题
随着人工智能与生物医学工程的飞速发展,机器学习技术已逐渐成为医疗领域医生诊断、分析病情的重要工具。癫痫是一种常见的神经系统疾病,临床患者数量众多。对于药物难治性癫痫患者,神经外科手术的成功率很大程度取决于癫痫始发区的精准定位。在术前评估中,癫痫脑电信号中的高频振荡节律已成为定位癫痫始发区的重要电生理标志物。由于高频振荡节律的微弱性、瞬时性,且癫痫脑电中混杂其他伪迹和噪声,基于医生肉眼判断的传统高频
在深度学习领域中,相比于图像的生成和风格迁移,文本的风格迁移和语义控制还存在很多挑战。文本风格迁移即针对文本表达的情感倾向、时态或话题等属性进行改写从而生成符合目标特性的文本。这其中涉及的语义控制、风格控制等技术对于可控文本生成至关重要。本文针对情感这一广受关注的属性研究并实现文本改写算法。然而平行语料的标注耗费资源且依赖于此的有监督模型效果受制于标注数据的数量和质量,因此本论文聚焦于非平行语料的
光电化学(PEC)传感器是经太阳能电池演变,具有高效率、高检测性能的新兴技术。近年,材料学科发展迅猛,新颖的光电活性材料不断涌现。高光电转化效率的光敏电极,能有效提高传感器的灵敏度,已成为PEC传感器发展的重点。有机-无机杂化钙钛矿,光电性能优异,广泛应用于太阳能电池、光催化等各领域。本论文应用有机-无机杂化钙钛矿作为光敏材料,通过不同方法对其改性,提高稳定性和光电化学响应能力。在此基础上,结合分