基于融合相似度的跨模态哈希检索方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liongliong451
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息飞速增长时代的到来,人们对于信息检索的需求也在不断增加。其中,作为机器学习方法的重要领域之一,哈希学习成为了用于信息检索的典型方法。如今网络上存储的数据存在多样性,传统的哈希方法研究范围局限于同种数据之间的检索,因此跨模态数据之间的检索逐渐受到关注。跨模态数据检索,因不同模态数据的数据分布不同,所以直接对数据训练哈希函数,会使得生成哈希编码无法充分保留有代表性的原始语义信息。而且,跨模态检索的另一个难题是对于不同数据分布的数据,其数据之间的相似度无法直接衡量,因此需要尝试将不同模态的数据投影到共同的语义子空间中,在共同语义子空间进行数据相似度的衡量。现有的跨模态检索的研究大都采用深度哈希的方法,结合标签数据的相似度对共同语义子空间进行训练,从而挖掘跨模态数据的相似度语义信息,最后把数据映射成哈希编码进行检索。然而大部分的方法忽略了相同模态内的相似度与跨模态数据的相似度之间的联系,从而导致训练得到的共同语义子空间无法保留有代表性的原始语义信息。于此同时,原始数据之间的相似度是基于真值距离,而哈希编码的相似度关系是基于汉明距离,在哈希编码的学习过程就需要削减真值距离与汉明距离之间的误差。因此,本文提出了基于跨模态检索的深度有监督相似度融合哈希方法(Deep Supervised Fused Similarity Hashing)。其中包含了相似度融合的方法,将不同模态数据的内在相似度与标签相似度进行有效融合,深入挖掘不同模态数据模态内相似度之间的关联,得到更具判别性的原始语义信息;由于不同模态数据的分布不同,所以数据在映射到相同的二进制哈希编码时会出现不同程度的误差,因此本文方法包含了改进的最大化间距量化机制,通过对不同模态数据调整不同的量化误差参数,有效削减哈希编码学习过程产生的真值距离与汉明距离之间的误差。
其他文献
在互联网与人工智能飞速发展的当代,表情编辑的研究对相关领域都有着重要意义,特别是对信息安全、人脸研究、人机互动以及社交娱乐等领域的发展都有着积极的促进作用。然而由于人脸数据中身份属性的影响,深度学习模型会遇到特征耦合以及面容混淆等问题,导致模型为了生成真实度高的拟合样本将面临巨大挑战。因此开展表情编辑的研究,促进其生成更高质量的拟合样本的需求愈发迫切。本文以条件生成对抗网络为基础框架,针对表情编辑
学位
生物特征识别已经成为认证系统中应用最广泛的技术之一。随着云技术的发展和推广,越来越多的生物识别系统采用数据库外包的方式来高效存储大规模图像数据库。由于生物特征数据的唯一性和持久性,一旦泄露,攻击者可以很容易地访问用户设备或获取用户的敏感文件和财产。因此,用于保护生物特征数据的隐私保持的生物特征识别应运而生。哈希二值表示由于其输入为高维实值域,输出为低维二值域被认为是一种安全的转化方式,广泛地应用于
学位
随着石油和煤炭等一次能源的枯竭,以及太阳能、生物质能和潮汐能等新型可再生资源的利用,研究人员将优先探索高效、清洁和可持续的储能和供电技术。超级电容器(也称为电化学电容器)因其能量密度高、充电和放电速度快、循环性能好和温度范围宽而具有广阔的发展和应用前景。具有核-壳结构和高质量负载的电极材料在各种重要的储能系统中显示出巨大的潜力,而赝电容材料的实际电容值已经日趋接近其理论值。然而,制备同时兼具高质量
学位
低表面张力的油类易粘附在基材表面,且难以从表面清除,给人类生产和生活均造成严重的油污污染。由于绝大多数油污染均始于表界面,通过对表面结构和组成的调控与改性,可有效阻止油污染。因此,开发耐久、高效且适合批量化制备的疏油涂层在防污、自清洁、防腐蚀、油滴输送、油水分离等领域均具有广泛的应用需要。疏油涂层通常由重入结构和低表面能化学成分协同作用组成。但构建疏油涂层的重入结构通常存在制备工艺复杂、稳定性差、
学位
随着人类社会的发展,全球能源需求不断增加。目前,能源供应仍以化石燃料为主,这不仅导致全球不可再生能源的枯竭,还会引起由于CO2浓度快速上升带来的全球变暖等环境问题。因此,开发清洁能源和调控CO2浓度已经成为一项关乎全球生态稳定的重大议题。从源头上调整能源使用比例,大力开发如氢能、风能、太阳能等可再生能源和对大气中的CO2进行捕集储存并进一步转化为工业化学品和低碳燃料是一种有效策略。通过共价键连接的
学位
行人检测在自动驾驶等领域有广泛应用,但是因为标注数据的成本较高,半监督行人检测算法的研究因此被提出。本文对半监督行人检测算法进行了研究,并提出基于图像生成来扩充行人检测数据,提高半监督行人检测算法的性能,包括以下方法:(1)从外部场景收集数据,但会存在两个问题:一、用风格不一致的外部场景的数据训练模型,模型最后在目标场景下测试时会产生偏差;二、外部场景的数据没有标注,图像中的行人可能未对齐。因此本
学位
随着人们对能源需求的日益增加,传统化石燃料的储量日益减少,并且导致环境污染日益加重。目前已经开发出风能、光能和潮汐能等转换成电能的方法,然而这些可再生能源因环境变化及地域差异等影响致使其输送的能量非常不稳定,所以人们急切需要开发出一种新型的能量转换及储存装置。超级电容器因具有绿色环保、成本低廉、制备简单、受环境温度影响小、比电容高、功率密度高、充放电速率快和循环寿命长等优点而在诸多电化学能量储存设
学位
家庭电力负荷预测在未来的电网规划和运行中起着重要作用。然而,与聚合负荷预测相比,家庭电力负荷预测面临着显著的负荷模式不确定性的挑战。聚类分析是一种实用的无监督学习技术,可以用于对相似的时间序列进行分组,降低各组中数据的不确定性方差。通过聚类分析,将家庭层面的负荷分布分组以形成集群层面的负荷分布,可以预期其表现出更规律的模式,对模型更具有可预测性。另一方面,用于度量时间序列相似性的目标函数在基于分区
学位
多孔有机骨架材料(Porous Organic Frameworks,POFs)是一类由轻元素(碳、氢、氧、氮和硼等)组成的有机基块通过聚合反应而形成的共价键连接的多孔聚合物。POFs具有骨架密度低、稳定性高、比表面积大、结构多样和修饰容易等特点,其在吸附和分离、催化和传感等领域研究广泛。对于POFs合成,主要关注聚合反应类型和构筑基块。对于聚合反应类型,依据使用的催化剂类型,主要包括无催化剂、酸
学位
半导体光催化技术可直接将光能转化为化学能及电能,是解决未来能源与环境危机的重要手段之一。在多种半导体材料中,石墨相氮化碳(g-C3N4)因价格低廉易得、极高的热稳定性和化学稳定性、合适的带隙等优点而备受瞩目。然而,合成方法及途径强烈影响材料的物理、化学性质。传统热聚合方法合成的g-C3N4具有比表面积小、光生载流子复合速率较快及可见光吸收少等缺点,极大地限制了其在光催化领域中的广泛应用。针对上述问
学位