基于稀疏表示的跨模态检索

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户：hlf00852

【摘要】

：

随着各种不同形式的多媒体数据(文本、图像、音频、视频等数据)的海量增长以及用户对检索体验要求的提高,不同模态、不同媒体数据之间的跨模态检索方式成为了检索领域新的发

【作者】

：

孙永聪

【出处】

：

重庆邮电大学

【发表日期】

：

2004年期

【关键词】

：

稀疏表示稀疏编码哈希编码多模态数据跨模态检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着各种不同形式的多媒体数据(文本、图像、音频、视频等数据)的海量增长以及用户对检索体验要求的提高,不同模态、不同媒体数据之间的跨模态检索方式成为了检索领域新的发展趋势。跨模态检索系统中用户只要输入任一种模态的数据,就可以检索返回相关的其他模态数据,使得检索结果更加丰富,满足用户的多元检索意图。考虑到存储成本、检索效率等问题是大规模多媒体数据检索的主要瓶颈,本文以多模态数据的稀疏表示为出发点分别提出了多图正则化稀疏编码的跨模态检索算法和变长度稀疏表示的跨模态检索算法,并进行了理论分析,同时在WIKI和NUS-WIDE等经典数据集上验证了它们的有效性。本文的创新工作有:1.提出了多图正则化稀疏编码的跨模态检索算法。首先针对跨模态检索中的多模态统一稀疏编码表示算法(MURL)只利用标签信息构造拉普拉斯矩阵表示数据关系,导致学习到的稀疏编码不能保持原始数据本身的空间拓扑信息,类别判别性弱等问题,提出了基于多图正则化稀疏编码的跨模态检索算法。然后通过加入各模态数据的拉普拉斯矩阵的线性组合方式来保证稀疏编码具有原数据的局部空间几何近邻关系,另外加入标签矩阵的线性回归项来加强稀疏编码的类别区分性来提高检索准确率,最终在统一稀疏编码空间内进行匹配、跨模态检索。与MURL方法相比,在WIKI和NUS-WIDE数据集上,MAP指标值分别提高了22%、12%,同时也高于典型性相关分析(CCA)、半耦合字典学习(SCDL)的方法。2.提出了基于变长度稀疏表示的跨模态检索。哈希编码是稀疏表示的特殊形式,近几年提出的跨视图哈希(CVH)、语义相关最大化的哈希编码(SCM)、语义保持哈希(SEPH)等方法把多模态数据映射到共同的哈希编码空间,通过松弛哈希编码的二值约束求解,学习到的多模态哈希编码是两种模态的折衷。因此不能够有效地表示各模态数据,使得类别区分性较弱。针对这些问题,本文提出了基于语义保持的方式把各模态数据分别映射到各自的最优长度的哈希编码空间,再通过二值约束的离散跨模态哈希算法求解各模态数据的最优哈希编码,从而获得不同模态的变长度哈希编码,最后通过保持语义相关的线性变换实现跨模态检索。提出的变长度哈希编码的跨模态检索模型对单标签或多标签、成对或非成对的多模态数据集场景都具有很好的适应性。在WIKI数据集、NUS-WIDE数据集和MIRFlickr数据集上验证了本文方法的性能总体上优于相关的SCM、SEPH、GSPH等跨模态检索算法。3.对集成稀疏编码和哈希编码的跨模态检索模型进行了探讨。虽然基于哈希编码的方法检索速度快捷,但是在一定程度上可能损失了原始数据的信息。为了既保持快速高效的检索,又要尽可能保全原始数据信息,因此本文将稀疏编码和哈希编码的优势结合起来做了一些稀疏哈希跨模态检索的探讨性工作,并在WIKI数据集上做了详细的实验表明检索性能有一定的改善。

其他文献

基于Tn5转座酶的建库技术在流产组织染色体检测中的应用研究

随着新一代高通量测序(Next Generation Sequencing,NGS)技术的革新发展,基于高通量测序技术越来越广泛地应用到医学临床检测领域,如无创DNA产前筛查(NIPT,Non-invasive pren

学位

Tn5转座酶流产组织染色体基因测序文库构建

徐旭生《猛进》时期思想研究

众所周知,徐旭生是中国近代史上著名的历史学家、考古学家,学界对其学术思想和学术成就关注、研究较多。但徐旭生在1920年代积极投身政治斗争,创办《猛进》周刊,反对军阀统治

学位

徐旭生《猛进》反对军阀反对帝国主义启蒙

去泛素化酶CYLD调控Hippo信号通路的分子机制

布鲁克斯皮格勒综合征(Brooke-Spiegler syndrome,BSS)是一种罕见疾病,是病变发生在皮肤及皮肤附属器上的综合征,大多数病人在成年初期开始长出肿瘤,多见于头颈部。这种综合

学位

CYLDHippoBioID相互作用去泛素化修饰

食管粘液表皮样癌的临床特点及预后影响因素的研究

目的:食管癌是全球最常见的消化道恶性肿瘤之一,我国为食管癌高发地区之一。食管粘液表皮样癌(Mucoepidermoid carcinoma,MEC)是食管腺癌组织学类型中一种罕见的病理类型,据

学位

食管粘液表皮样癌治疗方式手术预后因素生存率

基于图论同步不同控制器下的耦合系统网络

网络的数学描述是由顶点和连接它们的有向弧组成的有向图。在每个顶点处,局部动力学由称为顶点系统的微分方程组给出,无法直接分析动力学行为,同时也无法达成许多好的动力学性质。所以需要外部施加控制器,以达成稳定或者同步等动力学行为。本文的研究目的就是进行这类系统在不同控制器下的动态行为分析。主要研究的内容为运用图论的思想,考虑在三类控制器作用下的随机时滞耦合网络的稳定条件以及同步条件。Lyapunov泛函

学位

图论思想耦合时滞的耦合网络控制器同步性随机耦合振子

青海地区高血压患者的肠道菌群分布特点

目的:分析青海地区高血压患者的肠道菌群是否具有其特异性的分布特征,探讨它们在该地区的高血压发病过程中可能相关的病理生理机制。方法:收集青海西宁地区(海拔2260m)汉族高

学位

高原高血压肠道菌群16S rRNA汉族

青海某砂砾石类泥石流起动机制及危险性研究

青海省是我国受地质灾害影响较为严重的省份之一,其中泥石流灾害尤甚,在众多不同类型泥石流灾害当中发育着一种极为特殊的泥石流,与普通泥石流灾害最大的区别在于组成此类泥石流的物源和潜在物源全为砂砾石土,可称为砂砾石类泥石流,其主要发育在青海省广泛分布的第四系中下更系统弱胶结砂砾石地层中。受其物源特殊性质的影响,泥石流在发育特征和成因机制等方面有着较为鲜明的特点,而当前鲜有系统的针对此类泥石流灾害的研究。

学位

泥石流砂砾石起动机制FLO2D模糊数学法危险性评价

GeneXpert MTB/RIF联合ADA对结核性胸腔积液的诊断价值

目的:结核性胸腔积液(Tuberculous pleural effusion,TPE)是呼吸系统常见疾病。当今临床对结核性胸腔积液的诊断的金标准中,胸水结核杆菌涂片阳性率低,胸水结核杆菌培养耗时

学位

结核性胸腔积液GeneXpert MTB/RIF检测技术腺苷脱氢酶联合检测诊断价值

橙皮素早期干预对APPswe/PS1dE9双转基因小鼠抗炎和抗氧化作用影响

阿尔茨海默病(Alzheimer’s Disease,AD)是一种慢性神经退行性疾病,以认知功能障碍、学习记忆能力受损为主要临床表现。尽管目前关于AD的病因机制仍存在争议,但AD患者脑内会

学位

阿尔茨海默病橙皮素APPswe/PS1dE9双转基因小鼠早期干预氧化应激炎症反应Toll样受体2核因子κB血红素氧合酶-1

冠心病心绞痛痰瘀互结病证结合疗效评价量表的考评

目的:本研究目的是对已形成的量表的初级版本进行信度、效度和反应度的考评,并根据考评结果及专家意见对初步量表进行适当修改完善;基于结构方程对量表的理论结构进行验证性

学位

冠心病疗效评价探索性因子分析验证性因子分析量表考评

基于稀疏表示的跨模态检索

与本文相关的学术论文