基于内容和文本的混合图像检索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yyxu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于信息技术的飞速发展和社交网络的普及,图像数据库的规模与日俱增,这也为图像检索技术带来了新的挑战。如何对这些大规模的图像数据库进行高效的检索,是信息检索领域中一个亟需解决的问题。传统的图像检索技术主要包括两种:基于文本的图像检索以及基于内容的图像检索。前者通过计算查询关键字与图像的文本注释之间的相似度。来检索相似图像,简单快捷,但依赖于人工标注。而人工标注会带来高昂的人力和时间开销,且文本描述具有主观性、多义性和不确定性等缺陷。后者则利用图像的低层视觉特征来衡量相似性,避免了人工标注的弊端,但图像的低层视觉特征和高层语义之间的“语义鸿沟”,是其难以避免的瓶颈。为了减小传统图像检索方法中的语义鸿沟,融合文本和视觉信息的图像检索成为了近年来的一个研究热点,然而这方面的工作多集中于研究图像的特征模型、哈希技术和融合策略等针对图像本身的处理方法,以此来提高检索的质量和图像处理的速度,但对于如何利用索引机制来提高检索过程的效率这方面却关注甚少。因此,本文针对基于内容和文本的混合图像检索问题,就提高检索效率方面进行了一定的研究。首先,文章采用线性融合策略,基于图像视觉特征和文本注释的混合相似度,将top-k图像检索问题归约为一个与空间关键字查询相似的问题;然后,通过结合曼哈顿哈希、倒排索引和M树等技术,我们设计了一个新型的混合图像索引结构HIR树,并提出该索引在检索中所需的一系列重要的度量属性;同时,基于此索引,我们提出了一个高效的top-k混合图像检索方法,包括预处理过程、HIR树的构建算法和top-k查询算法三个主要部分。最后,文章对该检索方法进行了严密的理论分析,并通过在多个测试数据集上进行一系列的参数实验和对比试验,证明了本文的方法可以在保持准确率的前提下,显著地提升图像检索的效率。
其他文献
目的:本研究通过检测亮氨酸拉链肿瘤抑制因子2(LZTS2)和细胞周期素D1(Cyclind1)在上皮性卵巢癌、交界性卵巢肿瘤、卵巢良性肿瘤和正常卵巢组织中的表达水平,来探讨LZTS2及Cyc
癌症已成为危害人类健康的重要疾病之一,据统计中国每年新发恶性肿瘤病例约300多万例,死亡病例200多万例。为了开发新的抗肿瘤药物,2009年,Gupta等通过高通量筛选发现盐霉素
文本匹配是自然语言处理领域的关键问题。很多自然语言处理任务,如信息检索、机器翻译和对话系统等,都可以在不同程度上归结为文本匹配问题。所以文本匹配模型的进步,对自然
智能车辆作为一个集众多高新技术的复杂系统,是智能交通系统不可或缺的一部分。智能车不但可以应用于目前复杂交通路况,缓解交通拥堵并减少交通事故,而且因其机械化力量能够
知识经济时代,知识是经济高速增长起着至关重要的作用,是现代化企业的一种重要的战略资源、核心竞争力。因此,如何将依附于个体的知识纳入组织、让个体积极参与知识分享以实
液滴撞击固体壁面的现象普遍存在于自然界中,并且在航空航天、生物医学、电子制造等各个工业领域都有广泛的应用。目前在材料制膜领域普遍采用的旋涂方法,实际上就与液滴撞击
随着计算机和网络技术的不断深入发展,如今的互联网已经迈进了社交媒体时代。以微博为代表的新型网络媒体包含了大量关于新闻时事、政策法规、消费产品等话题的情感文本,反映
近年来,伴随互联网技术的不断发展和无线网络逐渐完善,导致移动设备的数目在不断增加,而用户规模的增大和需求的多样化对目前已有的网络提出了更高的性能需求。因此,设计出一种适应当前蜂窝移动网络的TCP拥塞控制算法,并在蜂窝移动网络中能够取得很好的效果就显得尤为重要。本文首先介绍了目前蜂窝移动网络中拥塞控制算法的研究现状。之后,对现有的拥塞控制算法根据其本身的特点进行了分类。本文选取了不同类别中的典型方案
天然岩体经过漫长的地质作用和工程扰动,内部普遍发育大量裂隙。完整的岩块透水性能相较于裂隙可忽略不计,因此岩体的渗透特性主要受裂隙的影响,而裂隙网络渗透特性则取决于
在我国社会终端能耗的构成中,建筑能耗占地区城镇总能耗的33%以上,因此为了实现节约型社会的目标,降低建筑物能耗是十分重要的。能耗历史数据的分析是实现建筑物节能的一个重