分布式平台下自适应的快速图像检索

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:anyjz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的兴起、新兴媒体的普及,各种拍照、摄像设备的爆炸式增长,人们将各种图像分享到社交媒体上,在线图像的数量巨幅增长。如何在这些数量庞大、内容丰富的图像数据中检索出相似图像,一直是图像领域研究的热点问题。图像的特征选择和检索的效率是图像检索研究者们关心的重点问题。选取合适的图像特征对图像检索的性能很重要。卷积神经网络(Convolutional Neural Networks,CNN)由更复杂的网络构成,与传统特征提取方法相比具有更强大的特征表达能力。同时,分布式计算平台Hadoop具有良好的稳定性、安全性、扩展性等特点,可以加速图像检索的效率。使用卷积神经网络提取的隐藏层输出,作为图像深度特征进行图像检索,并且借助于Hadoop的强大计算能力进行图像检索任务,加速图像检索。本文的主要工作内容有:(1)使用预训练的AlexNet网络模型,提取图像的深度特征。使用单层深度特征、多层网络层特征合并的方式进行图像检索任务。之后与基于传统手工特征的图像检索方法进行对比,最终选择FC6层特征进行图像特征索引的构建。(2)为了解决检索任务中深度特征维度过高,给图像检索带来的检索时间长、检索任务计算量大的难题,本文提出一种自适应的索引构建方法。使用深度特征构建索引并保存在HBase中,该方法可以提高图像检索的效率。(3)在分布式平台Hadoop上实现图像检索任务。根据图像特征构建特征索引,通过特征索引完成图像检索任务。实验表明使用Hadoop平台在大型数据集上进行图像检索任务可以有效提升图像检索效率。本文实验在四个公开的数据集Holiday数据集、UKbench数据集、Oxford Building数据集、MIRFlickr1M数据集上进行相关实验,包括提取图像特征、构建索引、图像检索。实验表明,通过建立图像特征索引和使用分布式平台Hadoop,图像检索任务的效率和准确率有所提升。
其他文献
目的:本文通过从不同角度对二陈汤类方的方证规律进行研究探讨,以期在整理归纳前人应用二陈汤类方经验的基础上,更好地继承与发展其理论与应用,掌握理解其内在的涵义,从而指
目的:探讨一针法胰肠吻合、连续板层胰肠吻合及陈氏胰肠吻合在腹腔镜胰十二指肠切除术(LPD)中的临床应用效果。方法:回顾性分析2017年9月至2019年3月在我院实施LPD的135例患
随着计算机软件系统规模的不断扩大和复杂性的逐渐增加,验证软件系统正确性和可靠性的难度也越来越大,传统的验证技术已经无法满足需求。运行时验证是一种提高软件系统正确性和可靠性的轻量级验证技术,是传统验证技术的有效补充,它通过监控软件系统的实际运行状态来验证软件系统是否正确。然而,在运行时验证中,监控软件系统的运行状态通常会产生一些额外的运行时开销,这会对软件系统的性能造成一定的影响。因此,减少运行时验
[目 的]1)了解我国狂犬病的分布概况,深入分析我国国家监测点狂犬病病例的暴露史、暴露后处置(PEP,Post-exposure Prophylactic)史、潜伏期等特征,探索我国狂犬病病例发病的
脊髓损伤(Spinal cord injury,SCI)是由炎症、感染、外伤等引起的脊髓功能丧失,临床主要表现为运动感觉功能障碍、尿便障碍、神经痛等。脊髓损伤的发生率不高,却具有高致残率
深度学习通过多层特征提取方式,可以将原始复杂数据自动表征为高级抽象特征,该方法具有很强的建模能力,在模式识别、语音识别、自动驾驶、人机对弈、计算机视觉、自然语言处
随着信息爆炸式增长,计算机需要处理的信息越来越多,但是硅芯片的技术难以支撑日益增大的计算量,导致计算机领域遇到发展瓶颈。为了解决这一问题,科学家提出了生物计算机概念。随着生物计算机研究的逐渐深入,人们发现DNA的并行计算能力,纳米分子结构,超高的存储能力等特点在突破计算机发展瓶颈上有很大的优势。生物分子逻辑运算(如DNA计算或DNA编程诊断)也因此受到了广泛关注。目前生物分子逻辑运算模型大多通过荧
春秋战国时期,百家争鸣为君主寻求济世安民之道,他们各自为营,产生了儒、法、道等政治思想学说,围绕时政展开激烈的讨论。直到战国末期,政治、制度开始趋于统一,百家在争鸣的
在现实世界的管理与工程领域,存在着诸多多目标优化问题。一个多目标优化问题通常存在多个而不是单个最优解。而基于群体的进化算法(evolutionary algorithms,EAs)在一次运行中就可以同时搜索到这多个最优解。虽然大多数已存在的多目标进化算法(MOEAs)都是基于帕累托占优的算法,近些年提出的一些基于分解的多目标进化算法表现得越来越成功和流行。尤其是一种采用锥形分解方法的锥面积进化算法
Linux系统中存在的安全隐患绝大部分都由内核引发,而设备驱动程序在内核中占据重要地位,因此设备驱动程序涉及到的安全漏洞问题极有可能造成整个操作系统的瘫痪。由于驱动程