基于深度残差网络的博物馆文物图像检索方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:liuln6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术在多媒体领域的快速发展及应用,文物图像的数量越来越多,这些也成为智慧博物馆建设的重要数据资源。但是目前在博物馆的调研过程中发现,这些图像数据并未被高效地利用起来,尤其是在图像检索方面仍停留于原始的人工标注阶段,依赖基础的文本信息进行检索。当图像质量较差或规模庞大时,人工标注工作的效果往往就显得捉襟见肘,信息标注的质量层次不齐,仅依赖文本特征词得到的图像检索结果也较差。因此,针对上述问题,本文提出一种基于深度残差网络的博物馆文物图像检索方法。本文的主要工作如下:(1)图像数据方面,通过网络爬虫等手段获取基础文物信息,整理归类后自建文物图像数据库,共包括青铜器、陶器、瓷器3个大类11个小类,每个大类400种文物,每张文物4张图像左右,共计4780张图像,得到原始数据集。(2)图像预处理方面,针对文物图像背景对特征提取存在干扰的问题,提出一种改进Deep Lab v3+网络的背景分割模型。采用深度可分离卷积操作替代原有模型编码过程中的普通卷积操作,同时在解码阶段使用3层3×3深度可分离卷积进行通道分离,增强图像的深度信息获取。通过实验,本改进方法分割结果光滑清晰,且平均分割耗时较低。在应用于当前的自建文物图像数据库进行实验时,该方法相较于Grab Cut模型平均耗时减少4.7s,相较于Deep Lab v3+模型平均耗时降低0.76s。(3)图像检索方面,针对文物图像特征提取单一,相似度检索效果差的问题,提出一种基于Res Net50改进的深度残差网络模型。在残差网络的结构中,整体池化采用最大值池化方法,构造基准网络Res Net50-IBN-a的残差块。此外去除第一个最大值池化层,在具体的残差模块1×1卷积核进行下采样工作前新增一层2×2的平均池化层,进一步降低残差网络模型的复杂度。本改进模型与经典深度学习检索模型进行对比,收敛速度较快,特别地,相较于Res Net50检索准确率提高2.6个百分点左右。(4)设计并开发了一种基于残差网络的文物图像检索系统,包括文物概览、用户管理、图像管理、图像检索及归类四个模块。本文针对博物馆现有系统进行图像处理时所遇到的难题入手,采用改进的算法增强图像检索精度,实现更好的数据管理。
其他文献
高考志愿填报是高考中的重要环节,对考生和家长而言意义深远。然而面对复杂多样的院校和专业信息,考生和家长很难在短时间内做出最符合自身需求的选择。个性化推荐能够根据用户特征和偏好推荐感兴趣的信息,已经在在线教育、专家筛选等教学科研领域得到成功的应用。针对高考志愿填报,本文进行了个性化高考志愿推荐系统研究,结合个人工作内容和多年从事高考招录工作的工作经验,构造高考志愿推荐文本,利用改进的卷积神经网络对文
学位
随着互联网技术的快速发展,众多电子商务平台服务业和社交平台从萌芽走向成熟。目前许多平台都提供了评论功能,购买商品或体验过服务的消费者都可以对商品或服务进行评论,这些评论表现了消费者们对于消费品或服务不同方面的客观评价。然而,用户却难以通过大量的评论来准确的找到自己所真正需要的信息,因此需要对评论数据进行更为细致的信息挖掘。本文使用潜在方面评分分析,简称LARA算法进行评论文本分析,LARA算法能够
学位
个人信用评估是当前金融科技中的热点课题之一。在当今智能时代,随着大数据、人工智能、移动互联等数字技术快速发展,金融与信息技术深度融合,现代金融科技不断进步,大数据背景下互联网信贷交易场景逐渐复杂。在互联网消费金融场景下,完善现代征信体系成为亟待解决的问题。近十年,随着互联网分期消费业务的快速发展,网络分期交易已是互联网电商活动中主流支付方式之一。与此同时,互联网个人信用体系的缺失和个人信用评价体系
学位
大脑是人体最复杂最精妙的器官,负责处理各种外界信息并做出正确反映。大脑中数以百亿计的神经元相互连接,构成了人类认知和行为模式的多样性。智力是人类得以创造文明的重要因素,也是个体不断成长进步的内驱力,因此各界研究者对智力的研究一直如火如荼。智力包罗万象,逻辑推理、思辨、记忆、解决问题的能力都统归于智力,但其抽象且不可直接测量的特点也是研究上的一大难点。非侵入的磁共振成像技术是探寻大脑活动和其神经机制
学位
非公有制经济作为我国市场经济中的关键一环,其地位的重要性毋庸置疑,因此我们要毫不动摇的坚持、巩固和发展。在非公有制经济中,家族企业始终起着重要的作用、扮演着关键的角色,家族企业的良好发展对带动人民充分就业、巩固我国经济社会的和谐与稳定意义非凡。但是在经济市场中,家族企业与广大中小微企业的处境类似:“融资难”问题使得企业难以获得充足的资金,进而难以实现扩大化经营与多元化发展。很大一部分原因源自于社会
学位
肺结节的早期诊断能够有效辅助医师进行肺癌前期的判别,对于预防肺癌的发生具有重要意义。临床中医师主要通过CT图像对肺结节症状进行判定。然而面对数量呈现出爆炸式增长的肺部CT图像,医师需要耗费大量时间判别才能满足临床需要,由于医师对图像认知不同,在具体判别过程中也可能存在误诊和漏诊的情况。医学图像检索技术可以从大量已有确诊病例中检索出与当前图像病理特征最相似的CT图像辅助医师进行判别和诊断,减轻医师工
学位
近年来,科学论文出版物的数量呈现快速增长趋势,如何有效地评估一篇科学文献的学术价值或学术影响力成为了热门话题。论文被引量是常用于衡量学术论文影响力的方法之一,它反映了论文对学术界的影响,引用成为对同行工作的一种肯定。因此,许多学者将目光聚焦于对论文被引量建模,并展开预测,取得了较好的效果。但目前已有的文献中,大部分学者主要利用的都是论文或作者本身的特征,仅一小部分学者考虑到了一类非常重要的因素——
学位
随着油气勘探程度的不断加深,低阻油层逐渐受到重视。近年来,鄂尔多斯盆地不断有低阻油藏发现,由于低阻油层成因复杂,测井响应特征多变,导致低阻油层判别困难,进而降低了整体的勘探开发效益,因此对低阻油层的成因研究及识别方法开展系统研究至关重要。本论文以鄂尔多斯盆地志丹洛河油区长6油层组为研究对象,结合地质背景,基于录、测井资料及常规物性、岩石薄片、扫描电镜、压汞、相渗、核磁共振及润湿性等岩心实验分析结果
学位
当下我国金融风险总体处于可控状态,但经济发展仍面临下行压力,各类突发事件导致的衍生风险将不可避免地传导至银行业。为防止商业银行不良贷款率出现反弹,对商业银行开展信用风险压力测试就显得尤为必要。本文以商业银行不良贷款率为承压指标,以GDP同比增速、CPI、M2同比增速等不同层面的宏观经济变量作为压力因子,构建压力传导模型,开展了关于信用风险的宏观压力测试研究。在压力传导模型的建立上,本文选用了带时变
学位
为了厘清鄂尔多斯盆地西部与南部长6-长4+5期沉积物源演化,从而为下一步油气勘探部署提供依据,利用碎屑锆石U-Pb测年方法,对定边和下寺湾地区延长组长6、长4+5油层组物源进行分析,结果表明:定边长6油层组、下寺湾长6油层组和长4+5油层组的样品年龄结构均为2700~2200Ma、2100~1600Ma和392~205Ma,其峰值年龄在2500Ma、1850Ma和250Ma左右,定边长4+5油层组
学位