面向民族服饰的细粒度图像检索关键技术研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:LXL66798
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的快速发展,服装市场的潜在价值也在逐步显现,针对服饰检索、服饰识别和服饰推荐等计算机视觉领域的研究出现一系列研究任务。我国有55个少数民族,民族服饰种类繁多,服装结构复杂,语义属性丰富,能够将服饰图像检索技术与民族服饰文化相结合,对民族服饰实现数字化,这对传统民族文化保护具有重要意义。民族服饰图像具有不同民族风格的服装款式、配饰和图案导致的民族服饰图像细粒度检索准确率较低的问题,本文提出面向民族服饰图像的全局-局部特征提取模型用于民族服饰图像细粒度检索,该模型能够较为准确的提取民族服饰图像的全局和局部特征,并且使用融合特征计算服饰图像之间的相似性,用重排序对排序结果进行优化,使用该方法完成对民族服饰图像细粒度检索,能够有效提高民族服饰图像细粒度检索准确率。首先,民族服装款式种类繁多、配饰和图案复杂,具有较多细粒度语义属性,且缺少公开标注的民族服饰图像数据集,本文在已有的民族服饰图像数据集的基础上,在本文实验需求的基础上对数据集进行筛选和扩充,根据对各个民族服饰图像细粒度属性所在区域进行归纳,自定义了民族服饰图像的细粒度语义属性;然后,使用标注好的图像训练检测模型,对检测结果进行分割,按照分类结果输入不同的特征提取分支,不同特征提取分支定义不同损失函数对输入图像提取全局和局部特征,解决了民族服饰细粒度属性繁多,以及服饰图像遮挡、变形等问题,准确提取了输入图像的全局和局部特征,能够提高后续检索的准确率。然后,针对民族服饰图像检索准确率较低的问题,本文提出结合融合特征和重排序的民族服饰细粒度图像检索方法。首先,使用提取到的全局特征与输入图像的全局特征进行相似性度量,根据全局特征的相似性得分进行初步排序,再使用排序结果Top-50的局部特征与输入图像局部特征进行相似性度量,最后,使用全局特征的相似性结果加权计算进行重排序,优化排序并输出最后的检索结果。实验结果表明,该方法能够准确的对民族服饰图像细粒度检索。最后,在前两部分研究方法的基础上,结合民族服饰图像细粒度检索的应用场景和用户需求,设计了基于民族服饰图像细粒度检索的系统框架,并实现了基于民族服饰图像的原型系统。该系统界面简洁,功能齐全,检索结果准确,能够较好的体现本文方法的有效性和实用性。
其他文献
古代石刻文献在我国历史文化研究中向来都是一项不可或缺的研究内容,具有重要的史料价值,但由于自然环境的侵蚀或是人为破坏,石刻文献的表面出现了若干大小不一、分布不均、形状多变的干扰区域,这不仅影响了人们的观感需求,而且对历史研究造成阻碍。信息化时代的来临,可将重要的石刻文献进行数字化储存以延长文物保存时间,也可通过网络共享的方式对石刻文献进行二次传播,打破时间地点的限制,增加古代历史文化的受众面,使用
芒果表皮缺陷检测是实现芒果的智能化采摘、果实质量分级的重要前提。基于卷积神经网络的计算机视觉技术为缺陷检测提供了可行有效的方法,是目前最为主流的检测方式。在自然环境下,光照的强弱、背景的复杂、果实枝叶茎干的相互遮挡等制约因素下,给芒果表皮缺陷的检测带来了巨大的挑战。采用深度卷积神经网络,可以提取更多的特征,具有更加实时精准的识别效果。因此,本研究采用基于语义分割、实例分割的方法研究自然环境下芒果表
图像融合的目标是将来自同一场景的多幅源图像的互补信息进行融合,生成高质量合成图像。红外图像反映的是目标在红外热辐射下的能量分布,不易受风沙烟雾等复杂条件影响,但其可视性并不是很理想,特别是物体纹理细节信息表现较差。可见光图像主要与目标场景的光反射有关,物体辨识度高,但容易受到外部环境的影响,特别是被遮挡时就无法准确地捕捉目标特征信息。所以,红外与可见光图像融合能够综合两种成像的优势,通过结合二者的
钢水碳含量终点预测作为转炉炼钢重要的一环,准确的预测将直接关系到炼钢效率,有利于减少能源和原材料浪费。由于熔池内不同比例的钢水碳含量能够反映在炉口火焰颜色、纹理形态等信息的变化上,因此采用炉口火焰图像特征提取的终点碳含量预测方法为传统预测提供一种新的参考,但火焰作为一种复杂变化的非结构对象,具有较强的随机性和相似性,给特征提取带来不小的困难,进而影响到终点预测的准确性。针对上述问题,本文将从钢水碳
转炉炼钢生产过程中,终点碳温的准确预报是钢铁产业至关重要的一环,而碳含量的准确预报对于提高钢铁冶炼工艺具有重要的意义。本文针对转炉终点炉口火焰图像相似性高,传统特征方法难以提取区分碳含量相近的火焰图像的关键特征,从炉口火焰图像的颜色特征和纹理特征提取入手开展研究,为提高基于炉口火焰图像特征提取的转炉炼钢终点碳含量预测准确率打下基础。本文的主要研究内容如下:(1)采用基于卷积神经网络火焰特征提取的终
行人重识别是一种利用计算机技术判断摄像机收集的视频或图像中是否存在特定行人的技术,可以自动地对多个不交叉摄像机捕捉的行人图像进行匹配,因而在智能监控系统中发挥着显著作用。但现有的大多数行人重识别方法是在单个有标记数据集上进行训练和测试的,如果在源数据集上训练的模型直接应用到目标数据集上会产生因行人图像风格差异等因素引起的域偏移问题,从而导致最终的识别精度很低。现实场景中已标记的行人样本是极度缺乏的
在当今信息时代的背景和进程下,作为信息技术载体和媒介的印刷电路板(Printed Circuit Board,PCB),从我们日常生活中经常接触和使用的手机、电脑等各类电子产品,到军事中的飞机、卫星等领域都有着广泛的应用。由于工业生产中对PCB更高的要求加之现在的电子产品高度的集成化,PCB板的生产更加细化、走线结构更加复杂,从而导致PCB板带有缺陷的概率大大提升。PCB板必须保证线路连接、线距以
纤维结构是存在于太阳色球层中的一种呈现出喷射状态的线性拉长结构,研究色球纤维的动力学特征能够帮助人们对太阳大气质量平衡以及针状体的演变过程进行更进一步的研究。进行纤维结构动力学特征的研究的前提是对太阳色球纤维进行准确的识别和提取,因此选择一种高效准确的识别方法是当前人们的关注重点。在进行色球纤维识别前,我们首先对纤维图像的特点进行了分析研究,发现当前纤维识别的难点以及存在的问题仍然有许多。因为在色
预测和推理未来结果的能力是智能决策系统的关键组成部分。近些年,以深度学习为代表的机器学习预测算法取得迅猛发展,广泛应用于天气预报、自然灾害预警、疾病诊断等领域。然而,在太阳光球磁场演化研究方面,由于缺乏完备的数据集和全面的评价标准,以及演化过程中存在磁结构运动、形变、浮现、消失等多种复杂变化交织的问题,使得直接在时间和空间上预测磁场的演化过程具有较大挑战,所以目前尚无对太阳磁场的演化过程进行预测研
随着我国网络技术普及度的加深,网络社交媒体中产生了海量的带有情感色彩的文本数据。研究者们根据情感表达中是否含有情感词,将其分为显式情感表达和隐式情感表达,由于我国网民更倾向于通过含蓄的方式来表达情感,所以中文的隐式情感表达数量非常庞大。对这些海量的隐式情感表达进行分析,是情感分析研究中不可或缺的重要部分,在舆情分析、升用户体验以及改进服务和产品质量方面,具有广泛应用场景和重要研究意义。本文对源自社