面向少数民族服装的图像解析及检索方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:zi198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国少数民族种类繁多,少数民族服装各式各样,服装视觉风格各异,能够将服装图像解析和检索与民族服装文化相结合,对实现少数民族服装图像数字化保护以及民族文化传承起着重要的作用。因此,本文针对缺少民族服装语义标签、局部特征繁杂等因素导致少数民族服装图像解析和检索准确率低的问题,结合视觉风格和标签约束对少数民族服装图像进行解析,对解析结果进行多任务的深度监督哈希映射实现民族服装检索,该方法能够有效提高少数民族服装图像解析和检索的准确率。首先,由于缺少完整的少数民族服装图像数据集,本文构建了一个包含55个中国少数民族的服装图像数据集,数据集中包含部分民族分支的服装图像。现有的语义标签只用于通用时尚服装,缺乏能够区分不同民族服装的语义标签,本文按照少数民族服装的基本款式结构、着装区域和配饰,定义少数民族服装的通用语义标签和民族语义标签,同时设置4组标注对,共8个标注点。其次,针对少数民族服装视觉风格各异,且少数民族服装视觉风格具有特殊性和多样性。本文构建划分少数民族服装视觉风格的概率模型,对少数民族服装图像进行视觉风格分析,最终将少数民族服装图像划分为7种民族风格,并进一步按照风格优化自定义的语义标签,解决了少数民族服装语义标签繁多的问题,能够提高后续解析的精度和准确率。然后,针对少数民族服装图像色块差异大且纹理图案等局部细节导致解析准确率低。本文结合优化后的语义标签和带有标注对的训练图像,在深度完全卷积神经网络Seg Net中加入视觉风格以融合局部特征和全局特征,并引入属性预测、风格预测和三元组损失函数对输入的待解析图像进行初步解析;通过构建的标签约束网络进一步优化初步解析结果,避免标签相互干扰,得到最终的解析结果。最后,单任务模型难以学习民族服装多样的款式,因此本文采用多任务的深度监督哈希算法学习解析结果中得到的不同服装款式,将其映射为二进制哈希码,优化损失函数,通过相似度计算实现少数民族服装图像检索。实验结果表明,该方法能够准确地实现少数民族服装图像检索。
其他文献
随着信息技术的发展以及知识经济的到来,使得知识已经逐渐成为科技创新的战略资源,传统信息服务正趋向发展为智能的个性化知识服务。同时当前科学研究进入第四范式,使得科学研究活动成为一项知识密集型的复杂工程,科研人员作为科研活动的主体,更需要大量科研知识的支撑其进行科研创新。在科学研究过程中,科研人员的自身特征、所处的科研阶段、针对的科研对象以及执行的科研任务的不同,导致科研人员对知识的需求也有一定差异,
碳基纳米材料来源与储量广泛、电学性能良好、载流子迁移率高、柔性且质轻,广泛应用于化学和生物传感器、柔性基底集成电路、高性能锂硫电池及催化与环境保护领域。目前常见的碳基纳米材料制备方法主要是化学气相沉积法(Chemical Vapor Deposition,CVD)。相较于传统CVD,微波等离子体化学气相沉积(Microwave Plasma Chemical Vapor Deposition,MP
近年来,随着多Agent技术及分布式人工智能的不断发展,对Agent具有自主决策能力的要求也越来越高,将多Agent技术应用于处理分布式结构下复杂问题的决策成为了一个重要研究方向。多Agent系统(Multi-Agent Systems)的运行环境日益趋于大型、开放、动态和不确定,这时就需要应用各种智能技术来构建具有自适应能力的Agent。在MAS中,Agent间通过何种方式完成单个Agent难以
随着当前互联网行业的快速发展,计算机软件系统作为一种具有极高工作效率的新兴生产力工具,已经渗透到各行各业。软件测试是一个或一系列过程,用来确认软件中存在的错误,以确保软件质量。而随机测试(Random Testing,RT)是一种黑盒测试技术,被广泛应用于软件测试领域,它从输入域随机地选择候选测试数据,来检测相关程序的特定功能。作为随机测试的重要部分,随机生成测试数据在降低成本的同时,还可以提高错
新加坡国际商事法庭的建立旨在为新加坡在该地区建成一个中立和具有影响力的争端解决中心,新加坡国际商事法庭在其建成后一年受理了第一起案件之后又受理了其他的国际商事案件,其国际商事法庭管辖权制度经历了实践的检验,充分体现了新加坡国际商事法庭的管辖权制度是具有优势的,吸引各国纷纷将其国际商事纠纷提交至其国际商事法庭管辖。管辖权范围的设定决定了一国国际商事法庭可以对哪些案件进行管辖,如果一国国际商事法庭的管辖权范围设置得当,将对世界范围内的国际商事案件具有极大的吸引力。本文旨在对新
现有的全球定位系统(GPS)仅能够提供道路级别的定位信息,而详细的车道级别道路信息是通向未来无人汽车技术的重要基础。在已有的研究中,车道级别的定位系统大多使用了昂贵的专用设备,如激光雷达等,不利于系统的普及。近年来,利用图像识别技术进行车道定位的方法开始出现,通过在车辆前方加装摄像头对图像进行分析,寻找出车道的位置。但这种方法容易受到其他因素的影响,如光照不足、道路老化、道路标识模糊等等。因此,设
显著性目标检测是指检测图像中最显眼的区域,并生成显著图,从而帮助人们快速有效获取有用信息。图像经过显著性检测处理,一方面能减少冗余数据的处理,节省存储空间,提高计算效率,降低时间成本;另一方面这些经过处理的区域和具体对象可以代表一类场景,使计算机学习到复杂的场景理解问题。现阶段多数显著性检测方法利用的是神经网络,经过卷积操作提取图像特征。然而大量的卷积和池化操作,会使图像的底层、细节等特征丢失,造
为了探讨基于高光谱图像技术快速、准确、稳定的大米产地确证方法,在吉林省不同水稻产区采集990个大米样本作为研究对象,利用高光谱成像系统获取4001000nm波段范围的高光谱图像,提取10pixel×10pixel感兴趣区域内平均光谱反射信息作为样本数据。为了减少噪声等干扰信息的影响,采用标准正态变换(standard normal Z transformation,SNV)、卷积平滑(Savitz
语言是音义结合的符号系统,语音、语义和语法是语言的重要组成部分,都是语言研究的对象。形容词是词的一个重要类型,从语义关系上来看,形容词中有不少的同义词,这些词语义上既有同义特征,也有异义特征,这些性质特征很值得深入研究。本文以语义关系为视角,在前人研究的基础上,运用语义、语法、语用和接触等语言学的理论和方法来分析讨论壮语同义形容词的类型、性质、特征和形成等问题。通过分析,论文对壮语同义形容词的类型
5-氟尿嘧啶(5-FU)是临床常用的抗肿瘤药物之一,但由于其毒副作用大、在体内代谢较快、半衰期较短而限制了临床上的应用。基于纳米粒子的药物递送体系作为一种新型给药体系,由于其靶向递送、环境响应释放、体内外成像等优点而成为研究热点。目的:本研究以具有中空结构、氮磷双掺杂的碳点作为纳米载体,5-FU为模型药物,设计并制备出一种pH响应性纳米给药体系,旨在提高5-FU的抗肿瘤活性,为5-FU新剂型的开发