基于深度神经网络的图像颜色词汇自动识别方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:jindere
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类颜色视觉是一种主观知觉,不同个体可能存在色觉差异。虽然存在个体色觉差异,但并不阻碍人们通过颜色词汇进行颜色相关的沟通交流。目前在计算机显示器上颜色显示的控制、彩色图像的存储等领域,主要使用RGB值或CIE色度坐标值来完成。但是RGB值对应的颜色是与显示设备高度相关的,相同的RGB值在不同的显示设备上会呈现出不同的颜色。即使物理上完全相同的色块(具有完全相同的CIE色度坐标值),在不同的空间上下文中也会具有不同的色觉感知。例如在颜色错觉图像中,物理上完全相同的两个色块,色觉感知可能不同。针对上述问题,同时考虑到日常生活中都是用颜色词汇进行沟通交流,本文首先通过视觉心理物理学实验建立一个基于人类主观颜色视觉感知获得的颜色标签数据集,然后使用此数据集训练深度神经网络,实现自动识别图像对应的11种中文颜色词汇,输出对应的颜色标签。这种基于主观视觉感知的颜色识别方法,在一定程度上避免了其它颜色提取方法具有的感知差异特性。本文构建了多个不同结构的卷积神经网络作为多标签分类器,将训练数据集分为两类,第一类包括色块图片和特定类型的图片,第二类只包括特定类型的图片。通过实验进行以下三种对比:两个网络结构的对比、训练数据集的对比、阈值的对比,从而确定出识别率最佳的颜色词汇识别模型,该模型能够准确识别多种颜色词汇,其评价指标F1-measure在不同测试集都能达到75%以上。并与其他颜色词汇识别方法进行比较,在减少了图像主题分割等预处理步骤的同时,提高了图像颜色识别中的准确率和鲁棒性。本文通过前期颜色词汇数据集的设计和建立得到较高质量的数据集,确保神经网络的训练效果,并通过对比不同深度神经网络模型的网络结构、训练集种类和不同的阈值,保证了颜色词汇识别模型的识别率。本文构建的模型解决了现存颜色提取方法的一些局限性问题,例如提取的颜色值和视觉主观感知存在差异性。由于识别的是颜色词汇,这对基于色彩线索的图像检索技术有一定帮助,并且更利于日常沟通交流中对色彩的描述。
其他文献
纸包装在非碳酸饮料和乳制品中的应用曾经历了一个高速发展期,抢占了大部分玻璃和金属容器的市场份额,但目前却遭遇了PET瓶的有力竞争,增幅逐渐回落,但仍然占举足轻重的地位,
CAx系统是CIMS工程中常见的应用系统,不同系统间的数据共享是实现系统集成要解决的基本问题.本文分析了CISSCAx系统的实现途径,即采用扩展商品化数据库,建立基于STEP标准的工
<正> 食品防腐剂是加工食品中不可缺少的添加剂。过去主要使用化学合成物质,但它对人体健康有不利影响,为此,在业界提倡寻求和使用天然防腐剂。它不但对人体健康无害,有的还
本文从教育要面向现代化入手,侧重谈广职院的教学手段、教学方法、教学管理、师资队伍的现代化变迁及未来发展构想.
本文应用社会及经济效益指标对平凉地区两所医院13年来的社会,经济效益进行了评价。结果表明:两所医院经济效益各项指标逐年增加,但综合评价结果不甚理想,社会效益的质量指标有待
<正>南京玄武湖公园是全国知名的市内综合性公园,它占地472公顷,由五洲与环湖路组成,风景秀美,是欣赏南京山水城林的最佳处。然而长期以来,公园外环长达10公里的环湖路,基本
会议
<正> 一、三大子行业(食品加工业、食品制造业和饮料制造业)供需状况1、供应状况 2003年上半年食品加工业、食品制造业和饮料制造业三大行业规模以上企业共实现工业产值(现价
近年来中国公共卫生危机是结构功能不良型的进程型危机,危及的层面已触及社会的道德底线。传统以政府为主导的单一中心危机管理模式不足以应对危机管理的需要,多中心治理的制
目的:建立人膀胱癌CDDP耐药细胞株T24/CDDP,鉴定其生物学特性,并探讨其对CDDP耐药的机制。方法:采用CDDP浓度逐步递增联合大剂量CDDP冲击方法,在体外连续诱导、培养膀胱癌细
本文介绍了目前长输气管道工程中新增的国产气液联动执行机构在输气站场、阀室的使用情况,分析国产气液联动执行机构的工作原理和目前使用过程中存在的不足和缺陷,针对这些存