【摘 要】
:
细粒度图像检索任务主要分为细粒度图像识别子任务和图像检索子任务,它在生物多样性监测、气候变化评估、智能零售、智能交通等领域都起着必不可少的关键作用。与粗粒度的图像不同,细粒度图像通常属于同一大类下的不同子类,不同类之间在外观上有着相似性,而相同类之间在姿态上千变万化,所以细粒度图像具有类间距离小、类内距离大的特点。这增加了细粒度图像分析的难度。为了解决目前存在的问题,本文对细粒度图像分析进行了系统
论文部分内容阅读
细粒度图像检索任务主要分为细粒度图像识别子任务和图像检索子任务,它在生物多样性监测、气候变化评估、智能零售、智能交通等领域都起着必不可少的关键作用。与粗粒度的图像不同,细粒度图像通常属于同一大类下的不同子类,不同类之间在外观上有着相似性,而相同类之间在姿态上千变万化,所以细粒度图像具有类间距离小、类内距离大的特点。这增加了细粒度图像分析的难度。为了解决目前存在的问题,本文对细粒度图像分析进行了系统的研究并提出了一系列的解决方案。具体的研究内容和创新点如下:首先,本文提出了一个轻量级的细粒度图像识别算法。过去的细粒度识别算法为了追求高精度,使用了有效但复杂的特征提取网络。然而,大型网络很难移植到移动端或嵌入式设备上。所以,本文用轻量级的Pelee Net取代了常用的Res Net作为特征提取网络,大大缩小了模型大小。但轻量级网络缺乏强大的特征表示能力,所以本文又创新性地提出了跨层多尺度的Non-Local模块,以捕捉不同尺度的特征及其之间的关联。接着,本文提出了基于深度哈希的细粒度图像检索算法。检索任务不仅要求精度高,还要求速度快、存储低。此时,将高维数据转换为低维编码的哈希算法就展现了它的优势。哈希算法在保留原始数据之间相似性的同时,以更少的计算量完成近似近邻搜索。所以,本文在之前提出的轻量级细粒度图像识别网络中加入哈希编码层,以完成检索任务。并探究了在细粒度图像检索任务中将哈希层前置的可解释性原理。其次,本文针对深度哈希网络难以进行离散优化提出了一系列的改进策略:一是利用连续松弛策略进行优化;二是在损失函数中添加了量化约束和位平衡约束,用来生成量化误差小、包含更多特征信息的优质哈希码。最后,本文在三个经典的数据集上做了广泛的实验以验证各项工作的有效性。实验结果表明,本文方法与最先进的方法相当,甚至在一些实验中超越了最先进的方法。
其他文献
郫县豆瓣作为川味中必不可少的辣味调味品,以其香辣醇厚的口感享誉中外,香味物质和呈味物质决定了它独特的风味。其营养与安全问题一直以来都是人们关注和研究的热点问题,重金属元素在食物链关系中富集达到一定浓度会损害人体健康,而目前关于郫县豆瓣中金属元素含量、发酵过程中呈味物质与活性物质变化及差异的研究较少。基于以上问题,本文以工厂和家庭郫县豆瓣为研究对象,对其矿质元素和重金属污染情况进行分析并提出摄入建议
多光谱图像由光谱成像仪用多个不同波段对同一地物反射而成,相较于可见光图像与二维图像,其不仅包含了地物的空间信息,同时也包含了丰富的谱间信息,能更详细地反映地物特征。同时由于多波段特点也使得多光谱图像的数据量剧增,给多光谱图像的传输、存储带来了极大挑战,因此,为有效利用多光谱图像、促进其应用,研究多光谱图像压缩具有非常重要的现实意义。随着深度学习相关技术的发展,深度学习逐渐应用在各个领域。因此,针对
近年来,许多研究者致力于多视图数据的分析与挖掘,其中一个重要的方向是针对多视图场景的异常检测。现有的多视图异常检测算法能够识别三种类型的异常,即属性异常,类异常和类-属性异常,且均只针对对齐场景。除对齐多视图场景外,现实生活中还存在着更具挑战性的非对齐多视图场景,其非对齐特性使传统多视图异常检测算法不再适用。同时,无监督异常检测方法因其在缺乏标记数据场景下的实用性而备受关注。其中,单类分类范式成为
民航飞行器的表面摩擦阻力约占巡航条件下飞行总阻力的一半,过大的表面摩擦阻力会增加飞行器的燃油消耗量,造成飞行器运行成本过高,并会加重环境污染。研究发现,利用流动控制技术可以有效降低飞行器的表面摩擦阻力,改善表面流动,减少燃油消耗并获得更高的经济效益。而多孔介质作为一种简单的、有效的被动控制方法成为了近年来的一个研究热点。本文通过在不同压力梯度流动条件下开展实验,验证了多孔介质减阻效果的有效性并结合
随着我国航天事业的蓬勃发展,空间维修技术已经成为了航天科技领域的一个研究重点。空间机械臂作为空间维修任务的主要执行机构,具有高精度、自主性以及大负载自重比等特点。针对空间维修的需求,本文在现有理论基础上对机械臂系统设计、动力学建模以及控制等问题展开深入的分析与研究。首先,对空间维修任务需求进行分析。根据任务需求设定了机械臂性能指标,进而确定了机械臂构型以及关节设计方案,并介绍了机械臂建模的理论基础
无人机凭借其组网灵活、移动性强、低成本等特点受到广泛关注,可应用于农业植保、巡检安防、遥感测绘等多种场景。另外为了应对未来新型业务场景和数据流量规模的爆炸式增长,毫米波通信的研发进入快速发展阶段。当前毫米波通信广泛采用大规模阵列天线生成窄波束,达到集中信号能量、克服传输损耗、提高频谱效率的目的。由于无人机和用户之间的相对运动使收发端之间的窄波束极易失配,因此需要对波束进行实时搜索、匹配和跟踪,这对
磁流体电推进技术无污染、比冲大、加速效率高,在高超声速风洞、跨大气层飞行器、轨道转移发动机和深空探测飞行器等方面的应用潜力巨大,是最被人们看好的新型推进技术之一。但由于耦合了电场、磁场和流场的关系,仍然存在复合机理不够明确、感生磁场干扰、成本高昂等问题。因此,作为这一技术的承载体,对磁流体加速器进行更加深入和系统化的研究是非常有必要的。为了研究磁场强度、外加电势、电导率、磁场分布和霍尔效应对加速器
全球科技创新活动空前激烈,新一轮信息技术革命和产业变革正在重塑全球经济结构和创新格局。新一代信息技术产业作为国家战略性新兴产业的重要支撑部分,其特点是技术迭代快、渗透性广、联动效应强。新一代信息技术产业的发展有助于提高我国科技创新实力,培育新的经济增长点,促进传统产业转型升级和经济高质量发展。近年来,我国加快推进产业结构转型升级,重点发展战略性新兴产业,努力增强科技创新能力,打造现代产业集群示范基
近年来,学习符号社交网络的表示进行符号预测任务已引起越来越多的关注。大部分现有工作多是针对无符号网络设计,但是由于不同符号链接性质的相对,这些模型不能直接应用到符号网络上。而符号社交网络处理领域一个具有挑战性的问题是在给定的符号标签极度不平衡的网络数据集中如何更好地学习与正链接性质相对的负链接信息。解决该挑战的现有工作按照使用的基本方法可以分类为谱聚类、低秩逼近、随机游走和神经网络。但是,基于谱聚
随着多媒体信息技术的发展,图像已成为人们获取各种类型的有效信息的主要途径之一,图像中所包含的信息可能涉及各种类型的秘密信息或个人隐私信息。因此,如何有效保护图像的安全,尤其是军事、医疗等特殊领域的图像的安全,是我们必须关注的问题。对经典图像安全的保护方式主要有图像加密技术。但是随着量子技术的快速发展,目前在经典计算机上安全的图像加密算法在量子计算机的威胁下可能将不再安全。所以,本文着力于利用量子技