基于近似近邻算法的图像检索研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户：typxh123

【摘要】

：

【作者】

：

黄耀

【机构】

：

南昌大学

【出处】

：

南昌大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来,图像尤其是动物图像已经成为网络数据的重要组成部分。从已有的海量数据中有效地检索出动物图像,对于发现动物和保护动物具有重要的意义。由于科学技术的发展,现如今的图像检索普遍是基于内容的,近些年更是将深度神经网络与图像检索结合以获得更准确的检索结果。但是基于深度学习的方式获取的图像特征往往维度很高,而利用这种高维度的图像特征进行检索,在实际应用中往往会带来难以接受的时延问题。基于上述的问题和背景,本文对图像的相似度检索算法做了相关研究。论文完成了以下工作:（1）提出了基于NSSG近邻图结构的改进算法KI-NSSG。本文针对NSSG随机选择起始导航点的问题,提出了算法改进,通过K-means预先划分多个聚类,之后再由这些聚类的中心确定新的导航点集。这种方式会使得导航点在近邻图上的分布更加均匀。算法在检索阶段先用目标点与这些导航点对比,将最近的一个作为起始点再进行检索。上述改进降低了算法时延,提高了算法的可用性。（2）将其他基于近邻图结构的算法HNSW、NSG、NSSG与KI-NSSG进行性能对比实验。实验在四个不同维度的公共数据集:SIFT1M、GIST1M、Crawl、GLo Ve-100上进行,测试了上述算法的查准率、每秒查询数量等指标,并分析了相关算法的表现。实验结果表明了KI-NSSG的可用性。（3）探索KI-NSSG的导航点数量对查询效率的影响并进行实验。将导航点的数量设置为不同的k值,并在上述数据集中进行实验对比,引入NSSG的结果作为参考。实验结果表明,在一定的取值范围内,KI-NSSG算法的检索性能也会随着k值的增大而提高。（4）针对动物图像的检索问题,设计并实现了一个检索系统。系统引入了基于KI-NSSG的图像检索方法。整体采用B/S架构,使用Mysql数据库和文件磁盘存储图像数据,通过静态文件保存图索引,通过Flask+Sqlalchemy框架开发系统后端,前端使用Vue和Element＿ui框架开发,并从索引构建、图像检索等功能模块介绍了系统的实现过程和效果。

其他文献

基于分层集成卷积神经网络的三维手姿态估计

手部作为人类最频繁使用的身体部位之一,对于人机交互具有重要作用。准确的三维手姿态估计成为人机交互领域的关键技术,基于视觉的三维手姿态估计逐渐成为研究热点。目前,大部分的三维手姿态估计都是基于深度图像,但该类图像需要专门的深度相机采集,不易获取,而彩色图像应用范围广,对用户约束小,易获取,采集成本低,因此本文研究基于彩色数字图像的三维手姿态估计。由于普通彩色图像缺少深度信息,同时手部结构又具有自遮挡

学位

基于手势识别的人机协作医疗辅助机器人系统关键技术研究

新型冠状病毒肺炎的爆发给全球的公共卫生体系带来了巨大的挑战,医护人员在与患者接触的各个环节都存在着极大的被感染风险,繁重的工作量使得医护人员夜以继日地奋战在抗疫一线。因此,我们迫切需要一种可以远程工作的人机协作医疗辅助机器人系统,降低医护人员的工作强度及交叉感染的风险。本文致力于实现自然、便捷且高效的人机交互方式,围绕手势特征提取、动态手势分类、机械臂逆运动学封闭解优化问题进行深入研究,搭建了一套

学位

基于知识图谱的农药自动问答系统应用研究

农业领域数字化和智能化是国家数字化建设战略的重要组成部分。农业发展离不开农药,食品安全中涉及的农产品的农药残留量关乎人民生命安全和身体健康。因此,基于人工智能技术实现农药知识自动问答系统是有意义的。针对农业从业者和农产品消费者对农药知识的了解和使用方面困难突出,以及目前农药知识相关知识服务比较缺乏问题,本课题致力于通过构建农药知识图谱,设计并实现农药知识自动问答系统来提供农药知识服务,提出了利用深

学位

基于多任务学习的医学图像分割算法研究

医学图像分析的第一步都是确定组织,因此,对于许多医学分析算法而言,背景去除是获得有效和准确结果的先决条件。尽管对操作人员来说识别WSI的组织区域是一项非常简单的事,但对于计算机而言可能是具有挑战性的,这主要是由于WSI存在颜色变化和伪影,而且,难以检测到诸如肺泡组织,脂肪组织和染色不良的组织。癌症区域分割是病理医生计算癌症阳性率并分析癌变症状的基础,因此癌症区域分割结果的好坏会直接影响到病理医生的

学位

区块链通用数据存证服务平台的设计与实现

互联网在给人们提供巨大便利的同时,其数据真实性、完整性等问题也随之出现。由于互联网数据易被篡改、被破坏,管理方难以维护其真实性与完整性。而区块链技术有着去中心化、防篡改、安全透明等天然特性且具备高公信力,可有效确保数据完整性、真实性,非常适用于数据存证类应用场景。因此,各方都寄希望于区块链以满足其存证需求。但若各应用场景都建立、维护各自的底层链,便会造成数据孤岛、底层链耦合度高、通用性差等问题。本

学位

基于深度学习的瓷砖瑕疵检测识别的研究和实现

缺陷检测是工业上非常重要的一个应用,与此同时,卷积神经网络在特征提取和定位上取得巨大成就。因此深度学习在目标检测领域取得了长足的发展,使得瓷砖表面缺陷检测成为一个有潜力的研究方向。但是瓷砖瑕疵检测依然受到检测目标中小目标较多,形状多变且不规则,特征不明显等因素的困扰,企业在生产制造的过程中依然无法避免的生产出具有各类瑕疵的瓷砖。如何解决以上种种问题,提高小目标瑕疵检测的精度是亟需解决的难题。本文主

学位

基于卷积神经网络的人脸表情识别研究与设计

人脸表情作为一种表达情绪的载体,在日常人际交往中起到了重要作用。现如今,人脸表情识别技术广泛应用于人机交互、智慧驾驶、医学等领域。随着深度学习技术的发展,基于卷积神经网络的方法正成为主流的表情识别方法,但依然存在表情识别准确率不高以及不同个体之间的脸部特征和表情差异大等问题。针对上述问题,本文进行了人脸表情识别研究,主要研究工作如下:（1）针对VGG16深度卷积神经网络存在表情特征提取不够充分的问

学位

基于面部表情数据的帕金森病辅助诊断研究

帕金森病作为一种慢性的神经退行性疾病,其导致大脑中的黑质和纹状体发生病变,由此产生的相关症状严重影响了患者及其家庭成员的正常生活。鉴于帕金森病当前仍无法被治愈。因此,精确、可靠的早期诊断方法对于减缓帕金森病的进展、改善患者健康状况发挥着至关重要的作用。面部表情障碍作为帕金森病的早期运动症状之一,使得帕金森病患者与正常人在面部表情表达上存在明显差异。在临床诊断中,由于面部表情障碍评估任务主观性较大,

学位

基于多尺度网络的自然图像去模糊研究

图像去模糊的研究已经有了诸多进展,深度学习在图像去模糊领域上也颇有建树,但是纵观深度学习的去模糊方法,或是因为模型结构较为简单,导致去模糊的效果难如人意,产生了诸如伪影、丢失边缘纹理等问题;或是因为模型结构过于复杂,导致其适应性较差,难以将其广泛应用于各类场景中。在这一背景下,本文基于经典的深度多尺度卷积神经网络（DMCNN）,提出了一个相对轻量级的多尺度去模糊网络。本文所做的主要工作如下:（1）

学位

基于优化YOLOv4的中餐食物图像识别与应用研究

为将中餐食物图像检测模型部署在移动端设备上,本文提出了一种基于优化YOLOv4的中餐食物图像检测模型,并通过实验证明其有效性。之后,基于所提出的模型,设计并实现了一个中餐食物图像检测系统。本文的主要研究内容及工作如下:1.针对传统目标检测模型占用资源较多,轻量检测模型精度较低等问题,本文首先从轻量化的角度出发改进YOLOv4模型,一方面使用轻量化神经网络Mobile Net V2替换原始YOLOv

学位

基于近似近邻算法的图像检索研究与应用

与本文相关的学术论文