基于深度学习的中餐菜品图像识别算法研究

来源 :西京学院 | 被引量 : 0次 | 上传用户:zz33xx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
食品与人类的日常生活息息相关,近年来,与食品相关的科学研究愈发火热。其中,以人工智能技术为主的菜品识别是诸多国内外学者的研究课题。菜品识别技术是开展智能食材管理、饮食健康监测等相关研究工作的基础部分,目前国外绝大部分的菜品识别技术适用于西餐和日式料理。鉴于中餐菜品的多元性和异质性,中餐菜品图像识别算法的研究始终是一个难点。当前,研究人员的主要目标是在公共数据集中实现高精度识别,导致大多数模型的网络深度大、网络结构复杂,从而对计算机内存需求大,计算能力要求高。在目前菜品识别的落地场景中,主流设备是移动终端设备,网络深度大、网络结构复杂的检测模型会消耗终端设备的大量计算资源,不利于移植到移动终端设备的便携使用。因此,目前菜品识别领域主要面对的挑战是如何设计一个能够应用于便携式设备的同时兼顾复杂性和准确率的菜品识别模型。本文从实际需求出发,采用基于深度学习的研究方法将中餐菜品图像的识别分成了菜品位置检测和菜品分类两部分,构建高效、智能、轻量化的中餐菜品识别算法。本文的主要工作内容如下:(1)目前公开的菜品数据集只适用于菜品分类,图像中仅包含单个菜品目标,不适用于真实场景下多菜品的情况。针对这一问题,本文面向餐厅应用场景,在某高校食堂进行了数据采集和处理等工作,通过拍摄采集和网络扩充的方式,自行创建了一个包含2734张共37类菜品的中餐菜品检测数据集FOOD37,从而解决真实应用场景下中餐数据集缺乏的问题。(2)针对中餐菜品位置检测问题,本文提出一种基于改进YOLOv5s的中餐菜品位置检测方法。该方法首先引入CA注意力机制,增强YOLOv5s模型对于菜品的检测性能,降低漏检率。然后,引入Ghost轻量化模块改进YOLOv5s的Backbone、Neck部分对网络模型进行压缩,提升检测速度,该模块能够通过高效操作以更少的参数量和计算量生成特征图。实验结果表明,本文提出的改进的YOLOv5s菜品位置检测模型可以使得参数量、GFLOPs和模型大小都减少近一半,检测速度也有明显的提升,在使得模型轻量化的同时,成功提高了检测效率而且能保证准确率。(3)针对中餐菜品分类问题,本文提出一种基于改进EfficientNet-B0的中餐菜品分类方法。该分类网络首先引入ECA注意力机制,ECA模块只涉及少量的参数,却取得了明显的效果提升;其次使用h-swish激活函数降低网络计算量;然后使用迁移学习方法提升模型的准确率;最后,使用本文提出的知识蒸馏方法进一步提升模型的准确率。本文所提出的改进方法,既可以有效的提升Efficient Net-B0模型对菜品分类的准确率,同时也保持了改进菜品分类模型的轻量化。(4)结合菜品位置检测模型和菜品分类模型,使用PyQt5设计界面搭载MySQL数据库开发菜品识别系统进行实际应用。
其他文献
<正>6月29日,为深入贯彻落实省第十三次党代会精神,推动青年干部理论武装不断深入,按照“能力作风建设年”活动学习型机关创建行动计划有关安排,黑龙江省审计厅举办了第二季度青年理论学习小组组间交流会。厅机关全体青年理论学习小组成员通过线上线下相结合方式参加会议。会前,各青年理论学习小组组织本组成员深入学习省第十三次党代会精神特别是许勤同志所作的报告,并撰写了学习心得。会上,9名来自不同小组的青年代表
期刊
随着通信技术与视频信息的不断发展,视频数据量呈指数式增长,无人机视频压缩存储以及传输工作面临越来越大的压力,这对无人机视频压缩与传输系统压缩存储提出了严格的要求,并且无人机无论在应用场景还是在具体的功能都变得更为复杂,对视频编解码的时延和系统稳定性都提出了极其严苛的要求。基于传统DSP处理器的视频的视频压缩与传输系统已无法满足低延时、高质量压缩的需求。本文针对传统视频压缩与传输系统存在的上述问题,
学位
恒温试验箱在航空航天研究所及高精度电子芯片领域具有广泛的需求和应用。依据电磁感应定律,磁场中的闭合导线会由于磁通量的变化而产生感应电流,因此对于高精度电子传感器芯片性能测试而言,为了避免在恒温箱测试中产生感应电流,影响芯片测试精度,需要在无磁或弱磁的恒温环境中进行试验和产品测试。针对当前我国小型恒温箱很难在弱磁无干扰和高精度温度控制方面同时满足高精度电子传感器芯片测试要求的难题,论文根据航天某研究
学位
串列式静电加速器已在辐照诱变育种、食品辐照保鲜、医疗卫生用品辐照灭菌、工业污水辐照消杀处理、新材料与新器件改性等领域得到了广泛应用。加速器运行时,经过强电场加速的电子、质子等粒子束流与加速器部件、靶件等反应会产生很强的辐射,此时如有人员误入实验大厅或者靠近加速器将会对人员造成辐射伤害,严重的可能会致死,同时人员的误操作也可能会损伤加速器系统,造成严重的经济损失。稳定可靠的安全联锁系统对于保证人员和
学位
核素能谱仪是通过对样品伽马射线特征能谱的定性分析,确定样品中所含的核素种类,并能对其进行定量分析,进一步得到样品中不同核素的含量,通常应用于环境辐射检测、核安全和辐射反恐领域。随着科技发展,核素能谱仪在食品安全、医疗卫生、地质勘探、边防安检、及太空探索等领域得到了广泛应用。国内外多家单位投入了大量人力、物力和资源,研制出了多种适用于不同场景的核素能谱仪产品。但在使用过程中发现,目前常用便携式核素能
学位
由于传感器科技的发展,人类所掌握的大数据分析信息技术也迅速增加,其中包括可见光与红外图像融合技术。该技术利用可见光源图像和红外源图像自身的特性,将两种源图像的有效信息整合在一起,去除无用的冗余信息,从而解决单个信息受限于成像方式、成像谱段以及自然因素的影响,减少目标场景的不确定性,提升系统的实用性。所以,对可见光与红外双波段图像融合技术的研究,有着非常巨大的实用价值。本文研究的可见光与红外图像融合
学位
随着医药领域和疾病机理研究的深入,科研人员发现miRNA(microRNA,微小RNA)这一种普遍存在于动植物细胞的大分子,会因其异常表达而导致正常细胞发生病变。同时也发现了miRNA可以作为一种新的药物靶点,可以在特定疾病条件下调节基因表达,产生特定的蛋白质。迄今为止,许多研究人员利用miRNA在分子水平上揭示药物疗效和发病机制。众所周知,传统的湿法实验存在许多问题,例如耗时长、劳动强度大和成本
学位
图像拼接在计算机视觉、图形遥感和虚拟现实中有着广泛的应用,是近年来图像处理的热点研究领域之一。随着电子信息技术的发展,智能交通近年来也越来越受到国家的重视,现今交通路口的违章图像获取有着高清晰度和高曝光速度的优势,但是在拍摄违章图像的时候,因为相机拥有高分辨率镜头,所以这种相机拍摄的图像视角不会很宽,无法获取更大范围的车辆周边环境,所以我们要在保证图像清晰的情况下,扩大路口图像的视野,这就需要用到
学位
近年来,国家鼓励工业、医疗、教育、娱乐等行业与VR/AR、机器人等技术相结合发展,而SLAM作为上述产业的核心技术在快速发展的同时也面临着许多挑战。其中,系统实时性问题、动态环境下的建图准确性问题和单个传感器导致系统使用场景受限等问题成为了目前领域内的研究热点。针对以上问题,本文研究并实现了一种基于视觉、惯性测量单元和激光雷达的多传感器SLAM系统,该系统不但能够实现动态环境下的高效建图与定位,而
学位
航空工业中,电源系统为飞机提供飞行所必须的电能,飞机电源的品质好坏对飞机的可靠性和安全性有很大的影响,所以对其性能指标的要求必须相当严格,在电源系统的设计最初,必须严格按照飞机电源标准进行检测。已有设备检测影响飞机电源性能品质的稳态参数并不全面,设备体积大,操作复杂,且相对误差和采样率仅满足标准所需要的基本条件。因此如何使测试设备更加便携,采样率更高,相对误差进一步缩小是目前飞机电源地面检测设备面
学位