少样本的餐盘菜品识别算法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:lycan95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,餐厅的计价方式主要分为人工计价和自动计价,人工计价的方式存在效率低、出错率高等问题,而自动计价的方式可以很好地解决这些问题。自动计价的方式又可分为两种,分别是基于餐盘识别技术和基于菜品识别技术的自动计价。其中基于菜品识别技术的自动计价方式不仅可提高结账速率和正确率,后续还可运用于记录并分析顾客的饮食偏好、食品相关知识的科普等。但这两种方式在实际落地的过程中,都存在依赖于大量数据集的问题,如一个餐厅中的餐盘类别总数是10类,则需采集超过5000张装有各种不同食物餐盘的图像。大量图像意味着高的采集成本,高的人工标记成本还有后续维护及更新系统的成本。因此,本文致力于解决以上问题,提出了基于少样本的餐盘菜品自动识别方法。本文的研究内容及创新点主要如下:1)本文构建并开源了真实餐厅场景下的少样本餐盘数据集和少样本菜品数据集:餐盘数据集包含20类餐盘,菜品数据集包含30类菜品。2)为了解决少样本餐盘检测问题,本文提出一种基于注意力机制的数据增强方法。该方法的一大创新之处在于:将空餐盘图像的数据集作为训练集,且只需少量的空餐盘图像,此数据集训练得到的模型可用于检测装有菜品的餐盘图像。而在通常餐盘识别方法中,需装有菜品的餐盘图像作为训练集。此方式简化了采集流程、大幅度减少采集数量、降低了时间和人工成本。在模型训练过程中,此方法可引导神经网络(Neural Networks)更多关注和学习到餐盘的形状和颜色等特征,更少关注不属于餐盘的特征如餐盘中菜品的特征,从而提升模型提取特征的性能,使得所提取特征的泛化能力更强。在实际检测装有菜品的餐盘图像时,减少了菜品区域对检测过程的干扰,提高了餐盘检测的精度和目标检测模型的鲁棒性。实验结果表明本文提出的方法精度最高可达89.63%,在相同实验条件下,较不使用该方法最多可提升58%的精度。3)为了解决少样本菜品分类问题,本文提出Food-VIT分类模型。本文将菜品识别问题分解为菜品定位和分类的二阶段问题。菜品定位通过常用的目标检测模型实现,Food-VIT模型用于实现菜品的分类。Food-VIT基于Vision Transformer(VIT)上进行改进,改进内容总共分为3个部分:新增图像变换层、新增特征融合层和引入新的损失函数。本文利用菜品图像是细粒度图像这一特性,提出新的图像变换方法,用于增加样本的多样性。图像变换层输出变形图像,再将变形图像与原图像对应的类别特征进行特征融合,特征融合层输出的类别特征作为此模型最终用于判定类别的特征向量。该特征向量中包含全局特征的同时,又包括局部特征,从而学习到不同类别菜品之间细小的差异,并提高类别特征的泛化能力。在计算损失时,不仅仅考虑原图像的损失,还有对应变形图像的损失。该计算方式有利于缩小同类别特征向量之间的距离,增大不同类别特征向量之间的距离,还可减少网络的过拟合。本文进行了一系列的实验对比,实验结果证明Food-VIT模型的效果明显好于VIT模型和一些其他经典模型。实验结果表明,在每类菜品只有1张图像时,Food-VIT模型的分类准确率可达到84.47%;在每类菜品只有10张图像时,Food-VIT模型的分类准确率可达到95.37%。
其他文献
近些年深度学习在计算机领域的深入应用,极大地推动了人工智能技术的蓬勃发展。如何使用深度学习这一主流的人工智能方法,与传统的计算机视觉任务相结合,是当今图像领域研究的热点。得益于深度学习网络强大的拟合能力,在显著性检测、语义分割、目标跟踪、目标检测、图像理解等视觉领域取得了巨大进展。其中,图像显著性检测是以检测视觉系统感兴趣区域为目的的机器视觉应用,旨在模仿人类视觉注意机制这一智能行为。本文就图像显
学位
目的:探究利妥昔单抗在难治性肾病综合征患儿中的疗效及对肾损伤标志物表达的影响。方法:选取2018年6月—2021年9月福建省立医院南院收治的80例难治性肾病综合征患儿作为研究对象,根据随机数表法将其分为对照组40例和观察组40例。对照组进行常规治疗,观察组在对照组基础上加用利妥昔单抗治疗。比较两组治疗总有效率、不良反应发生率、复发率、治疗前后疾病相关指标[白蛋白(ALB)、总胆固醇(TC)及24
期刊
阿尔茨海默病(Alzheimer’s disease,AD)是最为常见的一类痴呆症,正迅速成为本世纪最昂贵、最致命和负担最重的疾病之一。然而,AD发病机制尚未完全清楚,这就导致了没有有效药物能逆转AD的发病进程。食品和药物管理局(FDA)批准的4种AD治疗药物对认知改善的效果非常有限。至今,研究人员已经针对AD发病机制提出了各种假说,比如β-淀粉样蛋白(Aβ)级联假说、Tau假说和氧化应激假说等。
学位
介绍雷磊教授治疗早发性卵巢功能不全(POI)的经验。雷教授认为,肾气亏虚是POI主要病机,治疗上多以补肾调经为主,兼顾疏肝解郁、健脾养血、调理脏腑气机。其临床擅用四二五合汤辨证加减,配合中药外敷增强药效,内外兼治,并重视精神因素,倡导健康生活方式,从而调节肾-天癸-冲任-胞宫生殖轴的平衡,促进排卵,建立规律的月经周期,改善卵巢功能,其效颇佳。附验案1则,以资佐证。
期刊
目的 基于主题模型分析法探究国医大师夏桂成教授(简称“夏师”)早发性卵巢功能不全(premature ovarian insufficiency, POI)的诊治规律。方法 基于夏师诊治的POI门诊病历数据库,建立“POI—临床表征—处方”模型,运用主题模型分析方法进行数据挖掘。结果 POI分布于主题1和3。主题1临床表征分布概率从高到低依次为急躁易怒、脉细弦、口干、锦丝状带下量少、盗汗等,处方分
期刊
二维纳米片材料以其原子级厚度的独特片层结构作为功能薄膜的构筑单元,通过有序堆积和自组装在薄膜中构建规则的通道。基于二维纳米片状材料的膜材料具有优异的分离性能,能够突破trade-off效应,被认为是“下一代膜材料”。MFI型沸石分子筛膜具有优良的孔道结构,被广泛应用于分离领域,在异构体分离(如正/异丁烷、邻/对二甲苯的分离等)、二氧化碳/氢气分离、乙醇/水分离中展现了良好的性能。本文以二维MFI沸
学位
抗生素是一类天然或半合成抗菌药物,具有抗菌作用强、价廉易得等优势,广泛用于细菌感染性疾病的预防和治疗。随着抗生素生产量与使用量的增加,大量残留抗生素通过制药厂废水、生活污水或畜禽粪便等途径进入到环境中,不仅污染生态环境,而且还会通过食物链方式进入到食品中,给人类健康造成极大危害。食品和环境样品中抗生素残留水平较低,且基质干扰效应大,给后续的分析检测带来了一定的困难。因此,发展简便可靠的样品前处理技
学位
本研究旨在根据近5年(2016-2020年)大气污染物(PM2.5、O3、SO2、NO2和CO)的污染观测数据,探究金华城区大气污染物的污染特征。本研究于2020年12月在浙江师范大学金华校区17号楼楼顶(北纬29°8’27",东经119°38’15",海拔40米)进行了PM2.5样本冬季采集,于2021年7月进行PM2.5夏季样本采集。CO、SO2、NO2和O3的污染物数据来源于中国环境监测站的
学位
象山方言属吴语太湖片(又称北部吴语)甬江小片,本文以象山方言状态词为研究对象,在分析语料的基础上,探讨了象山方言状态词语法上的特点。本文分为六个部分。绪论首先梳理了现代汉语状态词及甬江片吴语状态词的研究成果概况;其次介绍了象山的地理概况和历史沿革、方言研究成果概况;从次说明了象山方言状态词的研究意义;再者说明了文章的语料来源及体例;最后描写了象山方言的音系。第一章考察了象山方言复合式状态词。分析了
学位
多金属氧酸盐(简称多酸)因其独特的物理化学性质具有广阔的应用前景,如多酸对诸多反应的催化,已经实现了工业化生产。但多酸在其它方面的应用,如功能组装、传感、生物医药等,还有巨大的空间待挖掘和研究。本论文基于钼灵活的配位方式、氧化还原电位高、容易被还原等特性,选取钼酸盐为研究对象,探究新型同多钼酸盐杂化材料的合成、结构及新奇功能。已通过溶液自组装法合成了11例同多钼酸盐杂化材料,根据所得化合物的结构特
学位