大规模食品图像数据集构建及识别方法研究

来源 :中国科学院大学(中国科学院人工智能学院) | 被引量 : 1次 | 上传用户:lxf_0077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生活质量提高,越来越多的人开始注重健康饮食,这就需要对食品有更加深入的了解,而食品识别技术可以在这方面更好地帮助人们。食品识别技术已开始在实际生活中应用,比如智慧餐厅、智能冰箱和膳食推荐等。然而,人工智能热潮背景下的食品识别技术仍然存在一些问题,比如食品图像识别准确率不高、识别的食品种类较少等。因此,如何改进大规模食品图像识别性能成为食品识别领域最关注的课题之一。尽管很多研究人员已经在食品识别方面做了大量工作,但与实际应用的期望还有一定差距。造成差距的原因有很多,两个主要原因是:目前食品图像数据集规模较小;尚无完全有效适合食品识别的方法。针对以上两个问题,本文从数据集构建和识别方法两个方面进行了研究和探讨,主要研究内容和贡献如下:(1)构建了一个大规模食品图像数据集:数据集是各种技术方法的重要基础,一个高质量数据集能够为方法有效性验证提供关键保障。考虑到现有食品图像数据集规模较小,本工作从食品种类概念体系构建、数据收集、数据清洗到扩充和验证分析数据,系统化地构思和构建了一个大规模食品图像数据集ISIA Food-500,这个数据集包含来自500类食品的405,776张图片,食品种类覆盖各大洲共52个国家。现有基准食品图像数据集包含食品种类和图片量较少,相比之下,ISIAFood-500数据集在图片量、种类数和可拓展性等方面具有较大优势。(2)提出了一种基于堆叠多尺度多注意力网络(Stacked Multi-Scale Multi-Attention Network,SMSMANet)的识别方法:考虑到现实很多情况下,人们偏向于视觉的食品图像识别,而且食品图像类间差异小、类内差异大等属性也需要一个既关注整体全局特征又注重细节局部特征的食品识别方法。本工作提出一种堆叠多尺度多注意力网络来进行食品识别,该方法以图像模态为输入,利用空间和通道注意力机制,结合多尺度策略,共同学习图像的全局特征和局部特征进行食品识别。作者通过大量实验证明了堆叠多尺度多注意力网络的有效性。
其他文献
写作就像我的好朋友,一路伴随着我,见证着我的成长。在写作的过程中,我记录下我的成长轨迹,形成许许多多美好的点滴,构成一份永恒的记忆。细细品味这些年的写作经历,不同的成长阶段有着不同的亮点,带给我不一样的感受。  一  小时候,我写作,很大程度上是受到了我妈妈的影响。妈妈是一名中学教师,爱看书,爱绣花,爱写毛笔字,和爸爸自由恋爱,历经战乱的颠沛流离,最终生活在一起。我很小的时候,妈妈常常跟我讲她的故
目的 :探讨经三角肌间入路采用肱骨近端内锁定系统接骨板治疗老年肱骨近端骨折的效果。方法 :对2012年4月至2014年4月我院收治的50例老年肱骨近端骨折患者的临床资料进行回顾
艰难梭状芽孢杆菌(Clostridium difficile)最初报道是在1935年由Hall和O’Tolle两人鉴定为新生儿菌群的组成部分。艰难梭菌起初并不受人关注,一直到1978年被证实与因长期服用
红色资源是中国共产党领导全国各族人民在新民主主义革命和社会主义建设的过程中形成的,能够为我们今天开发和利用并具有重要时代价值的各种物质和精神载体的总和。在新的历
拥有健康的身体意味着拥有一个健康的生活:自由、阳光、爱情、快乐、幸福,即使痛苦也会沉淀进一个绿色背景,让心可以坚韧,让情可以负担。白领们在每日的忙碌和巨大的压力中,
期刊
在钓鱼台国宾馆,于紧张的模特彩排空档,我终于"抓"到了如今已头戴世界"十佳"男模桂冠的中国顶尖模特刘凤成。冬日的斜阳正懒懒地射进宽大的落地玻璃窗,放眼窗外是一片依然生
期刊
妈祖文化是人类文明的优秀成果,也是世界非物质文化遗产。妈祖"行善救困、舍身取义"的大爱精神,既是中华民族的传统美德,也是人类真善美的化身。妈祖文化的丰富内涵,不但为中国
盾构法掘进因其独特的施工方法和工艺而对沿线地质信息有着特殊的要求,比之传统地下引水隧洞施工方法对地质资料的要求更加细化,更有侧重,结合南水北调潮河隧洞方案勘察工作