果蔬图像的混合粒度分类研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:szhanyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着机器视觉、大数据、互联网以及人机交互技术的发展,智能家居领域开始受到广泛关注,其中以智能冰箱的发展最为显著。智能冰箱期望实现食材的保鲜周期、种类、数量识别以及个性化食谱推荐等智能化食材管理功能。针对这一实际问题,机器视觉研究中的目标检测、目标分类、目标识别与计数等方法提供了相应的技术路线。然而,与一般的机器视觉任务不同,这一特定领域的研究需要专门的图像数据库。因此,本文构建一个新的、层次化结构的果蔬原材料图像数据库,命名为VegFru数据库。该数据库的类别结构符合人们日常的饮食和烹饪习惯,基本囊括了所有常见的果蔬类别。目前,VegFru数据库包含15大类,200小类蔬菜,10大类,92小类水果。每类包含200张以上自然图片,整个数据库包含91,117张蔬菜图片,69,817张水果图片,总共160,000张以上图片。针对提出的VegFru数据库,首先进行基本的混合粒度图像分类研究。为了与其他标准数据库对比,本文分别使用传统特征模型和卷积神经网络模型进行分类研究。传统分类模型使用BOW和SPM相结合的特征提取框架,首先提取多尺度SIFT和CM作为底层特征,分别进行LSA编码和FV编码,然后在空间金字塔子区域内进行最大池化得到图像的直方图表示,最后使用线性分类器分别对蔬菜和水果进行分类;卷积神经网络模型则分别给出VegFru数据库在AlexNet、 CaffeNet以及GoogLeNet三个网络模型中的分类结果。在基本分类模型的基础上,本文提出一个基于自上而下注意图分割的混合粒度图像分类模型。首先,在卷积神经网络模型中引入注意信息,检测和分割出图像的目标区域;然后利用分割图像学习新的网络模型得到分割网络,迫使网络关注图像的判别性目标区域,从而得到较优的初始化权值;使用原始图像对分割网络进行微调,最后得到的分部训练网络不仅能够充分挖掘图像的目标区域信息,还能补充分割网络遗漏的互补信息,进一步提高分类性能。综上所述,本文在智能家居的应用背景下,构建了一个特定领域的果蔬原材料混合粒度图像数据库,给出该数据库在传统特征分类模型与卷积神经网络模型中的基本分类结果,并提出一个新的利用自上而下注意图分割的分类模型,进一步提高分类正确率。为基于VegFru数据库的机器视觉技术以及智能冰箱研究提供数据来源和技术路线,促进智能家居、机器视觉与智能家居应用相结合的研究和发展。
其他文献
超声波测距系统以其价格低廉、易实现等优点被广泛应用于工业领域。测量精度和实时性是评价超声波测距系统的两个重要指标,本文设计了高精度超声波长度实时测控系统,同时解决
复杂系统常呈现出高度非线性和多变量的特征,对其进行预测建模较为困难。支持向量机和神经网络是最为常用的建模方法,然而,目前预测模型的研究对象往往为单变量序列或线性系
市教委直属单位先进性教育活 动自2005年7月5日动员大会开始, 到11月10召开总结大会,历时4个 多月,顺利完成了学习动员、分析评 议、整改提高各个阶段的任务,集中 学习教育基
水是柔弱的,在什么容器里就呈现什么形状;水是最有亲和力的,能包容身边的一切;而水又是最坚韧的,滴水可以穿石…… The water is delicate, and in what container it is sh
本刊讯为贯彻落实党中央、国务院有关精神,省委组织部、省政府教育督导团、省教育厅联合颁发《关于建立县(市、区)党政领导干部教育工作督导考核的通知》。经研究,我省决定在
1939年秋,繁峙县第二区领导指派民政助理张策和我(时任财粮助理),到小柏峪附近的村庄征收公粮。小柏峪村是繁峙县通往五台山和河北阜平县的重要交通路口,在军事上也是一个要
定义了一个关于有限维半单李代数g的弱量子代数wUq(g),证明它是一个弱Hopf代数,并构造了它的一组基,同时讨论了wUq(g)上的最高权模和Verma模.
由于左心室是心脏最重要的动力来源,很多对心脏的研究进而可转化为对左心室的研究分析。传统的静态分析存在的局限性又使基于四维图像的左心室运动分析成为了研究热点,尤其是
超声检测是一种广泛应用于工程和医学的无损检测方法。超声相控阵探伤方法是相控阵技术在超声检测中的应用,它主要是通过控制相控探头各个阵元的激励延迟时间来控制波束的偏
可进化硬件(Evolvable HardWare,EHW)是指硬件能够通过与环境的交互作用动态地和自适应地改变和调整自身的结构和行为,可进化硬件具备自适应、自组织、自修复的特点。作为可进