基于层级语义图嵌入的食物图像语义融合分类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zlp_dream
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
食物图像识别是饮食健康系统的关键技术,层级图嵌入算法是分类算法研究领域的重难点之一。结合层级图嵌入算法的食物图像识别算法在饮食健康与医疗检测等应用场景中有着广泛的应用前景。随着国家将饮食健康提升到了国家战略层面,经过层级结构图嵌入优化过的食物识别算法将在实际生活中表现出越来越重要的作用。食物识别准确率是非常重要的指标,但是由于分类模型的精度和冗余度的限制,使得提高识别准确率的代价高昂。结合层级信息进行食物的粗细混合分类提高使用者的接受度很有价值。如何更好地利用层级信息则是难点,因此基于层级图嵌入结构的食物识别方向是非常具有应用价值的研究课题。本文研究了前沿的层级分类算法,并针对其中自上而下的层级分类算法以及图像语义融合所遇到的难点问题进行了研究分析。充分研究和借鉴了层级语义图嵌入算法,将其与卷积神经网络结合。本文设计了一种基于层级语义图嵌入的食物识别算法。论文的主要工作有:本文针对目前自上而下进行层级分类所造成的层级深层节点的分类精度下降问题,提出了基于层级图嵌入的自下而上的层级分类过程。在本文提出的数据集上,本文提出的算法在细分类精度Top-1提升了7.79%。本文提出了层级搜索阈值以精细化地针对不同使用场景进行粗细分类比例的调控。食物图像弱监督识别需要充分的类别语义信息。不同国家食物语料库稀缺,语料收集困难。针对这种语料缺失的问题,本文采用构建层级语义图结构的方式缓解。目前图嵌入依赖于随机游走,但基于随机游走的嵌入方式无法充分地对稀疏图进行信息提取。使用层级语义图嵌入能够有效提取稀疏层级图的结构信息。本文所提出的模型相较于基准线模型,在Top-5指标上提升了2.70%。同时结合层级搜索算法,使得基于层级图嵌入的弱监督食物图像分类算法能够更进一步,实现大类上的模糊化处理。本文在陈静静博士的指导下,收集整理了目前类别最广泛且数据量最大的食物数据集。并在本数据集之上做相应的研究
其他文献
目的:改良加工小牛冻干松质骨技术,通过数字化模型精准设计股骨头骨支架及将其在自主研发的灌注生物反应器内加载肌腱干细胞诱导分化。为股骨头坏死再生提供材料基础。方法:通过对SD大鼠的股骨头MicroCT的数据进行分割重建,设计股骨头骨支架模型。采用改良的小牛冻干松质骨加工方法,将小牛新鲜松质骨数控雕刻成股骨头骨支架,并采用酶消化法进行去抗原后冻干。依据股骨头骨支架模型设计制造12轴灌注生物反应器模型,
目的:通过腺病毒载体上调和下调大鼠心肌组织中miR-327的表达,探讨其在心肌缺血再灌注损伤(MIRI)中的作用及其分子机制。方法:(1)腺病毒转染:将60只健康雄性SD大鼠随机分为5组,分别为假手术组(Sham组,生理盐水+假手术)、缺血/再灌注损伤组(I/R组,生理盐水+I/R)、miR-327抑制组(Ad-miR-327-i组,Ad-miR-327-RNAi+I/R)、腺病毒空载组(Ad-N
不同于监督学习,多示例学习的数据集由“包”组成,每个包中含有若干个以向量形式表示的示例。多示例学习数据集中包的标签明确,其基本假设为:正包中至少含有一个正示例,但具体是哪一个或哪几个未知;负包中全是负示例。随着多示例学习分类算法在图像和文本等领域应用越来越广泛,多示例学习降维算法也逐渐成为研究热点。本文主要研究工作如下:一、提出了一种对于多示例学习问题通过使用支持向量机实现线性降维的算法。首先,假
在自然场景理解中,视觉关系检测(Visual Relationship Detection,VRD)是机器理解图像的一个重要的任务,它旨在检测图像中的对象并识别对象间的关系(如人骑着马,杯子在桌上)。
目的 细胞分裂周期蛋白14B(cell division cycle 14B,CDC14B)是CDC14磷酸酶家族成员之一,在真核细胞中广泛表达,是一类高度保守的丝/苏氨酸蛋白磷酸酶,其可使靶蛋白的苏氨酸和丝氨酸去磷酸化,进而调节靶蛋白的生物学活性。研究表明,CDC14B广泛参与有丝分裂、减数分裂、胞质分裂、G2期损伤检查点激活、中心体复制、维持纺锤体稳定性、DNA损伤修复、癌变、纤毛形成等生理、
1999年,二十个全球最重要的经济体组成了二十国集团(G20)。发达和发展中经济体聚集在此平台上,共同讨论全球经济和金融发展问题。在2008年正式升级为领导人全球峰会,G20便成
近年来面向大规模图处理系统的研究成为并行与分布式计算领域乃至整个计算机与科学领域的重要课题。随着整个社会电子信息化程度越来越高,在社会公共安全提出全面信息化要求的背景下,基于互联网信息的社会公共安全大数据应用服务平台的建设,有助于对社会公共安全形势的预判,可以对领导决策提供参考。大规模图处理应用于社会公共安全,可以为上层应用提供计算分析支持。构建社会安全大数据平台,对海量数据进行分析,并转换为有效
沼液是养殖业粪尿等发酵后的废水,其中含有大量的营养元素和生长激素,资源化利用是解决沼液消纳的重要途径,是联系种养结合的重要纽带。沼液施用会造成土壤NH_3、N_2O和CH_4的排放,如何提高沼液的氮素利用率、降低温室效应是沼液施用过程中亟待解决的问题。本文以果园、菜地和农田土壤为研究对象,探究不同沼液施用方式和土壤含水量(water filled pore space,WFPS)对不同土壤NH_3
冠心病是目前世界上致死率最高的疾病之一,有近70%的急性冠脉疾病是由冠状动脉易损斑块破裂造成。医学上证实易损斑块的主要原因是巨噬细胞浸润,因此对于巨噬细胞的识别是早
目的:胆管癌是最具侵袭性的恶性肿瘤之一,由于其早期侵袭性特征和对化学疗法或放射疗法的反应差,导致其预后不良。越来越多的证据表明异常表达的肌动蛋白样6A(actin like 6A,ACTL6A)参与癌症的发生和发展。然而,它在胆管癌中的临床价值和生物学作用仍不清楚。我们初步研究发现,ACTL6A在胆管癌组织中异常表达。因此,我们推测ACTL6A的异常表达可能与胆管癌的发生和发展有关。本研究旨在探讨