【摘 要】
:
图像标注作为图像分析与理解的重要组成部分,已广泛应用到图像检索、图像描述、视觉问答等众多领域。图像标注是利用机器学习模型给图像分配反映图像核心内容的标签。现有的图像标注过程主要包括特征提取及表示,模型训练和测试。模型在测试阶段通常使用固定长度的标签标注每一幅图像,而标签长度应取决于图像内容的复杂度。现有的图像标注评价指标侧重于标签的绝对正误,尽管有效地衡量正确标签的个数,但忽视了标签的全局相关性。
论文部分内容阅读
图像标注作为图像分析与理解的重要组成部分,已广泛应用到图像检索、图像描述、视觉问答等众多领域。图像标注是利用机器学习模型给图像分配反映图像核心内容的标签。现有的图像标注过程主要包括特征提取及表示,模型训练和测试。模型在测试阶段通常使用固定长度的标签标注每一幅图像,而标签长度应取决于图像内容的复杂度。现有的图像标注评价指标侧重于标签的绝对正误,尽管有效地衡量正确标签的个数,但忽视了标签的全局相关性。因此本文从图像标注方法及评价指标展开深入研究,其主要工作如下:(1)提出了一种自适应标签长度的图像标注方法。首先,该方法提取图像的高层语义特征,根据语义特征预测图像的标签长度,预测的标签数量与实际标注任务更加一致;其次,利用相似图像和相关标签构建丰富的候选标签集合;最后,利用标签间的语义关系和采样算法从候选标签中选择具有代表性的标签,从而去除冗余标签。在常用的多标签图像标注数据集上,该方法与几种代表性的图像标注方法进行对比。实验结果验证了该方法可以预测更多正确的标签。(2)提出了一种基于语义树的图像标注评价方法,动态地评估标签的正确性及相关性。该评价方法根据标签的层级和同义关系,为相互关联的标签构造语义树;并且定义同一语义树下标签间的距离来衡量全局相关性。在此基础上,该评价方法将树状结构表示的标签关系融入准确率、召回率及F1值中,从宏观和微观的角度衡量标注模型的性能。在常用的多标签图像标注数据集上,该评价方法评估了几种代表性的图像标注模型。实验结果表明该评价方法能敏锐地捕捉预测标签与真值标签的语义关系,有效地评估模型性能。
其他文献
<正> 在英国工党領袖的爭夺中,曾經两次敗北的哈罗德·威尔逊,今年2月終于击敗了他的对手布朗,被推选为英国工党領袖。由于英国保守党最近几年来在內政外交上一系列的失敗和
目的分析重症SARS病人死亡的危险因素.方法利用单因素、多因素非条件Logistic回归对54例重症SARS病例的18个危险因素进行分析.结果年龄(OR=7.351,=0.042)、有无心血管系统并
偏执型精神分裂症是精神分裂症中较为常见的一种类型。起病年龄较晚,病初表现为敏感多疑,并逐渐发展成妄想,妄想内容常脱离现实,患者却坚信不疑,不能以道理说服。同时可伴有幻觉和
传统的故障诊断方法仅针对保护信息进行分析,没有充分利用电气量信息反映出的电网故障特征信息。提出多智能体系统(MAS)框架信息融合模型,针对大规模电网的结构和特性,集成多种
目的探讨安宫牛黄注射液对脑外伤后炎性反应因子白细胞介素-1β(IL-1β)和细胞间粘附分子-1(ICAM-1)表达的影响。方法将72只SD大鼠随机分为3组,采Feeney法造成鼠脑挫裂伤模型,对照
一个多世纪以来,国内外学者在印第安人来源问题的研究方面,进行了长期不懈的努力,取得了一定的成绩。特别是近年来,随着我国的改革开放,我国学者与国外学者加强了学术交流,
近期发布的《中国总会计师(CFO)能力框架》(以下简称"CFO能力框架")为中国企事业单位财务领导及高管提出了全面、系统和具有前瞻性的多项胜任力要求。这也是关系到新时代中国
晚三叠世龙门山前陆盆地的物源和盆地形成时间长期存在争议,争论的焦点主要集中在龙门山前陆盆地内上三叠统诺利阶须家河组下部地层的物源和构造背景。须家河组下部地层包括
在全球气候变化的大背景下,全球高温事件频发,其中农业是对气候变化最为敏感的产业之一。近年来,世界各国众多学者将气候变化对社会的影响作为主要研究内容,力图寻找破解这些难题的关键要素。中国既是水稻生产大国,又是水稻消费大国。因此,研究气候变化对中国水稻的影响也愈来愈受到更多学者的关注。已经有很多学者对浙江省水稻与高温之间的关系进行了研究,但这些研究均重点分析水稻产量与高温持续日数之间的相关性,对水稻高