基于Corr-LDA模型及卷积神经网络的图像理解方法

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户:jinxiangjinshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像标注及分类是图像理解的主要研究内容,现已成为机器学习、模式识别等领域中重要的研究热点。在图像标注任务中,基于概率主题模型的图像标注方法近年来受到了国内外学者的广泛关注,其结合了主题模型及概率图模型的优势,可以有效改善“语义鸿沟”问题。在图像分类任务中,卷积神经网络获得了很多令人瞩目的突破性成果,在图像分类领域中得到了广泛应用。本文基于概率主题模型及卷积神经网络来分别实现图像标注及分类任务,使用两个真实图像数据集验证了所做工作的有效性和合理性,其主要创新如下:1.提出了基于Corr-LDA模型的图像标注方法。考虑到类别对于图像标注是十分重要的辅助信息。类别和图像呈现的事物有着密切的联系,类别不同,图像呈现的事物也不同。当类别确定时,其图像标注词的范围也会减小。基于此,本文将依据图像类别信息,并为每个类别构建出适合该类的图像标注模型,同时,给出了相应的模型训练及测试过程。在Label Me图像数据集和UIUC-Sport图像数据集上的实验结果表明,本文提出的Corr-LDA-C方法是有效的。此外,本文提出方法是建立Corr-LDA模型基础上的,实际上也适用于其它用于图像标注的概率主题模型。2.提出了改进交叉熵损失函数的图像分类方法。考虑到在以Softmax为交叉熵损失函数的神经网络中,输出概率主要基于每个类别参数向量与样本隐层特征之间的线性运算,神经网络最终的输出会受制于每个类别参数向量的范数大小的影响。以二分类为例,如果某一类别参数向量的范数较大时,分类决策边界会偏向于范数较小的类别一侧,因此,这就会导致应属于另一类样本的错误分类,以致影响到图像的分类性能。基于此,本章提出一种新的交叉熵损失函数,称之为SCE-UD损失函数。该损失函数调整了分类决策边界的位置,使其不偏向于任何一类。在Label Me及UIUC-Sport数据集上的实验结果表明,文中提出的交叉熵损失函数不仅稳定性较好,而且分类效果也优于Softmax交叉熵损失函数。
其他文献
目前,高校的吸引力已不仅由师资力量决定,校园环境、合理的景观布局也成为招生的主要吸引源之一。校园景观在不同程度上影响了师生的活动与行为,构建一个风景优美、格局合理
随着国际社会交往互动的不断增加,政府国际公共关系已经成为公共关系实务的一项重要内容,但相关的研究还比较缺乏。本文从概念入手,分析了政府国际公共关系的主要传播方式及
<正>美刊《德国政治与社会》2010年夏季号刊载了美国学者拉塞尔.J.道尔顿和威利.尤题为《德国有统一的政党体系吗?》的文章。文章描述了1990年德国统一后历届大选的投票结果,
棉花的副产品——棉籽,可用来生产植物油脂棉籽油,而且不影响其主产品纤维的生产。棉籽油是世界各国的食用油之一,也是工业生产的原料之一。棉籽油中含有大量的必需脂肪酸,其
目的分析乳腺癌改良根治术后引流管拔管时间的影响因素。方法选取汕头大学附属粤北人民医院2016年1月~2018年1月行单侧乳腺癌改良根治术242例患者的临床资料,术后每日术区的
长期以来,家庭养老是农村居民养老的主要形式,传统的代际功能关系是实现家庭养老的基础和前提。近年来,人口老龄化、低生育率、人口流动和城市化等冲击了传统的农村家庭代际
喷嘴是柴油机的核心部件之一,其空化与磨损特性对柴油机的雾化、燃烧与动力特性均存在重要影响。从可视化和数值模拟两个方面研究柴油机轴针式喷嘴内部燃油的流动状况。结果
信息技术与高职教育教学的互相融合能够合理分配各类教学资源,有效提高高职教育的教学效果与学生的学习效率。本文以《高职英语口语与实训》的信息化课堂教学为例,阐述了信息
农民专业合作社是在农村家庭承包经营的基础上成立的民主管理的互助性经济组织。农民专业合作社以其成员为主要服务对象,主要提供包括农产品的销售、加工、运输、贮藏等服务