基于概率生成主题模型的图像场景分类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zxh87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像场景分类是图像分析和理解的基本问题之一。随着信息技术的发展,图像数据的总量达到迅猛增长,对这些海量图像数据进行快速、准确的分类,已经成为当前的重要任务之一。图像场景分类是根据一定的先验知识,对图像进行自动的标记为不同类别的过程,图像场景分类能为图像的后续处理提供语义基础,并已经成功的应用到很多领域。图像场景分类的方法多种多样,概率生成主题模型是目前研究的一个热点。概率生成主题模型的本质是用主题发生概率的向量来表示图像,其中主题是具有一定的语义信息的隐藏变量。主题模型首先用bag-of-words表示图像,然后对图像中的每一个视觉单词都分配一个主题,从而得到每一幅图像的主题发生频次向量,最后根据该主题向量来预测图像的类别。本文主要研究怎么决定图像中的视觉单词被分配的主题才能够取得较好分类的效果。本文基于隐狄利克雷模型、共享组件主题模型等现有的概率生成主题模型,针对这些模型在图像分类方面存在的问题,进行改进,并取得了一定的研究成果,主要工作如下:(1)介绍了共享组件主题模型,分析模型中主题的产生过程,发现不同主题是由相等先验概率采样产生的,但是分析实际图像可知,图像中每一个主题存在的概率是不相等的,因此本文提出了一种层次共享组件主题模型,通过引入一个层次狄利克雷过程,将主题发生的先验概率训练为一个与图像实际主题发生概率比较相近的向量,更好的描述了图像内容的多样化。(2)以层次共享组件主题模型为基础,进一步研究图像中主题产生的先验概率,发现不同类别的图像中主题存在的概率一般是不相等的,因此本文提出了一种标记层次共享组件主题模型,该模型是一种改进的有监督层次共享组件主题模型,模型增加了图像的类别标记信息,将图像的主题按图像类别估计其发生的先验概率,很好的描述了图像类别之间的差异性。(3)针对图像类别之间的差异性和一致性,本文提出判别式主题空间的概念,判别式主题空间包含许多子空间,即每一类图像特有的主题空间和所有类图像共有的主题空间,并提出了判别式的层次共享组件主题模型。该模型通过引入一个线性变换,将图像中单词分配的主题映射为另一个空间中的主题,最终得到一个更好更紧凑的图像主题向量表示。
其他文献
鞭毛素蛋白(flagellin)是构成细菌鞭毛丝状体的主体部分,是许多细菌共有的一种保守的病原相关分子模式(pathogen associated molecμLar patterns,PAMPs)分子。沙门氏菌鞭毛素
主控制器是整个DCS控制系统的核心,它负责数据的处理和交互,主控制器的性能直接影响到整个控制系统的实时性和可靠性等综合性能。而主控制器工作的性能主要依赖于内置CPU芯片的
介绍了盖茨比曲线下的基尼系数概念,分析其计算方法的局限性并进行了讨论。在收入五分法的基础上,利用多项式拟合曲线代替传统的洛伦兹曲线求北京市2012年的基尼系数,验证模型的拟合程度,并重新计算了我国2003—2013年11年的基尼系数,与国家统计局调查数据进行对比,结果验证了该方法的合理性及与统计数据的趋势性一致,根据11年数据预测出2014—2016年北京市基尼系数及相对误差。本文对基尼系数的计算
piRNA是2006年发现的一类生殖系细胞特异性小分子非编码RaNA(sncRNA),因为它们特异性地与Piwi家族蛋白质相互作用,因此被命名为Piwi相互作用RNA(Piwi-interacting RNA),简称piRN
学位
地面数字电视广播(DTTB)所具备的极大商业价值,使该技术得到了迅速的发展,目前世界上主要有三个标准。我国的起步虽然比较晚,但是也已开发出拥有自主知识产权的标准,清华大学提出
<正>2016年中国(苏州)电子竞技产业博览会暨AR/VR电子游戏动漫展于10月3在苏州国际博览中心圆满闭幕。此次活动在江苏省体育总会和苏州市体育总会指导下,由苏州市电子竞技运
本论文主要进行的是低相位噪声,宽频带整数分频频率合成器的设计。 频率合成器锁相环在通信以及其他的系统中的应用十分的广泛,设计一个高性能的频率合成器对于集成电路工程
SPR生物传感系统具有无需标记、实时检测、灵敏度高等优点,近年来受到了越来越多的关注,已经成为生物传感领域的研究热点。 本文完成了多通道SPR生物传感器采集控制子系统的
针对我国目前公共安全事业的需要,应急指挥系统的建设显得尤为重要。特别是在应急系统中对信息安全的要求更加苛刻。本文立足于气象应急指挥系统的建设,根据气象部门的具体需要