基于概率潜在语义分析的图像场景分类

来源 :天津大学 | 被引量 : 0次 | 上传用户:shifter_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的场景类别不仅包含了人们对一幅图像的总体认识,而且还提供了图像中对象出现的上下文环境,正确的场景分类为图像识别和检索提供了基础。因此图像场景分类就成为当前计算机视觉领域的热点问题。跟文档相似,图像可以由视觉词汇描述,这些词汇表达了一个或多个主题,这些主题反映了图像的场景。本文目的是研究合适的视觉词汇和主题生成模型,用以实现图像的场景分类。具体的,论文做了以下的研究工作:1、通过研究不同的视觉词汇和潜在主题数目对场景分类性能的影响,我们选择基于图像的灰度特征、颜色特征和SIFT特征生成视觉词汇,构建词汇表。然后在此基础上对上述算法进行改进,采用由彩色SIFT特征生成视觉词汇的方法,实验表明,论文研究的方法,分类效果提高明显。2、采用概率潜在语义分析(PLSA)模型对词汇表进行分析,发现图像中的潜在语义主题。把图像视为一篇由若干“视觉词汇”所组成的文档,把图像中的物体看成该图像文档所包含的潜在主题,利用PLSA模型发现图像中潜在语义主题的概率分布。3、利用K-最近邻(K-nearest Neighbours Classier,KNN)分类算法实现基于概率潜在语义分析的场景分类。实验表明,结合PLSA模型和KNN分类器的图像场景分类系统,可获得比其它场景分类方法更加理想的场景分类效果。
其他文献
变压器是电力系统中最重要的枢纽设备之一,对保障电力系统的安全运行起着十分重要的作用,必须最大限度地避免和减少变压器故障的发生。变压器油中溶解气体分析技术目前已成为变压器故障诊断中应用最普遍、最重要的技术之一,该技术能够根据气体的组分及含量变化判断变压器故障类型、部位严重程度及发展趋势,还能够发现用电气试验不易发现的潜伏性故障。然而该技术在判断具体某种故障类型的过程中存在一定的不确定性,针对这个问题
聚束SAR模式是合成孔径雷达成像中的一种重要工作模式,主要用于对较小特定区域进行较为细致的观测,通过调控波束指向,使其长时间照射目标区域而获得更高方位向分辨率。但由于
随着智能电网的发展,电力通信网在电力系统中的作用也越来越重要。SDH传输网作为电力通信网的骨干网络,承载了大量的电力生产及管理业务,其运行情况直接关系电力系统的安全稳定运行。本课题以电力通信SDH传输网为目标网络,通过实时采集SDH网络中的告警信息并对告警进行相应的统计分析来实现对网络性能的监测,具有重要的工程应用价值。本文从SDH传输网告警采集的现状出发,同时结合告警数据和接口的分析,阐述了系统
国际电联ITU-R第14次会议为3G的FDD和TDD系统划分了2.5-2.69GHz频段。2007年10月ITU批准WIMAX加入3G家族,基于802.16-2005标准的WIMAX系统可以使用的频段范围为:2.495-2.69GH
近年来,随着互联网飞速发展与数据业务的急剧增长,连接骨干网与用户间的接入网成为整个网络的瓶颈。而光纤到户(FTTH)作为接入网发展的最终目标,被广泛认为是一种理想的综合
IEEE 802.16是目前在宽带无线接入领域一种最具代表性的技术。宽带无线接入的一个重要目标是支持日益成为主流的多媒体业务。而为了支持多媒体业务,IEEE802.16使用接纳控制,
说话人识别是根据语音波形中反映说话人生理和行为特征的参数,自动识别出说话人的过程。作为一种生物认证技术,说话人识别技术广泛应用于互联网通信、银行等领域。本文详细介
近年来,无线技术快速发展,从最初只能进行语音通信的1G技术慢慢进步为无论是业务种类还是通信性能都有显著增长的4G通信,这使我们享受到了先进的数据传输技术所带来的便捷之
在中国黑龙江省会哈尔滨市的一个大型公园对面,绿树成荫的幽静环境中,有一家名为“久品康”的酒店.酒店门面高雅而富有传统文化韵味,乍一看让人感觉不是一家酒店,更像一家会
可编程片上系统SOPC(System On a Progammable Chip)作为一种基于FPGA的可重构SOC(System On a Chip),集成了系统需要的模块如处理器、存储器、I/O口等到一起,完成整个系统的