基于图像显著性与PLSA-GMM的自动标注技术研究

来源 :河南理工大学 | 被引量 : 1次 | 上传用户:winterryliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在基于内容图像检索研究领域,由于图像底层视觉特征与高层语义间“语义鸿沟”问题的存在,图像语义自动标注技术得到了广泛的研究。本文主要围绕着图像自动标注技术开展工作,论文首先介绍了图像标注与检索技术的现状、图像标注涉及的关键技术,在此基础上,提出了基于GMM(高斯混合模型)与PLSA(概率潜语义)的图像标注方法,并进一步基于反馈日志来提高标注效果。  论文的主要工作及创新如下:  (1) 对图像标注关键技术进行了梳理和总结,主要包括图像特征、图像标注模型、反馈技术、相似性度量及图像标注性能评价方法。  (2) 针对图像背景区域干扰的存在,基于图像前后背景分离思想,并分别提取的图像特征,通过使用 PLSA 在图像底层特征与标注词之间插入隐含主题,并建立隐含主题与标注词之间的关系;然后使用 GMM 通过机器学习建立模型参数,通过该模型完成图像标注。在此基础上,文中又设计了一种融合多特征(颜色特征、形状特征和纹理特征)的基于PLSA-GMM的图像标注方法。  (3) 为了减少底层特征与语义之间的差距,文中将日志反馈技术引入到自动标注中,基于日志信息、WordNet与PLSA-GMM模型,通过系统反馈来提高图像标注的性能。  (4) 基于上述图像标注模型,基于JAVA语言,实现了一个图像标注与检索的原型系统。
其他文献
目前电子商务领域普遍使用PKI、动态口令等技术来满足网络身份认证的安全需求。然而,常见的身份认证设备如USB KEY、动态口令牌等都存在潜在的安全隐患,以及便携性和扩展性等
团扇绢本设色纵25.1厘米横25.1厘米中国台北故宫博物院藏此图绘一对鸳鸯在水池中玩耍,小鸟停在树枝间顾盼生姿。在构图上鸳鸯、树等主体景物偏右,打破了对称的格局。画法上小
摘要:数形结合就是把抽象的数学语言与直观的图形结合起来。通过数与形之间的对应和转化来解决数学问题,数形结合思想通过“以形助数,以数解形”两个方面,它使復杂问题简单化,抽象问题具体化,变抽象思维为形象思维。  关键词:二次函数;二次方程和不等式;数形结合思想
本文研究了递归重叠时分复用(ROvTDM)技术,分析了ROvTDM系统三种结构的误码率性能,包括单路的ROvTDM系统、ROvTDM系统的并行级联结构及ROvTDM系统的乘积结构。并与非递归的重
弹丸膛内运动参数是武器设计和改进的重要依据,其中弹丸速度的提取有着尤其重要的意义。毫米波干涉仪利用多普勒效应可以实现对速度信息的有效提取,并且对于烟雾等恶劣环境还有着极好的穿透特性。毫米波单路干涉仪对测量弹丸速度急剧变化时估计误差很大,本文提出了双路干涉理论,对双路弹丸速度回波信号差分后,计算瞬时频率,采用时频分布手段进行处理,反演得到速度-时间曲线,将速度估计误差降低1个数量级。本文对非平稳信号
广电行业在三网融合的大背景下,提出了建设下一代广播电视网(NGB)的概念,并采用无源光网络(PON)和有线同轴电缆承载以太网(EOC)的联合技术来实现网络改造,从而开展全新的数字
声呐是利用水下的声信号对水中目标进行探测、勘察和通讯的设备,是水声学中使用最广泛、最高效的装置[23]。声呐是各国海军进行水中监测利用的重要手段。对水中目标进行检测、
随着因特网的日益普及、第三代移动通信技术的广泛使用和多媒体业务的迅猛发展,视频应用领域不断扩大,开发高质量、高性能的嵌入式视频压缩系统具有重要的理论意义和实用价值
利用图像序列进行运动目标的检测是很多计算机视觉应用的基础步骤。视频中的运动物体往往是需要关注的目标,运动目标检测算法的目的就是找到和提取这些目标的所在区域。传统的
随着宽带多媒体及互联网业务的迅猛发展,未来移动网络在技术变革的同时将更加关注用户体验质量(Quality of Experience,QoE)。除了提高系统吞吐量性能,对各种新兴业务的支撑能力