基于核密度的半监督学习算法在视频语义标注中的应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:dongdongthere
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上世纪九十年代以来,多媒体信息迅速膨胀,基于内容的视频检索成为了研究的热门课题。其中,如何利用机器学习理论使计算机能自动获取视频中的语义信息,以便有效地进行视频语义检索,是当今多媒体研究领域中一个亟待解决的问题。因此,如何进行有效的视频语义标注是本文研究的目的。目前已有的视频语义标注方法多是基于统计学理论,采用全监督学习方法进行语义标注工作。这种方法需足够多的已标记样本进行学习,从而建立分类器用以标记未知样本。众所周知,获取大量已标记样本是一项费时费力的工作,而获取大量未标记样本却是一项非常容易的工作。如此,通过对少量已标记样本和大量未标记的样本进行学习从而建立分类器的半监督学习方法应运而生。若其最终的学习效果与全监督学习方法的效果一致或接近,则在人工成本和实现上,半监督学习方法更具有优越性。如何利用未标记的视频样本信息达到类似于全监督学习的效果是半监督学习方法的关键。本文讨论了利用半监督学习方法进行视频语义标注的问题。文中采用统计学理论,利用贝叶斯概率公式计算视频语义出现的概率,选取概率最大的类别标注未标记的样本。在计算的过程中,使用了未标记样本的信息计算语义出现的后验概率。通过在贝叶斯概率公式中添加未标记样本信息的影响因子,利用未标记的视频样本信息,将半监督学习的方法引入视频语义标注的工作中,综合利用已标记和未标记的样本信息进行语义概率计算。核密度估计方法从数据样本本身出发研究数据分布特征,不利用有关数据分布的先验知识,避免了模型估计和参数估计的主观影响。为了使标注的视频语义更准确、有效,达到本文研究的目的,本文采用的半监督学习方法基于高斯核函数,结合半监督学习和核密度估计方法的优越性,采用最优的未标记样本信息参数影响因子对未标记的视频进行语义标注。文中针对该标注方法设计了语义标注性能分析系统,研究本文采用的方法的性能。结果表明:本文讨论的这种半监督学习方法可获得近似或等于全监督学习方法的结果,减少了人工工作,能提高视频语义标注性能,有利于大规模视频语义标注。
其他文献
词汇之间存在多种关系,如:上下位关系、同义关系、反义关系、整体-部分关系等等。其中,作为重要语义关系的一种,上下位关系是描述事物层次关系的基础。在中文自然语言处理中,
随着计算机网络与分布式计算技术的日趋成熟,基于MVC模式的Struts框架逐渐成为中小企业网站开发的主流。根据安全公司的报告显示网络攻击已经开始和经济利益挂钩,对于中小企
随着经济技术的发展,越来越多的设备和技术应用到汽车的安全防御和报警上,以便在更大程度上保证人们的行车安全。将这些设备安装到车上,并采集到更加准确、实时的信息是实现
随着网络和多媒体技术的发展,流媒体应用越来越流行。然而现有的互联网络缺乏对实时通信的良好支持,影响了流媒体的传输性能。同时,流媒体传输对系统I/O和网络带宽的高要求,
运动目标检测技术是计算机视觉领域的重要研究内容,它在工业、医学、军事、教育、商业、体育等领域有着广泛的应用。对运动目标进行准确的检测是序列图像分析的基础性工作,也
随着计算机网络技术、数字电视技术和通信技术日益成熟以及消费者对精神文化生活需求的迅速增长,CG(计算机图形图像)作为文化产业中重要的视觉媒体一部分业已得到越来越多的
随着互联网的广泛应用,网络安全问题日益严峻,恶意代码已成为互联网最严重的安全威胁之一。当前恶意代码传播与攻击手段呈现复杂化、多样化的趋势。传播方面出现了新的传播方
随着信息技术的飞速发展,计算机已经普遍应用于各行各业,成为目前应用最为广泛的信息处理和信息传输的设备。而这些信息处理设备在商业、军事、政府中处理重要的涉密信息时,
中医舌诊是通过观察舌的各种特征来了解人体的健康状况,从而对各种疾病做出诊断及病情评估,是祖国中医学应用最广、最有价值的诊法之一。随着现代科学技术的发展,将图像处理
近年来,随着虚拟仪器技术、运动控制技术的显著进步以及工业总线的迅速普及,将虚拟仪器技术应用于数控折弯机系统,使信号采集、传输、处理分析和控制一体化,已成为一种趋势。