基于多示例学习的视频字幕提取算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ltavip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于互联网及多媒体技术的飞速发展,使得人们所接受的大部分信息是图像或视频信息,但是由于图像的底层特征与高层语义之间存在着一条难以逾越的鸿沟,视频字幕提可以有效获的取图像的高层语义信息,从而提取图像中有用的信息。多数研究人员主要通过提取字符块的形状、纹理等底层特征来进行字幕提取,其精确度和效率还有待提高,机器学习在图像处理中的应用为字幕提取研究带来的生机。本文提出了一种基于多示例学习的视频字幕提取算法,多示例学习是一个比较新颖的机器学习框架,其改变了传统的分类器的分类模式,将数据集分成带有标记的包和不带标记的示例,若包中至少有一个示例为正,则把含有该示例的包标记为正,反之,若包中所有的示例均为反时,则该包标记为反,然后继续对正包中的示例重新建包,迭代计算,直到最大程度的将正反示例分开为止。本文通过改进后的多示例学习算法SVM-MI进行视频字幕提取相关的研究,由于支持向量机是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。SVM-MI算法汲取支持向量机可以解决高维和非线性问题等优点,成功将多示例学习转化为单示例学习问题,并且比现有的多示例学习算法在时间复杂度和鲁棒性上都有了明显的提高,该算法在视频字幕提取应用中取得不错的效果。实验证明,字幕提取的准确度有了很大的提高。
其他文献
Android系统由于免费、开源、可移植等优点,在移动市场发展迅猛,成为占有率最高的操作系统。Android流行的同时,伴随着层出不穷的恶意软件。恶意软件可以窃听通话、窃取信息
目前,全球范围内的垃圾邮件问题日益严重,不仅严重占用网络资源,威胁网络安全,更对人们的日常生活造成了严重困扰,给传统反垃圾邮件过滤技术带来了巨大挑战。云计算的出现和发展,打
图像分割是图像处理与计算机视觉领域中的基本技术之一,图像分割是指利用图像的灰度、颜色、纹理、形状等将一幅图像分割成若干个独立的有共同像素属性的对象,其实质是一个按
随着科技的发展和人们生活水平的提高,旅行已经成为越来越多的人生活中至关重要的一环,虽然现在有关旅行的应用系统很多,但真正能够满足用户实际需求的却很少,例如通过搜索引
虚拟心脏利用数学模型对心脏功能进行系统的仿真,以揭示其内部的运行机制以及临床医学和实验中一些无法解释的生理现象本质。该研究是一个集心脏解剖学、生理学、分子生物学
随着计算机的快速发展,软件产品在人们的生活中扮演越来越重要的角色,软件质量的重要性不言而喻,软件测试作为确保软件产品质量的重要方法,在软件的开发流程中所占的比重逐渐
随着大幅面扫描仪在更多专业领域的应用,用户在扫描精度和扫描速度上对其的需求也越来越多,进而使得新一代大幅面扫描仪的研究和开发更具现实意义。本文所述的大幅面扫描仪采用
随着互联网技术的不断发展与普及,IPv4地址不足的缺陷日益明显,作为以解决地址问题为首要目标的IPv6技术,逐渐登上互联网的大舞台。邻居发现协议是IPv6协议族中一个较为重要
近年来,随着容错技术的发展,软件容错技术作为一种提高软件可靠性的重要方法越来越引起关注。软件容错的主要技术包括:基于重复指令的错误检测技术(EDDI),基于数字签名的控制流检测
随着互联网科技的发展,人工智能在教育领域得到了广泛的关注与应用。通过机器解答数学应用题从而帮助学生提高解决问题的能力也是当前研究的热点,从更大范围上讲,教育机器人