论文部分内容阅读
近年随着互联网应用日益普及,网络多媒体数据量呈现爆炸式增长。更多人选择通过网络渠道来获取感兴趣的音视频新闻信息,高效精确的新闻音视频检索的重要性愈发凸显。传统的基于人工标注的新闻音视频检索方式若要从一段长的视频新闻中找出关心的新闻条目只能通过人工线性的逐步检测,需花费较高时间成本,同时不准确的新闻人工标注信息还会造成目标新闻检索的偏差。针对上述问题,本文在研究现有的基于内容的视频检测(CBVR,content based video retrieval)技术之后,以新闻音视频为研究对象,分析了音视频新闻的特点,然后基于音频静音衔接片段与镜头边缘检测的新闻条目分段方法,并利用FFmpeg多媒体处理,语音识别等技术,针对广电行业媒资管理人员设计实现了一套音视频新闻内容侦测软件系统。本文设计的音视频新闻内容侦测系统包括音视频新闻故事条目分段、音视频新闻片段预处理、基于关键字的新闻片段检索播放三个模块,主要工作有:1、研究新闻视频镜头突变以及音频静音衔接片段的特点,结合音频静音衔接片段检测与视频镜头边界检测技术,将新闻音视频素材以新闻条目为单元切割成独立新闻片段,完成音视频新闻故事条目分段模块的设计与实现。2、在获得新闻音视频条目片段的基础上,利用FFmpeg多媒体处理技术对获取的新闻故事条目片段进行音视频分离,并对分离出的音频进行格式转换,获取下一步用于内容检测的新闻音频素材;基于第三方语音识别开发库对处理过的音频进行内容识别,获取其新闻内容文本并保存成文件供后续的目标新闻检索使用,完成音视频新闻片段预处理模块的设计与实现。3、对分离出的所有新闻条目的内容文本文件逐个进行关键字匹配,检索出包含关键字的相应文本文件及其对应的视频新闻条目,并设计播放模块用以播放搜索结果,完成基于关键字的新闻片段检索播放模块的设计与实现。最后,对本文的研究内容进行了总结,经验证,设计实现出的音视频新闻内容侦测软件能够较好的完成目标新闻片段的分段、预处理以及检索,满足功能及性能需求设定。