音视频新闻内容侦测系统的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jimmyhill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年随着互联网应用日益普及,网络多媒体数据量呈现爆炸式增长。更多人选择通过网络渠道来获取感兴趣的音视频新闻信息,高效精确的新闻音视频检索的重要性愈发凸显。传统的基于人工标注的新闻音视频检索方式若要从一段长的视频新闻中找出关心的新闻条目只能通过人工线性的逐步检测,需花费较高时间成本,同时不准确的新闻人工标注信息还会造成目标新闻检索的偏差。针对上述问题,本文在研究现有的基于内容的视频检测(CBVR,content based video retrieval)技术之后,以新闻音视频为研究对象,分析了音视频新闻的特点,然后基于音频静音衔接片段与镜头边缘检测的新闻条目分段方法,并利用FFmpeg多媒体处理,语音识别等技术,针对广电行业媒资管理人员设计实现了一套音视频新闻内容侦测软件系统。本文设计的音视频新闻内容侦测系统包括音视频新闻故事条目分段、音视频新闻片段预处理、基于关键字的新闻片段检索播放三个模块,主要工作有:1、研究新闻视频镜头突变以及音频静音衔接片段的特点,结合音频静音衔接片段检测与视频镜头边界检测技术,将新闻音视频素材以新闻条目为单元切割成独立新闻片段,完成音视频新闻故事条目分段模块的设计与实现。2、在获得新闻音视频条目片段的基础上,利用FFmpeg多媒体处理技术对获取的新闻故事条目片段进行音视频分离,并对分离出的音频进行格式转换,获取下一步用于内容检测的新闻音频素材;基于第三方语音识别开发库对处理过的音频进行内容识别,获取其新闻内容文本并保存成文件供后续的目标新闻检索使用,完成音视频新闻片段预处理模块的设计与实现。3、对分离出的所有新闻条目的内容文本文件逐个进行关键字匹配,检索出包含关键字的相应文本文件及其对应的视频新闻条目,并设计播放模块用以播放搜索结果,完成基于关键字的新闻片段检索播放模块的设计与实现。最后,对本文的研究内容进行了总结,经验证,设计实现出的音视频新闻内容侦测软件能够较好的完成目标新闻片段的分段、预处理以及检索,满足功能及性能需求设定。
其他文献
近年来,随着无线传感器网络(Wireless Sensor Networks,WSNs)理论与实践研究的不断深入,其应用也随之不断涌现出来,目标跟踪(Target Tracking)就是其中的典型应用之一。无线
人脸识别是模式识别和计算机视觉领域非常活跃的研究课题,迄今为止,对于人脸特征的提取主要都是计算全局人脸特征,这样很容易产生在高维特征空间中特征向量对齐问题,并且容易
随着Internet技术的出现和通信技术的迅猛发展,人类积累的数据无论从规模上还是维数上都大大增加了,使得一些传统经典的聚类算法的效果急剧下降。为此,本文研究了投影寻踪线
模型预测控制作为处理现代工业过程控制的有力工具引起了广泛关注。现代工业通常要以经济效益最大化为目标,且需要有效的减小优化时间,因而系统的优化运行至关重要。本文对监
分子影像作为影像医学发展的最新阶段,因其能够探测疾病过程中细胞和分子水平的异常,为疾病在分子水平的治疗开启了一片崭新的天地。光学分子影像的优势使其在各种分子影像的
叶面积指数(LAI)是衡量陆地上植物光合作用能力的重要参数,目前常用的LAI测量方法有直接法和间接法两种,半球摄影法就是间接法中的一种。随着数码相机的普及以及图像处理技术
任务教学法是交际教学思路的一种发展形态,将其应用于商务英语阅读教学,可提高教学的针对性和实用性,发展学生综合运用语言的能力。 The task teaching method is a kind of
本文通过对荣华二采区10
介绍了热电偶、热电阻的分度号,测温范围、允差、适用条件及热响应时间,并且列表说明了各种温度检测仪表的测量范围。 Introduced thermocouple, RTD indexing number, temp
随着电力电子、微电子技术、交流调速系统和现代控制理论的发展,交流同步电机调速方案中的一些关键问题得到了解决,使得交流电机调速系统应用到更多的领域。由于具有高功率密度