基于语音的多媒体场景标记辅助系统

来源 :上海大学 | 被引量 : 0次 | 上传用户：ffanhaixin

【摘要】

：

标引的目的是通过给音频-视频数据加入标记，对其内容进行描述，以便于信息的检索和查询。语音标引在媒体资产管理中扮演了很重要的角色。本文介绍了一种基于语音识别的多媒体场

【作者】

：

杨庆涛

【机构】

：

上海大学

【出处】

：

上海大学

【发表日期】

：

2006年期

【关键词】

：

媒体资产管理语音标引 EBF网络数据融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

标引的目的是通过给音频-视频数据加入标记，对其内容进行描述，以便于信息的检索和查询。语音标引在媒体资产管理中扮演了很重要的角色。本文介绍了一种基于语音识别的多媒体场景标记辅助系统，该系统可自动识别标引员所说的短语，辅助标引员在视频媒体上实现标引。系统从语句中将这些短语分割出来，通过EBF神经网络进行建模。实验结果证明，该系统性能良好且具有实用性，在媒体资产管理方面有广阔的应用前景。本文主要内容是基于语音关键词识别技术的语音标引系统的研究与实现，提供了一个性能优良的语音识别引擎，通过系统测试，标引正确率达到91.3％。并以此引擎为基础，开发了面向广电体育节目编辑系统的语音标引平台。本文的工作主要集中在以下几个方面：第一，基于神经网络语言模型的识别网络构建。挑选出体育足球节目常用的一些关键词语构建一个与该关键词唯一对应的识别网络，在此识别网络的基础上进行关键词的识别。第二，将自适应加权融合算法应用于最后标引系统输出决策。对于用不同特征得到的识别结果，采用自适应加权融合的算法进行融合，经过此步骤处理的决策系统可以显著提高标引结果的正确率。第三，语音标引系统的实现。本文从系统设计到实现，提供了一个高扩展性能的语音识别引擎，它是针对汉语特定人关键词语音检索应用而开发的，能实现一个面向体育节目的语音检索平台，能够检索包含指定汉语关键词的WAVE格式文件，实验证明通过使用以上方法，系统能够获得良好的性能。

其他文献

基于无线传感器网络的移动机器人导航研究

救援机器人能够代替人员深入火场、矿井等危险的现场进行救援,受到了国内外研究机构的广泛关注。然而,传统救援机器人受到遥控距离短、感知范围有限、定位精度不准确等限制,

学位

无线传感器网络移动机器人导航动态路径规划自主构图机器人操作系统(ROS)

基于烧成带图像的回转窑熟料烧结工况识别方法研究

回转窑是一种大型的、生产水泥、氧化铝等工业原材料的核心热工设备。由于受到窑体旋转以及窑内复杂的燃料燃烧、物料烟气对流换热等因素的制约,现有的测量手段难以实现对回

学位

回转窑图像处理深度学习独立子空间分析单词包模型模式识别烧结工况

酒店营销中的竞争策略

期刊

餐农携手前景广阔