基于语音的多媒体场景标记辅助系统

来源 :上海大学 | 被引量 : 0次 | 上传用户:ffanhaixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标引的目的是通过给音频-视频数据加入标记,对其内容进行描述,以便于信息的检索和查询。语音标引在媒体资产管理中扮演了很重要的角色。本文介绍了一种基于语音识别的多媒体场景标记辅助系统,该系统可自动识别标引员所说的短语,辅助标引员在视频媒体上实现标引。系统从语句中将这些短语分割出来,通过EBF神经网络进行建模。实验结果证明,该系统性能良好且具有实用性,在媒体资产管理方面有广阔的应用前景。 本文主要内容是基于语音关键词识别技术的语音标引系统的研究与实现,提供了一个性能优良的语音识别引擎,通过系统测试,标引正确率达到91.3%。并以此引擎为基础,开发了面向广电体育节目编辑系统的语音标引平台。本文的工作主要集中在以下几个方面: 第一,基于神经网络语言模型的识别网络构建。挑选出体育足球节目常用的一些关键词语构建一个与该关键词唯一对应的识别网络,在此识别网络的基础上进行关键词的识别。 第二,将自适应加权融合算法应用于最后标引系统输出决策。对于用不同特征得到的识别结果,采用自适应加权融合的算法进行融合,经过此步骤处理的决策系统可以显著提高标引结果的正确率。 第三,语音标引系统的实现。本文从系统设计到实现,提供了一个高扩展性能的语音识别引擎,它是针对汉语特定人关键词语音检索应用而开发的,能实现一个面向体育节目的语音检索平台,能够检索包含指定汉语关键词的WAVE格式文件,实验证明通过使用以上方法,系统能够获得良好的性能。
其他文献
救援机器人能够代替人员深入火场、矿井等危险的现场进行救援,受到了国内外研究机构的广泛关注。然而,传统救援机器人受到遥控距离短、感知范围有限、定位精度不准确等限制,
回转窑是一种大型的、生产水泥、氧化铝等工业原材料的核心热工设备。由于受到窑体旋转以及窑内复杂的燃料燃烧、物料烟气对流换热等因素的制约,现有的测量手段难以实现对回
期刊
期刊
一、国际餐饮名店 香港镛记酒家集团有限公司 上海梅龙镇酒家 洛阳真不同饭店 杭州新开元大酒店 哈尔滨友谊宫 山东淄博饭店 成都海凌阁大酒楼 山东天外村酒楼有限公司 重庆
期刊
期刊
事件触发控制是一种满足特定触发条件才执行控制任务的非周期控制机制。它在保证稳定性和其他性能的前提下,显著节约网络化控制系统的通信资源。另一方面,执行器饱和普遍存在于
口味滑香可口、咸鲜适中有浓厚的鸭香味和元鲍的香味。颜色淡黄色。金虾白菜心糖、味精主料配料制法)诚然薯制法鲜靳往一大白菜心。干辣椒、二汤。盐胡椒粉、油、淦粉。1)将
期刊
期刊
10月23日上午8点30分,中国共产党辽宁省第十次代表大会在辽宁人民会堂隆重开幕。来自辽宁省各条战线的党员代表,肩负着全省310万共产党员和4200万人民的重托,精神饱满地步入