语者发现与跟踪技术的研究及应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:oceanspring
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语者发现与跟踪技术作为说话人识别技术的应用之一,它解决的是在待处理的音频文件中的语者数目、语者身份、语音背景等都未知的情况下,检测和识别出谁在音频文件中的什么时刻说了话,实现对音频文件中的不同语者的语音的有效分割、检测和识别。语者发现与跟踪技术有着广泛的应用前景,例如,针对电话语音、新闻广播、会议等音频数据,利用该技术实现对音频数据中的语者的语音进行检测和跟踪,高效的提取语者的语音信息。语者发现与跟踪系统一般主要包括特征提取、语音检测、说话人分割、说话人聚类和说话人识别,其中特征提取、语音检测和说话人分割的性能直接影响着系统的性能。本文重点在以下方面进行了研究:  (1)概括和归纳语者发现与跟踪系统的发展现状和技术基础。  (2)概括了说话人分割聚类常用的特征,重点研究了MFCC的提取过程及参数的设置,并引入短时能量和基音周期与MFCC融合,比较组合出的新的特征与MFCC的分割性能,选择出最佳的特征。  (3)概括了语音检测算法的常见技术,重点研究了基于统计模型的语音检测算法,提出了针对普通话的语音前端检测算法,实现对典型算法的改进和完善。在低信噪比环境下,语音前端检测算法能够有效的改善语音的前端检测错误。  (4)概括了说话人分割算法的常见技术,重点研究了基于度量距离的说话人分割算法,完成了对BIC分割算法和DISTBIC分割算法的对比,选择出最合适的分割算法。  (5)完成对语者发现与跟踪系统的设计与实现,系统的技术环节有特征提取、语音检测、说话人分割、说话人聚类、说话人重分割、说话人重聚类和说话人识别,分析了各个功能模块的实验结果及对系统性能的影响。
其他文献
电,已经成为人们生产生活中必不可少的最重要基础能源.随着各种新能源的高速发展,市场竞争的事态越发激烈,电力企业要想切实的提高自身的市场竞争力,就需要实现经济管理方面
学位
随着社会科学技术的发展,对于显示和观看的需求已不再限于二维平面,人们希望显示器能够真实地再现空间场景的三维信息。因此,立体显示应运而生并不断得到发展,成为当今显示领
随着社会的发展,我国各项产业获得了发展的契机.产业投资基金促进社会储蓄朝着投资转化,同时也使经济的增长方式彻底发生了改变,产业升级和结构也在进一步优化和调整,推进直
新时代背景下,现代化企业想要在激烈的竞争中站稳脚跟,就应该不断强化对投资管理工作,通过采取优质的管理手段确立完善的企业投资管理制度,积极引进和培养投资管理人才,有效
伴随着时代的发展,各个国家都在大力发展自身经济,都在努力创新和完善.任何一个国家都有中小企业,同时中小企业普遍面临一个共同问题,那就是“融资问题”.这是世界范围内的难
学位
近年来,各个企业越来越重视知识产权的建立.加强企业知识产权管理,挖掘企业知识产权中蕴含巨大商业价值成为企业竞争中的必胜法宝,本文从企业内、外部试探通过完善企业内部管
纸币图像识别技术是最近十年来在模式识别领域非常活跃的一个课题,对于金融行业来说有着非常重要的意义,它的作用是给出纸币面额、朝向、真假等清分信息并传给控制装置。随着
学位