基于对话型语音的说话人在线识别技术研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:whg_2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种较为有效的生物认证技术,它通过对语音数据的分析判断出何人在什么时间发出了声音。这种技术具有十分广阔的应用前景,已有的应用系统多为简单的说话人确认系统。本文研究了对话型语音的说话人识别技术,并实现了一个实用的说话人辨认系统。主要工作归纳如下:(1)提出了两阶段贝叶斯信息准则BIC (Bayesian Information Criterion)分割方法,第一阶段采用较大窗长分割策略保证了在线识别方法的即时性,第二阶段基于BIC的分割准则保证了说话人分割的准确性。(2)实现了一个基于矢量量化VQ (Vector Quantization)的说话人识别系统,改进了传统的LBG算法,使其更好的满足系统的在线识别特性。(3)提出了基于差别子空间的说话人识别方法,为每个说话人建立相应的子空间,将测试语音的个性特征与训练库中子空间进行比较,比较得分最高的即为识别结果。该方法有效提高了系统识别的准确率,同时降低了系统的时间开销,适合在线识别系统采用。(4)实现了一个基于对话型语音的说话人在线识别系统。
其他文献
Ad hoc网络是一组带有无线收发设备的移动节点组成的多跳临时性自治系统。Ad hoc网络凭借快速组网的优势,正迅速成为现代通信系统的重要组成部分,在军事和民用方面具有广阔的
随着经济的迅速发展、商品种类日趋多样化,假冒伪劣商品也日益增多。假冒伪劣商品不但影响经济的健康发展,而且损害企业和广大消费者的利益。传统的基于纸质材料防伪技术易于
目前软件工程中的验证与测试技术正不断融合,相互借鉴,共同为提高软件的安全性、可靠性做出努力。验证的模型检测方法可以应用于测试当中,而经过测试所得出的一致性结论又可
在校园综合系统建设发展中,夹杂着许多不同时期开发的异构系统,它们在讯息的互通互联上存在着很多的问题。系统越是扩展,讯息孤立的问题就越是严重,对校园的电子化发展造成了一定
多媒体内容检测是多媒体数据库中的一项重要应用。内容检测时提取的特征向量往往具有高维特性,传统的多维索引结构在高维空间中会面临着“维数灾难”问题。本文针对高维空间
现代社会,随着计算机技术与通信技术的发展,计算机的应用越来越广泛,但同时网络安全问题也日益突出。传统的安全保护措施如防火墙、数据加密等已不能完全满足网络安全的需要
随着工业、军事等领域对异常检测需求的日益增大,加之高性能、高可靠性图像处理算法的日益成熟,促使机器视觉技术广泛应用于异常检测当中。针对实际需求和一些亟待解决的问题
随着VCD、DVD、EVD、VOD等数字视频产品日益丰富,互联网技术的发展极大地推动了多媒体信息的广泛传播。然而,由于数字产品复制不会引起质量下降,非法用户可以容易地获取、复
视频质量评价作为数字多媒体技术中一项重要的技术之一,已经成为了视频研究的一个焦点,它在视频压缩、传输以及通讯领域中都占据举足轻重的地位。一个好的客观质量评价算法因
随着三维建模软件的广泛使用和三维扫描技术的发展使得三维模型的获取变得越来越简单,产生了大量的三维模型,并且三维模型开始被广泛应用于各个领域。三维模型已经成为继图像