基于稀疏表示的说话人识别研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:Vilmar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代生物识别技术的不断发展,说话人识别技术受到了越来越多的专家学者的关注。通过分析说话人的语音信息,从而有效的识别说话人的身份,说话人识别技术因其简便高效的特性受到广泛应用,例如网络安全、司法鉴定以及国家信息安全等领域。传统的说话人识别方法中,GMM-UBM采用通用背景模板自适应说话人模型,反映出了个性特征,但是计算量过大,区分能力不足,而流行的SVM分类器利用非线性核函数进行分类,尽管识别性能有所提高,但却过度依赖样本数据的分布。稀疏表示原理能够利用数量最少的原子反映信号特征,从而进一步提高系统的区分性。因此在深入的分析稀疏表示的原理以及字典构造方法的基础上,提出了基于稀疏表示的说话人识别,同时将Fisher判别字典学习算法应用于说话人识别,具体工作如下:(1)研究学习稀疏表示理论,对语音信号的稀疏性进行分析,探究语音信号稀疏性表示的可行性,结合语音信号的可重构的特性,提出基于稀疏表示的说话人识别方法i-SRC,采用当前主流的i-vector建模方式为说话人建立模型,利用说话人的均值超矢量构造随机字典,再通过重构误差进行识别,实验显示,GMM-SRC的识别率确实有所提升。(2)为了进一步提高识别的效率,在i-SRC的识别方法基础上,学习探讨了字典的构造方法,引入了一种具有判别性的字典学习方法,即Fisher判别字典学习算法,利用该算法训练得到一个具有区分性的结构化字典,该字典的原子与类别标签存在对应关系,以此可以很好地利用重构信息对测试语音进行分类。在NIST的语音数据库上的实验也表明,引入新字典算法改进后的识别方法等错误率有所下降,而识别效率得到了提高。
其他文献
计算机化自适应测验(Computerized Adaptive Test,CAT)是基于项目反应理论(Item Response Theory,IRT),并由计算机根据被试能力水平自动选择试题,最终对被试能力做出估计的一
在计算机系统中,存储子系统的能耗占据着相当大的比重,降低存储子系统的能耗对于降低整个系统的能耗具有十分重要的意义;同时,存储系统的性能也是整个计算机系统性能的瓶颈之
随着移动通信技术的飞速发展,基于无线传感器网络(Wireless Sensor Networks,WSNs)的定位技术受到越来越多的关注。无线传感器网络是由大量随机部署在监测区域的传感器节点组
优化是人们在科学研究、工程技术和经济管理等诸多领域中经常遇到的问题。粒子群优化算法(PSO)是最近十年来提出来的一种启发式群智能全局优化进化算法,具有原理简单、容易实
在现代工业生产乃至日常生活中,经常要用到各种各样的电动机,随着国民经济的不断增长,其需求量与使用量也在不断增加,成为国民经济生活中不可或缺的角色。但在实际的生产过程中,由于电网波动、负载冲击等影响经常造成电动机故障甚至损坏,对国民经济造成巨大影响,本文对电动机保护展开研究。首先介绍了电动机保护的意义、发展现状和存在的问题,针对电动机各种故障特征建立了相应的数学模型,讨论了交流电流保护的理论和算法。
互联网已经进入多媒体时代,越来越多的服务商介入流媒体行业,其中尤以网络电视和网络视频分享占主流位置,著名的公司企业我们早就耳熟能详。网络电视服务商使用P2P技术优化服
随着网络技术在当今世界的繁荣发展,网络上所承载的信息量也越来越多。在各种形式的网页所展示的数据中,包含结构化形式的数据的网页占有重要的地位,如何从这些结构化数据的
人脸检测是人脸识别系统中一个重要的步骤,是一门复杂的交叉学科,涉及到模式识别,图像处理,算法设计,计算机图形学等相关学科,人脸检测结果为人脸识别提供直接处理数据,所以
学位
在基于IEEE 802.11标准的无线局域网络中,节点的无线收发器可以使用免执照的ISM无线频段(Industrial, Scientific, and Medical Bands)进行通信。因而,便携电脑和PDAs(Person