基于PCANN的语音特征参数研究及在说话人识别中的应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhongbeiljb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从语音信号中有效地提取个人特征信息进行说话人身份的识别,是语音识别研究领域的一个重要研究方向。本文主要研究基于神经网络的主分量分析(PCANN),并将其应用到噪声环境下说话人的特征提取中,进一步分析其性能。主要工作如下: 首先,分析语音特征参数的提取过程,在噪声环境下对常用特征LPC、LPCC和MFCC等进行评价;对主流特征进行二次处理,包括加权、差分、组合和提取多帧部分特征(MFS),进一步剥离出隐藏在语音背后的说话人特征,并分析所得高维特征在说话人识别系统中的性能。 其次,研究主分量分析原理,结合主分量分析和神经网络,用自适应的线性神经网络实现最大主分量和多个主分量的提取,获得其神经网络模型和权值训练算法,并分析其性能。 最后,针对高维特征计算复杂度高、实时性差等缺点,用PCANN方法对其进行降维。提出基于PCANN的说话人识别系统,分析其工作过程,并考察PCANN方法去冗余、降维和降噪等特性。
其他文献
无线传感器网络(Wireless Sensor Network,WSN)是一种群体智能系统,对它的研究由来已久。目前其最新的研究和发展形式表现为物联网。物联网的实际应用和发展前景很广阔。然而
本文基于跨层的思想,研究了满足QoS要求的AMC的“阈值”设计,综合考虑物理层的信道状态信息、MAC层的队列状态信息以及应用的QoS需求信息三个方面,选择保证QoS要求的“阈值”进
人脸检测技术是进行脸部识别技术研究必不可少的部分,从上世纪90年代开始,仅仅十年的时间人脸检测技术就从崭露头角逐渐发展成为国内外的研究热点,尤其是在视频安全和安防监
随着无线承载网络性能的提高,特别是3G网络的普及,以实时视频流应用为代表的各种多媒体应用将会大方光彩。最典型的应用包括可视电话、电话会议、实时电视直播等,这些都是有非常
SIP协议(会话启动协议)凭借其简单、易于扩展、便于实现等诸多优点越来越得到业界的青睐,它正逐步成为下一代网络中的重要协议。而被称为体现了互联网本质的P2P(Peer-to-Peer)
本文重点研究了Adhoc网络中的QoS保障技术。在深入研究和分析Adhoc网络的各种特点以及现有的QoS解决方案的前提下,对原有的Adhoc路由协议AODV进行了修改使其能够满足一定的QoS
本文研究了基于组合设计LDPC码及有限几何LDPC码,包括它们的构造特点、编码、译码及其性能,研究表明,它们均具有较好的最小码距特征和较好的girth特征,仿真结果也证实了在中短码
通信系统的低误码率和低计算代价是所有检测技术追求的目标,本论文正是基于这一目标,研究了MIMO/OFDM系统中的各类检测算法,以期达到性能和计算复杂度的良好折衷。 目前提出
随着多媒体网络通信的发展,网络将承载越来越多的多媒体业务。这些具有不同码率、分辨率、满足不同标准的多媒体数据在经过各种异质网络、不同的接入设备,到达能力各异的接收终
通过对MPT(MYANMARPOSTSANDTELECOMMUNCIATONS)GSM运营系统ALCATELG2BSC,EvoliumG3BTS,MFSA935进行报告采集,路测DT和拨打测试CQT,OMC-R报告分析等多种监测方法。详细地分析了G